|
Кто такие бармаглоты? - Обожатели Borland'a.
|
Этот материал основан на изучении документации и справочных
материалов по BDE и на собственном опыте. На самом деле информация
из этого документа частично появлялась и раньше как в FAQ Borland
так и в материалах других авторов (в частности Epsylon
Technologies). Однако до сих пор большое количество разработчиков
используют BDE. Но в последнее время все больше людей работают с
SQL-серверами, и более популярными становятся компоненты прямого
доступа - IBObjects/FreeIBComponents/IBExpress, Direct Oracle Access
и другие. Кроме того, BDE не будет поддерживать Interbase 6.0
(диалект 3), да и вообще похоже, прекратит свое существование. В
Delphi 6 наряду со старым BDE и в Kylix (Delphi и C++Builder для
Linux) будет использоваться другая библиотека - dbExpress. Поэтому,
чтобы поставить жирную точку (или крест, как хотите) на BDE, я и
решил написать этот документ.
В большей степени этот текст напоминает то, что я читал на курсах
по Delphi и разработке баз данных 3-4 года назад. Привет вам,
курсанты! Можете прочитать этот документ хотя бы для того, чтобы
освежить память.
Введение
Для начала вернемся лет на 10 назад. В те времена на компьютерах
властвовали настольные СУБД - dBase, Paradox, FoxPro, Clipper и т.п.
SQL-сервера в основном работали на мэйнфреймах. Среди форматов
настольных СУБД был полный разнобой, и например, хотя Clipper,
FoxPro и dBase работали с форматом DBF, использовать таблицы друг
друга они фактически не могли из-за мелких, но существенных
различий. Обмениваться данными в те времена между разными СУБД можно
было разве что при помощи импорта-экспорта. Многие компании
понимали, что так дальше продолжаться не может. Некоторые встраивали
в свои продукты несколько "движков", но это приводило к распуханию
продукта, да и чаще всего пользователи работали только с одним
форматом данных, а не несколькими одновременно.
В 1990-м году Borland приобрел компанию Ashton-Tate, а вместе с
ней и dBase (и Interbase). Таким образом у Borland появилось две
настольные СУБД, с совершенно разными форматами - dBase и Paradox.
Понятно, что для дальнейшего развития этих продуктов усилия по
развитию форматов данных и работы с ними фактически удваивались. И в
частности поэтому было принято решение создать некое универсальное
ядро доступа к данным, которое могло бы работать с несколькими
форматами данных единым образом. Созданию такого ядра также
способствовало появление Windows, а следовательно и разделяемых
библиотек - DLL. Можно было выпускать несколько продуктов, используя
одни и те же dll доступа к данным. Это вполне соответствовало
объектно-ориентированной концепции разработки ПО, которая не только
использовалась в Turbo Pascal и в Turbo C++, но и при разработке
собственных приложений Borland, таких как dBase, Paradox и Quattro
(все для Windows).
примечание:
дальнейшая информация по датам взята из документа,
подзаголовок "Evolution of BDE/IDAPI Technology: 1990 -
94".
Технология была названа Open Database Application Programming
Interface - ODAPI, и впервые была использована в Quattro Pro 1.0 for
Windows в сентябре 1992 года. В январе 1993-го эта же версия ODAPI
1.0 была использована в Paradox 1.0 for Windows, а затем и в dBase
1.0 for Windows. ODAPI пока поддерживал только форматы dBase и
Paradox, и мог выполнять запросы к обоим форматам при помощи
механизма Query By Example (QBE), пришедшего из Paradox for DOS.
справка:
драйверы ODBC 1.0 от Microsoft впервые появились в
августе 1993 года. Информация из MSDN.
Всего через полгода, в сентябре 1993, ODAPI 1.1 уже поддерживала
работу с SQL-серверами Interbase, Oracle, Sybase и Microsoft.
Версия 2.0 была переименована в IDAPI (слово Open было заменено
на Integrated), и работами по расширению и стандартизации этого
интерфейса уже занимался не только Borland, а целый комитет с IBM,
Novell и Wordperfect включительно. В этой версии появился Local SQL
- ядро для выполнения запросов SQL к локальным форматам данных, и
IDAPtor - механизм для подключения ODBC-драйверов к IDAPI.
Последняя 16-ти разрядная версия IDAPI 2.5 использовалась в
Delphi 1. Далее, начиная с 3.0 (12 января 1996 года в составе
Paradox 5.0 for Windows), пошли 32-разрядные версии. Собственно, на
этом развитие функциональности BDE закончилось. Добавлялись новые
драйверы для доступа к SQL-серверам DB2, Informix, в BDE 3.5
появились кэшированные обновления (CachedUpdates), появился драйвер
FoxPro и сопряжение с DAO, но все это происходило на протяжении
достаточно длительного срока - с 1996 по 2000.
С одной стороны, функциональность BDE можно назвать даже
избыточной. С другой стороны повлияла конкуренция со стороны
Microsoft, стандарта ODBC. Собственно, по функциональности ODBC
является подмножеством BDE, но Microsoft в те годы предпринимала
очень активные действия по продвижению ODBC, и главным в этом был
выпуск ODBC SDK, с помощью которого любая фирма могла разработать
собственный ODBC-драйвер (надо сказать, что в те годы их было
огромное количество, причем большинство было весьма низкого качества
и невысокой производительности). А BDE был более "закрытым".
Например, BDE SDK так и не увидел свет, и был доступен разве что
избранным (я оказался в их числе, и надо сказать, что качество BDE
SDK и удобство написания драйверов было на высоте). С третьей
стороны, к этому времени WordPerfect был куплен Novell, Paradox
также был продан Novell, а затем Corel, а IBM похоже просто потеряла
к IDAPI интерес.
Короче, комитет IDAPI распался, а Microsoft задавил конкуренцией.
Несмотря на перечисленные негативные моменты, BDE активно
использовался не только самим Borland, но и многими другими фирмами.
Это Novell (продукт InForms), ReportSmith (впоследствии купленный и
проданный Borland), CrystalReports (вплоть до версии 5.0 использовал
BDE) и так далее.
Архитектура
Увлекшись историей я немного пропустил, зачем все это (BDE)
делалось. Частичная цель упоминалась выше - предоставить
универсальное ядро доступа к локальным форматам данных. Основная -
обеспечить прозрачную работу приложений как с локальными форматами,
так и с SQL-серверами. Как сейчас помню, что именно удобство при
работе с SQL-серверами рекламировалось как основное. Однако в
последние 2-3 года именно эта возможность вызывала наибольшее
количество нареканий. Давайте рассмотрим архитектуру BDE.
Основная работа с BDE производится посредством внешнего
интерфейса IDAPI (IDAPI32.DLL). Формат данных выбирается в
псевдониме (alias) соединения, и в принципе дальше работа с разными
форматами ничем не отличается. В том числе и неважно, как работает
приложение с BDE - через компоненты VCL DB, которые используют
функции BDE, или напрямую (все равно компоненты используют те же
функции BDE).
Дальше функции IDAPI транслируют вызовы в функции
соответствующего драйвера. Если это драйвер локального формата
(dBase, Paradox, FoxPro), то драйвер формата сам работает с
соответствующими файлами (таблицами и индексами). Если это SQL Link,
то вызовы транслируются в вызовы функций API клиентской части
конкретного SQL-сервера. Для каждого сервера SQL Link свой.
IDAPTOR (соединитель с ODBC) и интерфейс к DAO работает точно
также как и SQL Link, т.е. просто транслирует вызовы BDE в вызовы
ODBC или DAO, непосредственно к формату не имея никакого отношения.
Если посмотреть на файлы BDE, то можно подробно рассмотреть его
составные части.
- IDAPI32.DLL
- Основной интерфейс
- BLW32.DLL, BANTAM.DLL
- Языковые функции
- *.BTL
- Файлы с языковыми кодировками.
- IDBAT32.DLL
- Операции пакетного копирования данных
- IDDR32.DLL
- Модуль работы с Data Repository
- IDASCI32.DLL
- Драйвер для работы с текстовым форматом
- IDDAO32.DLL
- Драйвер трансляции вызовов к DAO
- IDODBC32.DLL
- Драйвер трансляции вызовов к ODBC
- IDPDX32.DLL
- Драйвер для работы с форматом Paradox
- IDDBAS32.DLL
- Драйвер для работы с форматом dBase и FoxPro
- IDQBE32.DLL
- Ядро обработки запросов QBE
- IDSQL32.DLL
- Ядро обработки запросов SQL
- SQLINT32.DLL
- SQLLink-драйвер трансляции вызовов к Interbase API
- SQLORA32.DLL
- SQLLink-драйвер трансляции вызовов к Oracle Call Level
Interface
- SQL*32.DLL
- Другие SQLLink-драйверы
Таким образом, при установке BDE "лишние" файлы можно без проблем
выкинуть.
Также, надеюсь, понятно, почему BDE "не работает" с SQL-сервером,
если не установлена клиентская часть этого сервера (то же самое по
отношению к DAO - без дистрибутива DAO BDE не будет работать с
файлами MS Access). Вообще клиентские части SQL-серверов
несовместимы между собой абсолютно. Поэтому невозможно написать
универсальный SQL Link.
Данный рисунок и список файлов, возможно, развеет популярный миф
о том, что Delphi хорошо приспособлена для работы с Interbase. Как
видите, Interbase для Delphi столь же равноправен, как скажем,
Oracle или любой ODBC-драйвер. В отличие от продуктов Microsoft в
BDE нет никаких "обходных" функций для работы со своими форматами,
т.е. работа с IB ведется только через SQL Link (без sqlint32.dll BDE
вообще не знает, что такое Interbase).
Отдельное место в архитектуре BDE и среди упомянутых файлов
занимают Local SQL и QBE Engine. Эти механизмы запросов будут
рассмотрены чуть дальше.
TTable и TQuery
TTable и TQuery являются основными компонентами, используемыми
при программировании приложений баз данных (TStoredProc не в счет, и
без него можно прекрасно обойтись, вызывая процедуры через select
или execute в компоненте TQuery). TTable предоставляет доступ как к
таблицам, а TQuery позволяет выполнять произвольные запросы. Если с
TQuery все понятно - он выполняет тот запрос, который написан в
свойстве TQuery.SQL - то TTable скрывает очень много подробностей
своей работы от программиста. Без SQL Monitor увидеть все тонкости
невозможно (если кто не знает - SQL Monitor находится в меню
Database).
Итак, запустите Delphi, откройте SQL Monitor, положите на форму
компонент TDatabase, подсоединитесь к серверу, затем положите
компонент TTable, присоедините его к алиасу TDatabase и выберите
любую таблицу из списка (свойство TableName). Переключитесь на SQL
Monitor, сотрите все что там появилось, переключитесь обратно, и
включите TTable.Active:=True; Смотрим в SQL Monitor (лог с самого
начала):
- первым запросом BDE хочет убедиться, что выбранная нами
таблица существует.
- второй запрос выбирает список полей выбранной таблицы, их
названий, типов, условий проверки и т.п.
- третий запрос выбирает информацию об индексах указанной
таблицы. Определяется, есть ли среди них первичный ключ, и по
каким полям построены индексы.
- четвертый запрос почти повторяет второй, и выбирает информацию
о полях - условия проверки, "вычисляемость" поля, допустимость
NULL и прочее.
- собственно, пятый запрос открывает таблицу, формируя запрос
SELECT FIELD1, FIELD2, ... FROM TABLE ORDER BY PK_FIELD ASC.
Заметьте, что подобные запросы выполняются каждый раз при
открытии таблицы (любой) компонентом TTable. Перечитывания этих
данных можно избежать, если включить у используемого алиаса параметр
ENABLE SCHEMA CACHE. При этом считанную первый раз информацию BDE
размещает на диске в указанном каталоге (SCHEMA CACHE DIR) в
специальном файле, кэширует информацию для SCHEMA CACHE SIZE
количества таблиц, и держит эту информацию в кэше в течение SCHEMA
CACHE TIME секунд (если -1, то вечно). Если структуры таблиц
закэшированы, то при их изменении на сервере (например, добавили
новое поле) приложение будет работать со старой структурой, что
может вызвать серьезные проблемы в работе приложения. SCHEMA CACHE
нужно использовать только тогда, когда структура базы данных
определена окончательно и не изменяется. Если все же очень сильно
хочется использовать кэширование структур таблиц, то не забывайте
правильно установить параметр SCHEMA CACHE TIME. Или при первом за
день подключении приложения к серверу сначала кэширование структур
можно выключить, отсоединиться, включить и подсоединиться снова -
таким образом в самом начале работы кэш структур таблиц будет
создан, и будет использоваться в течение дня.
примечание:
параметры SCHEMA CACHE не имеют абсолютно никакого
отношения к механизму Cached Updates или к кэшированию
данных.
Вернемся к запросу, которым TTable открыл таблицу. В конце
запроса стоит указание порядка сортирвки - ORDER BY FIELD ASC. По
умолчанию TTable сортирует данные в порядке поля первичного ключа. И
кстати, если пользоваться свойством TTable.IndexName, то все равно к
запросу будет добавляться ORDER BY INDEXFIELD ASC. Таким образом
получается, что свойство IndexName при работе с SQL-серверами
бессмыслено. Вместо него нужно просто использовать свойство
IndexFieldNames. Даже если в этом свойстве указать поле, по которому
нет индекса, то все равно BDE "прицепит" к запросу ORDER BY FIELD
ASC. Кстати, BDE абсолютно игнорирует направление индекса, и всегда
в запросе добавляет ASC, даже если индекс по этому полю создан как
DESCENDING (по убыванию). Получается, что отсортировать таблицу в
TTable по убыванию нельзя.
примечание:
можно было бы отнести этот недостаток на SQL Link для
IB, но вполне возможно что просто TTable не в состоянии кэшировать
и обновлять данные, отсортированные по убыванию (см. дальше о кэше
данных).
Кэширование данных
Как видно из предыдущего раздела, TTable работает с таблицами
сервера не каким-то хитрым образом, а формируя самые нормальные
SQL-запросы. И тут начинается самое интересное. Оказывается, при
выполнении запроса сервер выдает записи клиенту (приложению) по
очереди и по одной записи. Причем только "сверху вниз". Как только
записи на сервере кончились, сервер сообщает клиенту об этом
сигналом EOF вместо выдачи очередной записи. Конечно, в некоторых
современных серверах есть произвольное позиционирование и проход по
выборке не только сверху вниз но и в обратном порядке, но это
требует от сервера достаточно больших ресурсов.
примечание:
разумеется, клиентская часть SQL-сервера может
принимать записи от сервера "пачками". Но в любом случае получение
записи инициируется только вызовом функции fetch, и по этой
команде "выбирается" только одна запись. Т.е. приложение получает
записи по одной независимо от того, буферизируются они на
сервере/клиенте или нет.
Поскольку BDE - вещь универсальная, то он должен обеспечить
возможность перемещения по записям вверх и вниз независимо от
сервера. Т.е. он должен обеспечивать кэширование записей
самостоятельно. Взял запись с сервера - положил в кэш. Это означает,
что если вы открыли таблицу в 100 тысяч записей, и нажали в гриде
Ctrl-End, то все 100 тысяч записей "приедут" к вам на клиентский
компьютер. С таким пожиранием ресурсов надо как то бороться. Если в
TQuery можно ограничить количество выбираемых записей условиями
запроса, то в TTable этого сделать нельзя, поскольку как мы уже
видели, TTable формирует запросы самостоятельно.
Живой и мертвый кэш, или TTable и TQuery
Для решения проблем кэширования TTable было введено два разных
механизма кэширования. Для TTable - "живой" кэш, а для TQuery -
"мертвый". Для простоты лучше сначала рассмотреть "мертвый" кэш.
Вообще тут и рассматривать нечего - при перемещении по записям
записи помещаются в кэш. Как только все записи помещены
(пользователь "доехал" до конца выборки каким-либо способом),
обращения к серверу прекращаются, и любые передвижения пользователя
по записям совершаются только в кэше.
У "мертвого" кэша есть побочный эффект - если вызвать метод
Locate для поиска записи, то TQuery принудительно выберет все записи
в кэш, и только потом будет искать нужную запись в кэше. Собственно,
пока запись не считана, неизвестно - попадает она под условие Locate
или нет. Поэтому другим способом здесь искать записи невозможно.
"Мертвый" кэш существует до тех пор, пока запрос не будет закрыт
(TQuery.Close).
Живой кэш более сложен, и для его понимания придется использовать
чуть больше компонент на уже открытой в Delphi форме. Добавьте к
TDatabase и TTable компоненты TDataSource и TDBGrid. Grid растяните
по вертикали так, чтобы в нем было видно штук 5 записей (7, или 9,
не больше). Желательно чтобы в таблице при этом было не меньше 20-30
записей. Поместите кнопку рядом с Grid-ом, в которой на OnClick
напишите
Table1.IndexFieldNames := 'FIELD';
|
где FIELD - любое имя поля открытой таблицы, главное чтобы не
поле первичного ключа. Наличие индекса по этому полю не обязательно.
Скомпилируйте приложение, запустите его (не забыв запустить SQL
Monitor). Поместите курсор грида посередине, как показано на рисунке
(на содержимое грида не обращайте внимания - у вас оно будет
совершенно другим, в зависимости от выбранной таблицы).
Сотрите все в SQL Monitor. И нажмите кнопку Button1. Теперь
возвращаемся к началу лога в SQL Monitor:
- первый запрос выбирает значение поля, по которому нужно
отсортировать данные.
- второй запрос выбирает данные от текущей записи и "выше" - см
добавку WHERE FIELD < ? ORDER BY FIELD DESC
- третий запрос выбирает запись, которую нужно поместить на
место текущей (выборка запомненного первым запросом значения).
Кстати, этот запрос у меня почему-то выполнился аж три раза (BDE
5.1.1). Раньше он обычно выполнялся всего один раз.
- четвертый запрос выбирает данные от текущей записи и ниже -
см. добавку WHERE FIELD > ? ORDER BY FIELD ASC
Вот это и есть "живой" кэш. Т.е. при любых операциях перемещения
по набору данных, отличных от перемещения на одну запись (или
PageUp/PageDown) вверх или вниз, TTable уничтожает текущий кэш,
перечитывает данные столь экзотическим образом, и создает новую
копию кэша. По количеству вызовов isc_dsql_fetch вы можете понять,
что как "вверх" так и "вниз" от текущей записи второй и четвертый
запросы выбрали ровно столько записей, сколько помещается в Grid.
Если вы продолжите движение курсором по одной строке вверх или вниз,
то увидите каким способом (зачастую неэффективным) BDE довыбирает
необходимые записи (особенно неэффективность проявляется при
движении вверх).
Если же курсор находится вверху или внизу грида, то вместо трех
запросов отображения данных будет два - выборка текущей записи и
выборка записей только вверх или вниз от текущей записи.
Существенный момент - выборка "вверх" всегда использует
сортировку по убыванию. Если по полю сортировки нет индекса по
убыванию, то Interbase (или другой сервер) будет сортировать
результат в памяти или на диске, что существенно медленнее
сортировки с использованием индекса. Поэтому "резкие" перемещения,
например в конец таблицы при помощи Ctrl-End будут приводить к
значительной паузе, пока сервер отсортирует данные и выдаст
резульат. Повысить скорость в этом случае можно только
использованием ClientDataSet, который сортирует кэш вместо выдачи
серверу SQL-запросов.
Locate в живом кэше в отличие от мертвого кэша выполняется
намного быстрее, т.к. TTable применяет ту же самую технику очистки
кэша для поиска нужной записи.
|