English version
8-800-555-90-25
Новая версия Программного комплекса 6.2016.
Практические рекомендации:
Все статьи

Рената Ванка-Еникеева

Глава направления «Евразия и Международное техническое право» Немецкой комиссии по электротехнике (DIN)

Онлайн-издания-для-профессионалов Помощник бухгалтера Архив решений арбитражных судов Полезная информация - юристу Банк документов

Курсы валют

30.09.2016

EUR70.8823-0.6915
USD63.1581-0.7928

Студенту и преподавателю

Программные технологии «Кодекс», как универсальный инструмент создания и доступа к электронным библиотекам

Сайт Государственной научно-технической публичной библиотеки России,
http://www.gpntb.ru/win/inter-events/crimea2000/doc/tom1/555/Doc8.HTML, июнь 2000 года

В докладе рассмотрены проблемы создания и доступа к электронным библиотекам на основе полнотекстовых баз данных. Акцентировано внимание на отсутствие единого подхода к построению электронных библиотек. Рассмотрены технологические особенности подготовки, создания, актуализации и доступа к электронным библиотекам. Подробно изложены особенности информационных и программных технологий "Кодекс". Приведены варианты использования технологий "Кодекс" на примере создания и доступа к электронным версиям печатных изданий.

Проблема создания и доступа к полнотекстовым или фактографическим базам данных и построению на их основе электронных библиотек в последнее время обсуждается достаточно часто, в том числе на предыдущей 6-й международной конференции "Крым 99" [1]. При этом основное внимание традиционно уделялось принципам построения таких библиотек, обеспечению доступа к имеющимся информационным ресурсам, в том числе с использованием современных телекоммуникационных средств.

Однако не только сама концепция построения электронных библиотек находится в стадии разработки, но и само понятие "электронная библиотека" неоднозначно трактуется различными авторами. Поэтому говорить о едином подходе различных разработчиков к решению задачи построения электронных библиотек в настоящее время не приходится. Кроме того, в составе электронных библиотек используются совершенно различные электронные ресурсы (от краткой библиографической информации о конкретном ресурсе до полнотекстовой, графической или аудио-, видео информации). Это еще более усложняет задачу выработки единых подходов и стандартов по хранению и доступу к необходимой информации. Следует обратить особое внимание и на то, что различия в характеристиках ресурсов приводит их создателей к необходимости использовать специфические средства навигации и поиска информации, а это, в свою очередь, влечет дополнительные трудности при совместном использовании библиотек, подготовленных различными разработчиками.

Консорциум "Кодекс" занимается созданием электронных библиотек по правовой и экономической тематике более 9 лет. За это время накоплен большой опыт по созданию и распространению таких информационных ресурсов на всей территории России и за рубежом.

Первоначально для создания и обеспечения доступа к правовой информации разработчики использовали стандартные системы управления базами данных (СУБД). Однако, по мере совершенствования механизмов обработки информации, расширения информационного массива до размеров в несколько десятков мегабайт становилось все более и более ясно, что стандартные СУБД не в полной мере удовлетворяют предъявляемым к ним требованиям. В числе таких требований:

  • В базе данных необходимо эффективно хранить объекты различного размера. Документы, комментарии, СНИПЫ и т.п. довольно сильно варьируются в размере - от сотен байт до десятков мегабайт. Накладные расходы на хранение должны быть минимальными. Поэтому система должна уметь хранить записи разного размера и реализовать сжатие данных. В универсальных СУБД хранение записей переменной длины обычно реализовано не очень эффективно, а сжатие реализовано только в дорогих серверных системах.
  • СУБД должна обеспечивать поддержку передачи изменений в БД (обновлений). При этом обновления должны быть небольшого размера, а сама процедура актуализации выполнятся достаточно быстро. Встроенные системы репликации универсальных БД для этого не подходят - они требуют постоянного соединения между СУБД во время репликации и не имеют режима передачи пакетов. Универсальные системы для создания справочных систем обычно вообще не имеют такой возможности.
  • Поддерживать поиск в информации на русском языке, в т.ч. и такие сложные виды поиска, как "интеллектуальный". Такие возможности поддерживаются только в дорогих серверных СУБД причем с использованием дополнительных пакетов.
  • Работать на различных платформах - DOS, Windows 16 и 32 бит, UNIX. В различных архитектурах - локально, файл-сервер, клиент-сервер. Универсальные СУБД обычно работают в одной архитектуре.
  • Иметь низкую стоимость. Коммерческие СУБД имеют достаточно высокую стоимость.

На основе этих и других требований был разработан инструментальный комплекс создания и ведения полнотекстовых баз данных "Кодекс-Мастер". Первоначально круг вопросов, для решения которых была предназначена программа "Кодекс-Мастер", был достаточно ограничен и фактически предназначался создания и ведения полнотекстовых правовых баз данных, содержащих только текстовую информацию по различным правовым тематикам. Однако, принципы, заложенные в этой системе управления базами данных, позволили затем абстрагироваться от конкретного вида представления информации, как это предполагалось изначально. Это привело к тому, что появилась возможность хранения в таких базах данных не только текстовой информации, но и информации, представленной в другом виде. Например, формулы, таблицы, иллюстрации и другие графические объекты. Соответственно, расширение возможностей системы открыло новые направления ее использования при создании сходных по характеру хранимой информации полнотекстовых баз данных.

Система "Кодекс-Мастер" представляет собой инструмент для создания информационно-поисковых систем различного назначения. Данная система может быть использована для создания:

  • правовых баз данных;
  • баз данных документов организаций или учреждений;
  • электронных версии газет, журналов и книг;
  • различных справочников (библиографических, адресных, тематических и т.д.)
  • словарей и др.

Система рассчитана на создание и ведение больших массивов документальной информации. Хранение информации в базе данных организовано на основании логического разбиения документов на типы по некоторым формальным параметрам. Таким параметром может выступать характер информации, представленной в документе, например, нормативный документ можно отличить от консультации в виде «вопрос-ответ» или от тематического словаря. Совокупность документов, относящихся к одному типу, логически выделяется в тематический раздел (для традиционных СУБД - база данных). Все тематические разделы БД логически связаны между собой, между ними реализован механизм гипертекстовых переходов по ссылкам и по всем разделам обеспечен сквозной поиск. Все это позволяет характеризовать совокупность информационных разделов как единое информационное пространство.

Структура документов, с которыми предполагает оперировать разработчик полнотекстовых баз данных на основе программы «Кодекс-Мастер», может быть различна и характеристики самого программного комплекса «Кодекс-Мастер» не накладывают ограничений на состав атрибутов, описывающих документ. Однако, для обеспечение совместимости информационных разделов с базовым программным комплексом «Кодекс» и возможности сохранения принципа «единого информационного пространства», Центр компьютерных разработок разработал набор стандартных шаблонов, на базе которых легко реализовать тематический раздел, для хранения практически любых документов. В случае необходимости разработки тематического раздела с новой структурой Центр компьютерных разработок оставляет за собой право создания соответствующего шаблона для конкретного разработчика.

БД «Кодекс» представляет собой гипертекстовое пространство, состоящее из текстовых объектов. Текстовый объект (объект базы данных) состоит из текста произвольного размера и набора атрибутов (показателей). Из любого места текстового объекта в любое место другого текстового объекта могут быть установлены гипертекстовые ссылки. Текстовые объекты в пределах одного раздела имеют одинаковую структуру. При вводе новых текстов в базу данных система автоматически производит ин индексирование по всем словам для последующего быстрого контекстного поиска по всем разделам БД.

Программа «Кодекс-Мастер» фактически является функциональной надстройкой над программным комплексом управления полнотекстовыми базами данных «Кодекс» и, соответственно, обладает всеми функциональными характеристиками этого комплекса. Использование программы возможно в локальном, сетевом вариантам или с использованием корпоративной версии «Кодекс- Intranet». Программа имеет развитый, дружественный и интуитивно понятный интерфейс, реализующий все возможности Windows -интерфейса. В данной программе реализована возможность настройки режимов работы, атрибутов поиска, интерфейса пользователя, вывода информации на печать, «горячих» клавиш и т.д. Форматирование текстов возможно средствами встроенного текстового редактора или путем загрузки форматированных текстов из других редакторов (например, MS WORD ). Тем не менее разработчики предполагают у пользователя «Кодекс-Мастер» наличие определенный профессиональных навыков работы с ЭВМ, а также навыков работы по разработке баз данных различного назначения.

Дальнейшее развитие линии программных продуктов «Кодекс» ориентировано на интеграцию с программными продуктами фирмы Microsoft Office . Примером такой интеграции служит система «Кодекс для Word», в которой для доступа к базе данных «Кодекс» используется интерфейс программы « Microsoft Word».

1. "Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества", Материалы конференции, Судак, Автономная Республика Крым, Украина, 5-13 июня 1999 г.

Перов А.И.,
Информационно-правовой консорциум "Кодекс", Санкт-Петербург, Россия