База данных
- (англ. database), (БД) - совокупность описаний объектов реального мира, определенным образом структурированных и связанных между собой, актуальных для конкретной прикладной области и представленных на машиночитаемых носителях в форме, пригодной для применения ИТ.Организация данных в БД требует предварительного выбора и построения модели данных, назначение к-рой - систематизация информации (см. Экономическая информация) и отражение ее свойств (по содержанию, структуре, объему, связям, динамике, источникам и т.д.).
БД неразрывно связаны со всеми информац. ресурсами общества, создаются на их основе, а мн. из них и могут использоваться только вместе с документальными источниками информации. Информационные ресурсы рассматриваются как важная часть нац. ресурсов, а проблемы их развития - как часть общих проблем информатизации общества.
Построение такой модели осуществляется в неск. этапов с последовательным приближением к оптимальному варианту, к-рый наиболее адекватно отражает моделируемую предметную область.
Для создания БД в первую очередь определяют интересующие объекты (напр., поставщики, потребители, предприятия, работники и др.), а затем выделяют для каждого объекта набор характериз. его свойств -минимально возможную смысловую единицу («реквизит»). Напр., свойствами пр-тия могут быть: его название, адрес, расчетный счет в банке, тип выпускаемой продукции и т.п.
Объекты реального мира, сведения о к-рых хранятся в БД, называют «сущностями», а их актуальные признаки - «атрибутами». Вопрос об информац. содержании БД решается не только путем определения предметной области, но и с учетом интенсивности работы с разл. видами информации, их динамич. характеристиками, частотой корректировок, степенью их взаимосвязи.
Как правило, пользователь интересуется не всей информацией, содержащейся в БД, поэтому необходимо обеспечить ему возможность выделения отдельной части (подмодели, локальной модели). Структура организации данных в БД должна учитывать связи между разл. видами данных и обеспечивать быстрый доступ к ним.
Существует три осн. типа логической организации данных: иерархическая модель (имеет структуру в виде графа и выражает только вертикальные связи типа подчинения нижнего уровня верхнему); сетевая модель (представляется в виде графа общего вида, где присутствуют горизонтальные и обратные связи); реляционная модель (совокупность таблиц, называемых «отношениями», над к-рыми выполняются операции, формулируемые в терминах реляционной алгебры, для реализации автоматизированного ответа на запросы пользователей системы). Наибольшее распространение в наст, время имеют реляционные БД.
Разновидность реляционной модели - постреляционная модель данных, позволяющая строить высокоэффективные информац. системы, обеспечивающие одновременный доступ к информации большому числу пользователей. По виду данных выделяют БД: документографические (документальные) с подразделением их на библиографические и реферативные; фактографические; числовые; полнотекстовые; лексикографические; смешанные (гибридные).
По назначению содержащейся информации различают БД: деловой информации (соц. информация, кадастры, регистры, статистич., коммерч., финанс, управ-ленч. информация; данные о продукции и т.п.); информации для специалистов (научно-технич., экономич., маркетинговая, правоохранительная, исследовательская, производств., конструкторская, технологич. информация и т.п.); массовой информации (правовая, библиотечно-библиографич., архивная, учебная, справочная, общественно-политич., словарно-энциклопе-дич. информация, информация о культуре, спорте, досуге и т.п.).
По способу доступа БД делят на размещенные на хост-узлах (доступные через вычислительные сети); тиражируемые в коммуникативных форматах; тиражируемые программными средствами (включая CD-ROM); локальные.
Стандартные формы БД дополняются сегодня мультимедийными документами, графич. образами, хронологич. рядами, процедурными, или активными, данными и пр. сложными информац. формами. Источники для формирования БД - первичные документы: технич. документация, отчеты, формы статистич. отчетности, специальные журналы, монографии, аналитич. обзоры, информац. листки, материалы конференций, выставок, проспекты изданий и услуг и т.д.
Все больше используются также вторичные источники информации: СМИ (статьи из газет и журналов, рефераты, лицензии, каталоги отечеств, и зарубежных фирм, теле- и радиоинформация, рекламные объявления, адресные и специализир. справочники, регистрац. карточки, публикуемые балансы пр-тий и банков, письма, анкеты, паспорта пр-тий, статистич. публикации, договора, прейскуранты и т.п.).
Важнейшие характеристики БД-тематич. состав (БД законодательной информации, информации о персоналиях, адресно-справочные, коммерч. информации и т.п.); полнота информационных ресурсов (охват разл. тематич. предметных областей (наличие пробелов) и полнота их отражения в оригинальных БД, а также мера удовлетворения соотв. пользователей предлагаемыми формами и режимами предоставления информации). БД должна отражать объекты реального мира однозначно и непротиворечиво (условие целостности БД-database integrity).
Для поддержания информац. базы в рабочем состоянии применяют комплекс программных и языковых средств - систему управления базой данных (СУБД). СУБД - это пакет программ, обеспечивающий ввод, хранение, корректировку, сохранность и перемещение данных, формирование ответов на запросы, связь с др. программными средствами.
Совокупность одной или неск. БД, справочника БД, СУБД, библиотеки запросов и прикладных программ называют банком данных, БнД (англ. databank). Выбор управляющих программ определяется типом логической модели, имеющимися программными и технич. средствами. Осн. критерии выбора СУБД: минимизация сложности освоения системы, ее внедрения и использования; качество технич. документации и уровень сопровождения. Удобство работы пользователя определяется пользовательским интерфейсом - частью СУБД, ориентированной на взаимодействие пользователя с компьютером.
Доступ к данным осуществляется в виде запросов, к-рые формулируются на стандартном языке запросов. Действие, осуществляемое над БД, называется транзакцией.
Особенность соврем, реляционных БД - их распределенный характер (distributed databank), т.е. содержание фрагментов из неск. БД, к-рые располагаются на разл. узлах сети компьютеров и, возможно, управляются разными СУБД. Потребности в более удобных и мощных средствах моделирования предметной области, чем реляционные БД, удовлетворяет развивающееся направление семантических, или объектно-ориентированных, СУБД, полнее обеспечивающих возможности выражения семантики данных.
Появляются СУБД новых поколений - объектно-реляционные и дедуктивно-объектно-ориентированные. Наиболее эффективное средство представления сведений о БД -их электронные каталоги, или базы метаданных.
С помощью баз метаданных могут решаться след. задачи: организация учебы БД; планирование развития информац. ресурсов; информац. обеспечение процессов формирования научно-технич. политики в разл. областях экономики и соц. сферы для определения перспектив и путей их информатизации.
Составной частью интеллектуальных, в части, экспертных, систем, применяемых в управлении, экономике, финансово-кредитной сфере, образовании и т.п., являются базы знаний, англ. knowledge base (БД на основе семантической сети, процедурной, фреймовой и др. моделей, организованные способом, позволяющим системе отвечать на вопросы, ответы на которые в явном виде в базе отсутствуют).
Экспертные системы, содержащие базы знаний, алгоритмы решения конкретных задач и программно-технические средства, дают возможность пользователю на основе вводимых данных о текущем состоянии объекта управления или анализируемой ситуации получать варианты рекомендаций для выбора управленческих действий.