Главная » Учебно-методические материалы » ТЕХНИЧЕСКИЕ ДИСЦИПЛИНЫ » Информационные системы в экономике: курс лекций (СИБИТ)

Тема 2 БАЗОВЫЕ ТИПЫ ИНФОРМАЦИОННЫХ СИСТЕМ
24.11.2017, 11:10

2.1 Понятие фактографической информационной системы

Фактографические ИС оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных. ИС фактографического типа предназначены для хранения и поиска фактов, показателей, характеристик каких-либо объектов или процессов. По своей сути такая ИС представляет собой систему управления базами структурированных данных.

Важнейшие требования к ИС – хранение и обработка данных – не были реализованы возможностями систем управления файлами, существовавшими в 60-х годах; отсутствовали поддержание логически связанных файлов, средства восстановления данных в системе после сбоев и параллельная работа нескольких пользователей; не был реализован язык манипулирования данными.

В начале 70-х гг. был разработан новый вид программного обеспечения – системы управлении базами данных, позволивший структурировать, систематизировать и организовать данные для их компьютерного хранения и обработки.

База данных (БД) представляет собой совокупность специальным образом организованных данных, хранимых в памяти вычислительной системы и отображающих состояние объектов и их взаимосвязей в рассматриваемой предметной области.

Логическую структуру хранимых в базе данных называют моделью представления данных. К основным моделям представления данных (моделям данных) относятся следующие: иерархическая, сетевая, реляционная, постреляционная, многомерная и объектно-ориентированная.

Система управления базами данных (СУБД) — это комплекс языковых и программных средств, предназначенный для создания, ведения и совместного использования БД многими пользователями. Обычно СУБД различают по используемой модели данных. Так, СУБД, основанные на использовании реляционной модели данных, называют реляционными СУБД. СУБД предназначена для централизованного управления базой данных как социальным ресурсом в интересах всей совокупности пользователей. СУБД реализуют следующие функции:

1. Управление данными во внешней памяти. Функция управления данными во внешней памяти включает в себя обеспечение необходимых структур внешней памяти как для хранения непосредственных данных, так и для служебных целей, например для убыстрения доступа к данным в некоторых случаях (обычно используют индексы).

2. Управление буферами оперативной памяти. СУБД обычно работают с базами данных значительных размеров; по крайней мере, этот размер превышает доступный объем оперативной памяти. Единственным способом реального увеличения этой скорости является буферизация данных в оперативной памяти.

3. Управление транзакциями. Поддержание механизма транзакций – необходимое условие даже однопользовательских СУБД. При соответствующем механизме управления транзакциями пользователь может почувствовать себя единственным пользователем СУБД.

4. Журнализация и восстановление БД после сбоев. Поддержание надежного хранения данных в базе требует избыточности хранения данных, причем та их часть, которая используется для восстановления, должна храниться особо надежно. Наиболее распространенный метод поддержания такой избыточности – это ведение журнала изменений базы данных. Если СУБД корректно соблюдает этот протокол, то с помощью журнала можно решить все проблемы восстановления БД после любого сбоя.

5. Поддержание языков БД. Для работы с БД используются специальные языки, в целом называемые языками баз данных.

 

2.2 Модели и типы данных

Хранимые в базе данные имеют определенную логическую структуру иными словами, описываются некоторой моделью представления данных (моделью данных), поддерживаемой СУБД. К числу классических относятся следующие модели данных: иерархическая, сетевая, реляционная. Кроме того, в последние годы появились и стали более активно активно внедряться на практике следующие модели данных: постреляционная, многомерная, объектно-ориентированная.

2.2.1 Иерархическая модель

В иерархической модели связи между данными можно описать с помощью упорядоченного графа (или дерева).

Для описания структуры (схемы) иерархической БД на некотором языке программирования используется тип данных «дерево». Тип «дерево» является составным. Он включает в себя подтипы («поддеревья»), каждый из которых, в свою очередь, является типом

«дерево». Каждый из типов «дерево» состоит из одного «корневого» типа и упорядоченного набора (возможно пустого) подчиненных типов. Каждый из элементарных типов, включенных в тип «дерево», является простым или составным типом «запись». Простая

«запись» состоит из одного типа, например, числового, а составная «запись» объединяет некоторую совокупность типов, например, целое, строку символов и указатель (ссылку).

Иерархическая БД представляет собой упорядоченную совокупность экземпляров данных типа «дерево» (деревьев), содержащих экземпляры типа «запись» (записи). Часто отношения родства между типами переносят на отношения между самими записями. Поля записей хранят собственно числовые или символьные значения, составляющие основное содержание БД. Обход всех элементов иерархической БД обычно производится сверху вниз и слева направо.

Корневым называется тип, который имеет подчиненные типы и сам не является подтипом. Подчиненный тип (подтип) является потомком по отношению к типу, который выступает для него в роли предка (родителя). Потомки одного и того же типа являются близнецами по отношению друг к другу.

В целом тип «дерево» представляет собой иерархически организованный набор типов

«запись». Между предками и потомками автоматически поддерживается контроль целостности связей. Основное правило контроля целостности формулируется следующим образом: потомок не может существовать без родителя, а у некоторых родителей может не быть потомков. Механизмы поддержания целостности связей между записями различных деревьев отсутствуют.

Основные операции манипулирования данными: поиск указанного экземпляра БД (дерева); переход от одного дерева к другому; переход от одной записи к другой внутри дерева; вставка новой записи в указанную позицию; удаление текущей записи и т.д.

К достоинствам иерархической модели данных относятся эффективное использование памяти ЭВМ и неплохие показатели времени выполнения основных операций над данными. Иерархическая модель данных удобна для работы с иерархически упорядоченной информацией.

Недостатком иерархической модели является ее громоздкость для обработки информации с достаточно сложными логическими связями, а также сложность понимания для обычного пользователя.

 

На иерархической модели данных основано сравнительно ограниченное количество СУБД.

2.2.2 Сетевая модель

Сетевая модель данных позволяет отображать разнообразные взаимосвязи элементов данных в виде произвольного графа, обобщая тем самым иерархическую модель данных (рис.3).

Для описания схемы сетевой БД используется две группы типов: «запись» и «связь». Тип «связь» определяется для двух типов «запись»: предка и потомка. Переменные типа «связь» являются экземплярами связей. Сетевая БД состоит из набора записей и набора соответствующих связей. На формирование связи особых ограничений не  накладывается. Если в иерархических структурах запись-потомок могла иметь только одну запись-предка, то в сетевой модели данных запись-потомок может иметь произвольное число записей-предков (сводных родителей).

В различных СУБД сетевого типа для обозначения одинаковых по сути понятий зачастую используются различные термины. Например, такие как элементы и агрегаты данных, записи, наборы, области и т. д.

К числу важнейших операций манипулирования данными баз сетевого типа можно отнести следующие: поиск записи в БД; переход от предка к первому потомку; переход от потомка к предку; создание новой записи; удаление текущей записи; обновление текущей записи; включение записи в связь; исключение записи из связи; изменение связей и т. д.

Достоинством сетевой модели данных является возможность эффективной реализации по показателям затрат памяти и оперативности.

В сравнении с иерархической моделью сетевая модель предоставляет большие возможности в смысле образования произвольных связей.

Недостатком сетевой модели является высокая сложность и жесткость схемы БД, построенной на ее основе; сложность для понимания и выполнения обработки информации в БД обычным пользователем; ослаблен контроль целостности связей вследствие допустимости установления произвольных связей между записями.

2.2.3 Реляционная модель

Реляционная модель данных предложена сотрудником фирмы IBM Эдгаром Коддом и основывается на понятии отношение (relation).

Отношение представляет собой множество элементов, называемых кортежами. Наглядной формой представления отношения является привычная для человеческого восприятия двумерная таблица. Таблица имеет строки (записи) и столбцы (колонки). Каждая строка таблицы имеет одинаковую структуру и состоит из полей. Строкам таблицы соответствуют кортежи, а столбцам — атрибуты отношения. С помощью одной таблицы удобно описывать простейший вид связей между данными, а именно деление одного объекта (явления, сущности, системы и проч.), информация о котором хранится в таблице, на множество подобъектов, каждому из которых соответствует строка или запись таблицы. При этом каждый из подобъектов имеет одинаковую структуру или свойства, описываемые соответствующими значениями полей записей. Например, таблица может содержать сведения о группе обучаемых, о каждом из которых известны следующие характеристики: фамилия, имя и отчество, пол, возраст и образование. Физическое размещение данных в реляционных базах на внешних носителях легко осуществляется с помощью обычных файлов.

Достоинство реляционной модели данных заключается в простоте, понятности и удобстве физической реализации на ЭВМ. Именно простота и понятность для пользователя явились основной причиной их широкого использования. Проблемы же эффективности обработки данных этого типа оказались технически вполне разрешимыми.

Недостатком модели является: отсутствие стандартных средств идентификации отдельных записей; сложность описания иерархических и сетевых связей.

Реляционная модель данных (РМД) некоторой предметной области представляет собой набор отношений, изменяющихся во времени. При создании информационной системы совокупность отношений позволяет хранить данные об объектах предметной области и моделировать связи между ними. Элементы РМД и формы их представления приведены в табл. 1.

Отношение является важнейшим понятием и представляет собой двумерную таблицу, содержащую некоторые данные.

Сущность есть объект любой природы, данные о котором хранятся в базе данных.

Данные о сущности хранятся в отношении.

Атрибуты представляют собой свойства, характеризующие сущность. В структуре таблицы каждый атрибут именуется и ему соответствует заголовок некоторого столбца таблицы.

Таблица 1 Элементы реляционной модели

Элемент реляционной модели

Форма представления

Отношение

Таблица

Схема отношения

Строка заголовков столбцов таблицы

Кортеж

Строка таблицы

Сущность

Описание свойств объекта

Атрибут

Заголовок столбца таблицы

Домен

Множество допустимых значений атрибута

Значение атрибута:

Значение поля в записи

Первичный ключ

Один или несколько атрибутов

Тип данных

Тип значений элементов таблицы

 

Проектирование систем управления базами данных фактографических систем

Особое значение при проектировании имеет предметная область объекта.

Предметной областью называются элементы материальной системы, информация о которых хранится и обрабатывается в ИС. Информационным отображением всей предметной области экономического объекта служит информационная база ИС. Информационная база состоит из одной или нескольких баз данных. Для описания предметной области необходимы такие термины, как объект, свойство объекта, взаимодействие (связь) объектов, свойство взаимодействия.

Объектом называется любой элемент некоторой системы. В экономических приложениях понятие объекта сужается до понятия физического объекта, под которым понимается любой предмет, занимающий место в пространстве. Отдельный предмет часто назывется экземпляром объекта, а различные множества предметов, образованные по заданному принципу, называются типами объектов.

Концептуальное проектирование СУБД связано с описанием разнообразных информационных требований пользователей. Результатом этого этапа является высокоуровневое представление информационных требований, например такое, как диаграмма «сущность – связь». Подход к концептуальному проектированию предполагает, что рассматривается представление одного пользователя, например администратора, который понимает требования всех пользователей и объединяет эти требования в полный набор согласованных спецификаций.

Концептуальное проектирование оперирует информацией, независимой от любой фактической реализации (т. е. от любой конкретной системы технического или программного обеспечения). В ходе проектирования исследуется возможность преобразования модели в СУБД – зависимое представление.

При проектировании возможно использовать специальные программные средства реализации фактографических информационных систем пакеты программ – CASEсредства (Computer Aided System Engineering). Суть автоматизации в том, что на достаточно простом языке описываются программное обеспечение, концептуальная схема, которая потом преобразуется в логическую схему конкретной СУБД. С помощью CASEтехнологии:

-быстрее создают и внедряют БД при меньших затрат;

-обеспечивают единый простой интерфейс;

-сокращают усилия по обслуживанию приложений;

-осуществляют контроль за взаимодействием и полнотой представления;

-проводят последовательную декомпозицию сложной задачи.

Основной недостаток пакетов CASE – упрощенный подход к концептуальному моделированию.

Рассмотрим объектное представление или нисходящее проектирование СУБД. Существуют два метода концептуального проектирования: объектное представление и моделирование сущностей. Объектное представление включает формулирование, определение и интеграцию объектов высокого уровня, используемых для построения модели. Основное внимание при этом уделяется интеграции понятий (концепций), представляющих объекты. Попросту говоря, технология этого подхода заключается в объединении элементов, которые в свою очередь могут состоять из отдельных частей. Эти элементы рассматриваются как объекты, объединенные в виде иерархии объектов.

Процесс проектирования проходит стадии моделирования представлений и объединения представлений. Видами представлений данных являются: общее представление (с точки зрения организации в целом), прикладное представление, информационное представление и представление событий. Каждому типу представления соответствует особый вид информации:

1. Цели или ограничения организации. Производственные или коммерческие цели организации, выраженные в терминах требуемой информации. Различные информационные ограничения, такие как требования отчетности, необходимость проверки, управляющие воздействия, а также меры по обеспечению секретности.

2. Обрабатываемая информация. Информация о существующих и будущих приложениях. Сюда включаются все предполагаемые виды обработки базы данных.

3. Информационные структуры и связи. Моделирование общих информационных связей: существующих элементов данных, агрегаций элементов данных и связей, необходимых для отображения деятельности организации или предприятия. Этим обеспечивается основа для специальных и незапланированных запросов.

4. События и планирование. Сроки представления информации, различных отчетов, сроки решения прикладных задач. Сюда включается как незапланированная (специальная), так и заранее определенная информационная деятельность организации.

Моделирование представлений заключается в фактическом сборе информации на различных уровнях организации в соответствии с четырьмя видами представлений. При моделировании ПО разбивается на ряд локальных областей, моделируется каждое локальное представление, а затем они объединяются. Выбор локального представления зависит от масштабов ПО. Для удобства в одном локальном представлении желательно использовать 6–7 типов сущностей. Если это не соблюдается, то, возможно, область применения локального представления слишком обширна.

 

2.3 Понятие документальной информационной системы

Документальные ИС – системы работы с документами на естественном языке – публикации и т.д. они обеспечивают анализ данных при неполном, приближенном представлении смысла. наиболее распространенный тип ДИС – информационно – поисковые системы (ИПС), предназначенные для накопления и поиска по различным критериям документов на естественном языке.

Информационный поиск в ИПС некоторая последовательность операций, выполняемых с целью отыскания документов, содержащих определенную информацию, или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.

Поисковый массив – массив элементов информации, в котором производится информационный поиск.

Существуют следующие основные виды информационного обеспечения в данных системах:

· Регламентное обслуживание в форме подготовки и издания обзорных и реферативных информаций, библиографических указателей и т.п., или обслуживание по стандартным запросам;

· Оповещение отдельных специалистов (абонентов) о текущих публикациях, представляющих для них потенциальный интерес путем избирательного (адресного) распределения информации (ИРИ) по профилям интересов, сформулированных потребителем, или дифференцированного обслуживания руководителей (ДОР) по мере поступления информации, необходимой для принятия решений;

· Ретроспективный поиск, т.е. отыскание документов, в которых находятся сведения по конкретным запросам, в массиве всех накопленных источников информации, что может осуществляться либо в форме подготовки тематических подборок, либо в оперативном режиме.

Имеет место и другая классификация видов информационного обслуживания: по источнику информации, по типам документов, по направленности или адресности, по периодичности или срочности, по способу доведения документов до потребителя, по назначению, цели.

Способы реализации видов и форм обслуживания зависят от вида, назначения и способа реализации конкретной ИПС. В современных условиях распространены режимы обслуживания в форме он-лайнового доступа к базам данных автоматизированных ИПС и предоставления информации на СD.

Для эффективного информационного обслуживания и навигации необходимо выявить информационные потребности. Поэтому изучение запросов потребителей информации является первоочередной задачей научно – информационной деятельности. Задача эта довольно сложная, т.к. потребителя как правило, не умеют четко формулировать свои потребности, и они уточняются по мере работы с получаемой информацией.

Прежде всего, каждому документу, вводимому в поисковый массив, ставится в соответствие поисковый образ документа (ПОД), который представляет собой характеристику, отражающую основное смысловое содержание документа. Простейшим ПОД может являться заглавие документа, переписанное в форме перечня входящих слов. Устанавливаются правила включения в ПОД существительных в единственном числе и именительном падеже, глаголов – в неопределенной форме или в виде отглагольных существительных и т.п. правил, общих для формирования ПОД и ПОЗ – поискового образа запроса.

Для реализации процедуры описания документов и запросов с помощью ПОД и ПОЗ разрабатывают информационно – поисковые языки (ИПЯ). Для сопоставления ПОД и ПОЗ разрабатывают и применяют различные критерии поиска или критерии смыслового соответствия (КСС).

Точность поиска определяется точностью отображения документов и запросов с помощью их поисковых образов и степенью совпадения ПОД и ПОЗ. Поэтому возможна неполнота выдачи документов, либо, наоборот, «поисковый шум», которые представляют собой своеобразную плату за облегчение процедуры информационного поиска.

Документальные ИПС в ответ на вводимые в них информационные запросы выдают оригиналы, копии или адреса хранения документов, содержащих требуемую информацию.





БАНКОВСКОЕ ДЕЛО
БУХГАЛТЕРСКИЙ УЧЕТ
БЮДЖЕТ И БЮДЖЕТНАЯ СИСТЕМА РФ
ВЫСШАЯ МАТЕМАТИКА, ТВ и МС, МАТ. МЕТОДЫ
ГУМАНИТАРНЫЕ НАУКИ
ДОКУМЕНТОВЕДЕНИЕ И ДЕЛОПРОИЗВОДСТВО
ДРУГИЕ ЭКОНОМИЧЕСКИЕ ДИСЦИПЛИНЫ
ЕСТЕСТВЕННЫЕ ДИСЦИПЛИНЫ
ИНВЕСТИЦИИ
ИССЛЕДОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ
МАРКЕТИНГ
МЕНЕДЖМЕНТ
МЕТ. РЕКОМЕНДАЦИИ, ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ
МИРОВАЯ ЭКОНОМИКА И МЭО
НАЛОГИ И НАЛОГООБЛОЖЕНИЕ
ПЛАНИРОВАНИЕ И ПРОГНОЗИРОВАНИЕ
РАЗРАБОТКА УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ
РЫНОК ЦЕННЫХ БУМАГ
СТАТИСТИКА
ТЕХНИЧЕСКИЕ ДИСЦИПЛИНЫ
УПРАВЛЕНИЕ ПЕРСОНАЛОМ
УЧЕБНИКИ, ЛЕКЦИИ, ШПАРГАЛКИ (СКАЧАТЬ)
ФИНАНСОВЫЙ МЕНЕДЖМЕНТ
ФИНАНСЫ, ДЕНЕЖНОЕ ОБРАЩЕНИЕ И КРЕДИТ
ЦЕНЫ И ЦЕНООБРАЗОВАНИЕ
ЭКОНОМИКА
ЭКОНОМИКА, ОРГ-ЦИЯ И УПР-НИЕ ПРЕДПРИЯТИЕМ
ЭКОНОМИКА И СОЦИОЛОГИЯ ТРУДА
ЭКОНОМИЧЕСКАЯ ТЕОРИЯ (МИКРО-, МАКРО)
ЭКОНОМИЧЕСКИЙ АНАЛИЗ
ЭКОНОМЕТРИКА
ЮРИСПРУДЕНЦИЯ