Информационный фонд системы управления должен как минимум обеспечить получение выходных наборов данных из входных с помощью алгоритмов обработки и корректировки. Это возможно, если создана корректная инфологичесая модель предметной области. ИЛМ позволяет построить каноническую схему информационной базы, от нее перейти к логической схеме (даталогическая модель) и далее к физическому уровню реализации. Инфологической (концептуальной) моделью ПО называется такое ее описание, где не ориентируются на возможные программные и технические средства. Принципы построения ИЛМ известны. Однако для построения информационной базы одной ИЛМ недостаточно.
Необходимо провести анализ информационных потоков для установления связи между элементами данных. Нужно оценить их группировки в наборах входных, промежуточных и выходных данных, исключить избыточные связи и элементы данных. Получаемая в результате такого анализа безызбыточная структура называется канонической структурой информационной базы. Она является одной из форм представления ИЛМ. Для анализа информационных потоков в системе исходными являются данные о парных взаимосвязях, или отношениях (т.е.: есть отношения или нет отношений) между элементами или наборами элементов. Информационные элементы - различные типы входных, промежуточных и выходных данных, которые образуют соответствующие наборы:
- N1 - наборы входных элементов данных
- N2 - наборы промежуточных элементов данных
- N3 - наборы выходных элементов данных.
Формализовано связи (то есть парные отношения) между наборами информационных элементов представляются в виде матрицы смежности В.Матрица смежности - это квадратная бинарная матрица, которая проиндексирована по обеим осям множествам информационных элементов.
D={d1, d2, ...ds}, где s - число информационных элементов. Запишем матрицуВ:
(22)
- qij=1, если между di и dj отношения существуют;
- qij=0, если не существуют;
- i=; j=.
В позиции ij матрицы смежности записывают 1(qij=1), если между информационными элементами dj и di существует отношение R0. R0 таково, что для получения значения информационного элемента dj необходимо обращение к элементу di. Наличие такого отношения между di и djобозначают: dj R0 di. Этому соответствует dji =1. Отсутствие отношения dj R0 diсоответствует dji =0. При этом каждый информационный элемент недостижим из самого себя di= R0 dj (i=)
В соответствии с матрицей смежности существует информационный граф:G=(D;R0) Множеством вершин графа G является множество D информационных элементов. Каждая дуга графа (di,dj) соответствует условию dg R0di, то есть записи 1 в позиции ig матрицы В.
Пусть задано множество D из четырех наборов информационных элементов:D={d1, d2, d3, d4}. Пусть В имеет вид:
Из матрицы смежности видно:
- для вычисления элемента d3 необходимо обращение к элементам d1 иd2.
- для получения элемента d4 - обращаться только к d3
- элемент d2 не зависит ни от одного из элементов матрицы.
В этом простейшем случае информационный граф соответствует рисунку:
При таком несложном варианте мы уже получили структуру информационных связей. Но если элементов существенно больше, воспринимать и анализировать такой граф крайне сложно, так как он неупорядочен. Граф составлен на основе ИЛМ, которая не гарантирует точности и неизбыточности.
Для формального выделения входных, промежуточных и выходных элементов, для определения последовательности операций обработки информационных элементов, для детального анализа взаимосвязей на основе графа G=(D, R0)строят следующую матрицу - матрицу достижимости М. М достижимости - это квадратная матрица, проиндексированная по обеим осям множеством информационных элементов D. Запись=1 в каждой позиции (ij) соответствует наличию для каждой пары (di, dj) смыслового отношения достижимости R. Существует ряд условий для построения матрицы М:
- элемент dj достижим из элемента di (то есть выполняется условиеdiRdj), если на графе G=(D, R0) существует направленный путь от вершины dj к вершине di.
- если diRdj, то отношение достижимости между элементами di и djотсутствует и в позиции (ij) матрицы М записывают 0.
Разберемся, что дает нам структура матрицы М:
- Запись "1" в j-том столбце соответствует информационному элементуdi, который необходим для получения значений dj. Они (записи) образуют множество элементов предшествования А(di) для данного элемента dj.
- Записи "1" в i-той строке матрицы М соответствуют всем элементам dj,достижимым из рассматриваемого элемента di и образующим множество достижимостей R(di) этого элемента.
Отсюда можно сделать очень полезные выводы:
- информационные элементы, строки которых в матрице М не содержат единиц (1), то есть нулевые строки, являются выходными информационными элементами.
- информационные элементы, соответствующие нулевым столбцам матрицы М, являются выходными.
- информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными.
Для рассмотренного примера с простым графом с 4 элементами матрица достижимости М может быть записана:
М= (23)
Отличие матрицы смежности В и достижимости М:
В матрице М учитывается смысловое отношение R между информационными элементами, а в матрице В учитывается только непосредственное R0 - наличие отношений без учета их характера.
Информационный граф системы Gs(R) структурируется по уровням N1, N2, N3.Он позволяет определить информационные входы и выходы системы, выделить основные этапы обработки данных, их последовательность, циклы обработки. При этом удаляются избыточные, лишние дуги графа и элементы , что наглядно видно на графе.
Выводы:
- Граф, полученный после структуризации, определяет каноническую структуру информационной базы.
- Каноническая структура задает логически неизбыточную информационную базу.
- Выделение наборов данных по уровням объединяет логические записи и упорядочивает их в памяти.
От канонической структуры при описании процесса хранения переходят к логической структуре информационной базы. Логический уровень процедур хранения, актуализации и извлечения определяется моделями баз данных. Модели баз данных основаны на том, что структуры данных обладают устойчивостью. Взаимосвязи между информационными элементами могут быть типизированы основными видами:
- Один к одному.
- Один к многим.
- Многие к многим.
Применение одного из видов взаимосвязей определило три основные модели данных в БД .
Разработка модели процесса накопления данных должна выполняться в соответствии с предложенными этапами, что позволит эффективно реализовать один из важнейших информационных процессов в рамках ИТ:
- Создание канонической структуры на основе инфологической модели предметной области и модели выбора хранимых данных.
- Формализованное описание БД на основе трех моделей: модели хранения данных (структура БД), модели актуализации данных и модели извлечения данных.
- На основе указанных моделей создаются алгоритмы и программы.
- Создание физической модели происходит с помощью совокупности программ, реализуемых и используемых на ЭВМ .
Таким образом можно определить все этапы и все составляющие процесса