Независимость данных — критический аспект при управлении любой системой баз данных. Она позволяет изменять приложения, не изменяя для этого структуру базы данных, и изменять конструкцию базы данных, не оказывая при этом влияния на работу приложений. Система управления базами данных не должна вынуждать выносить окончательные решения о том, какие данные должны сохраняться, как получать к ним доступ и что будет нужно пользователям. Система не должна становиться бесполезной при изменении потребностей.
Введение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
2 Физическая независимость данных. . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Логическая независимость данных. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4 Заключение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8
5 Список использованной литературы. .
Моделирование данных за 9 минут
Работа содержит 1 файл
ГОУВПО «Мордовский государственный университет им. Н. П.Огарева»
Кафедра информационно-вычислительных систем
Выполнила: студентка 201 группы
Проверил: Крылова С.Л.
1 Введение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
2 Физическая независимость данных. . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Логическая независимость данных. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4 Заключение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8
5 Список использованной литературы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Независимость данных — критический аспект при управлении любой системой баз данных. Она позволяет изменять приложения, не изменяя для этого структуру базы данных, и изменять конструкцию базы данных, не оказывая при этом влияния на работу приложений. Система управления базами данных не должна вынуждать выносить окончательные решения о том, какие данные должны сохраняться, как получать к ним доступ и что будет нужно пользователям. Система не должна становиться бесполезной при изменении потребностей.
По мере накопления опыта использования первых систем управления базами данных довольно скоро стало очевидным, что необходим дополнительный уровень независимости данных. Общая логическая структура данных, как правило, сложная, и по мере роста базы данных она неизбежно изменяется.
Поэтому важно обеспечить возможность изменения общей логической структуры без изменения при этом использующих ее многочисленных прикладных программ. В некоторых системах изменение общей логической структуры данных составляет форму ее существования, т. е. эта структура находится в состоянии постоянного развития. Поэтому требуются два уровня независимости данных. Мы будем называть их логической и физической независимостью данных.
DEV1-12. 05. Логическая структура данных
2 ФИЗИЧЕСКАЯ НЕЗАВИСИМОСТЬ ДАННЫХ
Физическая независимость данных означает, что физическое расположение и организация данных могут изменяться, не вызывая при этом изменений ни общей логической структуры данных, ни прикладных программ.
У физической независимости данных имеется много различных форм. Однако во всех случаях целью является возможность изменения организации физических данных без нарушения работоспособности любой прикладной программы, зависящей от старого формата данных.
Одним из примеров физической независимости данных является возможность системы баз данных разделить строки некоторой таблицы между несколькими дисками и/или несколькими узлами кластера без потребности модификации какого-либо приложения. Другим важным примером физической независимости данных является отображение полей каждой строки реляционной таблицы на разные диски. Хотя в системе баз данных каждая строка может отображаться на непрерывный контейнер хранения (например, запись) одной дисковой страницы, возможен также вариант, когда крупные атрибуты таблицы, обращения к которым происходят не очень часто (соответствующие большим текстовым объектам, изображениям JPEG или многомерным массивам), хранятся в отдельных контейнерах разных дисковых страниц и/или разных томов для максимизации общей производительности системы.
И снова подобные оптимизации физического хранения данных реализуются таким образом, чтобы быть совершенно прозрачными для прикладных программ, за исключением, возможно, изменения их производительности. В качестве аналога из научной области можно рассмотреть прикладную программу, в которой используется структура языка C для описания записей данных на диске, и физическая организация этих записей изменяется без потребности в переписывании и даже перекомпиляции прикладной программы (или любого другого приложения, обращающегося к тем же данным). При допущении применения таких методов физическая независимость данных позволяет добиться повышения производительности за счет распараллеливания, достигаемого путем реорганизации данных – без дополнительных усилий или с небольшими усилиями со стороны ученых.
3 ЛОГИЧЕСКАЯ НЕЗАВИСИМОСТЬ ДАННЫХ
В современных системах баз данных также обеспечивается логическая независимость данных, которая изолирует программу от изменений в логической организации базы данных – позволяя разработчиками добавлять и удалять в базе данных связи и информацию. Логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения прикладных программ (изменение, конечно, не должно заключаться в удалении из базы данных таких элементов, которые используются прикладными программами).
В то время как физическая независимость данных используется для сокрытия изменений в физической организации данных, логическая независимость данных скрывает изменения в логической организации данных.
Логическая независимость данных обычно поддерживается с использованием представлений (view). Представление определяет виртуальную таблицу, специфицируемую с использованием SQL-запроса над одной или несколькими базовыми таблицами и/или представлениями. Представления служат нескольким целям, включая повышение уровня безопасности (путем сокрытия атрибутов от приложений и пользователей, не обладающих истинной потребностью доступа к этим атрибутам) и улучшение производительности (путем материализации представлений, определенных с использованием сложных SQL-запросов над очень большими таблицами). Но, прежде всего, представления используются для обеспечения корректного функционирования старых программ даже при реорганизации используемой ими баз данных.
Например, рассмотрим программу, корректное выполнение которой зависит от некоторой таблицы T, которую администратор желает реорганизовать путем вертикального разделения на две части, сохраняемые в таблицах T’ и T». Для сохранения работоспособности приложений, зависящих от T, администратор может определить над T’ и T» представление, соответствующее исходному определению таблицы T, что позволит старым программам продолжать корректно функционировать.
Кроме того, данные эволюционизируют. Системы переходят от использования кодировки EBCDIC к ASCII, а затем к Unicode, от проприетарных форматов плавающих чисел к формату IEEE, от марок к евро, от восьмисимвольных имен в кодировке ASCII к тысячесимвольным именам в кодировке Unicode. Важно обеспечить выполнение этих изменений таким образом, чтобы не разрушить миллионы строк существующих программ, для которых желательно видеть эти данные по-старому. Для решения этих проблем используются представления, динамически транслирующие данные в соответствующие форматы (производя преобразования между символьными и числовыми видами, между почтовыми кодами, состоящими из шести и девяти цифр, между длинными и короткими именами, и скрывая от старых программ новую информацию). Проблема двухтысячного года (преобразование двухсимвольного формата года в четырехсимвольный формат) продемонстрировала большинству организаций важность независимости данных.
Для реализации и логической, и физической независимости данных в системах баз данных используется схема. В схеме базы данных сохраняются все метаданные, включая определения таблиц и представлений, а также информация о существующих индексах и о том, как таблицы отображаются на тома внешней памяти (и узлы в среде параллельных баз данных). Для независимости данных важно отделить данные и метаданные от программ, манипулирующих этими данными. В противном случае другие программы, по существу, не могли бы найти эти метаданные, что, в свою очередь, не позволило бы нескольким программам совместно использовать общую базу данных.
4 ЗАКЛЮЧЕНИЕ
Разделение программ и данных совершенствуется в объектно-ориентированном подходе. Классы данных, инкапсулирующие методы обеспечивают независимость данных и существенно облегчают эволюцию данных без затрагивания программ. Так что эти идеи все еще развиваются. Но ключевая идея этого раздела состоит в том, что для обеспечения независимости данных существенным является наличие явного и стандартного уровня доступа к данным с четкими метаданными и явным доступом к данным.
5 Список использованной литературы
- Дейт К. Дж. Введение в системы баз данных.: Пер. с англ. — 6-е изд. — К.: Диалектика,1999. – 784 с.
- Кагаловский М.Р. Энциклопедия технологий баз данных. – М.: Финансы и статистика, 2002. – 800с.
- Системы управления базами данных. Журнал издательского дома «Открытые системы», 1995 -2003 гг.
- Ульман Дж., Уидом Дж. Введение в системы баз данных./Пер. с англ. – М.: Издательство «Лори», 2000.- 374с.
- http://dssp.karelia.ru/~ivk/ book/2/2_1_1.html
- http://students-programmers. ru/tag/opisanie-dannyih/
- http://dssp.karelia.ru/~ivk/ book/2/2_1_3.html
Источник: www.stud24.ru
СУБД как средство обеспечения логической и физической независимости данных
База данных хранит не только рабочие данные организации, но и их описания. По этой причине базу данных еще называют набором интегрированных записей с самоописанием. В современных СУБД описание данных содержится в системном каталоге, а сами элементы описания принято называть метаданными, т.е. «данными о данных». Наличие самоописания данных в базе данных обеспечивает в ней независимость программ от данных и позволяет СУБД различать и поддерживать два независимых взгляда на базу данных, воплощенных соответственно в понятиях «логической» и «физической» независимости данных.
Логическая независимость данных означает, что общая структура данных может быть изменена без изменения прикладных программ. Представление данных в приложении не должно зависеть от структуры реляционных таблиц. Если в процессе нормализации одна реляционная таблица разделяется на две, представление должно обеспечить объединение этих данных, чтобы изменение структуры реляционных таблиц не сказывалось на работе приложений.
Под физической независимостью данных понимается способность СУБД предоставлять некоторую свободу модификации способов организации базы данных в среде хранения (например, с целью повышения эффективности баз данных), не вызывая необходимости внесения соответствующих изменений в логическое представление и не затрагивая созданных прикладных программ, использующих базы данных. Приложения не должны зависеть от используемых способов хранения данных на носителях, от аппаратного обеспечения компьютеров, на которых находится реляционная база данных.
Этот аспект использования СУБД, связанный с независимостью данных, определяется разным подходом к интерпретации данных в файловой системе и СУБД. В файловой системе, интерпретирующая информация закладывалась в программы, использующие данные. Это существенно повышает значимость программы, так как вне интерпретации данные представляют не более чем совокупность битов в некотором запоминающем устройстве. В условиях совместного использования данных при множестве различных приложений указанный подход можно применять только до определенного предела, так как написание множества программ, в которые встроены близкие (но не идентичные) механизмы интерпретации, становится весьма неэффективным.
В СУБД данные ассоциированы с механизмами их интерпретации. Поэтому не требуется закладывать интерпретирующую информацию в каждое приложение, использующее данные из базы данных. Таким образом, обеспечивается однократность интерпретирующей информации, что существенно меняет роль данных. Данные из баз данных уже нельзя рассматривать как совокупность битов, они приобретают определенную интеллектуальную окраску. В таком качестве их можно расценивать как семантически значимое представление части реального мира.
Существующие на сегодняшний день модели данных дают возможность представить лишь частичную семантику данных. Можно, конечно, считать, что этого недостаточно, и пытаться найти более привлекательную модель, которая полностью отражала бы семантику реального мира. Однако создание такой модели дело будущего, и приходится работать с существующими моделями данных, а недостающую семантику, как и прежде, закладывать в неявном виде в обрабатывающие программы.
Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:
Источник: studopedia.ru
47706 (Наращивание экономической и статистической информации в двухструктурных реляционных базах данных), страница 2
Документ из архива «Наращивание экономической и статистической информации в двухструктурных реляционных базах данных», который расположен в категории » «. Всё это находится в предмете «информатика» из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе «остальное», в предмете «информатика, программирование» в общих файлах.
Онлайн просмотр документа «47706»
Текст 2 страницы из документа «47706»
Эволюция концепций баз данных
Понятие база данных появилось в конце 60-х годов. До этого в сфере обработки данных говорили о файлах данных и о наборах данных.
До появления компьютеров третьего поколения (первые из них были установлены в 1965 г.) программное обеспечение обработки данных осуществляло в основном операции ввода-вывода. 0б организации данных приходилось заботиться при написании прикладных программ, и делалось это элементарным способом, т. е. данные обычно организовывались в виде простых последовательных файлов на магнитной ленте.
Независимость данных отсутствовала. Если организация данных или запоминающие устройства изменялись, прикладной программист должен был соответствующим образом модифицировать программы, заново их компилировать и затем отлаживать. Для того чтобы обновить файл, нужно было записать новый. Старый файл сохранялся и назывался исходным.
Предыдущий вариант также сохранялся, а нередко сохранялись и более ранние версии файла. Многие файлы использовались для одного приложения. Для других приложений часто использовали те же самые данные, но обычно в другой форме, с другими полями, и поэтому приходилось из одних и тех же данных создавать различные файлы. Вследствие этого уровень избыточности в системе был очень высок и существовали различные файлы, содержащие одни и те же элементы данных.
Иногда использовались файлы с произвольным доступом к данным, которые позволяли пользователю получить непосредственный доступ к любой записи в файле вместо того, чтобы последовательно просматривать весь файл. Средства адресации записей обеспечивались прикладным программистом при написании программы. Если изменялись запоминающие устройства, в прикладную программу необходимо было вносить большие изменения. На практике изменение запоминающих устройств неизбежно. Новая технология привела к значительному уменьшению затрат на хранение одного бита информации, а размеры файлов сегодня часто превышают по объему использовавшиеся ранее запоминающие устройства.[7].
Этап 2 (конец 60-х годов) характеризуется изменением по сравнению с этапом 1 как природы файлов, так и устройств, на которых они запоминались. Предпринимается попытка оградить прикладного программиста от влияния изменений в аппаратуре. Программное обеспечение допускает возможность изменения физического расположения данных без изменения при этом их логического представления при условии, что содержимое записей или основная структура файлов не изменяется.
Файлы, соответствующие этому этапу развития средств обработки данных, подобно файлам этапа 1, предназначаются для одного приложения или для тесно связанных между собой приложений.
По мере развития средств обработки коммерческих данных становилось ясно, что прикладные программы желательно сделать независимыми не только от изменений в аппаратных средствах хранения файлов и от увеличения размеров файлов, но также и от добавления к хранимым данным новых полей и новых взаимосвязей.[7].
Известно, что база данных представляет собой постоянно развивающийся объект, который используется возрастающим количеством приложений. К базе данных добавляются новые записи, а в существующие записи включаются новые элементы данных. Структура базы данных будет изменяться с целью повышения эффективности ее функционирования и при добавлении новых типов запросов. Пользователи будут изменять требования и модифицировать типы запросов на данные.
Структура базы данных является менее статичной, чем файловая структура. Элементы хранимых данных и способы их запоминания непрерывно изменяются. Если на организацию данных со стороны вычислительной системы накладывается ограничение в виде требования постоянства файловой структуры, то это приводит к тому, что в случае ее изменения программисты тратят много времени на модификацию существующих программ, вместо того чтобы заниматься разработкой новых приложений.
В одном случае может сообщаться только имя элемента данных или записи, которую он хочет получить. В другом случае (при наличии другого программного обеспечения) он должен был сообщать идентификацию элемента данных и имя набора, в котором этот элемент данных содержится.
Добавление новых элементов данных в записи без изменения прикладных программ возможно при том условии, что программное обеспечение связано с данными на уровне элементов данных (полей), а не на уровне записей. Это часто приводит к созданию сложных структур данных. Однако хорошее программное обеспечение баз данных избавляет прикладного программиста от трудностей, связанных со сложностью структуры. Независимо от того, каким образом данные организованы на самом деле, прикладной программист должен представлять себе файл в виде сравнительно простой структуры, которая спланирована в соответствии с его требованиями.
Программное обеспечение баз данных этапа 3 (начало 70-х годов) располагало средствами отображения файловой структуры прикладного программиста в такую физическую структуру данных, которая запоминается на реальном носителе и наоборот.
В зависимости от уровня программного обеспечения прикладной программист элемента данных должен также знать организацию файла данных. В этом случае ему, возможно, придется задать машинный адрес данных. Если отсутствует независимость данных, прикладному программисту необходимо знать точный физический формат записи. Самый худший вариант — это случай, когда программист должен быть “навигатором”.[7].
Процесс преобразования обращения прикладного программиста к логической записи или к элементам логической записи в машинные обращения к физической записи и ее элементам называется привязкой. Привязка — это связь физического представления данных с программой, которая эти данные использует. После выполнения процесса привязки программа уже не будет независимой от физических данных.[7, 3].
Итак, для 3-го этапа:
- Различные логические файлы могли быть получены из одних и тех же физических данных.
- Доступ к одним и тем же данным осуществлялся различными приложениями различными путями, отвечающими требованиям этих приложений.
- Программное обеспечение содержало средства уменьшения избыточности данных.
- Элементы данных являлись общими для различных приложений.
- Физическая структура данных независима от прикладных программ. Ее можно было изменять с целью повышения эффективности базы данных, не вызывая при этом модификации прикладных программ,
- Данные адресуются на уровне полей или групп. [7].
По мере накопления опыта использования первых систем управления базами данных довольно скоро стало очевидно, что необходим дополнительный уровень независимости данных. Общая логическая структура данных, как правило, сложная, и по мере роста базы данных она неизбежно изменяется.
Поэтому важно обеспечить возможность изменения общей логической структуры без изменения используемых при этом многочисленных прикладных программ. В некоторых системах изменение общей логической структуры данных составляет форму ее существования, т. е. эта структура находится в состоянии постоянного развития. Поэтому требуются два уровня независимости данных. Их называют логической и физической независимостью данных.
Логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения прикладных программ (изменение, конечно, не должно заключаться в удалении из базы данных таких элементов, которые используются прикладными программами).
Физическая независимость данных означает, что физическое расположение и организация данных могут изменяться, не вызывая при этом изменений ни общей логической структуры данных, ни прикладных программ.[7, 8, 3].
Этап 4 характеризуется идей логической и физической независимости данных; логическая структура данных может сильно отличаться от физической структуры данных и от их представлений в конкретных прикладных программах. Программное обеспечение баз данных будет фактически преобразовывать представление данных прикладного программиста в общее логическое представление, а затем будет отображать логическое представление в физическое представление данных.
Назначение такой структуры обеспечивает максимум свободы в изменении структур данных без переделки при этом выполненной ранее работы по формированию и использованию базы данных.
- База данных может развиваться без больших затрат на ведение.
- Средства, предусмотренные для администратора данных, позволяют ему выполнять функции контроллера и обеспечивать сохранность данных.
- Обеспечиваются эффективные процедуры управления защитой секретности, целостности и безопасности данных.
- В некоторых системах используются инвертированные файлы, позволяющие осуществлять быстрый поиск данных в базе данных.
- Базы данных конструируются для выдачи ответов на не планируемые заранее информационные запросы.
Требования, которым должна удовлетворять организация базы данных.
Изучением этого вопроса долгое время занимались различные группы людей в учреждениях, использующих компьютеры, в правительственных комиссиях, на вычислительных центрах коллективного пользования. Комитет CODASYL опубликовал отчеты на эту тему (CODASYL—организация, разработавшая язык КОБОЛ). Организации пользователей IBM SHARE и GUIDE в своем отчете сформулировали требования к системе управления базами данных. Организация ACiM (Association for Computing Machinery) также занималась изучением этого вопроса.
Источник: studizba.com