|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| • Структура DC • Контролируемые словари • Базовые элементы DC • Расширения простой модели DC • Уточнение элементов • Схемы кодирования • Базовый словарь • Основные принципы построения DC • Привязка DC к синтаксическим схемам |
|
![]() Система метаописаний Dublin Core Пиджин – особого рода язык,
предназначенный для удовлетворения потребностей в межэтническом общении Дублинское ядро
– Dublin Core (DC) – является,
пожалуй, самым грамотным и успешным проектом, связанным с разработкой
структуры метаописаний ресурсов. Инициативной группой (Dublin Core
Metadata Initiative, DCMI) был принят ряд точных концептуальных
решений, позволивший найти приемлемый компромисс между выразительностью
и простотой, естественностью и полнотой метаописаний. Поскольку проект
DublinCore построен весьма элегантно и, в то же время, эффективно, он
достоин подробного рассмотрения в качестве эталлоной на сегодняшний
день системы метаописаний ресурсов. В данном пункте
мы не только рассматриваем DC, но на примере этого успешного проекта
изложим основные принципы и правила построения систем метаописаний.
Инициативная группа по разработке DC была создана в 1995 году в ответ на очевидную необходимость появления эффективных механизмов поиска в Интернете. С самого начала она включает специалистов из разных областей – библиографов, архивистов, представителей гуманитарных школ, специалистов в области стандартизации, и информационных технологий. Первые встречи рабочей группы привели к разработке пятнадцатиэлементного Дублинского ядра, которое с тех пор остается относительно неизменным. Эта основа включает частично элементы, которые имеют одинаковые значения в совершенно разных предметных областях, например, относящиеся к созданию, именованию и определению предметной области ресурсов. В то же время другие, вероятно, выходят за рамки общепринятых, в частности, темпоральные (временные) и пространственные характеристики (элемент Coverage), а также элементы, ответственные за описание прав интеллектуальной собственности. Первоначальной целью DC-описаний были простые документы, разработанные в HTML. Такие документы обобщенно характеризуются не очень благозвучным по-русски понятием, как «документоподобные объекты» (document-like objects, DLO). Существенным качеством DLO является простота их структуры и жизненного цикла. В частности, концепция DLO не включает в себя ни подчастей (например, глав, параграфов и т.д.), ни сложных взаимосвязей с другими объектами – реальными или виртуальными. Конечно, имидж автономных, отдельных объектов, описанных одномерными каталожными записями, больше подходит к обычным книгам, стоящим на библиотечных полках. Для таких ресурсов как, например, базы данных, такой механизм представляется не совсем подходящим. С другой стороны, концепция DLO весьма полезна как простая метафора для характеризации разнообразных веб-ресурсов, которые формируют основу для междисциплинарного поиска и обмена информацией. Том Бейкер для характеристики простых описательных утверждений Дублинского ядра использовал такое понятие как «пиджин» (pidgin). Пиджин – особого рода язык, предназначенный для удовлетворения потребностей в межэтническом общении. Пиджин не является родным ни для кого из говорящих на нем (его название происходит из искаженного на китайский манер английского слова «бизнес»). Такой язык появляется, когда, например, представители разных этносов становятся беженцами, и попадают в один лагерь. Представители таких сообществ очень быстро развивают простой декларативный язык, обеспечивающий базовое общение между этническими группами. Пиджином можно назвать и язык разговорников – наборов основных фраз, предназначенных для туристов, когда они посещают чужую страну. Основными свойствами таких языков являются • очень
ограниченный словарь
• простая декларативная структура (как правило, использование высказываний в настоящем времени, без сложносочиненных и сложноподчиненных предложений). Представляется, что это наиболее точная характеристика набора базовых элементов Дублинского ядра. Дублинское ядро можно понимать как компактный язык для разработки утверждений определенных типов, описывающих ресурсы. В этом языке имеется два класса терминов – элементы («существительные») и квалификаторы («прилагательные»). Существительные и прилагательные в этом языке формируют простые предложения, предметом описания которых являются ресурсы. В многообразном мире Интернета DC является «простейшим всеобщим языком для виртуальных туристов», на котором могут общаться почти все. И пусть он не всегда обеспечивает глубокое описание сложных концептов, зато его легко понять. Структура DCСтруктурно Дублинское ядро
состоит из двух уровней
•
Simple Dublin Core – простой
уровень, который еще называется неквалифицированным;
• Qualified Dublin Core – квалифицированный уровень. Простой уровень состоит из 15 базовых элементов, квалифицированный уровень содержит еще один элемент – Audience, а также группу квалификаторов (атрибутов) базовых элементов, позволяющих уточнять информацию из базовых элементов метаописаний. Каждый элемент DC является опциональным (необязательным) и может повторяться в метаописании сколько угодно раз. Кроме того, порядок элементов в метаописании также никак не регулируется. Порядок, в котором несколько экземпляров одного и того же элемента (например, Creator – создатель) входят в метаопиание, может иметь значение в некоторых системах, но не гарантируется, что этот порядок будет сохраняться в других реализациях. Упорядочение зависит от синтаксиса, в котором реализуется Дублинское ядро. Например, в синтаксисе RDF/XML порядок поддерживается, а в HTML нет. Контролируемые словариВажная роль словарей в
информационных системах уже обсуждалась нами
выше. При наличии словаря значения для соответствующего поля
метаописаний выбираются из строго фиксированного множества слов,
ограниченного набором тщательно подобранных терминов. Это может очень
серьезно улучшить возможности автоматической обработки метаописаний, а
также повысить качество результатов поиска, поскольку компьютеры хороши
в побуквенном сравнении слов, но чувствуют себя намного хуже, когда
описание термина сделано в «человеческом» стиле, с синонимами,
контекстом и т.д. Без терминологического контроля несовместные и
некорректные метаданные способны самым плохим образом сказаться на
качестве результатов поиска информации.
Приведем несколько примеров контролируемых словарей. Стандарт ISO639 кодирует имена естественных языков. Версия ISO639-1 обеспечивает двухбуквенные обозначения языков, а ISO639-2 трехбуквенные. В таблице приведены некоторые коды, являющиеся элементами соответствующего контролируемого словаря:
Еще один пример
контролируемого словаря – уже упомянутая выше универсальная десятичная
классификация (УДК) – международная
библиотечно-библиографическая классификация, активно используемая
в библиотечном деле, а также работниками образования и науки. УДК
представляет собой иерархическую структуру, каждая вершина которой
помечена определенным цифровым кодом. Вот некоторые примеры:
Элементами словаря
являются коды. Каждый код обозначает некоторый класс
объектов предметной области. Например, УДК 517.1 обозначает
совокупность всевозможных материалов (книг, статей, учебников и т.д.),
имеющих отношение к началам математического анализа. При этом код 517.1
выступает в роли имени этой совокупности объектов, превращая эту
совокупность в ресурс (вспомним определение ресурса как любой сущности,
имеющей имя).
Элементы
больших словарей, как правило, образуют сложные
иерархические системы – таксономии. Если моделируемая предметная
область имеет сложную организацию и большое количество разнообразных
объектов, то количество элементов в словаре также достаточно большое.
Например, УДК имеет более ста двадцати тысяч элементарных кодов. С
учетом богатых возможностей УДК по образованию сочетаний общее
количество вариантов приближается к бесконечности. По сути, это
группирование объектов предметной области в классы с определением
отношения наследования. При разработке метаданных регулярная
иерархическая структура в значительной степени облегчает выбор нужного
элемента описания. Таксономии также являются одной из основ для
построения «интеллектуальных» сервисов обработки метаданных.
Но эти качества уже выходят за рамки понятия «словарь». Они будут рассмотрены нами в последующих пунктах этой главы. Здесь можно провести аналогию с энциклопедиями, которые формируют совокупность терминов в алфавитном порядке. Понятно, что объясняемые в энциклопедии термины имеют сложные взаимосвязи, соответствуют разным классам объектов и т.д., но явно это никак не влияет на структуру энциклопедии, которая представляет собой словарь с упорядоченными в алфавитном порядке терминами. Ценой использования таких контролируемых словарей является необходимость существования некоторой административной группы, которая поддерживает существование, строгость и развитие того или иного словаря. Например, библиотека конгресса США поддерживает словарь LCSH (US Library of Congress Subject Headings). Консорциум UDC поддерживает УДК. Кроме того, нетривиальной задачей является продвижение словаря в сообщество, обучение словарю людей, занятых работой с метаданными. Сегодня ситуация не очень хорошая. Например, из десяти изданных в России книг, взятых нами наугад, только две имели корректные коды УДК. У остальных книг коды либо не соответствовали тематике, либо были устаревшими. Это довольно серьезная проблема, поскольку вряд ли можно построить поисковую систему на некорректных данных. Системы поиска и обработки метаданных должны отличать ситуации, когда в метаданных используется не обычное ключевое слово, а термин из словаря. Для этого служат специальные квалификаторы, которые явно указывают на используемый в данном метаописании словарь. Базовые элементы DCНиже представлены базовые
элементы DC с описаниями и рекомендациями для
разработчиков метаданных (с использованием материалов из ряда
источников).
Базовые элементы DC на сегодняшний день являются основой для многих
систем метаописаний, и в первую очередь, образовательных. В частности,
на Дублинское ядро опирается система метаописаний IMS/LOЬ. Кроме того,
на примере базовых элементов можно
продемонстрировать ряд важных тонкостей и полезных деталей, связанных с
созданием метаописаний ресурсов. Поэтому мы уделим внимание каждому
базовому элементу Дублинского ядра, дав стандартное описание элемента,
рекомендации для разработчиков метаданных, а также наиболее характерные
примеры использования элементов. В примерах элементы будут
представляться в виде пар
атрибут = значениегде атрибут – это имя ресурса, а значение – характеристика, присвоенная ресурсу. Рассмотрим базовые элементы Дублинского ядра, а также примеры и рекомендации по использованию полей. Title (название, имя ресурса)
Примеры: title = "Курс математического анализа" title = "Учебник полифонии" title = "Коммерсантъ" Creator (создатель ресурса)
Примеры: Creator = "Shakespeare, William" Creator = "Манцивода Андрей Валерьевич" Creator = "ЦРУ" Subject (предметная область ресурса)
Примеры: Subject = "открытое образование" Subject = "УДК 517.1" Subject = "Маркс Карл" Description (Текстовое описание содержимого ресурса)
Примеры: Description = "Эта книга посвящена использованию современных информационных технологий для развития распределенных систем открытого и дистанционного образования" Publisher (публикатор)
Пример: Publisher="Российский государственный институт открытого образования” Publisher="Издательство Детгиз" Contributor (участник создания ресурса)
Примеры: Contributor = "Ресторан Славянский Базар" Date (Дата)
Пример: Date="1998-02-16" Date="1998-02" Date="1998" Type (тип ресурса)
Примеры: Последовательность, определяющая «Каталог выставки электронного искусства»: Type="Image" Type="Text" Type="Каталог выставки" Первые два значения принадлежат словарю DCMI Type Vocabulary. Третье не специфицировано. Понятие «Интерактивная мультимедийная образовательная программа»: Type="Image" Type="Text" Type="Software" Type="Interactive Resource" Все значения взяты из словаря DCMI Type Vocabulary. Format (физическое или цифровое представление ресурса)
Примеры: Title="Dublin Core icon" Type="Image" Format="image/gif" Format="4 kB" Title="Мона Лиза в бигуди" Type="Image" Format="image/jpeg" Format="210 x 320 pixels" Date = “1994” Title="Синий гребень" Creator="Кандинский Василий" Type="живопись" Format="масло" Format=”картон” Format="104 x 133 cm" Identifier (идентификатор ресурса)
Примеры: Title="открытое образование" Identifier="http://www.openet.ru/glossary#open-education" Subject="словарь" Identifier="ISBN:0385424728" Source (источник ресурса)
Примеры: Source=”Третьяковская галерея” Source=”Картинка из издания Ромео и Джульеты 1922 года, стр. 54” Source=”http://www.izvestia.ru” Language (язык ресурса)
Примеры: Language="ru" Language="fr" Language="Русский с резюме на английском" Language="en-US" Relation (взаимосвязь ресурса с другими ресурсами, свойства
Примеры: Title="Теория моделей" Relation="Справочная книга по математической логике в 4-х томах" [Отношение “являться частью” (IsPartOf). “Теория моделей” – первый том четырехтомника] Title="Краткий курс математического анализа. Электронная версия" Relation="Курс математического анализа. Электронная версия" [Отношение ”являться версией” (IsVersionOf). Краткий вариант электронного учебного пособия по математическому анализу является версией курса в целом] Title="Рапсодия" Creator=”Рахманинов” Relation="Компакт-диск" [Отношение «являться форматом» (IsFormatOf)] Title="О русской повести и повестях г. Гоголя" Relation="Миргород" [Отношение «ссылается-на» (References). В статье В.Белинского дается характеристика сборника повестей Гоголя «Миргород»] Title="Иван Васильевич меняет профессию" Relation="Иван Васильевич" [Отношение «базироваться-на» (IsBasedOn) (фильм снят по мотивам пьесы Булгакова)] Title="Автомобиль" Relation="Бензин" [Отношение «требует» (Requires)] Обратите внимание на то, что в базовом DC никак не уточняется тип отношения (конкретизация отношений появляется только в квалифицированном Дублинском ядре). Поэтому в базовом варианте системы метаописаний можно зафиксировать только факт, что данные ресурсы каким-то образом связаны. Coverage (временная и пространственная область действия)
Примеры: Coverage="1995-1996" Coverage="Иркутская область" Coverage="Серебряный век" Coverage="20 км на север от Брюсселя" Rights (имущественные и авторские права)
Примеры: Rights="Пиво только членам профсоюза" Rights="http://cs-tr.cs.cornell.edu/Dienst/Repository/2.0/Terms" Расширения простой модели DCПо свидетельству Карла
Лагоуза первые же дискуссии
разработчиков DC обнажили внутренний раскол между минималистами и
структуралистами. Минималисты говорили, что значение Дублинского ядра
состоит в согласованном множестве широких категорий, используемых для
создания простых метаданных в формате «атрибут = значение». Вторые
видели в Дублинском ядре основу богатого и однородного языка описаний –
«эсперанто» метаданных. Это движение в сторону большей сложности было
мотивировано желанием построить формат описаний, который мог бы
описывать ресурсы детализировано, аналогично тому, как это делается в
типичных библиографических каталогах. В 1997 году было принято решение,
согласно которому DC должен был быть расширен с помощью так называемых
квалификаторов, позволяющих уточнять утверждения о ресурсах. Данное
расширение Дублинского ядра было сделано чрезвычайно аккуратно, и
допускало, по сути, только два типа квалификаторов. Первый из них
касался уточнения самого элемента, а второй – уточнения допустимых
значений элемента:
Уточнение элементов. Эти квалификаторы делают значение элемента более узким и специфичным. Уточненный («квалифицированный») элемент имеет тот же смысл, что и неуточненный элемент, но с более узкой и строгой областью действия. Например, общее понятие Creator (создатель) может быть уточнено более конкретным понятием Author (автор). Пользователь (программа, сервис или человек), который не понимает смысла данного уточнения, должен иметь возможность игнорировать квалификатор и работать с элементом, как если бы он был неквалифицированным. Строгие и корректные определения уточнений элементов должны быть публично доступными. Схема кодирования. Квалификаторы этого вида определяют схему интерпретации («понимания») значений элементов. Эти схемы включают в себя контролируемые словари, условные обозначения или правила разбора (парсинга) значения. Значение, сформированное в соответствии со схемой кодирования, будет либо элементом некоторого контролируемого словаря (например, термином из некоторой классификационной иерархии, такой как УДК), либо строкой, сформатированной в соответствии с формализованной нотацией (например, «1960-12-20» в качестве стандартной записи даты). Если схема кодирования непонятна обработчику, значение элемента все равно должно остаться полезным для читателя-человека. Строгое описание схемы кодирования для квалификаторов должно находиться в свободном доступе. Любой квалификатор Дублинского ядра должен принадлежать одному из этих двух типов. В примерах квалификаторы элементов будем записывать через двойное двоеточие. В зависимости от типа квалификатора, он находится либо слева, либо справа от равенства.
и так далее. Те
квалификаторы, которые находятся в левой части
равенства, имеют тип уточнения элементов. Те из них, которые находятся
в правой части, имеют тип схемы кодирования.
Кроме квалификаторов, расширение простой модели DC включает новый – шестнадцатый – элемент
Пример использования: Audience = “Старшие классы средней школы” Уточнение элементов Дублинского ядраТеперь перечислим уточнения элементов DC, принятые к настоящему времени.
Схемы кодирования Дублинского ядраКроме уточнения самих
элементов квалифицированный DC позволяет уточнять
типы значений элементов. Это делается через схемы кодирования. Схемы
кодирования либо уточняют словарь значений, из которых можно выбирать
нужные, либо фиксируют строгий формат, в котором должна быть
представлена строка-значение. Кратко перечислим словари и форматы
представления значений, которые к настоящему времени рекомендуются
Дублинским ядром.
Базовый словарь типов ресурсовУделим особое внимание
ключевому словарю Дублинского ядра – DCMI
Type
Vocabulary, – определяющему тип ресурса. Этот словарь является
базовым
классификатором ресурсов, и должен пониматься практически всеми
системами, поддерживающими Дублинское ядро. Поэтому его использование
предоставляет возможности работы с ресурсом даже тем системам, которые
не способны обрабатывать более специфическую информацию из других
элементов. Этот словарь состоит из следующих элементов:
Основные принципы построения DCК серьезным достижениям
группы разработчиков Дублинского ядра следует
отнести тщательно продуманные принципы построения системы метаописаний.
Простота Это ключевой
принцип построения, обеспечивающий широкое
распространение системы метаописаний. Множество основных элементов DC
является предельно компактным, тщательно продуманным, и состоит всего
из 15 элементов. Этот набор сформирован таким образом, что позволяет
даже неспециалисту корректно подготовить метаописания ресурсов, и в то
же время обеспечивает эффективный доступ к этой информации в сетевой
среде.
Всеми понимаемая семантика Серьезной
проблемой при поиске и обработке информации в
информационных и, в частности, образовательных системах является
различное понимание одних и тех же терминов. Смысл терминов меняется
как от одной предметной области к другой, так и от одного сообщества
людей к другому сообществу. В этой ситуации DC предлагает тонко
настроенный набор элементов, которые везде понимаются одинаково.
Разработчикам DC удалось найти такую обобщенную терминологию, которая в
том или ином случае может проявляться по-разному, но при этом быть всем
понятной. Например, элемент Creator обозначает создателя ресурса в
широком смысле, который в разных ситуациях может оборачиваться автором,
разработчиком и т.д. Поэтому «создатель» в DC определяется в довольно
абстрактных терминах как сущность (организация, персона, сервис и пр.),
ответственная за создание ресурса.
Интернационализация Набор
элементов DC был первоначально разработан на
английском языке, но имеет версии на многих других языках – финском,
норвежском, тайском, японском, французском, португальском, немецком,
греческом, индонезийском, испанском. Русский эквивалент DC используется
в универсальной модели описания образовательных ресурсов,
разрабатываемой в рамках ИОС ОО РФ.
Несмотря на то, что технические сложности интернационализации в спецификации Дублинского ядра непосредственно не затрагиваются, вовлечение в работу инициативной группы представителей разных наций и стран обеспечило учет многоязыковой и межкультурной среды при разработке стандарта. Расширяемость Обеспечивая
простоту базового набора элементов описаний,
инициативная группа по разработке DC учитывала часто возникающую
потребность в продвинутых («профессиональных») метаописаниях ресурсов,
включающих разнообразную, подчас специализированную, информацию о
предмете описания. Для этого в DC включен механизм расширения набора
элементов. Предполагается, что другие эксперты в области метаописаний
могут создавать и развивать свои собственные наборы элементов,
настроенные на нужды их сообществ и предметных областей. Однако,
поскольку ядром этих метаописаний служит DC, то даже очень
специализированные описания будут иметь общую часть, понимаемую всеми.
![]()
Как отмечалось выше, в этом
смысле DC выступает в роли
«пиджина» – упрощенного языка, одинаково понимаемого разными
сообществами. «Графически» это представлено на рисунке. Такое
использование DC является основой для интероперабельности между разными
сообществами, предметными областями, образовательными системами и т.д.
Title = “Мона Лиза в бигуди”
Creator = “Леонардо да Винчи” Creator = “Джордж Кастальдо” Date = “1506” Date = “1994” Coverage = “Лувр” Identifier = “ http://www.studiolo.org/Mona/MONA08.htm ” Format = “image” Format = “12597 B” Format = “210 x 320 pixels” В соответствии с принципом
«один-к-одному» каждый ответ на вопрос «Кто
является создателем ресурса?» дан в метаданных в виде отдельного
утверждения (DC-элемента). То же самое касается дат, связанных с данным
ресурсом. Отметим, что основной набор элементов не позволяет уточнить
роль приведенной даты в жизненном цикле ресурса. Для того, чтобы это
сделать, нужно использовать квалификаторы элементов.
Привязка DC к синтаксическим схемамСинтаксис представления
элементов DC в основных спецификациях
Дублинского ядра никак не регламентируется. Дублинское ядро
представляет собой абстрактную систему элементов, которая может быть
реализована с помощью различных синтаксических схем. Это позволяет
Дублинскому ядру влиять на самые разнообразные проекты, основанные на
разнообразных синтаксических решениях. Разработчики DC лишь выработали
набор общих рекомендаций, которые должны быть учтены в конкретных
синтаксических схемах, реализующих Дублинское ядро.
Пространства именДля основных элементов
Дублинского ядра рекомендуется использовать
следующее пространство имен:
xmlns:dc="http://purl.org/dc/elements/1.1/"
Префикс dc является
стандартным префиксом для основных элементов
Дублинского ядра. Например,
<dc:creator>Alexander
Pushkin</dc:creator>
Для квалификаторов предусматривается следующее пространство имен: xmlns:dcterms="http://purl.org/dc/terms/"
Наконец, для уточнения
значений элементов с помощью их типизации
рекомендуется использовать пространство имен для типов данных XML-схемы:
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
поскольку типизация
значений DC-элементов унаследована от типов данных
значений в XML-схеме.
Начнем с общих рекомендаций. Рекомендация 1Разработчикам
рекомендуется строить XML-приложения на основе XML-схем,
а не DTD, поскольку XML-схемы более гибкие и более удобные при
использовании другими XML-приложениями.
Рекомендация 2Разработчики должны
использовать пространства имен, чтобы уникальным
образом идентифицировать DC-элементы, их уточнения и схемы кодирования.
Теперь рекомендации,
связанные с реализацией простого Дублинского ядра.
Абстрактная модель простого DCхарактеризуется следующими
базовыми позициями, которые должны быть
отражены в реализации:
• В
простом DC одна запись
представляет собой набор из одного или нескольких свойств вкупе со
значениями, ассоциированными с этими свойствами
• Каждый DC-элемент представляет собой свойство (атрибут) описываемого ресурса. • Каждое включенное в описание ресурса свойство должно быть одним из 15 базовых элементов Дублинского ядра. • Каждое значение свойства представляет собой строку символов. • При необходимости строка символов должна быть явно привязана к языку, на котором она записана. Рекомендации, связанные с простым DC: Рекомендация 3Разработчики должны
представлять свойства как XML-элементы, а значения
– как содержимое этих элементов. Например, вариант
<dc:title>Dublin Core
in
XML</dc:title>
является более предпочтительным, чем <dc:title value="Dublin
Core
in XML" />
Рекомендация 4Имена DC-элементов в
XML-документах должны быть написаны строчными
буквами:
<dc:title>Dublin Core
in
XML</dc:title>
предпочтительнее, чем <dc:Title>Dublin Core
in
XML</dc:Title>
Рекомендация 5Несколько значений одного
DC-свойства должны быть представлены с
помощью нескольких XML-элементов – по одному на каждое значение
свойства:
<dc:title>First
title</dc:title>
<dc:title>Second title</dc:title> Для квалифицированного
Дублинского ядра, в котором элементы уточняются
с помощью набора квалификаторов, имеются следующие рекомендации.
Абстрактная модель квалифицированного DCимеет следующие базовые
свойства:
• В
квалифицированном DC (также,
как и в простом) одна запись представляет собой одно или несколько
свойств со значениями, ассоциированными с ними
• Так же, как и в простом Дублинском ядре, каждый DC-элемент представляет собой свойство (атрибут) описываемого ресурса. • Каждое свойство представляет собой: o либо один из базовых
DC-элементов;
• Экземпляры описания свойства могут повторятьсяo либо один из других элементов, рекомендованных DCMI [DCTERMS] (например, audience); o либо одно из уточнений базовых DC-элементов • Каждое значение свойства является символьной строкой • Каждая строка может иметь сформирована в соответствии с некоторой схемой кодирования. • Каждая схема кодирования должна иметь имя; • Каждая символьная строка может быть привязана к определенному языку, на котором она сформулирована. Рекомендации для квалифицированного Дублинского ядра: Рекомендация 6Уточнения элементов должны
обрабатываться в том же стиле, что и
основные элементы Дублинского ядра. Например,
<dcterms:available>2002-06</dcterms:available>
То есть уточнения
элементов должны вести себя как другие DC-элементы.
Рекомендация 7Схемы кодирования
элементов должны реализовываться с помощью атрибута
xsi:type в пространстве имен xsi, например,
<dc:identifier
xsi:type="dcterms:URI">http://www.openet.ru</dc:identifier>
Рекомендация 8Уточнения элементов и
схемы кодирования должны использовать имена,
являющиеся терминами метаданных из [DCTERMS],
например,
<dcterms:isPartOf
xsi:type="dcterms:URI">
http://www.bbc.co.uk/ </dcterms:isPartOf> <dcterms:temporal
xsi:type="dcterms:Period">
name=The Great Depression; start=1929; end=1939; </dcterms:temporal> И, наконец, Рекомендация 9В тех случаях, когда
значения элементов относятся к определенному
естественному языку, это должно быть явным образом указано с помощью
атрибута xml:lang:
<dc:subject
xml:lang="ru">морепродукты</dc:subject>
<dc:subject xml:lang="en">seafood</dc:subject> <dc:subject xml:lang="fr">fruits de mer</dc:subject> В заключение приведем
пример записи метаданных на языке XML,
построенный в соответствии с перечисленными рекомендациями:
<?xml version="1.0"?> <metadata xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/"> <dc:title> Automated Theorem Proving </dc:title> <dc:creator> Mantsivoda Andrei </dc:creator> <dc:creator xml:lang="ru"> Манцивода Андрей Валерьевич </dc:creator> <dc:subject xsi:type=dcterms:UDC> 681.3 </dc:subject> <dc:subject xml:lang="ru"> искусственный интеллект </dc:subject> <dcterms:abstract xml:lang="ru"> Работа представляет собой обзор
методов автоматического доказательства
теорем
</dcterms:abstract><dc:date> 2004-04-04 </dc:date> <dc:type> Article </dc:type> <dc:format> LaTeX </dc:format> <dc:identifier> http://andrei.baikal.ru/atp2004 </dc:identifier> <dc:language> ru </dc:language> </metadata>
![]() |
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||