ФГБУ НТЦ Информрегистр - Антопольский А.Б., Ауссем В.И., Блау С.А., Жежель А.И.. Исследование и разработка системы метаданных для электронных информационных ресурсов и сервисов в фундаментальной науке

Антопольский А.Б., Ауссем В.И., Блау С.А., Жежель А.И.. Исследование и разработка системы метаданных для электронных информационных ресурсов и сервисов в фундаментальной науке



Отчет
о результатах работ по гранту РФФИ № 04-07-90087
"Исследование и разработка системы метаданных
для электронных информационных ресурсов и сервисов
в фундаментальной науке"

Антопольский А.Б., Ауссем В.И., Блау С.А., Жежель А.И.

Москва, 2004 г.

Содержание

Введение

1. Предметы и цели метаописаний научных информационных ресурсов

2. Системы предметно-тематического поиска в сети Интернет и используемые ими метаданные

2.1. Универсальные "поисковые машины"

2.2. Некоторые региональные Интернет-каталоги и системы

3. Специализированные научные сайты и порталы, их поисковые и иные сервисные возможности

3.1. Некоторые примеры ведущих научных информационных сайтов

3.2. Дополнительные услуги российских научных информационных сайтов и порталов

3.3. Научные WEB-порталы и распределенные информационные системы

3.4. Виртуальные музеи

4. Системы метаданных и их использование для организации научных информационных ресурсов и сервисов

4.1. Разработка формальных моделей, языков и программного инструментария систем метаданных. Их реализация в сети Интернет.

4.2. Универсальные системы метаданных и их применение для создания каталогов научных и образовательных ресурсов

4.3. Проект ИСИР

4.4. Специализированные системы метаданных и их использование

4.5. Метаописания Web-сервисов. Спецификация UDDI.

4.6. Разработка интерфейсов к разнородным ресурсам на основе стандартов метаданных

Введение

При решении любых задач поиска, отбора информации из крупных информационных массивов, задач управления такими массивами возникает необходимость избежать сплошного просмотра и анализа, пусть даже в той или иной степени автоматизированного, всей имеющейся информации. Гораздо предпочтительнее получить компактно записанные стандартизованные данные о представляющих интерес аспектах рассматриваемых информационных объектов. Подобные данные об информации вполне естественно называть метаданными. Типичным примером метаданных являются, например, библиографические описания и выходные данные книг и других изданий.

Набор метаданных о том или ином информационном объекте составляет его метаописание. Объекты метаописаний могут быть весьма различны по уровню: от отдельных записей, документов, статей, разделов и глав монографий и научных трудов до огромных сложноструктурированных информационных массивов информации, интернет-порталов, крупных архивов и библиотек. Структура и состав метаописаний, очевидно, в значительной степени должны зависеть от уровня, типа и физической природы описываемых информационных объектов.

Требования к метаописаниям определяются также составом задач управления информационными массивами, для решения которых эти описания используются. Характер решаемых задач управления влияет, например, на наличие и степень отражения содержательных, организационных, технологических, правовых, экономических и других аспектов, связанных с описываемыми объектами. Задачи оптимизации поиска информации, в свою очередь, определяют необходимость наличия подробных адресных и идентификационных метаданных.

Помимо типа описываемых объектов и характера решаемых задач на состав используемых метаданных оказывают влияние и особенности сферы использования информации. Так, требования к метаописаниям управленческой документации, правовых документов, научной и художественной литературы могут в значительной степени отличаться друг от друга. Одной из сфер, предъявляющей наиболее разнообразные требования к описанию обращающейся в ней информации (особенно ее содержания), является фундаментальная наука.

В научном информационном пространстве, значительная часть которого формируется в Интернет, в основном в Web, генерируются многочисленные информационные ресурсы, различающиеся по самым различным параметрам. Это ресурсы различной структуры данных, различной тематики, посвященные объектам разной природы, использующие различный программный инструментарий. Эти ресурсы существенно разрознены, недостаточно структурированы и систематизированы. При создании их описаний недостаточное внимание уделяется вопросам интероперабельности, слабо применяются соглашения по стандартизации электронного представления информационных ресурсов, средства поддерживающие интеграцию информационных ресурсов, повышение качества поиска. В результате пользователь не может получить полную и достоверную информацию о ресурсах, представляющих для него интерес.

Очевидно, что каждая область науки оперирует своими специфичными данными и имеет потребность в собственных форматах их представления, что обусловлено требованиями функциональности соответствующих систем обработки информации. Этим объясняется малая степень интеграции научных данных, по сравнению с образовательными, библиотечными, и другими типами ресурсов.

Тем не менее, необходимость обеспечения активных научных коммуникаций, прежде всего на междисциплинарном уровне, требует решения задачи интеграции научных ресурсов, начиная с верхнего уровня. Именно исследование систем метаданных для информационных ресурсов фундаментальной науки как инструмента для их интеграции является основным содержанием первого этапа настоящей научной работы.

Конечная цель работы заключается в создании интерактивной Интернет-системы формирования метаописаний электронных научных информационных ресурсов. В связи с этим основное внимание исполнителей на первом этапе было сосредоточено на особенностях систем метаданных, применяемых именно для описания электронных информационных ресурсов (прежде всего, сетевых). В то же время, авторы считают, что нельзя проводить резкую грань между методами описания традиционных и электронных документов и информационных массивов. Нельзя согласиться с высказываемым иногда мнением, что метаданными следует называть только "информацию о документе, понимаемую компьютером" [1].Семантические принципы описания, идентификации и поиска материалов научных исследований и разработок не зависят кардинально от технологии хранения и обработки информации. Речь может идти лишь о появлении новых, технологически обусловленных элементов описания и о повышении требований к формализации описаний. Последнее, правда, связано не столько с электронной формой самой описываемой информации, сколько с использованием метаописаний в системах автоматизированного поиска и обработки информации. Степень же формализации некоторых "традиционных" метаописаний (например, библиографического описания) весьма высока, что позволяет их использовать и в автоматизированных системах (непосредственно, при наличии соответствующего программного обеспечения, или как основу для "машинного" описания). Таким образом, несколько меньшее внимание к "традиционным" метаданным в настоящей работе объясняется их большей известностью и изученностью, а не их меньшей значимостью.

Также весьма важными, но не находящимися в центре внимания авторов настоящей работы, являются проблемы программно-технологической реализации существующих систем метаданных. Составляющие часть этих проблем вопросы использования протоколов и форматов, позволяющих формировать и предоставлять пользователям метаописания сетевых информационных ресурсов рассматриваются в разделе 4.1. ("Разработка формальных моделей, языков и программного инструментария").

Главным предметом исследований на данном этапе работы стала семантика систем метаданных, определяющая их состав и принципиальные возможности использования. Семантика и состав метаданных в свою очередь определяются решением уже упомянутых выше вопросов о составе объектов метаописаний и целях использования описаний. Рассмотрению именно этих вопросов посвящен первый раздел отчета.

Очевидно, что анализировать методы описания информационных ресурсов имеет смысл только на основе достаточно полного представления об особенностях нынешнего состояния, тенденциях развития и условиях функционирования описываемых научных информационных ресурсов. Поэтому два крупных раздела отчета (разделы 2 и 3) посвящены обзору наиболее характерных примеров научных информационных ресурсов, информационных систем и предоставляемых ими возможностей и услуг.

В последующих разделах отчета анализируются сведения о метаданных различных типов, выделяемых в связи с особенностями описываемых объектов и целями использования метаописаний.

Описания различных типов метаданных базируются на примерах из конкретных систем метаданных, используемых известными информационными системами. Несмотря на это, авторы сочли полезным привести отдельно краткие, но в то же время достаточно целостные описания ряда информационных проектов (прежде всего отечественных), основанных на создании и использовании универсальных и специализированных систем метаданных (см. раздел 4 отчета). В заключении на основе проведенного сбора и анализа сведений о системах метаданных намечены основные направления требований к методам построения и использования метаописаний информационных ресурсов для сферы фундаментальной науки.

В ходе настоящей работы широко использовались отечественные разработки и обзорные исследования в области создания и функционирования систем метаданных. Бесспорным лидеромобщих и теоретических разработок в области метаданных в России, включая, прежде всего формальные модели систем метаданных и онтологий, является в настоящее время научный коллектив под руководством проф. В.А.Серебрякова (ВЦ РАН). Публикации этого коллектива по данной проблеме весьма многочисленны [2-9] и посвящены различным аспектам рассматриваемой проблемы. В этом же ряду следует отметить работы М.Р.Когаловского [10-14], Л.А. Калиниченко [15], А.В. Манциводы [16] и ряда других исследователей. Представляют большой интерес такие обзорные работыкак указатель источников по метаданным в области науки, образования и технологий А.Лопатенко [17], каталог систем метаданных Ю.А. Хохлова и С.А. Арнаутова [18], обзорсистем метаданных, содержащийся в монографии А.Б.Антопольского [19] и ряд других.

Предметы и цели метаописаний научных информационных ресурсов

Проблема определения предмета описания непосредственно связана с задачами членения информационного массива (или, в некоторых случаях, скорее "потока информации") и идентификации информационных объектов. Наиболее очевидный и часто встречающийся способ членения информационного массива опирается на факт размещения несовпадающих (то есть не являющихся точными копиями друг друга по содержанию) подмассивов информации (документов, произведений и их совокупностей) на отдельных носителях информации. На этой основе строятся чаще всего описания книг, журналов и другой полиграфической продукции. Таковы же обычно и описания тиражируемых электронных изданий на съемных носителях (CD-ROM, CD-R, дискеты). Результаты этого способа членения информации определяются, очевидно, авторами и издателями.

При размещении информации в сети некоторым аналогом членения информационного массива по информационным носителям является соотнесение разных фрагментов массива с различными сетевыми адресами. Заметим, что иерархическая структура сетевых адресов позволяет, сохраняя данный принцип членения информации, создавать многоуровневые описания информационных ресурсов или, по крайней мере, выбирать уровень описания, в наибольшей степени соответствующий поставленным целям.

Следует отметить, что метаописание, содержащее электронный адрес информационного объекта (или программно связанное с этим адресом), является фактически описанием не только собственно информации, а некоторого элемента конкретной информационной системы со своими правилами и возможностями хранения, обработки, поиска и выдачи информации. В традиционной библиотеке или архиве аналогом такого описания является каталожная карточка, содержащая адрес (шифр хранения) книги, документа (единицы хранения).

Реально широко распространенными собраниями метаописаний, не содержащих адреса хранения информации, являются лишь библиографические и реферативно-библиографические издания. Система метаданных для них ограничивается фактически элементами "классического" библиографического описания. Во всех остальных случаях система метаданных может и должна включать интересующие пользователя сведения о порядке и условиях доступа к информации, предоставляемых информационной системой возможностях обработки информации. Особенно актуальной такая информация может быть для пользователей многих научных информационных систем, предоставляющих разнообразные возможности обработки информации (как содержащейся в системе, так и в ряде систем дополнительно вводимой пользователем), включая осуществление средствами системы различных вычислений, построение графиков и другие возможности. Такие дополнительные возможности информационных систем последнее время часто называют научными сервисами. Рассмотрению ряда существующих научных сервисов, связанных с теми или иными информационными ресурсами, и способов их отражения в метаописаниях ресурсов посвящен раздел 3.2. настоящего отчета.

В зависимости от поставленных целей предметом метаописания могут быть информационные единицы (фрагменты), меньшие, чем те, что объединяются единым носителем или сетевым адресом. Это, например, отдельные документы и статьи в сборниках (обычно в несетевых изданиях), разделы, главы некоторого произведения, фрагменты текста, несущие ту или иную смысловую нагрузку, фрагменты, имеющие разную семиотическую природу (текст на естественном языке, таблицы, рисунки, видео и так далее). В этих случаях идентификация объектов описания связана с членением целостных изданий и разметкой текста, осуществляемыми либо автором (составителем) и отражаемыми, например, содержанием (оглавлением) издания, либо дополнительно в рамках информационной системы, в которой эти издания, документы, информационные массивы планируется использовать. В качестве эффективного инструмента такой дополнительной разметки, эксплицитной с точки зрения автоматизированной обработки информации, широко применяется в настоящее время язык XML(ExtensibleMarkupLanguage – "расширяемый язык разметки"), точнее его синтаксис.

Еще чаще, чем фрагменты произведений (изданий, документов) предметом метаописаний становятся более крупные информационные объекты – базы данных, объединяющие множество отдельных документов или фактографических описаний отдельных объектов, электронные библиотеки, музейные, архивные и книжные коллекции, аудиа- и видеофонды и так далее. Во многих случаях такие совокупные объекты физически представлены на множестве разных носителей или занимают некоторое множество сетевых адресов, обычно связанных иерархически.

Следует отметить, что, несмотря на явную "многоуровневость" большинства информационных ресурсов,значительная часть применяемых ныне систем метаданных либо прямо "настроены" только на один уровень членения информационного континуума (обычно это уровень отдельных изданий или произведений), либо пытаются игнорировать, хотя бы на верхнем уровне своей структуры, различия предметов описания. Последнее характерно для так называемых универсальных систем метаданных, наиболее распространенным представителем которых сейчас стало Дублинское ядро (DublinCore, далее – DC). Стремление обеспечить единство структуры описания любых информационных объектов, облегчая в определенной степени автоматизированную обработку описаний, приводит в ряде случаев к фактической неоднозначности трактовки и практики использования некоторых элементов системы метаданных для объектов разного уровня.

Так, ясно, что интерпретации категории DC "создатель" ("creator") будут несколько различными, например, для документальной базы данных и для входящих в нее документов. В то же время, для многих пользователей их оценка необходимости к базе в целом может зависеть и от перечня авторов отдельных документов, вошедших в базу данных. Точное отражение семиотической природы информации (в DC, например, отражаемой обычно с помощью разных значений категории "тип ресурса" – текст, изображение, звук и так далее) легче удается в описаниях небольших информационных объектов (фрагментов). Для крупных объектов (книга, содержащая иллюстрации, тем более целая библиотека) часто указывается только превалирующая форма. То же можно отметить и в отношении такой традиционной категории метаописания как "язык" и некоторых других. Эти примеры свидетельствуют о желательности, по крайней мере в части случаев, создания взаимосвязанных описаний различных уровней представления (членения) информационных ресурсов.

Различные технологии разметки (прежде всего, XML-технологии) дают возможность создания удобных для использования в сетевом режиме описаний многоуровневых информационных объектов. Некоторые системы метаданных имеют средства для установления соответствий между различными описаниями (в DC, например, через категорию "связи"). В то же время, на практике почти не встречаются научные информационные системы, которые бы в явном, удобном для использования виде содержали взаимосвязанные метаописания как крупных информационных ресурсов, так и входящих в них объектов и фрагментов этих объектов.

Подобная ситуация объясняется, с одной стороны, большой трудоемкостью создания такой объединенной системы метаописаний для сколько-нибудь широкого круга крупных информационных ресурсов и упоминавшимися выше сложностями построения семантики системы метаданных для описания многоуровневых информационных объектов. С другой стороны, цели формирования массивов метаописаний в конкретных случаях связаны обычно с идентификацией ряда однородных объектов одного уровня, а не с решением задачи создания исчерпывающей информационной модели. Поэтому для того, чтобы перейти от описаний объектов одного уровня к описаниям объектов другого уровня чаще всего надо перейти к другому каталогу или другой, быть может связанной ссылками, поисковой системе (подсистеме).

Цели создания метаописаний в основном можно разделить на две группы: поиск информационных объектов и организация управления функционирования и использования этих объектов в информационной системе. Кроме того, метаописания могут использоваться с целью исследования существующих информационных ресурсов, например, для получения статистических сведений о них без непосредственного обращения к самим ресурсам. Исследовательские задачи, однако, являются, как правило, вторичными, и сами элементы метаописаний (метаданные) устанавливаются исходно для выполнения тех или иных функций при решении задач поиска или/и управления.

Характер и состав метаданных, используемых для поиска информационных объектов, определяются теми критериями, представлениями и знаниями, которые пользователи соотносят с требуемым предметом поиска. Чаще всего, особенно при поиске научных документов и их собраний, пользователь предъявляет требования к содержанию, предметной области искомых информационных ресурсов. Метаданными в этом случае следует считать любые элементы, используемые применяемой информационной системой для определения тематики просматриваемых документов (ресурсов, фрагментов и т.п.). Такие элементы обычно представлены различными классификационными индексами предметно-тематических классификаций, ключевыми словами, дескрипторами, стандартизованными элементами изображений и так далее. Поисковые элементы могут быть или заранее приписаны искомым объектам (в том числе составлять их специально выделенную часть) или вычленяться из текста (изображения) в ходе самого поиска средствами поисковой системы. При использовании предметно-тематических классификаций в сетевых гипертекстовых системах "приписывание" поисковых элементов ресурсам (или другим искомым информационным объектам) осуществляется обычно путем установления отсылки от рубрик классификации к соответствующим ресурсам и построения таким образом виртуального каталога ресурсов.

Так или иначе, состав метаданных, используемых для поиска информации по предметно-тематическому принципу, определяется применяемой информационно-поисковой системой, точнее, поисковым языком. Поэтому для охвата метаданных этой группы один из разделов настоящего отчета посвящен описанию основных поисковых систем ("поисковых машин") Интернета и ряда российских поисковых интернет-порталов (см. раздел 2).

Наиболее удобным непосредственно для человека (в отличие от автоматизированной системы) источником сведений о содержании отдельных документов и более крупных информационных объектов является, безусловно, текст на естественном языке в виде аннотации или реферата. Поэтому аннотации и рефераты остаются важной частью многих систем метаописаний информационных ресурсов.

Иногда в качестве дополнительного средства идентификации тематической направленности материалов могут использоваться и иные данные, не относящиеся к классификационным или лексическим единицам. Это, например, фамилии авторов и названия организаций, известных пользователю. Однако изначально подобные данные предназначены и чаще всего используются не для тематического поиска, а для поиска и идентификации конкретных документов, изданий, составных произведений и коллекций.

Классическим примером метаописания конкретного издания, документа является библиографическое описание. Оно охватывает сведения об издании в целом, месте, времени, объеме издания, лицах и организациях, имеющих отношение к созданию произведения и его изданию (авторы, составители, редакторы, издательство и т.д.). Еще больше сведений, прежде всего о процессе полиграфического производства издания (типография, тираж, шрифты, физические размеры и т.д.) традиционно приводится в выходных данных издания. Аналогичные по структуре описания используются для документов сферы управления, законодательных и иных нормативных актов, отчетных документов (в том числе в сфере науки). В подобных документах такие реквизиты как номер и дата принятия документа, орган, принявший документ часто являются основными поисковыми признаками документа.

Библиографические и близкие им по составу описания вполне приложимы и к электронным документам, изданиям, коллекциям. Лишь некоторые данные, связанные с полиграфическим исполнением (издательство, типография, тираж, метрические размеры) заменяются на сведения, характерные для цифровой реализации (наименование и владелец сайта, веб-дизайнер, объем в байтах, форматы, требования к программному обеспечению и т.п.).

Легко заметить, что только часть данных, входящих в библиографические и подобные им описания непосредственно используются для поиска информации, Обычно это наименование, автор, реже год и место издания, а в упоминавшемся случае официальных документов – номер, дата и наименование организации (органа власти). Ряд других сведений (язык, наличие таблиц, иллюстраций, фотографий, применяемый формат данных, требования к программному обеспечению и т.п.) используются обычно для дополнительного поиска или для "неавтоматизированной" оценки пользователем степени приемлемости для него конкретных материалов.

Как отмечалось ранее, метаданные применяются и в целях организации управления информационными ресурсами в конкретной информационной системе. Это, прежде всего, указания на то, какие процедуры, кем на каких и при каких условиях могут (или должны) осуществляться с данным информационным ресурсов (отдельным документом и даже частью документа). Этот класс метаданных используется, например, для управления доступом к данным, для организации процесса ведения информационных массивов, обмена данными между взаимодействующими системами и т.п. Примеры метаданных данного класса имеются в разделе 4 настоящего отчета.

Некоторые метаданные о функционировании информационного ресурса в конкретной системе могут быть интересны и для пользователя при определении желательности получения той или иной информации. Это, прежде всего, так называемый рейтинг ресурса, измеряемый часто количеством обращений к нему, но иногда и более сложным образом определяемой количественной оценкой качества материала.

Для информационного обеспечения научной сферы помимо сведений о самих информационных ресурсах и порядке их функционирования в информационной системе весьма часто для пользователя представляет интерес информация об исследовании, научном проекте, программе, в рамках или на основе которых создан информационный ресурс или отдельный научный документ. Такими сведениями могут быть, например, место проведения исследований, проект, программа, экспедиция, в которых получены результаты, описанные или использованные в работе, применявшиеся в ходе исследования методы, инструменты и так далее. В результате появляются возможности управления процессом консолидации разнородных массивов данных в рамках крупных научных проектов или для целых специализированных областей исследований. Примеры ряда научных проектов, использующих системы метаданных для организации своего внутреннего информационного пространства приводятся в разделе 4.6 настоящего отчета.

Суммируя сказанное в данном разделе, следует отметить, что метаданные могут относиться к объектам различного уровня, как например:

предметно-тематические области,

научные программы и проекты,

наборы и коллекции данных и документов,

конкретные произведения, их части и фрагменты,

реализации информационных ресурсов и отдельных документов в конкретных системах.

Кроме того, метаданные могут использоваться для решения многих различных (хотя и родственных) задач, как в интересах пользователей, так и владельцев информационной системы. Тем не менее, на практике существует стремление к целостному описанию информационных объектов. Это приводит к распространению в большей или меньшей степени универсальных наборов (систем) метаданных, постепенной стандартизации методов отражения конкретных значений метаданных в этих системах. В то же время, нельзя не отметить, что в большинстве случаев универсальные системы метаданных однозначно задают лишь общую структуру, синтаксис описаний, которые для многих конкретных систем оказываются избыточными, а для других – требуют расширения и спецификации отдельных параметров. Поэтому для исследования систем метаданных следует рассматривать не только их общую семантико-синтаксическую структуру и реализующие ее программные средства, форматы и протоколы, но и особенности функционирования как универсальных, так и узкоспециализированных научно-информационных систем, использующих те или иные виды метаданных. В связи с этим дальнейшие разделы настоящего отчета в основном связаны с описанием отдельных проектов и систем, показавшихся авторам наиболее характерными и перспективными с точки зрения применения метаописаний.

Системы предметно-тематического поиска в сети Интернет и используемые ими метаданные

В ряду известных и используемых в Интернете информационных поисковых систем (иногда называемые информационными машинами) можно выделить российские поисковые системы, среди которых основными можно считать Яндекс, Рамблер, Апорт, Mail.Ru, работающую в зоне рунета зарубежную систему Google. Проект системы Turtle, широко разрекламированный разработчиками, практически умер, не успев родиться. Помимо названных общеизвестных систем следует отметить многочисленный отряд региональных Интернет-справочников, каталогов и поисковых систем, действующих в зоне рунета и имеющих в составе ресурсов, предоставляемых ими, информацию по науке и технике.

Основным поисковым средством подобных систем является полнотекстовый лексический поиск. Кроме того, важнейшей и наиболее часто используемой услугой является предоставление пользователям предметного (предметно-тематического) каталога проиндексированных системой сайтов, обращение к которому позволяет сузить область поиска и тем самым уточнить запрос. Предметные каталоги, точнее лежащие в их основе классификации и рубрикаторы, являются представителями информационно-поисковых языков, и их можно рассматривать как один из видов метаданных.

Задача создания каталогов для того, чтобы ориентироваться в значительных объемах накопленной в Интернете информации, возникла уже к середине 90-х годов. Поэтому сначала за рубежом, а в 1995 г. в России ЦЭМИ РАН была начата работа над каталогом русскоязычных рeсурсов, который позже получил известность под названиями "Ау!" и @Rus. В настоящее время каталоги информационных ресурсов предоставляет подавляющее большинство информационных систем, однако различные системы используют свои методы каталогизации и способы описания информационных ресурсов. Универсальными поисковыми машинами практически не используются традиционные классификации и рубрикаторы, применяемые библиотечными и патентными системами, системами научно-технической информации, многими локальными информационно-поисковыми системами. Поэтому кратко рассмотрим особенности каталогов и некоторых других поисковых средств основных универсальных и ряда региональных поисковых систем.

2.1. Универсальные "поисковые машины"

Поисковая система Яндекс в настоящее время индексирует более миллиона российских и зарубежных русскоязычных серверов, а также серверов на территории бывшего СССР (всего более 175 миллионов оригинальных документов). Система обладает развернутой системой формирования запроса, в частности, допускается ввод поискового предписания на естественном языке – в этом случае все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима "Расширенный поиск", в котором применяется система многоступенчатых меню. Пользователю предоставляется возможность задать различные условия соответствия интересующих его слов и представления найденной информации: Пользователь может задать условия расположения искомых слов относительно друг друга, а именнно: слова должны располагаться или подряд, или в одном предложении, или не очень далеко, или на одной странице. Искомые слова могут быть где угодно в тексте документа, или в его заголовке, или в тексте ссылки. Можно задавать ограничения/уточнения по языку документа, его дате, формату представления данных и ряду дополнительных условий.

Каталог Яндекса содержит 15 предметных рубрик, среди которых была рубрика “Наука и образование”. Пользователь может ограничить область поиска, используя помимо предметных рубрик рубрики “Регионы”, “Справки” и “Типы сайтов”. Следует отметить, что в процессе работы над данным обзором этот каталог изменялся. Так, в рубрике “Наука и образование” еще в конце мая 2004 г. содержались следующие подрубрики: “Науки”, “ВУЗы”, “Курсы”, “Школа”, “Рефераты”, а к 20 числам июня состав подрубрик стал следующим: “ВУЗы”, “Абитуриентам”, “ЕГЭ”, “Курсы”, “Рефераты”, т.е. раздел “Науки” исчез с первого уровня каталога и перешел на второй уровень. Подобные изменения, очевидно, диктуются необходимостью соответствия актуальным запросам пользователей, в данном случае запросам на информацию от заканчивающих школу и поступающих в ВУЗы школьников и молодежи.

Для поиска научных информационных ресурсов, очевидно, нужно использовать рубрику «Учеба”, далее – подрубрику “Науки”, к которой на день анализа каталога был отнесен около 500 сайтов. Эта цифра, естественно, не является постоянной, т.к. сайты рождаются и умирают; но об умерших сайтах сведения не сообщаются, при обращении к ним пользователь получит просто сообщение системы о том, что доступ к сайту не возможен.

В подрубрике “Наука” представлены следующие группы сайтов:

Гуманитарные науки

Естественные науки

Технические науки

Конференции и семинары )

Научная периодика

Научно-популярные журналы

Универсальное

Анализ информации, выдаваемой системой на каждом из уровней каталога, показывает, что раздел “Наука” в Яндексе хорошо структурирован, есть разделение на гуманитарные, естественные и технические науки. Рубрика “Естественные науки” содержит в качестве следующего уровня их перечень. В большинстве случаев на этом уровне также существует возможность уточнить запрос и выйти на ограниченное множество сайтов. Так, выбрав в рубрике “Биология” подрубрику “Общая биология”, мы получили сведения о 44 сайтах, в основном, это сайты институтов Академии наук и ВУЗов, есть сайты, посвященные определенным проблемам и задачам. Например, сайт “Практическая молекулярная биология”, на котором помещено описание молекулярно-биологических методик, сведения о приготовлении и прописях растворов.

Поисковая система Ramblerявляется первой российской профессиональной поисковой системой, действующей с 1996 года. В 1997 году появляется Rambler's Top100 – уникальный рейтинг-классификатор, который не только оценивает на основе объективных данных популярность российских ресурсов, но и позволяет одним "кликом" перейти к ним. Возникновение такого универсального счетчика, способного направлять аудиторию на разные ресурсы, создало в российском Интернете активную, динамичную конкурентную среду. Веб-мастера стали более тщательно и вдумчиво работать над своими сайтами, стремясь занять в Топ100 более высокие строчки. Хороший рейтинг дает дополнительные преимущества – быстрый рост аудитории. Названия рубрик этого каталога-счетчика могут быть представлены в алфавитном порядке или сгруппированными по категориям.

Запущенная в 2003 году новая версия поисковой машины отличается значительно увеличенной скоростью поиска; а также тем, что, благодаря новой архитектуре системы, обновление поискового индекса происходит несколько раз в день. Кроме того, пользователям поисковой системы Rambler предоставлен новый механизм ассоциаций. Набрав в поисковой строке нужное слово, следует кликнуть на окно "найти", после чего открывается страница, в которой найденные документы расположены в порядке убывания релевантности (соответствия запросу). На этой же странице в самом низу есть строка "У нас также ищут". В ней приведено несколько слов и словосочетаний, тематически (ассоциативно) связанных с исходным запросом пользователя. Практически это – предоставление информационно-поискового квазитезауруса.

Для составления сложных запросов пользователь может использовать режим "Детальный запрос", который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.

На главной странице системы Рамблер представлен алфавитный каталог, режима Rambler”sTop 100, содержащий 54 предметные рубрики; которые могут быть сгруппированы в 10 категорий. Использование этого режима не предусматривает предоставления подробных описаний сайтов, соответствующих запросу пользователя; система дает перечень названий сайтов, который может быть отсортирован по количеству хостов, посетителей, хитов. О каждом сайте можно получить следующую информацию:

-адрес (страница/сервер);

-идентификатор в Rambler”sTop 100;

-дата регистрации;

-дата последнего обращения;

-количество уникальных хостов сегодня;

-количество посетителей сегодня;

-количество показанных страниц сегодня.

Результатом тематического поиска средствами Рамблер является перечень соответствующих запросу ресурсов, о каждом из которых предоставляется следующая информация: название ресурса, фрагмент текста, содержащий слова запроса, или перечень сервисных блоков сайта, идентификатор ресурса, его адрес в Интернете, дата регистрации, название рубрики.

В каталоге есть рубрика “Наука и техника”, подрубриками которой названы “Наука”, “Образование”, “Техника”, “Электроника”. Обращение к подрубрике “Наука” производит отбор сайтов, отнесенных к ней; на день анализа подрубрика содержала 500 сайтов. Отнесенные к этой рубрике сайты весьма различны не только по отраслям науки, но и по самому научному статусу: от сайтов институтов Академии наук РАН, электронных библиотек, научных и научно-популярных журналов до сайтов по оккультизму; причем, большинство сайтов практически не содержат крупных научных информационных ресурсов.

Система Googleпредставляет собой локализованный российский вариант глобальной поисковой системы. Главный каталог системы представлен на английском языке, а каталог для поиска в российской зоне Интернета – на русском. Режим “расширенного поиска” предоставляет пользователю при составлении поискового предписания форму, в которой можно задать условия поиска, используя различные типы метаданных (тема, автор, язык, дата, идентификатор сообщения, свободные или заданные последовательности слов и т.д.), что способствует повышению точности поиска.

Google является лучшей поисковой системой для поиска иллюстраций.

Система “Апорт!”,разработанная во второй половине 1990-х годов, к настоящему времени, возможно, несколько устарела, однако сохраняют ценность некоторые характеристики, в числе которых подсистема выдачи результатов: искомые слова показываются в контексте документа, что позволяет сразу же определить степень соответствия источника интересу пользователя. Система осуществляетинформационный поиск с учетом русской морфологии. Уточнение поиска возможно с использованием по разделам каталога и серверам. Каталог системы, особенно в его части “Наука и образование”, на наш взгляд, хорошо структурирован, и поиск по нему может быть полезен научным работникам и специалистам. Проведенный нами поиск по каталогу “Апорт” с использованием рубрики “Научно-техническая информация” дал более точный результат по сравнению с поиском средствами системы “Яндекс”.

В системе “Апорт!” имеются специальные режимы для поиска иллюстраций и аудио файлов. Стоит иметь ввиду, что "Апорт!" не ограничивает сферу деятельности только российскими или русскоязычными ресурсами: в его базе отражено большое число документов с зарубежных серверов. В "Апорт!" также включен справочник ресурсов Интернет.

Система Mail.Ru – первая рунетовская поисковая система, не индексирующая информационные ресурсы в Интернет самостоятельно, а покупающая результаты индексирования на стороне. Каталог системы содержит рубрику “Наука и образование”, обращение к ней переводит пользователя к следующему уровню, в котором есть возможность выделить естественные и общественные науки, однако в нем отсутствуют технические науки, и вообще этот каталог значительно проигрывает по сравнению с возможностями каталога системы “Апорт!”. При этом лексический поиск средствами Мэйл обеспечивает достаточно высокие результаты.

Поисковая система Лупа (www.lupa.ru ) демонстрирует весьма скромные показатели по сравнению с лидерами поискового сервиса, однако может быть полезна при поиске редких материалов. В разделе “Наука и образование” есть рубрика “Научные издания и публикации”, которая, в свою очередь, имеет раздел “Научные отчеты, статьи, публикации”. К сожалению, наряду с интересными сайтами и публикациями на них, система выдает вполне “винегретное” по тематике и степени научности множество сайтов, от статей Понтекорво об элементарных частицах до сайта по сатанизму.

В Интернет-справочнике Weblistотражаются не только российские серверы, но также и сайты ближнего зарубежья. Источники проаннотированы. Рубрика “Наука”, на наш взгляд, не является в настоящее время достаточно развитой.

Каталог ресурсов Улитка (http://www.ulitka.ru/)в настоящее время насчитывает более 35.000 ссылок. Пополняется регулярно, но не слишком оперативно. Следует отметить, что рубрика каталога “Наука, техника, производство” отбирает из массива около 5000 сайтов, которые можно отсортировать по алфавиту, дате занесения в каталог или количеству посещений. Такая возможность отнюдь не улучшает поисковые качества, так как пользователю выдается слишком большой не организованный по содержанию массив наименований сайтов, отнесенных к данной рубрике. Вряд ли этот каталог может быть удобен для поиска научных информационных ресурсов.

Многоязычный поисковый каталог MavicaNET. Интернет непрерывно растет, он включает огромное количество научных ИР на разных языках и становится все более доступным специалистам из разных стран. Цель данного каталога, размещенного по адресу http://www.mavicanet.ru/directory/rus/, - помочь пользователям Интернета из разных, прежде всего европейских, стран в поиске нужной информации на родном языке, в том числе научной направленности. Редакторы в каталоге MavicaNET работают на добровольной основе, для этого достаточно выбрать представляющие интерес категории (разделы) каталога и зарегистрироваться в системе. После регистрации редактор имеет право добавлять новые описания ИР и перемещать старые в структуре каталога. Однако деятельность добровольного редактора контролируется персоналом каталога MavicaNET.

Текущие параметры каталога: ссылок на ИР – 371990, категорий – 31016, поддерживаемые языки – 28 (прежде всего основные европейские языки, включая русский). Что значит – каталог MavicaNET поддерживает несколько языков? Это означает, что интерфейс каталога, названия управляющих элементов, названия категорий и описания ИР переведены на соответствующий язык. Язык просмотра каталога MavicaNET можно переключить на любой странице, чтобы все время работы с каталогом находиться в родной языковой среде. Содержимое ИР не переводится, их первоначальный язык сохранен.

Пользовательский интерфейс каталога MavicaNET очень удобен. Реализован контекстный поиск по содержимому ИР с учетом выбранного языка. В каталоге работают фильтры для детализации поиска и различные виды сортировки в категориях, однако процедура поиска путем навигации по категориям каталога несколько необычна. Это объясняется тем, что структура каталога MavicaNET – направленный граф со сросшимися ветвями. В результате, у одной дочерней категории может быть несколько родительских категорий. Поэтому к одной категории может вести несколько путей, которые показываются при навигации. Например, к ИР геологической разведки ведут два пути: 1) Культура->Наука->Науки о Земле->Геология->Геологическая разведка и 2) Культура->Наука->Науки о Земле->Геология->Ресурсы и ископаемые->Геологическая разведка. Категориями верхнего уровня являются: “Бизнес и экономика”, “Государство и право”, “Культура”, “Личная жизнь”, “Общество”, “По странам и регионам”, “Популярные темы”, “Природа” и “Техника и технологии”.

В настоящее время каталог MavicaNET реализован таким образом, что к большинству научных ИР путем навигации можно добраться только через категорию “Культура”. Что и вызывает недоумение в начале работы с каталогом, поскольку ожидалось появление научной категории на верхнем уровне. Да и предлагаемый состав дочерних научных категорий вызывает сильное желание поспорить. Вместе с тем, каталог MavicaNET является очень динамичной системой: его структура, объем наполнения, языковая поддержкапостоянно меняются и со временем он может стать достаточно популярным поисковым сервисом в национальных научных сообществах.

2.2. Некоторые региональные Интернет-каталоги и системы

Каталог УралWeb – каталог Интернет-ресурсов Большого Урала (Свердловская, Пермская, Челябинская, Оренбургская, Тюменская, Курганская области, Башкортостан, Удмуртия, республика Коми). Классический региональный каталог, отражающий сайты, располагающиеся в Уральском регионе или тематически с ним связанные. Имеется система удаления устаревших ссылок. Постоянно актуализируется. Имеет сравнительно хорошо структурированную рубрику "Наука и образование".

В Каталоге ресурсов Интернет в Сибири (http://intersib.ab.ru/) отражаются сайты, физически расположенные в Сибирском регионе. Описания снабжены аннотациями и указанием количества обращений к конкретному источнику. Возможен непосредственный поиск по ключевым словам с использованием для уточнения запроса перечня категорий. Имеется рубрика “Наука” представлены в приложениях. Отдельные сайты, отнесенные к этой рубрике, могут представлять интерес, однако вряд ли этот каталог имеет большую значимость для регулярного поиска научной информации, так как многие даже известные и доступные через универсальные каталоги сибирские научные сайты здесь недоступны.

Пермский поиск (http://search.perm.ru )- поисковая система, обеспечивающая учет документов, расположенных на серверах Пермской области. Каталог системы содержит рубрику “Наука и образование, в которой пользователь получает информацию справочного характера о серверах учреждений сферы образования и учебных заведениях.

Каталог Самарских Интернет-ресурсов (http://samaraweb.ru/) отражает сайты Самары и самарской области. Каталог имеет хорошую структуру и вполне качественно выполненные аннотации. В рубрике “Наука и образование” есть раздел “Научная информация”, к которому отнесены сайты, содержащие научную и околонаучную информацию. Во всяком случае, по сравнению с другими региональными сайтами наполнение этого раздела выглядит значительно интереснее.

Каталог ресурсов Интернет Тверского региона содержит сайты, расположенные в Тверской области. Учитываются только отдельные самостоятельные сайты, поэтому объем каталога еще не велик, однако рубрика "Наука и образование" уже сейчас охватывает сайты всех научных и образовательных учреждений и ассоциаций Твери. Аннотации отсутствуют. Возможен поиск по ключевым словам.

Рассмотренные в разделе 2 системы, справочники, каталоги, оперирующие с Интернет-ресурсами позволяют заключить, что выполняемая каталогизация ресурсов осуществляется либо путем индексирования Интернет-ресурсов, либо путем перечисления ресурсов. Описание ресурсов осуществляется на самом упрощенном уровне, обычно это – наименование ресурса, его URL, краткое содержание или характеристика ресурса, кодировка. В ряде случаев такой информации бывает достаточно, однако для описания научных ресурсов, очевидно, следует использовать более совершенные методы каталогизации с применением специальных систем метаданных.

Специализированные научные сайты и порталы, их поисковые и иные сервисные возможности

В настоящее время в сети Интернет имеется большое количество сайтов (и порталов), содержащих Web-сервисы для проведения фундаментальных научных исследований. Это прежде всего, сайты научных издательств; сайты научных библиотек; сайты научных обществ и организаций, представляющих информацию о своей научной деятельности; сайты (указатели, каталоги, поисковые машины), помогающие научной общественности найти необходимые информационные ресурсы и Web-сервисы.

Сайты, предназначенные для научных целей, характеризуются широким спектром разнообразия, однако определить состав типового сайта можно. Он, скорей всего, будет включать следующие основные разделы:

НОВОСТИ и ОБЪЯВЛЕНИЯ;

БАЗЫ ДАННЫХ (например, база данных, содержащая основные результаты исследований; библиографическая или полнотекстовая база данных по публикациям и учебникам в рассматриваемой области научных исследований);

ФОРУМ для организации и проведения тематических электронных конференций;

НОВЫЕ ЭЛЕКТРОННЫЕ ПУБЛИКАЦИИ для размещения электронных материалов по результатам новых исследований (данный раздел может формироваться на основе свободного доступа);

ССЫЛКИ на информационные ресурсы и Web-сервисы по рассматриваемой научной дисциплине.

Кроме того, типовой сайт по фундаментальной научной дисциплине может включать и дополнительные разделы:

ПОИСК по тематике (поисковый запрос и результаты поиска в виде ссылок на ресурсы могут поступать по e-mail);

ПОДПИСКА и РАССЫЛКА УВЕДОМЛЕНИЙ (например, при поступлении новых электронных публикаций);

ЭНЦИКЛОПЕДИИ, ЭЛЕКТРОННЫЕ СПРАВОЧНИКИ и СЛОВАРИ по тематике.

Отметим, что наименования разделов и доступных на сайте сервисов вполне логично рассматривать как специальные метаданные, характеризующие содержание и функциональные возможности связанных с этим сайтом информационных ресурсов.

Структура данных научной информации также отличается разнообразием: кроме обычных текстов, активно создается и распространяется научная информация в виде графики, ГИС, анимации, 3D-представлений, аудио, различных интерактивных систем и др.

3.1. Некоторые примеры ведущих научных информационных сайтов

Если проанализировать состав типового сайта, то можно сделать вывод, что основными Web-сервисами фундаментальной науки, в настоящее время, являются ИНФОРМАЦИОННЫЕ УСЛУГИ, включающие и поисковый сервис по конкретной тематике (поиск персоналий, организаций, публикаций), и аналитический сервис на основе собранных статистических данных. Большинство информационных услуг для научных целей предоставляется в свободном доступе.

В качестве примера сайта фундаментальной науки можно рассматривать сайт ЦДФЭ НИИЯФ МГУ (http://depni.sinp.msu.ru/cdfe/), на котором представлены такие Web-сервисы как:

База данных (БД) по ядерной спектроскопии NESSY;

БД по ядерным реакциям EXFOR;

Справочник параметров основных состояний атомных ядер;

Поиск публикаций по ядерной физике в библиотеке NSR Национального центра ядерных данных США (Брукхэвенская национальная лаборатория);

Каталог (указатель) фотоядерных данных с 1995 г.;

Справочник параметров гигантского дипольного резонанса, сечения фотоядерных реакций;

Справочник порогов основных фотоядерных реакций;

Каталог сечений реакций под действием заряженных частиц (разработчик ЦАЯД РНЦ “Курчатовский институт”);

Калькулятор порогов и энергий ядерных реакций;

Справочник вероятностей внутренней конверсии изомерных переходов малой энергии;

Коллекция публикаций сотрудников ЦДФЭ;

Коллекция ссылок на другие сайты и Web-сервисы ядерной физики (например, Los Alamos National Laboratory Nuclear Data Viewer).

Примером мощной и качественной базы электронных публикаций по различным разделам математики, физики, биологии и вычислительной техники является архив, размещенный на сайте http://arxiv.org. Сопровождают сайт и отбирают публикации для размещения в архиве сотрудники Cornell University (США). Архив имеет хорошую репутацию у специалистов, которые постоянно пополняют архив новыми публикациями. Публикации в архиве ищутся по наименованию, дате, авторам, тематике и находятся в открытом доступе. Аналогичный сервис организован Казанским государственным университетом в виде электронного журнала Lobachevskii Journal of Mathematics. Журнал работает с 1997 г. и доступен по адресу http://ljm.ksu.ru. В журнал принимаются статьи по математике, включая алгебру, геометрию, математический анализ, теорию вероятностей, математическое моделирование. Полнотекстовые версии принятых статей доступны в стандартных для математического сообщества форматах (.dvi, .ps, .pdf).

На сайте Научной электронной библиотеки (НЭБ, http://elibrary.ru/defaultx.asp) предоставлен доступ к огромной коллекции научных информационных ресурсов (условия доступа для читателей и организаций изложены на сайте):

Полнотекстовые электронные версии журналов издательства ELSEVIER SCIENCE по всем направлениям фундаментальной науки (всего 475 наименований);

Полнотекстовыеэлектронныеверсиижурналовиздательств KLUWER ACADEMIC PUBLISHER (всего 750 наименований), SPRINGER (452), BLACKWELL (642), ROYAL SOCIETY OF CHEMISTRY (29), INSTITUTE OF PHYSICS (42), ACADEMIC PRESS (175), WORLD SCIENTIIC PUBLISHING (57);

База данных научного цитирования Института научной информации США Science Citation Index Expanded;

Электронные журналы крупнейшего мирового информационного провайдера – американской компании EBSCO (1166 наименований);

Библиографическая база данных Dissertation Abstracts американской компании ProQuest, в которой представлены диссертации авторов из более 1000 учебных заведений и университетов (начиная с 1861 по настоящее время);

Библиографические базы публикаций по медицине MEDLINE, AIDSLINE, CANCERLIT, EMBASE ALERT;

Библиографическая база публикаций по математике Zentalblatt MATH;

Полнотекстовые электронные версии научных журналов, издаваемых ИНИОН РАН (всего 24 наименований);

База данных научных отчетов, подготовленных по результатам выполнения проектов, финансируемых РФФИ (содержит более 18000 отчетов, начиная с 1994 года);

Полнотекстовые электронные версии российских научных журналов (всего 21 наименование).

На странице НЭБ, http://elibrary.ru/stat_global.asp, доступна статистика библиотеки: по представленным в ней информационным ресурсам, по читателям, по использованию ресурсов, персональная статистика для организации, для издательств, для участников проекта НЭБ. Анализ этой статистики позволяет определить наиболее востребованные научные публикации, журналы и издательства, спрогнозировать будущий спрос на ИР по научным направлениям и т.д. В какой-то мере эволюция научных электронных библиотек показывает, что, формируя полную и достоверную базу данных некоторой области научной деятельности и развивая аналитический сервис, разработчики могут в перспективе предложить полноценные системы поддержки принятия решений в этой области.

В настоящее время в опытную эксплуатацию запущен библиографический каталог БИТ (Библиография по Информационным Технологиям) научных публикаций с индексами цитирования, ориентированный на русскоязычную научную периодику [20]. Каталог БИТ включает в себя публикации научных журналов “Программирование” (ретроспектива с 1997 г. по 2003 г.) и “Вычислительные методы и программирование” (с 2000 г. по 2002 г.), труды конференций “Научный сервис в сети Интернат” и “Высокопроизводительные вычисления и их приложения”. Предполагается, что на основе данного сервиса можно определить наиболее авторитетные публикации по вычислительным и информационным технологиям. Данный Web-сервис свободно доступен по адресу http://bit.csu.ac.ru.

На сайте http://www.scirus.com находится поисковая машина SCIRUS, которая построена по подобию известных универсальными поисковиками типа Google, Rambler, Яндекс. Но в отличие от универсальных поисковиков SCIRUS индексирует только Web-страницы, содержащие научный контент. В настоящее время SCIRUS проиндексировал 167 миллионов Web-страниц, в которые входят сайты и информационные ресурсы научно-исследовательских организаций и учебных заведений различных стран мира (включая Россию), а также следующие журнальные источники и научные электронные коллекции: Beilstein on ChemWeb, BioMed Central, MEDLINE on BioMedNet, ScienceDirect, Society for Industrial & App. Mathematics, Chemistry Preprint Server, CoqPrint, E-print ArXiv, Computer Science Preprint Server, Mathematics Preprint Server, NASA, US Patent Office.

Весьма распространенными в Интернете являются данные ботанических коллекций [21, 22]. Подобных данных накоплено уже довольно много, и акцент смещается в последнее время в область эффективного поиска и анализа ботанических данных. На основе ГИС-интерфейса на сайте http://garden.kaleria.ru/look/index.shtml разработана специализированная информационно-поисковая система растений. В системе можно выбрать карту определенной российской и сопредельной области. Каждая карта представляет собой графическое изображение области, на которой нанесены зоны, позволяющие либо перейти к более глубокому уровню или производить поиск по точечным объектам (города, сады). Имеется возможность детализировать поиск растений: “по открытому грунту”, “по оранжерейным растениям”, “по редким растениям”. Карты, используемые в поисковой системе, учитывают температурные зоны устойчивости растений, широтные диапазоны, регионы России и страны СНГ, отдельные города, сады различной ведомственной принадлежности (прежде всего, ботанические сады вузов России). Аналитический Web-сервис (http://hortus.kaleria.ru/com/soft.htm) используется для изучения процесса интродукции растений России на основе сравнительного анализа результатов поиска растений с данными коллекционных фондов ботанических садов РАН, вузов и зарубежных аналогов в идентичных зонах устойчивости растений.

Другой поисковый Web-сервис ботанических данных – ИПС “Коллекции ботанических садов России и сопредельных государств” (http://www.bgci.ru/base/aboutru.php), информационно-поисковая база данных названий растений и краткой информации по ботаническим садам России и сопредельных государств. Участники проекта по разработке этого Web-сервиса: Международный Совет ботанических садов по охране растений, 118 ботанических садов из России и 13 стран СНГ и Балтии. Поиск растений ботанических садов ведется по семейству, роду и виду, а также по специальным ботаническим параметрам: внутривидовой эпитет, грекс, культивар, гибридная формула растений. Очевидно, что воспользоваться в полном объеме возможностями такого рода поисковых машин смогут только специалисты; именно они должны определить стандартный набор и значения поисковых параметров для своей области знаний.

Интересными являются попытки расширить функциональность поиска публикаций в полнотекстовых базах электронных библиотек. Поисковик электронной библиотеки T-Libra [23] позволяет не только находить публикации путем контекстного поиска, но и, выполнив обработку полнотекстовой информации, ответить на такие вопросы как:

В каких контекстах автор использовал данный термин?

Какие термины и как часто использовались в заданной публикации?

Какие термины и как часто автор использовал в своих произведениях? и др.

В результате появляется возможность определить предметно-тематическую ориентированность публикаций, а электронную библиотеку использовать в качестве исследовательской среды.

В ИЭМ РАН ведутся работы по созданию единого поискового сервиса по нескольким базам экспериментальных данных в области наук о Земле (в первую очередь – в области геохимических наук) [24]. Подобная информация весьма разнородна, тесно связана (результаты зависят от условий эксперимента) и плохо формализуема, поэтому она принципиально несводима в единую базу данных. Предложены поисковые критерии, которые могут быть выбраны как общие:

термодинамические условия (диапазоны давления и температуры) экспериментов;

химический, минеральный или фазовый состав исследуемой системы.

В результате поиска выдается список тех систем, которые удовлетворяют хотя бы одному из общих поисковых критериев – например, система MgO-FeO-Na2O-SiO2 в диапазоне давлений 10-15 кбар и температур 800-1200 градусов. Возможности поиска могут быть усилены использованием элементов экспертных оценок, позволяющих производить выборки на основе неполных или недостающих данных и предлагать возможную интерпретацию этих данных. С пилотным вариантом поискового сервиса можно ознакомиться по адресу http://database.iem.ac.ru/experiment.

Следует отметить, что значительное развитие получили и научные сайты, имеющие региональную направленность своего содержания. Например, проект “Этнография народов Приволжья” ориентирован на открытие широкой общественности через Интернет значимых этнонациональных ресурсов народов территорий Приволжского федерального округа. Создаваемый в рамках проекта тематический сайт (http://www.ethos.nnov.ru), наряду с историко-культурным описанием этнографических характеристик регионов Приволжья (БД обычаев и праздников, календарь этнособытий, маршруты этнического и паломнического туризма, справочник этнических организаций, реестр этнографических и конфессиональных памятников, БД этнографических коллекций музеев), будет содержать Web-сервисы, ориентированные на межэтнический и межкультурный обмен между пользователями, а также средства совместного формирования этнографического материала, проведения дискуссий, консультаций и просто бесед с авторитетными учеными. Учитывая, что Российская Федерация – многонациональное государство, подобные этнографические Интернет-проекты являются перспективными. Они способны привлечь значительную аудиторию и сформировать вокруг себя устойчивое виртуальное сообщество.

Примером еще одного перспективного регионального Интернет-проекта является разработка сайта “Природа Южной Сибири и ее защитники” (http://ecoclub.nsu.ru/). Учитывая огромную популярность на Западе экологической проблематики, можно предположить, что такие тематические сайты будут очень востребованы и в России. Задачи проекта:

Знакомство общественности с живой природой и уникальными ландшафтами Южной Сибири, оповещение об экологических угрозах;

Предоставление возможности внести посильный вклад в сохранение природного наследия;

Создание для общественного природоохранного движения Южной Сибири виртуального места общения, полезного справочника и источника новостей, дополняющего официальную информацию.

Сайт “Природа Южной Сибири и ее защитники” фактически является виртуальным клубом экологов и защитников окружающей среды Южной Сибири, благодаря наличию ИР хорошего качества и Web-сервисов “коллективного творчества”:

Форум “Экология и природоохранная биология”;

Последние новости по экологической тематике;

Объявления;

Фотогалерея профессиональных и любительских снимков о природе;

Фильмотека “О природе”;

Дискуссии;

База полнотекстовых документов природоохранного законодательства;

Полезные ссылки;

Анонсы книг и журналов по экологической тематике;

Справочник экологических организаций и инициативных групп Сибири, обзор их деятельности.

Некоторые наиболее востребованные и затратные информационные услуги, представленные в Интернате, могут быть платными. В 2001 году в рамках подписанного договора между РФФИ и Институтом научной информации США российские ученые получили возможность использования базу данных по научному цитированию Science Citation Index Expanded, содержащей данные из более 5800 ведущих научных журналов (с ретроспективой с 1991 г. до настоящего времени) в области естественных наук. Общий объем базы – почти 10 миллионов статей. Зеркало БД установлено в России на серверах Научной Электронной Библиотеки и обновляется еженедельно. В соответствии с договором доступ к базе данных Science Citation Index Expanded открыт для пяти российских академических библиотек (и их филиалов):

Библиотека по естественным наукам РАН (Москва);

Библиотека Российской Академии наук (Санкт-Петербург);

Центральная научная библиотека Уральского отделения РАН (Екатеринбург);

Государственная публичная научно-техническая библиотека СО РАН (Новосибирск);

Центральная научная библиотека ДВО РАН (Владивосток).

Эти библиотеки являются провайдерами услуг, которые предоставляют доступ к данному ресурсу российским научно-исследовательским и учебным заведениям по подписке. Для ознакомления с поисковыми и аналитическими возможностями интерфейса базы данных можно использовать Краткое руководство на русском языке, подготовленное специалистами Центральной библиотеки Пущинского научного центра РАН. В этой библиотеке также функционирует учебно-консультационный центр, в рамках которого организуются семинары и консультации по использованию базы данных Science Citation Index Expanded.

Некоторые научные учреждения информируют через Интернет о своей научной деятельности не только в виде сведений о научных мероприятиях и проектах, доступа к результатам исследований (например, к базам экспериментальных данных, коллекциям отчетов и публикаций), но и путем предоставления доступа к своей оперативной информации. В частности, Институт земного магнетизма, ионосферы и распространения радиоволн РАН (http://www.izmiran.rssi.ru/) предоставляет данные о краткосрочных прогнозах (на следующий день) геомагнитной обстановки в Москве, солнечной активности и текущем мониторинге космического излучения в Москве.

3.2. Дополнительные услуги российских научных информационных сайтов и порталов

Помимо услуг по доступу к информационным ресурсам научных организаций, формальных и неформальных научных сообществ организуют и предоставляют дополнительные услуги, как характерные ранее для многих традиционных научных библиотек, так и связанные с организацией вычислений, управлением программными средствами, моделированием и так далее.

Представленный ниже обзор Web-сервисов фундаментальной науки конечно не претендует на полноту, но он показывает разнообразие имеющихся Web-сервисов, а также тенденцию того, что наиболее уникальные и затратные из них могут предоставляться на платной основе. Сейчас среди научных Web-сервисов быстро увеличивается количество интерактивных служб, требующих активного взаимодействия с пользователем, а также служб, предоставляющих данные для дальнейшей обработки. Разнообразный состав услуг, предоставляемых в Интернете, и их коммерциализация характерны не только для Web-сервисов фундаментальной науки. Так, по данным компании Gartner Dataquest, к 2006 году провайдеры любых сервисов будут поставлять более 70% своих услуг через Web-сервисы, которые будут приносить более 40% доходов, причем продолжится инкрементальный рост уже существующих рынков Web-сервисов и использование таких технологий, как ASP, J2EE, .NET и e-marketplace [25].

В тоже время большинство разработчиков отмечают, что сдерживающими факторами в разработке Web-сервисов и приложений на их основе являются отсутствие установившихся стандартов, проблемы с информационной безопасностью, а также отсутствие четкого определения архитектуры приложений нового поколения [25]. В результате слабо проработаны вопросы стандартизации представления данных и организации информационного обмена между “источником” и “приемником” Web-сервиса, между разными Web-сервисами для их интеграции.

3.2.1. Дополнительные библиотечные услуги.

Сайты ряда научных библиотек (например, http://benran.ru) предоставляют возможность заказа копий статей (в т.ч. – электронных) в рамках обслуживания по межбиблиотечному абонементу. Воспользоваться данным сервисом могут все абоненты Библиотеки по естественным наукам РАН – организации, заключившие с библиотекой договор библиотечного обслуживания. После заключения договора абоненты получают код и пароль для доступа к сервису “ЗАКАЗ ЛИТЕРАТУРЫ”. Данный сервис является платным, и его стоимость зависит от количества и сложности заказов, сделанных абонентом за определенный период времени. Аналогичный Web-сервис, заключающийся в изготовлении и доставке зарегистрированным пользователям электронных копий изданий, имеющихся в Зональной научной библиотеке ТГТУ, реализован на странице http://lib.tver.ru/edd. Эти два примера показывают, что в настоящее время некоторые традиционные сервисы информационного и библиотечного обслуживания переносятся в Интернет, но на более оперативный уровень.

3.2.2. Управление сетевыми информационными ресурсами.

Примером предоставления сервисов данной группы может служить сервер сетевой статистики (http://stat.iszf.irk.ru) Института Солнечно-Земной Физики СО РАН, где представлены данные о загрузке каналов сети RBNet (Russian Backbone Network, http://www.rbnet.ru) на текущий день, а также статистика за последний месяц. RBNet выполняет функции опорной сети, клиентами которой являются некоммерческие региональные сети в рамках федеральных округов. На странице http://www.ripn.net:8080/rbnet/networks.html представлен список головных организаций региональных сетей, подключенных к сети RBNet. В этот список входят научно-исследовательские учреждения РАН и высшие учебные заведения. Услуги, предоставляемые сетью RBNet – доступ к научно-образовательным ресурсам, в том числе зарубежных сетей, и создание наложенных выделенных сетей (VPN) на основе технологии MPLS. Для доступа к сети Интернет общего назначения используются возможности нескольких операторов, при этом основной шлюз функционирует совместно со шведским коммерческим оператором Telia. RBNet в настоящее время имеет прямой пиринг (связность на уровне прямых физических соединений) с Федеральной университетской сетью RUNNet. Сеть RBNet оказывает и дополнительные услуги по организации сетевых программно-информационных ресурсов:

Сервис USENET/NEWS (использование сервера новостей);

Размещение вторичных (secondary) DNS-серверов на серверах сети;

Использование прокси-сервера (HTTP-Proxy);

Релеинг входящей почты (Mail Relaying).

На ряде серверов некоторых научных сетей пользователя предоставляют такие услуги как подключение к сети Интернет по телефонной линии, получение почтового ящика, регистрация поддоменов, размещение Web-страниц. Примером предоставления таких услуг может служить сайт http://www.anrb.ru Академической сети Республики Башкортостан (ANRB).

3.2.3. Моделирование и расчеты.

Наряду с информационными услугами развиваются и другие Web-сервисы, которые можно использовать для научных целей. Например, на сайте http://nrv.jinr.ru/nrv/ функционирует база экспериментальных данных в области низких энергий с программным обеспечением (ПО) для их анализа. ПО основано на фундаментальных моделях ядра и ядерных реакций и позволяет проводить всесторонний анализ экспериментальных данных и ядерной динамики при низких и промежуточных энергиях в рамках современных теоретических подходов [26]. Для обеспечения актуальности и достоверности база экспериментальных данных постоянно расширяется и обновляется.

Доступ к базе данных и ПО осуществляется через имеющиеся Web-браузеры, поддерживающие работу Java-апплетов. Работа с предоставленным Web-сервисом организована по следующей схеме. Удаленный пользователь формирует входные данные для анализа исследуемой ядерной реакции через Java-скрипт диалог, в котором он может выбрать массы и заряды сталкивающихся ядер, энергию столкновения, форму и величину потенциальной энергии взаимодействия, индивидуальные характеристики каждого ядра. Подготовленные данные передаются CGI-приложению, которое запускает расчетную программу, а затем пересылает результаты расчета пользователю в виде html-ответа со встроенными интерактивными Java-апплетами. Меню Java-апплетов, отображаемое совместно с насчитанными в графической форме данными, предоставляет пользователю возможности дальнейшей работы с полученными результатами непосредственно в рамках браузерного окна.

На странице http://teos.ficp.ac.ru/rusbank расположена еще одна база экспериментальных данных, но уже по термодинамическим свойствам веществ при высоких давлениях и температурах. База содержит более 20000 экспериментальных точек по ударной сжимаемости, изоэнтропическому расширению, измерению скорости звука за фронтом ударной волны и изобарическому расширению для примерно 660 веществ. Для обработки экспериментальных данных предусмотрены модули расчета различных аппроксимаций ударно-волновых данных. Выбранные данные и их аппроксимации выводятся в графической форме в окно браузера. Также пользователю предоставляется возможность проводить расчет термодинамических кривых веществ по нескольким моделям уравнений состояний. Результаты расчетов можно посмотреть на графике в сравнении с экспериментальными данными или в текстовом виде (для последующей обработки). Кроме того, на одном графике могут быть представлены различные кривые для разных веществ, построенных по различным моделям уравнений состояния [27]. Недостатки предлагаемого сервиса – реализован только англоязычный пользовательский интерфейс, отсутствие инструкции по использованию.

В настоящее время много внимания уделяется службам по предоставлению через Интернет вычислительных ресурсов для решения высокопроизводительных задач на базе таких современных технологий как использование кластеров [28,29] и GRID-сетей [30, 31]. В качестве средств доступа к интегрированным вычислительным ресурсам используют Web-браузеры, telnet-клиенты и различные специализированные программы. В 2001 г. в рамках академической программы корпорации Intel был создан Центр компьютерного моделирования Нижегородского университета, который объединил свои вычислительные ресурсы в кластер [32] и предоставил Web-доступ к нему для изучения параллельных методов решения сложных вычислительных задач и выполнения параллельной многоэкстремальной оптимизации.

С 2000 г. в рамках суперкомпьютерной программы “СКИФ” Союзного государства разрабатываются отечественные вычислительные кластеры “СКИФ”. Так в 2003 г. в соответствии с этой программой в ИНС РАН разработан модернизированный кластер на базе 32 процессоров AMD Athlon MP 1800+. Предельная пиковая производительность этого кластера – 98 Gflops. С самого начала выполнения программы “СКИФ” предусматривалась поддержка удаленного режима использования создаваемых кластеров. На кластерах устанавливаются лицензионные пакеты для научных и инженерных расчетов. Доступ для использования этого ПО предоставляется бесплатно. Весьма активно модернизированный кластер используется в режиме удаленного доступа группами исследователей из НИИ механики МГУ им. М.В. Ломоносова, Челябинского государственного университета, Университета Тюбингена (Германия) [33]. В 2003 г. было запланирована разработка двух кластеров семейства “СКИФ”, производительностью 400 Gflops и 0,7 Tflops соответственно.

Вычислительный комплекс “АТОМ”, созданный в ФТИ им. Иоффе РАН, представляет собой специально разработанное ПО для исследования многоэлектронных эффектов в атомах. С помощью этого ПО можно выполнять 21 специализированное вычисление. Подобные вычисления на современном компьютере PC могут выполняться в течение нескольких суток. Установка ПО “АТОМ” на кластере МЦ СпбГУ (10 компьютеров PIII/256Mb/15Gb, объединенных через коммутируемый FastEthernet 100Mb/s) позволила снизить время выполнения ПО на порядок. В настоящее время проводятся работы по использованию вычислительного комплекса “АТОМ” на основе GRID-сети и Web-доступа с целью дальнейшего увеличения производительности и эффективности вычислений [34].

В университете Северной Каролины (США) совместно со специалистами по программному обеспечению корпорации IBM разработана система автоматизированного создания новых лекарств (CADD). Эта система автоматизирует процессы молекулярного моделирования, поиска в базе лекарственных знаний и анализа результатов моделирования. При создании системы CADD использовался продукт IBM WebSphere Studio Application Developer Integration Edition, совместимый с технологией J2EE. Входные параметры, управляющая информация о процессе моделирования и результаты моделирования размещаются в СУБД IBM DB2 Universal Database. На базе продукта IBM WebSphere Portal for Multiplatforms был создан Web-портал (под управлением ОС Linux) с Web-сервисом, обеспечивающим удаленный доступ к системе CADD и функционирующим по схеме “бизнес-бизнес” (B2B). Для облегчения обмена научной информацией как внутри университета, так и с другими лабораториями Web-портал и его сервис предоставляют персонализированный и защищенный доступ к молекулярным данным и обеспечивают возможность совместного использования точных численных моделей, описывающих действия новых лекарств. Запрос, поступающий от какого-то исследователя на Web-портал, преобразуется в формат XML, после чего Web-сервис с помощью протокола SOAP доставляет этот запрос в систему CADD. Результаты обработки запроса Web-сервис, используя SOAP-команды, пересылает обратно на Web-портал для оперативного доступа. В настоящее время университет Северной Каролины предполагает повысить эффективность системы CADD за счет использования среды распределенных вычислений (Grid computing). С кратким отчетом директора лаборатории молекулярного моделирования университета Северной Каролины, д-ра Александера Тропша, о системе CADD и научных исследований с помощью Web-сервисов на базе технологий IBM можно ознакомиться на странице http://www.ibm.com/ru/software/webservices/examle.html.

С целью предоставления в широкий доступ вычислительных мощностей НИВЦ МГУ был организован Вычислительный полигон (http://parallel.ru/cluster). В качестве аппаратных платформ Вычислительного полигона используются четыре вычислительных кластера – SCI (32 процессора PIII/500, соединенных высокоскоростной коммуникационной сетью SCI), AQUA-1 (46 PIII/1000, соединенных коммуникационной сетью Fast Ethernet), AQUA-2 (36 PIII/850, Fast Ethernet) и LEO (32 Xeon/2.6 ГГц, SCI). Задача пользователя передается на выбранный кластер через систему очередей Cleo (http://cluster.parallel.ru). В зависимости от заданного пользователем режима получения результатов (непосредственно в окне браузера или по указанному адресу электронной почты) Web-интерфейс сервиса либо дожидается постановки задачи на выполнение и получения результатов, либо только информирует пользователя о постановке его задачи на выполнение. В частности, кластеры Вычислительного полигона использовались в режиме удаленного доступа для тестирования производительности сетевых технологий, а также для сравнения эффективности различных методов параллельного программирования [35]. Для того чтобы стать пользователем Вычислительного полигона, надо оформить и направить на адрес This e-mail address is being protected from spambots. You need JavaScript enabled to view it заявку. Если заявка удовлетворена, пользователь получает логин и пароль для работы с выбранным кластером.

В настоящее время очень актуальной является идея создания общедоступного рынка машинного времени высокопроизводительных распределенных систем. Понятно, что большие вычислительные мощности (а также уникальная аппаратура) простаивают не только вследствие окончания фундаментальных исследований. Например, специалисты фирмы Sun Microsystems прорабатывают идею продажи время финансовых и фондовых бирж, где находится мощное вычислительное оборудование, ничем не занятое в ночное время. Если бы рынок машинного времени существовал, то фундаментальной науке можно было бы арендовать необходимое оборудование на некоторое время. В результате, ученые получили бы альтернативу приобретению в собственность дорогого оборудования, что привело бы к уменьшению стоимости исследований и к повышению эффективности использования машинного времени.

По оценкам аналитиков, потенциальный рынок распределенных машинных ресурсов огромен, учитывая число компьютеров во всем мире и их постоянный рост. Однако внедрение технологий продажи машинного времени сопряжено с решением сложнейших задач по обеспечению информационной безопасности. Кроме Sun над комплексом проблем предоставления в широкий доступ вычислительных ресурсов работают и другие фирмы, например, IBM и HP.

3.2.4. Научные видеоконференции в режиме реального времени.

Технологии, связанные с передачей видео- и аудиоинформацией через Интернет в режиме реального времени, активно используются в научном общении, образовании и медицине. В [36] описываются программные средства, разработанные в ИММ УрО РАН и предназначенные для создания Интернет-видеоконфиренций. Данные программные средства обеспечивают двунаправленную и многонаправленную аудио-видео связь в реальном времени между многочисленными участниками. Предлагаемые программные средства и примеры их использования продемонстрированы на медиасайте УрО РАН (http://webtv.uran.ru). Прежде чем использовать данный Web-сервис, с помощью предлагаемых программных средств на видеосервере должен быть сформирован набор страниц – “комнат”. Комнаты могут быть иерархически организованы: внутри комнаты могут находиться как участники конференции, так и подкомнаты. Связи между комнатами могут быть произвольными; переходы из одной комнаты в другую могут образовывать циклы. Существуют “общедоступные” комнаты и комнаты ограниченного доступа (виртуальные конференц-зал и секции соответственно). Некоторые комнаты участникам разрешается посещать с видеокамерой (“себя показать”), другие – только в качестве наблюдателей. При дискуссиях между участниками видеоконференции Web-сервис может не участвовать в передаче собственно медиапотоков, а лишь организовывать медиапотоки. При формировании медиапотоков используются современные аппаратные и программные средства сжатия информации (mp3, MPEG4). Ознакомиться с прайс-листом на программные и аппаратные средства разработки видеоконференций можно на странице http://webtv.uran.ru/ru/prices.htm.

Практические результаты создания научных видеоконференций в режиме реального времени с помощью компонент комплекса Real Entertainment (Real One) фирмы RealNetworks описаны в [37]. Компоненты Real One организуют видеоконференцию в архитектуре клиент-сервер. Удаленный участник должен использовать клиент RealPlayer для просмотра видеоконференции и иметь устойчивую связь с видеосервером Real One с определенным запасом полосы пропускания. В такой конфигурации участникам видеоконференций предоставляется возможность слушать докладчика, видеть его и представляемые им презентации, задавать вопросы и получать на них ответы. Одним из крупных событий, транслировавшихся в Интернете по предлагаемой технологии, стала Интернет-сессия Национальной школы гастроэнтерологов и гепатологов, проходившая в ЯрГУ 3-го апреля 3003 г. Количество удаленных участников составило от 1000 до 2000 человек. География участников – от Сибири (Якутск, Иркутск, Томск, Екатеринбург и др.) до Средней России, Северного Кавказа (Махачкала), ближнего (Минск, Ровно, Полтава) и дальнего зарубежья. Главной проблемой такого рода трансляций является качество академических каналов связи и межсетевых развязок; от них в значительной степени зависит полноценная организация научных видеоконференций в режиме реального времени через Интернет [37].

В НИВЦ МГУ создан комплекс программно-аппаратных средств поддержки решения задач дистанционного обучения и научного общения – трансляция в реальном времени семинаров и лекций, сбор, архивирование и дальнейшее выставление на Web-сервере выступлений и событий с конференций и симпозиумов [38]. Для поддержки регулярного вещания в Интернете университетских мероприятий и событий в реальном времени создан сайт (http://webtv.msu.ru). Предлагаемый комплекс можно использовать и для организации научных конференций в режиме реального времени. В состав комплекса входит необходимое оборудование – цифровая камера с несколькими способами подключения к компьютеру, радио-микрофон для выступающего, средства настройки компьютера для выхода в Интернет. Для демонстрации видеоконференций в Интернете используется ПО, разработанное в Институте математики и механики УрО РАН (http://webtv.uran.ru). Достоинствами данного ПО являются возможность устанавливать двухсторонную связь между клиентами и высокое качество передачи звука и изображения. С помощью предлагаемого комплекса программно-аппаратных средств ведутся регулярные Интернет-трансляции научных конференций, которые проводятся в МГУ.

Основная причина недостаточно широкого распространения видеоконференций – невысокое качество передачи видеоизображений через Интернет. Однако это препятствие вполне преодолимо технически, путем создания скоростных и надежных каналов связи. Поэтому с улучшением качества телекоммуникационной инфраструктуры следует ожидать дальнейшее развитие этого Web-сервиса, в том числе и для целей фундаментальной науки.

3.2.5. Дистанционное обучение.

Еще один Web-сервис, который получает распространение в Интернете, является дистанционное обучение. Особенностью и привлекательной стороной дистанционного обучения является то, что в этом случае услуга предоставляется без необходимости посещения учебного или научного заведения, с правом свободного выбора времени и объема обучения. Дистанционное обучение (образование) предполагает использование следующих форм учебного материала [39]:

Специализированные текстовые методические материалы c иллюстрациями;

Специализированные видеокурсы;

Видеокурсы в режиме реального времени, являющиеся аналогом традиционных курсов обучения.

Межуниверситетский аэрокосмический центр (МАЦ), функционирующий на базе лаборатории аэрокосмических методов кафедры картографии и геоинформатики географического факультета МГУ, работает на ниве повышения уровня образования в области аэрокосмических методов в университетах России [40]. МАЦ (http://www.scanex.ru/rus/lakm) проводит Интернет-семинары, которые рассматриваются как одна из возможных форм дистанционного обучения аэрокосмическими методами. С 2000г. центром было проведено пять Интернет-семинаров:

“Получение космических снимков по сети Интернет”;

“Компьютерная обработка аэрокосмических снимков. Работа с многозональными снимками в свободно распространяемой программе MultiSpec”;

“ Аэрокосмические снимки для школьного образования. Тема: Горы. Высотная поясность”;

“Новые типы снимков. Terra: ASTER, MODIS, MISR”;

“Аэрокосмические снимки для изучения высокогорья. Динамика оледенения. Высокогорные стихийно-разрушительные явления”.

На семинарах участникам предоставляются методические материалы, которые включают теоретическую часть, практические задания для работы и инструкции по их выполнению, контрольные вопросы, снимки. Структураи “начинка” семинаров учитывают интересы пользователей разного уровня. В целом материал семинаров рассчитаны на преподавателей, делающих только начальные шаги в компьютерной аэрокосмической подготовке: большинство заданий являются несложными, а инструкции расписаны достаточно подробно. Вместе с тем, имеется возможность учесть и интересы “продвинутого” специалиста, предлагая ему более сложные вопросы, дополнительный материал и альтернативные вопросы.

Еще один пример дистанционного обучения, но уже по молекулярной биологии, представлен на сайте http://webcenter.ru/~duckweek/citology. Здесь выложен материал для изучения нескольких тем современной биологии, которые объединены в теоретический курс и практикум по цитологии и цитогенетике.

Сотрудниками лаборатории открытого образования кафедры цифровых технологий и центра компьютерных технологий Воронежского государственного университета создана электронная коллекция учебных видеоматериалов, которая с аннотациями размещена на Web-странице http://www.main.vsu.ru/video.html. В настоящее время в состав коллекции входят видео-курсы по разделам физики: “Квантовая физика” и “Классическая механика”. Для разработки видео-курсов используется программа LearingSpace фирмы Lotus/IBM. Для просмотра видеоматериалов на удаленный компьютер необходимо установить кодек MPEG4.

Институт прикладной математики им. М.В. Келдыша РАН предлагает набор видеолекций (http://www.applmat.ru/pages/comma/) по следующим разделам математики:

Дифференцирование (6 лекций) и интегрирование (1);

Линейная алгебра (4);

Обработка данных (2);

Обыкновенные дифференциальные уравнения: задачи Коши (10), краевые задачи (2);

Динамические системы (8);

Дифференциальные уравнения в частных производных (5).

Видеолекции дополнены практическими упражнениями, выполненными с помощью пакета MathCAD. Поскольку видеолекции оформлены в формате HTML, для их просмотра требуются только обычные браузеры. Для использования дополнительных мультимедийных возможностей, заложенных в видеолекии и практические упражнения, необходима предварительная установка клиентских компонентов языка Java. Предлагаемый Web-сервис дает возможность бесплатной установки этих компонент. В состав Web-сервиса входит ограниченное количество видеолекций, а их полный набор включен в мультимедийную версию на CD-носителе, которая издается фирмой 1С.

Для изучения русского языка на странице http://learning-russian.gramota.ru/idictation.html выложен набор интерактивных диктантов. Выбрав вариант диктанта (например, отрывок из повести А.П.Чехова “Степь”), необходимо заполнить выделенные места нужной буквой или знаком препинания. По мере заполнения текста он проверяется на правильность: правильные места выделяются зеленным цветом, а неправильные – красным.

Очень популярными Web-сервисами, в настоящее время, являются системы тестирования знаний. Некоторые из этих систем используются автономно, другие – входят в состав процедуры дистанционного обучения. Как правило, подобный сервис предоставляет набор контрольных вопросов и варианты ответов – на каждый вопрос необходимо выбрать правильный ответ. По результатам тестирования выдается протокол с оценкой. В качестве примера можно обратиться к сайту http://test.allbest.ru, на котором размещена онлайновая система тестирования знаний по следующим дисциплинам: биология, ботаника, география, зоология, математика, иностранные языки и др.

3.2.6. Размещение информации пользователей. Ресурсы "коллективного творчества.

Важную роль в обеспечении развития научной деятельности и научных коммуникаций играет предоставление некоторыми научными и научно-организационными сайтами услуг по созданию научных информационных ресурсов и WEB-сервисов пользователей.

Так, на сайте http://agora.guru.ru размещена служба автоматизации создания, размещения и поддержки Интернет-представительств научных конференций. В состав этой службы входят следующие услуги:

получение адреса сайта вида http://agora.guru.ru/conference_name;

использование большого количества настраиваемых шаблонов страниц;

простое управление разметкой текста на страницах;

самостоятельная организация на сайте научной конференции следующих возможностей: подписка на рассылку новостей по e-mail; регистрация участников конференции; регистрация докладов, прием тезисов на распределенное рецензирование докладов.

В настоящее время с помощью этого Web-сервиса разработано 21 “виртуальное представительство” научных конференций (список доступен по адресу http://agora.guru.ru/conferences.php). Для того чтобы использовать службу автоматизации создания Интернет-страниц научной конференции необходимо запомнить регистрационную форму (http://agora.guru.ru/register.php) и отправить ее персоналу. После рассмотрения заявки и оплаты Web-сервиса, желающий создать представительство научной конференции в Интернете получит инструкцию, логин и пароль для входа в службу автоматизации.

В ряде информационных систем, размещенных в Интернете, обслуживающий персонал может оказывать услуги по наполнению баз данных и обобщенному анализу накопленных данных. Так, например, служба редакторов системы навигации ИР ГСНТИ [41] оказывает, на договорной основе, услуги по созданию метаописаний научных ИР и вводу их в базу метаданных системы.

В рамках созданной научно-образовательной сети Пущинского Научного Центрасотрудникам доступны службы размещения персональных страничек, научных ИР и опубликования электронных материалов (http://www.psn.ru/net/servis/) на Web-сервере Центра. Перед использованием служб предлагается ознакомиться с онлайновым документом “Правила и порядок размещения информации на сайте www.prn.ru”.

Интернет является идеальной средой, которая, по существу, провоцирует специалистов на создание новых информационных ресурсов. Создание ресурсов "коллективного творчества" способствует повышению качества научной информации, а также эффективному взаимодействию ученых, формально состоящих в разных научных коллективах. Часто достаточно крупные ресурсы создаются в чатах и форумах, размещенных на научных сайтах и порталах. Например, сайт “Виртуальная пустынь” (http://www.uic.nnov.ru/pustyn) содержит примеры коллективного создания и редактирования текстов сообществами экологов и биологов. Коллективным авторством на этом сайте собираются сведения (тексты, фото и видео-записи) о растениях и животных Нижегородской области. Данный проект реализуется при финансовой поддержке Управления образовательных и культурных программ Государственного Департамента США в рамках программы “Обучение и доступ к Интернет” [42].

Наряду с тем, что и как представлено на тематическом сайте, свободное (но не анонимное) и регулярное использование Web-сервисов “совместного творчества” может привести к формированию устойчивых виртуальных научных сообществ. Основу образования виртуальных сообществ обычно составляют энтузиасты, которые, например, собираются на форумах для обсуждения определенных предметных областей, либо попросту в поисках единомышленников [39]. Местом действия виртуальных сообществ становятся научные сайты и Web-порталы, посвященные конкретной научной тематике и оснащенные различными Web-сервисами “совместного творчества” (чаты, форумы, электронная почта, хостинг персональных страниц, коллекция электронных публикаций участников сообщества). Как правило, на таких тематических сайтах и Web-порталах информационный материал представлен таким образом, чтобы расширить границы целевой аудитории, заинтересовав не только специалистов.

В последнее время стремительно растет популярность такого простого Web-сервиса, как ведение блогов, персональных заметок, которые публикуются в открытом доступе. Поскольку заметки располагаются в хронологическом порядке, блоги часто называют сетевыми дневниками. В основе блога, как правило, лежит программный механизм, позволяющий автору легко добавлять новые заметки, а читателям делать к ним комментарии. Описания научных экспериментов в виде блогов позволяет, зафиксировав хронологию, условия и детали их проведения, решать проблемы авторских прав и открытой экспертизы научных результатов. Примерами открытых блогов, где могут вести свои заметки все желающие, являются http://www.livejournal.com, http://www.blogger.ru, http://www.xanga.ru.

Несмотря на огромный положительный потенциал, который заложен в использовании средств "коллективного творчества", было бы ошибкой считать, что в научных сообществах существует полная гармония по их использованию. Немалое количество специалистов считает, что, пока в научном мире существует конкуренция, лимиты на финансирование, государственные, корпоративные и личные интересы, открытого доступа к важным научным информационным ресурсам еще долгое время не будет. В результате, такие специалисты отказываются предоставлять доступ к своим научным данным через Интернет.

3.2.7. Интернет-магазины.

Практика применения дистанционного образования показала, что для России пока свойственны слабые каналы связи, прежде всего на участке “последней мили”, поэтому дистанционное обучение используется ограниченно. Когда научный или образовательный материал имеет насыщенную графику или видео, то целесообразно представлять его на CD-ROM, DVD и видеокассетах. В этом случае на научных сайтах может использоваться Web-сервис, обеспечивающий распространение материала на таких носителях. Так, например, на Российском астрономическом портале (http://www.astrolab.ru)реализован Интернет-магазин, где можно оформить заказ на приобретение DVD и CD-ROM с аэрокосмическими снимками высокого разрешения, а также книг и настенных карт. В Интернет-магазине сайта “Первый всероссийский астрономический портал” (http://www.starlab.ru) продаются не только книги и журналы по астрономии, но и такой товар как телескопы, монтировки и бинокли.

Институт научной информации по общественным наукам (ИНИОН) РАН предлагает через Интернет-магазин (http://www.inion.ru/shop/index.html) свою продукцию (печатные издания, базы данных и электронные книги), а также следующие услуги: поиск в библиографических базах данных ИНИОН по социальным и гуманитарным наукам, изготовление и доставка электронных копий источников (статей из журналов и сборников, находящихся в фондах библиотеки ИНИОН), депонирование рукописей. Практически все Интернет-магазины, реализованные на научных сайтах, работают на платной основе.

Надо заметить, что научные сообщества в целом рассматривают данный Web-сервис как непрофильный и считают, что он больше подходит бизнесу. Поэтому научные коллективы стараются реализовывать свою продукцию и сопутствующие им товары через популярные онлайновые магазины, такие как 1С, ФИЗИКОН, ОЗОН, БОЛЕРО и др. В этом случае, на научных сайтах, по взаимной договоренности, размещают ссылки на коммерческие Интернет-магазины.

В тоже время, среди научной общественности популярными являются специализированные книжные Интернет-магазины, основной товар которых – научно-образовательная литература. В качестве примера можно привести магазин Mathesis (http://shop.rcd.ru) – совместный проект Института компьютерных исследований и Научно-издательского центра “Регулярная и хаотичная динамика”. На витринах этого виртуального магазина регулярно выставляются книги и электронные библиотеки на CD, изданные центром РХД, по четырем основным разделам: математика, физика, биология и нефтегазовые технологии. Хочется отметить работу подобных магазинов по отбору продаваемых книг: они стараются предлагать либо “классику научной мысли” – фундаментальные научные труды, либо современные научные публикации, востребованные среди специалистов. В этом видится преимущество этого Web-сервиса по сравнению с некоторыми университетскими электронными библиотеками, в которых нередко заносится устаревшая, вышедшая из обращения научная и учебная литература [39]. Кроме того, специализированные книжные Интернет-магазины отличаются более высоким качеством предлагаемых изданий.

В различных ЦНТИ, входящих в систему ГСНТИ, накоплен огромный объем научно-технической информации, который можно использовать для проведения фундаментальных исследований и внедрения их результатов. На основе технологии коммерческих Интернет-магазинов эти учреждения предпринимают попытки для реализации этой информации. В частности, на сайте http://www.shop.csti.ru представлен Интернет-магазин научно-технической информации Челябинского ЦНТИ. В этом магазине можно найти, ознакомиться с аннотацией и приобрести следующие научно-технические документы:

Конструкторская документация;

Документация по пожаробезопасности;

Ведомственные нормативные документы;

СНИП;

ГОСТ;

Научно-технические разработки России;

Патенты России.

Например, этот магазин предлагает:

“Методические указания по составлению проектов производства сложных строительно-монтажных и погрузочно-разгрузочных работ кранами” (Цена: 35 руб.);

“Положение о надзорной и контрольной деятельности в системе Госгортехнадзора России ” (Цена: 35 руб.);

“Удобрения с микроэлементами. Методы определения содержания кобальта” (Цена: 117 руб.);

3.2.8. DOWNLOAD.

На ряде научных сайтов реализована служба “Download”, позволяющая пользователю скачать (как правило, бесплатно) специализированное ПО, необходимое для научной деятельности. Например, с сайта “MMOnline – Информационный портал о мехмате МГУ” (http://www.mmonline.ru)можно скачать дистрибутивы таких распространенных среди математиков программ, как: Tex и его разновидности, программы просмотра и печати PostScript-файлов, DjVu Viewer, компилятор Turbo C++, MathPlayer и др. На химическом портале http://www.chemport.ru в разделе “СОФТ” представлены ссылки (22 шт.) на службы “Download” для “скачивания” различных программ, используемых при проведении химических исследований.

Служба DOWNLOAD сайта “Мир психологии” (http://psychlogy.net.ru) предлагает возможность скачать следующий специализированный софт:

Advanced Baby-Sitter – программа контроля и ограничения времени, проводимого ребенком за компьютерными играми;

SunRav TestOfficePro – пакет программ для создания, проведения различных тестов и обработки результатов тестирования;

“Патофизиология-Ассистент” – оценка профессионального мышления врача любой медицинской специальности;

“Социометрия” – программа для автоматического подсчета взаимных выборов и составления социометрической матрицы;

электронная книга Брайна Трейси “21 секрет успеха миллионеров”, рекомендованная психологами для ежедневного чтения, а также рефераты по психологии, психологические игры и тесты.

Надо заметить, что, благодаря простоте и экономической целесообразности, DOWNLOAD может стать наиболее распространенным Web-сервисом. Если необходимое для исследований ПО находится в свободном доступе, то это может существенно сказаться на уменьшение и сроков, и стоимости исследований. Вместе с тем существует потенциальная опасность, что этот сервис может стать источником распространения и “вредных” программ, например, таких как вирусы и программы-шпионы. Некоторые провайдеры сетевых услуг для фундаментальной науки, выкладывая программное обеспечение в свободный доступ, не предпринимают никаких мер по проверке его на наличие “вредных” программ и тем самым способствуют дискредитации этого полезного Web-сервиса. Создание специализированных служб сертификации, которые бы гарантировали не только функциональность, но и “чистоту” скачиваемого ПО, может существенно повысить доверие пользователей к этому Web-сервису.

3.2.9. Специализированные услуги.

В [43] описан Web-сервис по дистанционному наблюдению за космическими объектами с помощью мощного телескопа, подключенного через цифровую видео-сеть к Интернету. Предполагается, что астроном-заявитель, не приезжая на телескоп, сможет руководить наблюдательным процессом по своей программе дистанционно, в то время как ответственный наблюдатель на телескопе будет выполнять астрономический эксперимент. Проведение полностью удаленных экспериментов с радиотелескопом РТ 7.5 намерена осуществить кафедра “Радиоэлектронные системы и устройства” МГТУ им. Н.Э. Баумана вместе с НИИ “Радиоэлектроника и лазерная техника” в рамках проекта по созданию астрономической Интернет-лаборатории (http://lud.bmstu.ru/rtelescope).

В [44] описана система дистанционного доступа к текущим информационным и экспериментальным ресурсам телескопа БТА САО РАН. Удаленный наблюдатель в режиме реального времени может получать астрономические данные, телевизионные изображения телескопа и местные метеоусловия на странице “BTA-online” (http://www.sao.ru/BTAcontrol). Недостаток предлагаемого сервиса – реализован только англоязычный пользовательский интерфейс.

В 1999 году несколько институтов СО РАН и Новосибирский государственный университет (НГУ) организовали Центр коллективного пользования микроскопического анализа биологических объектов (ЦКП) с целью эффективного использования уникального научного оборудования НГУ и институтов СО РАН: Институт цитологии и генетики СО РАН, Новосибирский институт биоорганической химии, Институт систематики и экологии животных СО РАН. На сайте ЦКП (http://www.bionet.nsc.ru/microscop) представлена информация о местонахождении ЦКП, номенклатура и фотогалерея предоставляемого оборудования (основное оборудование, оборудования для электронной и световой микроскопии), штат, правила работы в ЦКП, инструкция по использованию оборудованию. После заключения договора, оплаты и сдачи экзамена по правилам работы на оборудовании сотрудникам научно-исследовательских организаций СО РАН, а также студентам и аспирантам НГУ, предоставляется рабочее место цитолога для проведения исследований на оборудовании, имеющемся в ЦКП.

Идея эффективного использования уникальных экспериментальных стендов и оборудования с помощью Интернета является “актуальной во все времена” и похоже ей уделяется много внимания не только российскими научными институтами, но и высшими учебными заведениями. Так в МГТУ им. Н.Э. Баумана разработан экспериментальный стенд “Механика деформируемого твердого тела” на основе авторизованного удаленного доступа. Экспериментальный стенд позволяет исследовать механические свойства материалов при статических испытаниях на растяжение-сжатие и при более сложном комплексном нагружении, включающем также и кручение. Результаты экспериментов выводятся в окно Web-браузера и включают: диаграмму “сила-перемещение”, графики момента и угла поворота, скорости перемещения траверсы и угла поворота захватов. Для проведения эксперимента необходимо предварительно оформить заявку, получить пароль для доступа к стенду, сформировать сценарий проведения эксперимента, проверить его на осуществимость. Только после этого возможно проведение экспериментов в полностью автоматическом режиме, не требующего присутствия обслуживающего персонала. Возможна реализация сложных сценариев эксперимента, включая, например, циклические режимы и длительные эксперименты без разгрузки образца. Экспериментальный стенд “Механика деформируемого твердого тела” находится на сайте http://lud.bmstu.ru/lab_sopr.htm, там же находится демонстрационная версия лабораторного практикума. ДанныйWeb-сервис можно использовать не только для проведения экспериментальных исследований материалов, но и для выполнения лабораторных работ по сопромату в удаленном режиме (т.е. дистанционное обучение) [45].

В [46] предполагается, что такой Web-сервис как виртуальный эксперимент будет развиваться в трех направлениях:

дистанционное управление реальной установкой (экспериментальным стендом);

использование данных уже полученных в результате экспериментов;

компьютерное моделирование реальных процессов.

3.3. Научные WEB-порталы и распределенные информационные системы

В настоящее время очень актуальными являются идеи и подходы к формированию единой сетевой инфраструктуры научного сообщества. Ситуацию, когда один и тот же (по содержанию и целевому назначению Web-сервис разрабатывается многими коллективами и разными средствами, нельзя рассматривать как удовлетворительную. Желательная ситуация – отдельный сервис, созданный некоторым разработчиком, работает как на частных данных, так и на всех других существующих в сети и принадлежащих данному профессиональному сообществу информационных ресурсах [47]. Прототип такого единого информационного пространства для общественных наук может быть продемонстрирован на примере портала Соционет (http://socionet.ru/).

Предполагается, что переход от разрозненных сайтов к научным Web-порталам станет первым шагом, который позволит научным сообществам иметь “единую точку доступа” ко всем научным данным, документам и приложениям, размещенным в Интернете, возможность эффективного поиска нужных информационных ресурсов и Web-сервисов, возможность унификации Web-сервисов. Решать задачи интеграции Web-сервисов, информационной безопасности, обмена данными между информационными системами в рамках единого информационного пространства Web-портала стало проще. Сегодняшние Web-порталы предлагают функции управления контентом, его накопления, поиска и категоризации, а также функции персонализации, совместной работы и ограниченного доступа. Попытки разработки стандартов Web-порталов и эволюция стратегий поставщиков портальных решений показывают, что в будущем будут предоставлены условия для интеграции множества непохожих порталов. Основой для подобной интеграции можно считать принятие во второй половине 2003 г. портлетных стандартов: Web Services for Remote Portlets (WSRP) и Java Specification Request 168 (JSP168).

Примером успешного отечественного проекта по разработке и использованию порталов является система образовательных порталов, созданная в рамках выполнения Федеральной целевой программы “Развитие единой образовательной информационной среды (2001-2005 годы)” [48]. К началу 2004 г. создано и введено в опытную эксплуатацию 10 федеральных образовательных порталов, один из которых, так называемый горизонтальный (http://www.edu.ru), предоставляет информационно-справочные услуги для систем образования в целом. Созданы также тематические вертикальные порталы по вопросам экономики, права, социально-гуманитарному и политологическому образованию, физике, химии, биологии и гуманитарным наукам. Организовано информационное взаимодействие между горизонтальным и вертикальными порталами. Функционируют и профильные порталы: это портал системы российского открытого образования, портал информационной поддержки единого государственного экзамена, портал по поддержке процессов обучения в странах СНГ. К новым проектам относится создание и сопровождение будущего портала по информационным и телекоммуникационным технологиям. Ведется разработка корпоративных стандартов, обеспечивающих информационное взаимодействие образовательных порталов в рамках международного научно-образовательного пространства.

В рамках другой Федеральной целевой программы, ФЦП “Мировой океан”, во ВНИИГМИ-МЦД создается “Единая система информации об обстановке в Мировом океане” (ЕСИМО). Система реализована в виде горизонтального Web-портала (http://www.oceaninfo.ru), интегрирующего информационные ресурсы и Web-сервисы в области океанографии и морской деятельности [49]:

указатель ссылок на тематические сайты, на сайты ведущих российских и международных организаций;

поиск океанографической информации по классификации и географической карте;

базы данных нормативно-правовых документов, нормативно-методических документов и научно-технической информации;

словарь ЕСИМО, словарь океанографических терминов;

настройка на персональные нужды пользователей;

доступ участникам ФЦП к служебной зоне портала, где находятся рабочие материалы, отчеты и другие служебные документы;

форум, новости, рассылка по подписке.

Служебные Web-сервисы портала включают средства ввода метаописаний, ограничения доступа, сбора статистики использования информационных ресурсов портала, работы со словарем параметров ЕСИМО, просмотра кодификатора.

Информационные сервисы предоставляют возможности поиска ресурсов по классификации (сфера, явление, тип информации – анализ, прогноз, климат), по географической карте и по организации – создателю ресурса. Предполагается, что поиск будет вестись не только по базе метаданных, но и по океанографическим данным и метеосводкам, поступающим по каналам Глобальной сети телесвязи и переданным в международный обмен.

Для организации единого информационного пространства портала используется компонентная архитектура CORBA и платформа EJB с использованием XML-технологии. В результате Web-сервисы и службы портала объединены в кластерную систему приложений.

Портал “Мировой океан” создан как информационная система, позволяющая пользователю получить интересующую его информацию по любому району, в любой момент времени независимо от его местонахождения и вида терминала (ведутся работы по поддержке доступа к порталу с использованием мобильных телефонов). На 10 июня 2003 г. в портале имеется более 50 тыс. документов (описания массивов данных – более 400, сведения о рейсах научно-исследовательских судов – 32500, сведения о научно-исследовательских судах – около 10 тыс., сведения о проектах, организациях, экспертах, приборах и т.д.). На портале можно получить текущие данные, полученные по каналам Глобальной сети телесвязи, а также прогностическую и климатическую информации о состоянии природной среды на последний срок наблюдений.

В 1997 г. руководством РАН было принято решение о развертывании работ по созданию Интегрированной Системы Информационных Ресурсов (ИСИР) РАН [3] в виде информационного портала, который бы объединил основные научные информационные ресурсы и Web-сервисы различных учреждений РАН. Назначение ИСИР РАН – обеспечение доступа ученым, научным коллективам и организациям к информационным ресурсам и электронным услугам РАН, организация оперативного информационного обмена и эффективного поиска научной информации. В основе концепции построения ИСИР РАН лежит современная технология открытых систем, предполагающая использование единой системы метаданных для описания научных ресурсов и сервисов различного типа. Позже этот проект эволюционировал в проект Единой информационной системы РАН (ЕИС РАН). Основные разработки этого проекта, связанные с созданием системы метаданных, представлено ниже в разделе 4.3.

Для увеличения своей аудитории некоторые научные Интернет-проекты намеренно расширяют свою тематику, стремятся популяризировать научную информацию, делая ее доступной не только для специалистов. Подобные Web-сервисы призваны стать местом ознакомления широкой общественности со значимыми результатами фундаментальной науки. Так, например, Российская Научная Сеть (http://www.nature.ru) представляет собой информационный портал и распределенную информационную сеть, нацеленные на облегчение доступа населения к научной, научно-популярной и образовательной информации, и на стимулирование междисциплинарного обмена знаниями между профессиональными участниками научного и образовательного процессов. Научная Сеть содержит каталог основных научных публикаций, базы биографий выдающихся ученых, диссертаций, научных статей, научно-популярных обзоров по широкому спектру научных дисциплин. Информационный сервис “Научная Сеть” устроен так, что вся информация доступна как в виде ленты новостей, так и через поисковую систему по ключевым словам, авторам, названиям материала. Источниками информации для Научной Сети являются русскоязычные научно-образовательные ресурсы Интернета, издательские дома, выпускающие научную и научно-популярную литературу, крупные научные и учебные заведения, образовательные и научные фонды, участники научных сообществ. Правила предоставления материала для Научной Сети опубликованы на странице (http://www.nature.ru/doc/rules.html). Научная Сеть складывается из информационных ресурсов, объединенных общими принципами редакционной и технологической политики (тем самым нивелируется профессиональная специфика информационных ресурсов), и составляющих логически единую базу научных знаний. Список участников портала “Научная Сеть”:

астрономия: Астронет;

геология: Все о Геологии;

физика: Fhys.Web.Ru;

криптография: Cryptography.Ru;

Русское Зарубежье;

Междисциплинарный научный сервер: Scientific.Ru.

Таким образом, формирование единого информационного пространства для научных сообществ идет не только по пути развития специализированных, тематических Web-порталов, но и на основе создания распределенной системы (сети) баз данных и знаний по конкретной предметной области. В последнем случае, на равноправной основе, объединяются различные ресурсы, посвященные одной тематике, нескольких сайтов. В отношении предоставления доступа к этим информационным ресурсам и их использования, на сайтах может проводиться самостоятельная политика. Объединение информационных ресурсов в единую распределенную сеть позволяет ее участникам, координируя свою научную работу, исключить дублирование при создании ресурсов, а также обеспечить рост своей аудитории за счет использования не одной, а нескольких “точек входа” для доступа к ресурсам и Web-сервисам. Сайты (узлы) распределенной системы обеспечиваются возможностью полного автономного функционирования: выход из строя какого-то сайта не сказывается на функционировании других узлов системы. С другой стороны, взаимные перекрестные ссылки и возможность поиска по всем объединенным информационным ресурсам реализуют идею единого виртуального информационного хранилища.

Примером такой распределенной информационной системы является сеть БАФИЗ-2, распределенная система баз данных и знаний в области фундаментальных свойств материи и прикладной ядерной физики. Информационное пространство сети БАФИЗ-2 образуют, прежде всего, ресурсы сайтов следующих научных организаций: Лаборатории информационных технологий Объединенного института ядерных исследований (http://dbserv.jinr.ru), Отделения ядерной физики РАН (http://ruhep.ru), Научно-исследовательского института ядерной физики МГУ (http://dbserv.npi.msu.ru), Петербургского института ядерной физики (http://dbserv.pnpi.spb.ru). В дальнейшем предполагается подключение к сети БАФИЗ-2 сайтов еще трех научных организаций: Института физики высоких энергий, Института теоретической и экспериментальной физики и Института ядерных исследований. Кроме того, в состав распределенной сети БАФИЗ-2 входят ресурсы Web-сервера коллаборации RDMS CMS (http://sunct2.jinr.ru), а также данные физических архивов OMNI и COHO, доступные со следующих страниц: http://alpha.sinp.msu.ru/datasets.html, http://alpha.sinp.msu.ru/dataintr.html.

На текущий момент, в сети БАФИЗ-2 нарушен принцип равноправности узлов, поскольку существует базовый узел, размещенный в ОИЯИ (http://dbserv.jinr.ru). Единая поисковая система, реализованная пока только на этом узле, обеспечивает поиск на всем информационном пространстве БАФИЗ-2; здесь же размещены основные сведения и отчеты по созданию и развитию сети БАФИЗ-2. В рамках развития сети БАФИЗ-2 предполагается выполнить принцип равноправия узлов, а также сформировать единый каталог информационных ресурсов и единый репозиторий предлагаемых Web-сервисов (с использованием спецификаций SOAP/WSDL/UDDI). На базовом узле сети БАФИЗ-2 размещена страница, http://dbserv.jinr.ru/js/ws.html, на которой содержатся сведения о перспективных технологиях использования Web-сервисов с их базовыми стандартами/протоколами типа SOAP (обмен XML-сообщениями между Web-сервисами), UDDI (формирование регистра и репозитория Web-сервисов), WSDL (XML-подобный язык описания Web-сервисов), LDAP (протокол доступа к каталогам), а также сведения об архитектуре OGSA (Open Grid Services Architecture) и другая интересная информация.

3.4. Виртуальные музеи

Данный сервис реализуют, как правило, в виде тематического Web-портала, аккумулирующего накопленные объемы ИР по конкретной научной дисциплине за некоторый, как правило, продолжительный, период времени. Научные организации, частные лица содержат в своих архивах и фондах множество уникальных научных экспонатов, вещественные памятники, символы и реликвии научно-технической культуры, документальные факты достижений отечественной фундаментальной науки. Цель виртуальных научных музеев – сделать подобную информацию достоянием специалистов и широкой общественности.

Поскольку полноценные изображения биологических объектов требуют значительных объемов и существенный трафик при обмене, то при создании Пущинского виртуального биологического музея (ВБМ) [50] было принято решение использовать, наряду с Web-порталом, преимущества распределенной информационной сети, GRID-сети. В ВБМ каждый участник музея создает свой локальный сегмент экспонатов по единым технологическим требованиям, а программные ресурсы GRID-сети обеспечивают их эффективное взаимодействие. В результате появляется возможность быстрого, почти одновременного, доступа ко всем архивам музея для решения задачи “полного воссоздания” биологического образца из различных фрагментов.

К 250-летию МГУ создан Виртуальный музей истории Московского университета (http://museum.guru.ru), основная задача которого – предоставить широкий доступ к уникальным историческим сведениям, документам и экспонатам. Основные разделы музея:

“Реликвии” содержит архивные документы и музейные экспонаты по истории Московского университета. Архив – полнотекстовая библиотека уникальных исторических источников, относящихся к началу деятельности университета. Экспозиция – галерея изображений памятных медалей, знаков, грамот и других экспонатов, рассказывающих об университетской истории;

“Персоналии” содержит сведения о замечательных людях Московского университета, его профессорах и студентах;

“Библиотека” содержит полнотекстовые исторические очерки о Московском университете, воспоминания и избранную библиографию по материалам исследований истории университета (XIII – XIX вв.);

“Поиск” материалов по атрибутам: основные даты и события; предметы, кафедры и факультеты; персоналии (профессоры, ректоры и деканы, студенты);

“Уставы” представляет хронику изменения организационной структуры Московского университета: содержит тексты уставов Московского университета с момента его основания, а также схемы, иллюстрирующие управление университетом на различных исторических этапах;

“Летопись” реализует поиск основных событий в истории Московского университета (по временному интервалу, по ключевым словам);

“Прогулки” содержит описания и исторические фотографии зданий Московского университета, схема Московского университета, перечень несохранившихся зданий (XVIII – начало XX века).

Сибирский Зоологический Музей Института систематики и экологии животных СО РАН разрабатывает свой виртуальный аналог (http://szmn.eco.nsc.ru), который содержит следующие разделы: “История музея”, “Экспозиция”, “Научные коллекции”, “Штат и адрес музея”, “Галерея оригинальных фотографий животных в природе”, “Информация”, “Евроазиатский энтомологический журнал”, “Музейные ссылки”. Раздел “Экспозиция” содержит фотографии реальных экспонатов, которые хранятся в фондах музея. Фотографии экспонатов размещены на двух основных витринах: “Позвоночные” и “Беспозвоночные”, которые тематически детализируются. Так, например, на витрине “Позвоночные” представлены фотографии по следующим тематическим разделам:

Разнообразие отрядов насекомых;

Стрекозы: жизнь и разнообразие;

Жуки: разнообразие и жизненные формы;

Жуки-жужелицы Алтайских гор и их характерные места обитания;

Бабочки Сибири и Заполярья;

Бабочки Дальнего Востока;

Бабочки-птицекрылки – краса тропиков;

Перепончатокрылые: пилильщики, осы, пчелы, наездники;

Двукрылые: мухи, комары и другой гнус;

Экология насекомых;

Насекомые строят;

Гнезда общественных ос и пчелиных;

Вредители леса;

Раковины морских моллюсков;

Пресноводные моллюски;

Наземные моллюски Северной и Средней Евразии.

Еще один интересный виртуальный музей, Музей антропологии и этнографии имени Петра Великого (Кунсткамера) РАН, находится по адресу http://www.kunstkamera.ru/. Создатели данного научного сервиса отмечают, что его появление было бы невозможным без финансовой поддержки Российского гуманитарного научного фонда и спонсорской помощи таких организаций как компания LANCK ltd., Автономная некоммерческая Российско-американская организация “Трансграничное Экологическое Информационное Агентство” (TEIA), Санкт-Петербургский государственный университет, Василеостровский телекоммуникационный центр и отделение антропологии Музея. Эта помощь состояла в предоставлении помещения, музейных экспонатов, необходимого оборудования и программного обеспечения, средств разработки и доступа в Интернет, т.е. всего комплекса средств, необходимого для организации и устойчивого функционирования такого научного Web-сервиса как виртуальный музей.

В настоящее время отечественные виртуальные научные музеи используют, в основном, текстовую информацию, различные базы данных (преимущественно, библиографические БД) и фотографии музейных экспонатов. Но надо ожидать, что в недалеком будущем они будут активно использовать качественное цифровое видео, 3D-изображения, сборники тематических лекций со звуковым сопровождением и с элементами анимации, т.е. те способы предоставления информации, которыми и силен Интернет.

Системы метаданных и их использование для организации научных информационных ресурсов и сервисов

Как уже отмечалось, признаки и свойства информационных объектов, которые могут использоваться для организации поиска и управления данными достаточно многообразны. Поэтому, для расширения возможностей информационных систем нужны многоаспектные описания информационных объектов, использующие определенный набор метаданных различных типов. При этом, для охвата информационной системой сколько-нибудь широкого множества информационных ресурсов этот набор метаданных должен быть в достаточной мере стандартным для информационного пространства, в котором он применяется. По степени видового и тематического охвата информационных ресурсов применяемые наборы (системы) метаданных можно разделить на универсальные и специализированные.

Помимо задачи подбора множества типов метаданных, адекватно описывающих выбранное множество информационных ресурсов, разработка системы метаданных должна решать также задачу стандартизации и формализации записи метаданных, обеспечения возможностей автоматизированной обработки метаописаний. При этом, для обеспечения интероперабельности информационных систем и расширения возможностей применения уже готовых проектных решений при создании новых систем, желательно выработать ряд стандартных подходов к построению структуры систем метаданных и ее реализации на уровне программных средств.

В связи с изложенным можно выделить следующие направления исследований и разработок в области создания и использования систем метаданных:

Разработка формальных моделей, языков и программного инструментария систем метаданных;

Универсальные системы метаданных и их применение для создания каталогов научных и образовательных ресурсов;

Специализированные системы метаданных и их использование;

Разработка интерфейсов к разнородным ресурсам на основе стандартов метаданных в различных областях науки.

Разработка формальных моделей, языков и программного инструментария систем метаданных. Их реализация в сети Интернет.

Текущее состояние Web характеризуется слабой структурированностью данных, низким уровнем их взаимосвязи. Распространение XML-технологий дает возможность структурировать информацию, обеспечить синтаксическую интероперабельность приложений. Следующий этап развития Web ориентируется на технологии, которые вносят в Web возможность семантической интероперабельности. Логическим продолжением развития Web – от гипертекстовых страниц к XML-данным, от XML – к машинной интерпретации данных и объединению разбросанной в Web информации является Semantic Web.

Semantic Web – это расширение Web, в котором информации придается определенная семантика, позволяя людям и машинам работать вместе“ – примерно такое определение дают своим работам члены W3C Semantic Web Activity. Целью этого проекта является внедрение в Web таких технологий, которые позволят существенно повысить уровень интеграции информации, обеспечить развитую машинную обработку данных, дадут возможность выдавать более адекватные ответы на поисковые запросы и т.д.

Semantic Web базируется на модели данных Resource Description Framework (RDF), позволяющей объединять информацию из различных источников. Второй базовый компонент Semantic Web – это RDF/XML-синтаксис, который дает возможность представить RDF-данные в XML- форме. Следующий уровень в пирамиде технологий Semantic Web занимает язык RDF Schema (RDFS) – язык описания словарей RDF-терминов (классов и свойств Web-ресурсов). В отличие от XML-схем, которые описывают структуру XML-документов, ограничивают их содержание, RDF-схемы позволяют определять семантику данных, основанных на XML-представлении. RDFS служит фундаментом для более богатых языков описания моделей предметных областей (языков описания онтологий), которые позволяют адаптировать к Web системы математической логики и обеспечить семантическую обработку данных.

RDF модель данных, составляющая основу методики Semantic Web, является представителем семейства реляционных моделей данных, специфика которой состоит том, что ресурсы и свойства идентифицируются с помощью глобальных идентификаторов - URI. RDF описывает предметную область в терминах ресурсов, свойств ресурсов и значений свойств. RDF-данные можно расценивать как совокупность утверждений – субъект, предикат (свойство) и объект утверждения, представлять в виде направленного графа, образуемый такими утверждениями.

RDF/XML-синтаксис позволяет записать граф в последовательной форме, пригодной для обмена данными. Этот синтаксис достаточно гибок – он допускает различные формы записи одного и того же графа, различные сокращенные формы.

RDFS предоставляет механизм для определения необходимой совокупности типов ресурсов и свойств. RDFS вводит такие понятия, как классы, подклассы, свойства и подсвойства, дает возможность накладывать на них ограничения. RDFS позволяет определить классы ресурсов и свойства как элементы словаря типов данных, и специфицировать, какие свойства, с какими классами могут быть использованы. RDFS выражает эти словари средствами RDF, предоставляя набор предопределенных ресурсов и свойств с обозначенной для них смысловой нагрузкой, которые могут быть использованы для описания новых RDF-словарей.

Таким образом, любое RDFS-описание представляет собой “обычные” RDF-данные – данные о классах и свойствах. RDFS позволяет определить уникальные (идентифицируемые URI) классы ресурсов, представляющие концептуальную модель конкретной предметной области, и уникальные (идентифицируемые URI) свойства, интересующие нас в этой области. Принадлежность ресурса к конкретному классу задается с помощью свойства rdf:type, представляемого в графе дугой от экземпляра к классу. Описываемые в словаре классы сами являются экземплярами предопределенного класса rdfs:Class, свойства же являются экземплярами класса rdf:Property. RDFS позволяет указать, каким классам присущи заданные свойства, и ресурсы какого класса могут появиться в качестве значения заданного свойства. Эта информация указывается в словаре с помощью свойств rdfs:domain и rdfs:range соответственно. RDFS позволяет связать классы (rdfs:Class) отношениями множественного наследования (rdfs:subClassOf). В RDFS-модели, как и в обычном объектном подходе, классам свойственен полиморфизм. То есть, экземпляр подкласса всегда может сыграть роль экземпляра своего суперкласса, и появиться как субъект или объект свойства, для которого в качестве соответственно range или domain был указан суперкласс. Свойства также могут быть связаны отношениями множественного наследования (rdfs:subPropertyOf). Наследование свойства означает более узкую специализацию этого свойства, уточнение смысла и сужение границ использования.

Язык RDFS предоставляет лишь базовые возможности для описания схем данных предметных областей, но он легко может быть расширен дополнительными примитивами моделирования, более детально и специализировано описывающими нужные аспекты классов и свойств. Механизм расширения внутренне присущ RDFS, поскольку для описания схем используется модель данных RDF, которая позволяет расширить описание любых ресурсов дополнительной информацией. Предопределенный словарь “мета-типов” RDFS также может быть расширен под нужды приложения, благодаря чему появляется возможность добавлять в язык новые примитивы.

Расширяемость позволяет RDFS стать фундаментом для более богатых языков концептуального моделирования – языков описания web-онтологий предметных областей. Цель таких языков – указать дополнительную машинно-интерпретируемую семантику ресурсов, то есть сделать машинное представление данных более похожим на положение вещей в реальном мире. Использование богатых языков концептуального моделирования позволит адаптировать к Web большое количество наработок в области систем инженерии знаний и баз знаний. Привлечение к Web систем логики и искусственного интеллекта составляет вершину “пирамиды Semantic Web”, обеспечивая адекватный поиск информации и ее машинную интерпретацию.

Важнейшим свойством веба является децентрализация как подготовки, так и хранения информации. Из этого вытекают следующие последствия. Во-первых, невозможно использовать вместо URI короткие имена. Во-вторых, можно заменить описание какого либо ресурса ссылкой на его URI. В-третьих, никогда описание ресурса не может признаваться исчерпывающим, в вебе всегда может найтисьеще одно описание этого ресурса, содержащее о нем дополнительные сведения.

Язык RDF Schema позволяет описывать словари классов и свойств, в том числе контролируемые словари вариантов значений. Поскольку классы, свойства и экземплярыметаданных идентифицируются не просто именем, а URI, то это позволяет разделить их по профилям, соответствующим “пространствам имен”. RDF Schema служит базой для более сложного языка описания онтологий предметных областей (Ontology Web Language, OWL), который позволяет определить более сложные ограничения на применение классов и свойств, на структуру метаданных.

Разбиение схемы метаданных на последовательно наращиваемые подсхемы становится возможным благодаря свойственной RDF децентрализации данных: каждая схема рассматривается как набор утверждений, а расширенная схема – как набор дополнительных утверждений. OWL позволяет указывать метаданные о схемах, и в частности, их функциональную зависимость, импорт схем. При импорте все утверждения импортируемой схемы становятся утверждениями импортирующей онтологии – подсхемы. Подсхема может не только определять собственные классы и свойства, но и указывать дополнительную информацию об импортированных классах и свойствах, в частности, добавлять новые свойствак импортированным классам, уточнять тип значений и ограничения на импортированные свойства. Для импорта схем RDF Schema и OWL предлагают ряд методических приемов, в том числе:

Механизм подклассов, позволяющий указывать специализацию классов, уточнение семантики терминов и наборов свойств;

Механизм подсвойств, уточняющий специализацию свойств их характеристики;

Механизм эквивалентности, классов, свойств, элементов словарей значений.

Эти механизмы позволяют указать отображение схем на стандартные и широко применяющиеся профили метаданных, в том числе не обязательно ориентированные на RDF Schema.

Универсальные системы метаданных и их применение для создания каталогов научных и образовательных ресурсов

Как уже отмечалось системами метаданных, имеющими самую длительную историю применения, являются стандарты библиографических описаний. Их расширения, приспособленные к появлению новых объектов описания (прежде всего, электронных изданий), составляют значительный класс претендующих на универсальность современных систем метаданных. Практически все известные системы этого класса принадлежат к семейству форматов типа МАРК (UNIMARC, RUSMARC, USMARC, MARC 21). Организации каталогов на основеэтой системы метаданныхпосвящена обширная литература и множество экспериментальных и промышленных систем. Библиографию работ, посвященных библиотечным технологиям на основе системы МАРК, можно найти, например, в [51].

Важно иметь в виду, что системы метаданных семейства МАРК используются не только в библиотечных системах. Они явились основой достаточно широко распространенной технологии поиска в распределенных базах данных, использующейсетевой протокол Z.39.50 и построенные на этом протоколе серверные и клиентские программы. На этой технологии, в частности, строится известная система учета правительственных ресурсов США GILS [52].

Несмотря на очевидную эффективность организации поиска в распределенных БД по данной технологии, многие специалисты скептически смотрят на ее перспективы. Главные причины этого – необходимость для конечного пользователя иметь специальные клиентские программы и необходимостьшлюза при взаимодействиис веб-серверами.

В последние годы наибольшую популярность приобрела система метаданных "Дублинское ядро" (Dublin Core – далее DC). Полное название системы - Метаданные Дублинского ядра для простого открытия ресурса (The Dublin Core Metadata for Simple Resource Discovery).

Стандарт метаданных DC – это простой, но эффективный набор элементов для описания широкого спектра сетевых ресурсов. Включает в себя пятнадцать элементов, семантика которых была совместно определена международными междисциплинарными группами профессионалов в области библиотечного дела, вычислительной техники, кодирования текстов, специалистов музейного дела, других смежных областей исследования.

В DC существует два класса терминов - элементы и квалификаторы, которые могут быть организованы в простые утверждения. Сами ресурсы понимаются в этом языке как предметы. Каждый элемент имеет ограниченный набор квалификаторов, атрибутов, которые могут быть использованы для дальнейшего уточнения (но не расширения) значения элемента. Инициатива метаданных Дублинского ядра (Dublin Core Metadata Initiative, DCMI) определила стандартные пути "квалификации" элементов с использованием различных типов квалификаторов.

Использование формата Dublin Core ставит задачу достижения следующих характеристик:

Простота создания и поддержки ресурсов. Набор элементов должен быть по возможности мал и прост для того, чтобы дать неспециалистам возможность с легкостью и минимальными затратами создавать записи описаний информационных ресурсов для обеспечения высокой эффективности нахождения этих ресурсов в сетевой среде.

Легко понимаемую семантику, что позволяет как генерировать метаданные непосредственно создателями ресурса, так и более эффективно искать информацию в Интернете.

Международный охват. Набор элементов ДЯ разработан на английском языке, но созданы версии и на многих других языках Специальная группа "Многоязычный ДЯ" координирует попытки связать эти версии в распределенном регистре, используя технологию RDF. Правительство ряда стран утвердило DC в качестве национального стандарта метаданных.

DC отлично подходит в качестве стандарта для описания объектов типа “публикация”, что обусловлено следующими преимуществами этого стандарта:

набор основных семантических элементов компактен и, в то же время, позволяет задавать практически все требуемые атрибуты;

простота имплементации;

наличие полного комплекта нормативных документов и технической поддержки;

семантика каждого элемента может быть уточнена с помощью квалификаторов, как стандартных, известных и понятных всем, так и специально разработанных для точной спецификации семантического смысла определенного атрибута при обмене данными внутри небольшого сообщества;

в стандарте заложена возможность использования различных семантических схем, словарей и т.п.

определен механизм, позволяющий извлечь информацию из описания, использующего нестандартные расширения пространства имен;

стандарт получает все более широкое распространение в мировом сообществе.

Набор элементов ДЯ представляет собой простую запись, описывающую ресурс. Предполагается, что он будет основой для электронных библиографических описаний и улучшит структурированный доступ к информации в Интернете. Цель в облегчении описания, организации, открытия и доступа к сетевым информационным ресурсам. Стандартизованы 15 элементов описания информации:

заголовок;

автор или создатель;

тема и ключевые слова;

описание;

публикатор;

другие контрибуторы;

дата;

тип ресурса;

формат;

идентификатор ресурса;

источник;

язык;

связи;

область (coverage);

управление правами.

Восемь элементов могут быть уточнены с помощью одного или более квалификаторов (например, "альтернативное название"), в то время как набор разрешенных схем кодирования (определяемых необязательным атрибутом scheme) позволяет создавать квалификаторы для 10 элементов.

Словарь типов DCMI представляет собой общий междисциплинарный список одобренных терминов, которые могут использоваться в качестве значений для элемента Resource Type, идентифицируя жанр ресурса. Спецификация базовых структурных значений DCMI (Dubin Core Structured Values (DCSV)) предназначена для записи значений атрибутов на таких языках разметки, как HTML и XML.

Наиболее крупной попыткой создания универсального каталога научных информационных ресурсов, осуществляемой на основе стандарта Дублинского ядра метаданных, следует признать проект Навигационной системы по информационной ресурсам государственной системы научно-технической информации.Этот проект при поддержке Министерства по науке, промышленности и технологиям в 2002-2004 гг. ведет консорциум организаций (ГНИИ ИТ «Информика», БЕН РАН, ВИНИТИ РАН и Информэлектро) при головной роли ФГУП НТЦ «Информрегистр» [41, 53]. В этот каталог, в отличие от многих, существующих в Интернете, включены не только сетевые ИР, но и локальные, в том числе распространяемые на переносимых носителях.

Основная модель описания ИР строится на основе Дублинского ядра, в значительной степени расширенного. В частности, описание ИР в этой системе сопровождает достаточно подробное описание владельца ИР – юридического или физического лица.

Основные типы ресурсов, описываемые в этой системе – это электронные коллекции документов, в том числе базы данных, сайты или разделы сайтов, электронные библиотеки и периодические электронные издания, ГИС, специальные массивы научно-экспериментальных данных. Отдельные документы в этой системе не каталогизируются, чтобы избежать дублирования с другими известными каталогами и базами данных ГСНТИ. По состоянию на конец 2004 г. в Навигационной системе представлено более 4 тыс. описаний ресурсов, свыше 1 тыс. юридических и 2 тыс. физических лиц - владельцев и создателей ресурсов. Формат описания ресурсов в этой системе и краткие пояснения к правилам заполнения отдельных полей приводится ниже.

Наименование ИР. Обязательный элемент. Допускается до 4 значений.

Приводится наименование информационного ресурса, отражающее его основное назначение. Официальное наименование ресурса приводится первым. Первое значение приводится на русском языке. В случае наличия принятого сокращения наименования ресурса оно приводится вторым. В качестве дополнительных могут приводиться перевод полного и сокращенного наименований ИР на английский язык.

В случаях подготовки описания ИР, поименованного в соответствующем нормативном документе (нормативно-правовой документ, задание на проведение НИР, грант и т.п.), необходимо приводить это наименование.

История переименований. Необязательный элемент.

Текст, содержащий сведения об истории переименований ресурса, список его прежних наименований.

Описание. Обязательный элемент. Допускается несколько значений.

Описание содержимого ИР приводится в виде краткого реферата, в котором следует использовать основные термины, характеризующие ресурс. Объем реферата не должен превышать 1000 знаков. При описании сложных ИР (сайт крупной организации, банк данных, включающий множество баз данных) допустимо расширение объема реферата до 2000 знаков.

Описание ресурса должно начинаться с указания типа ресурса, за исключением случаев, когда он определяется из названия. Желательно приводить вид информации ресурса в зависимости от типа ресурса (тип баз данных для БД и т.п.). Далее приводится сокращенное изложениесодержания: тема, тематика, предмет ИР, назначение, структура и состав ИР, в том числе: наименование основных полей для БД, разделы сайта (при описании сайта в целом), при описании его отдельных разделов - принадлежность описываемого ресурса к конкретному сайту; основные функции, возможности навигации по описываемому ИР.

В случае вторичной информации целесообразно указывать наличие первоисточников.

Далее приводится сокращенное изложениесодержания: тема, тематика, предмет ИР, назначение, структура и состав ИР, в том числе: наименование основных полей для БД, разделы сайта (при описании сайта в целом), при описании его отдельных разделов - принадлежность описываемого ресурса к конкретному сайту; основные функции, возможности навигации по описываемому ИР.

Допускается приведение фрагментов описаний, взятых из альтернативных источников в виде отдельных значений поля.

Владелец ресурса Обязательный элемент. Допускается несколько значений.

Приводится полное официальное наименование юридического лица (организации, учреждения, государственного органа, предприятия, общественной или иной организации) или физического лица – владельца ИР. Допускается запись наименования в виде, приведенном на документе, являющемся исходным для формирования описания ИР. В случае наличия официально заверенного источника информации наименование должно совпадать с указанным при регистрации заявителя.

Для физических лиц приводится в виде: Фамилия Имя Отчество.

Создатель ресурса. Необязательный элемент. Допускается несколько значений.

Приводится полное официальное наименование юридического лица или физического лица, несущего первичную ответственность за создание ИР. Допускается запись наименования в виде, приведенном на документе, являющемся исходным для формирования описания ИР. В случае наличия официально заверенного источника информации наименование должно совпадать с указанным при регистрации заявителя. Для физических лиц приводится в виде: Фамилия Имя Отчество.

Соисполнитель. Необязательный элемент. Допускается несколько значений.

Приводится наименование лица, внесшего вклад в создание или публикацию ИР. Те же требования, что и для предыдущего элемента.

Взаимоотношения “создателя”, “владельца”, “соисполнителя” прописываются вблоке полей «Правовые отношения».

Блок сведений о предметной области ИР

ГРНТИ. Обязательный элемент. Допускается до 5 значений.

Приводится тематика ИР, выраженная кодами Рубрикатора ГРНТИ. Желательна простановка не менее двух уровней рубрик.

Допустимо употребление кодов в виде:

00/90 –для политематических ИР;

00/26 –для комплексных ИР по общественным наукам;

27/43 – для комплексных ИР поестественным и точным наукам;

44/81 –для комплексных ИР потехническим и прикладным наукам и отраслям экономики;

82/90 – для ИР по межотраслевым проблемам.

Тип ИР. Обязательный элемент.

Приводится одно из значений Классификатора типов ресурсов:

базы данных (БД);

веб-сайты (отдельные веб-страницы и другие разделы сайтов, если эти разделы являются совокупностью документов);

хранилища данных;

электронные библиотеки, включая электронные музеи, галереи и пр.;

электронные издания (содержащие коллекции документов с информационно-поисковыми системами) – сетевые или на носителях, а также сетевые электронные издания (журналы), имеющие печатные аналоги;

специальные массивы научных данных (электронные модели объектов, массивы экспериментальных данных, базы знаний, диагностические, экспертные системы и др.);

массивы электронных конструкторских, технологических и других производственных документов (прежде всего, создаваемые в рамках CALS-технологий);

ГИС-системы и электронные карты (массивы геоданных)..

Источники финансирования. Необязательный элемент.

Приводятся одно или несколько значенийиз Классификатора “Форма финансирования” Государственная

- Федеральная

- Субъектов РФ

- Совместного ведения РФ и субъектов РФ

Муниципальная

- Совместного ведения органов местного самоуправления и субъектов РФ

- Собственность органов местного самоуправления

Общественная (собственность общественных и других некоммерческих организаций)

- Общественная собственностьс участием государства

- Общественная собственностьбез участия государства

Акционерная

- Акционерная с участием государства без участия иностранного капитала

- Акционерная с участием государства с участием иностранного капитала

- Акционерная без участия иностранного капитала

-  Акционерная с участием иностранного капитала

Частная (физических лиц)

Поддерживаемые языки. Обязательный элемент. Допускается несколько значений.

Представление языков в соответствии с ГОСТ 7.75 СИБИД Коды наименований языков

Блок полей, характеризующих временные и пространственные области действия ресурса (охват). Допускаются повторения.

Временной охват. Необязательный элемент. Допускается несколько значений.

Текстовое описание временного интервала источников, на основании которых создан описываемый ИР. Например: средние века, меловой период, VI-X века.

Географический охват. Необязательный элемент. Допускается несколько значений.

Текстовое описание пространственного интервала источников, на основании которых создан описываемый ИР.

Блок полей, описывающий родственные ресурсы. Допускаются повторения. Необязательный.

Ссылка. Сетевой, библиографический или какой-либо другой формальный адрес родственного ресурса

Описание родственного ресурса.Приводятся наименование и текстовое описание на русском языке родственного ИР с указанием отношения родства

Блок полей, описывающий ресурсы-источники. Допускаются повторения.

Элементы аналогичные предыдущему блоку.

Блок полей, описывающий правовые аспекты использования ресурса

Регистрация. Необязательный элемент. Допускается несколько значений.

Приводится регистрационный или учетный номер, присвоенный ИР в другой системе регистрации ИР. Приводится наименование системы регистрации, в которой ИР присвоен указанный регистрационный или учетный номер (Например: Государственный регистр баз и банков данных).

Правовой документ. Необязательный элемент. Допускается несколько значений.

Текст, содержащий наименование и описание относящегося к вопросу правообладания документа. Наименование приводится согласно документу о правообладании.

Правовые отношения. Для Государственных ИР заполнение поля является ОБЯЗАТЕЛЬНЫМ и должно содержать данные об основаниях возникновения этих прав, соглашениях об их распределении, а также сведения о переуступке таких прав заключенных лицензионных договорах. Допускается несколько значений.

Текст, содержащий информацию о правовых отношениях заявителя к ИР, а также другие известные ему сведения о правах других субъектов (“владельцев”, “создателей”,“соисполнителей” и “держателей”) на представляемый ИР.

Блок полей, описывающий условия и возможности практического использования ресурса

Контактное лицо. Допускается несколько значений.

Приводится ФИО контактного лица. Способ записи – аналогично записи сведений о физических лицах: Фамилия Имя Отчество.

Телефоны для справок. Допускается до 3 значений.

Электронныеадреса для справок и консультаций. Допускается несколько значений

Адресресурса.

Приводится сетевой адрес размещения ресурса

Условия доступа и услуги. Необязательный элемент.

В текстовой форме отражаются условия доступа и услуги, оказываемые на основе ресурса. Для отдельных ресурсов, содержащих библиографические данные, желательно указывать возможность доступа к полнотекстовым источникам. При наличии ограничений специально оговаривается возможность получения доступа к ресурсу. Например: “Необходима предварительная регистрация”, “Доступ по паролю”, “Доступ с 10 до 14 часов”.Отдельно приводится перечень дополнительных услуг и условий их предоставления. Например:“Подготовка аналитико - статистических данных и выполнение тематических запросов на платной основе”.

Необходимое оборудование. Необязательный элемент.

Текстовое описание оборудования, необходимого для использования ресурса (марка, тип, технические характеристики, дополнительные специальные требования к оборудованию)

Для сетевых ИР указываются требования, относящиеся к клиентской части

Необходимое программное обеспечение. Необязательный элемент.

Текстовое описание программного обеспечения, необходимого для использования ИР.

Для сетевых ИР указываются требования, относящиеся к клиентской части

Объем-количество. Необязательный элемент.

Для ресурсов, представляющих совокупность однородных элементов приводится их количество. Для ресурсов типа БД приводится объем БД в записях.

Объем дискового пространства. Необязательный элемент.

Приводится объем занимаемого пространства на носителе информации

Вид конфиденциальной информации. Обязательный элемент

Отражается степень ограничения доступа к ИР. Приводятся значения в соответствии склассификатором “Виды конфиденциальной информации”.

Блок временных характеристик

Дата создания ресурса. Обязательный элемент.

Дата записывается в формате ISO 8601 (Приложение 3). Допускается ограничиться годом создания ресурса.

Дата публикации или начала использования ресурса. Обязательный элемент.

Приводится дата публикации или начала использования ресурса. Представление согласно ISO 8601. Для электронного издания приводится год издания ЭИ.

Дата последнего обновления ресурса. Обязательный элемент.

Приводится дата последнего обновления ресурса. Представление согласно ISO 8601.

Период обновления ресурса. Обязательный элемент.

Приводится одно из значений Классификатора “Период обновления ресурса”

Дата первого представления данных об ИР. Обязательныйэлемент.

Дата записываются в формате ISO 8601.

В случае интерактивного ввода данных формируется автоматически.

Дата последнего обновления данных об ИР. Обязательный элемент.

Дата записываются в формате ISO 8601. В случае интерактивного ввода данных формируется автоматически

Примером универсального корпоративного каталога разнородных ресурсов, также созданного на базе Дублинского ядра метаданных, может служить система, созданная в Московском государственном институте электронной техники [54]. Задача построения единого информационного пространства в этом институте решалась при помощи создания централизованного хранилища систематизированных описаний информационных ресурсов, используемых и появляющихся в процессе научной или образовательной деятельности на кафедрах и подразделениях. Это хранилище организовано как портальный репозиторий метаописаний первичных ИР.

При постановке задачи формирования метаописаний непосредственно в местах возникновения ИР встают задачи соотнесения структуры и семантики метаописаний, с одной стороны, к понятиям конкретного направления деятельности, а с другой – семантикой элементов стандарта Дублинского ядра. Для решения этой проблемы был выбран путь создания шаблонов-посредников для преобразования представлений, принятых для описания ресурсов в конкретных областях деятельности, в единый формат Дублинского ядра. Таким, образом, пользователь, который формирует метаописания, реально работает со специфическим представлением единого формата данных, используемого в центральном репозитории.

Для поддержания репозитория в актуальном состоянии и его взаимодействия с источниками информации была разработана специальная программа менеджер описаний информационных ресурсов (МОИР) с настраиваемым шаблоном для формирования представления метаописаний ресурсов для конкретных источников. Древовидность XML-формата используется для создания оригинального интерфейса при формировании представления метаописания на основе настраиваемого шаблона. Базовый шаблон поддерживает все элементы метаописания по стандарту Дублинского ядра. Этот же шаблон используется для создания интерфейса для формирования поисковых запросов при обращении через портал к репозиторию.

Система МОИР имеет клиент-серверную архитектуру, причем клиентские модули используются для формирования метаописаний источником в его пользовательском представлении, сохранения созданных метаописаний, а также служебной информации, в каждом клиентском месте. Получаемая от клиента информация содержит служебные сведения и описания ресурсов, представленные в виде XML-файла. Сервер взаимодействует с портальным модулем авторизации пользователя, хранилищем метаописаний и реестром служебной информации. В итоге взаимодействия сервер возвращает клиенту перечень идентификаторов зарегистрированных в хранилище ресурсов. Эти идентификаторы размещаются в локальном реестре и организуется связь со ссылками на физическое расположение ресурсов.

Аналогичный каталог разнородных ресурсов, создаваемых в университете и афилированных с ним структурах, также на основе Дублинского ядра метаданных предполагается создать в рамках портала ГУ ВШЭ [55].

Применение Дублинского ядра в качестве интегрирующего инструмента для разнородных ресурсов планируют также создатели многофункциональной информационной системы “Эволюция трудовых отношений в российской промышленности от дореволюционной индустриализации к нэпу” [56]. Авторы указывают, что система метаданных Дублинского ядра обладает такими бесспорными достоинствами как простота (особенно по сравнению системамиметаданных семейства МАРК), и использование языка HTML, что облегчает поиск документов сайта внешними поисковыми системами. Для историка особенно важно, что Дублинское ядро предлагает элементы, позволяющие описывать источники происхождения документов и взаимосвязи между ними. Кроме того, система метаданных позволяет организовать поиск внутри сайта средствами, дополнительными к обычному вербальному полнотекстовому поиску. Учитывая организацию информационных ресурсов и характер потребностей пользователя, атрибутивный поиск, наряду с вербальным поиском и поиском по классификаторам,является необходимым инструментом многофункциональной информационной системы.

Проект ИСИР

Универсальные системы метаданных могут стать идеологической основой для создания тех или иных навигационных и управляющих подсистем, но крупнейших организационных систем, интегрирующих большое число разнообразных информационных ресурсов. Наиболее крупным отечественным научно-информационным проектом, реализующим идеологию универсальных систем метаданных является разработка Интегрированной системы информационных ресурсов РАН (ИСИР), выполненная коллективом ВЦ РАН под руководством В.А. Серебрякова. В рамках этого проекта были разработаны основные модели формирования и взаимодействия схем метаданных на основе RDF.

В ИСИР сформировано расширение языка RDFS, пригодное для описания локального и глобального аспектов объектной схемы данных. Используются понятия RDFS-классов и свойств, идентифицируемых URI, понятия наследования классов и свойств, rdfs:range свойства, добавляющие возможность четко описать класс в терминах его атрибутов, как это делается в объектно-ориентированных языках программирования. С этой целью введено специальное свойство schema:property - отношение, связывающее класс с его свойствами.

Каждый репозиторий рассматривает свою схему ресурсов как замкнутое описание, по которому можно получить, например, соответствующее ODL-описание или сгенерировать систему bean-подобных Java-классов. Он интерпретирует rdfs:range как ограничение на тип значений свойства, которому должны удовлетворять хранимые данные, schema:property - как ограничение, четко задающее все присутствующие в классе атрибуты (которым будут соответствовать get/set методы в java-классах, поля в реляционной БД и т.п.). Репозиторий интерпретирует свою схему ресурсов в рамках традиционной объектной парадигмы, как требуется ИСИР при хранении данных. Это не противоречит идеям Semantic Web, поскольку приложения могут интерпретировать RDFS-описания по собственному усмотрению.

С другой стороны, при обмене данными между репозиториями и интеграции их информации, RDFS-описание объектной схемы каждого репозитория расценивается с позиции децентрализации, распределенности информации в Web. При загрузке сторонних RDF-данных, из них отбирается только та информация, которую репозиторий способен сопровождать согласно своей замкнутой схеме и своим ограничениям. При формировании результатов поисковых запросов поисковый сервис может возвращать пользователям описания ресурсов, интегрирующие свойства разных репозиториев, а, возможно, к тому же отфильтрованные в соответствии с предпочитаемой пользователем схемой ресурсов.

ИСИР использует RDFS как фундамент для описания объектных схем за простую объектную модель, удобство расширения новыми примитивами и адаптированность к Web, а следовательно и к обмену RDF и XML данными. Онтологические языки, в частности OWL, слишком сложны в силу своей ориентации на системы логики, и не имеет смысла использовать их лишь для описания объектной схемы репозитория и простых ограничений на нее. Но многие онтологии могут быть легко адаптированы под требования ИСИР путем их упрощения, что позволяет создавать цифровые библиотеки, хранящие информацию в соответствии с системой классов и свойств данной онтологии.

Приоритетное положение RDFS в ИСИР не мешает изначально описать объектную схему репозитория на других объектно-ориентированных языках, либо получить по существующей системе Java-классов. ИСИР предоставляет некоторые механизмы по отображению таких описаний объектной схемы друг в друга и их генерации.

Итак, ИСИР сопоставляет модель данных хранилища и модель данных Semantic Web через прослойку представления объектов языка Java, таким образом открывая Semantic Web доступ к хранимой информации. Когда мы находимся на web-уровне, мы исходим из принципов глобализации и децентрализации Semantic Web и используем RDFS для отражения объектной схемы интересующей нас предметной области. Когда же мы ограничиваем свою область видимости конкретным репозиториям, мы используем замкнутую объектную схему, соответствующую традиционной объектной парадигме, которая может быть выражена в терминах ODL, UML, или расширенного RDFS ИСИР. Этой схеме соответствует набор java-классов, отражающих предметную область. И наконец, Репозиторный Сервис ИСИР позволяет организовать отображение объектов этих классов в данные конкретного используемого хранилища, в соответствии со специфицированным механизмом отображения объектной модели данных в модель данных хранилища.

Архитектура ИСИР повсеместно применяет XML-технологии (XSLT, SOAP, XForms и пр.) и использует XML для представления хранимых объектных данных в сериализованном виде. Для XML-сериализации объектов используется сокращенный RDF/XML-синтаксис, который, с одной стороны, позволяет использовать XML Schema и воспользоваться всеми удобствами XML-технологий. С другой стороны, при обмене такой информацией для интеграции данных различных репозиториев ИСИР, используются все преимущества Semantic Web. Cтруктура такого RDF/XML файла четко соответствует объектной схеме репозитория ИСИР, объекты которого представлены в XML. Таким образом, RDF-файл несет в себе семантику сериализованных данных, а не только данные и их структуру. Получатель сможет правильно сопоставить сериализованные данные с собственной системой классов и свойств, и адекватно их обработать. Это как раз то преимущество, которое несет Semantic Web – семантическая интероперабельность

ИСИР расширяет язык RDFS возможностью четкого указания допустимых атрибутов класса (в соответствии с традиционной парадигмой объектно-ориентированного программирования), возможностью выделения линии одиночного наследования в наследовании классов (понятие «абстрактных классов») и некоторыми простыми ограничениями на множество значений свойства. С этой целью используются следующие метаклассы:

schema:Classиschema:Property – подклассысоответственно rdfs:Class и rdf:Property. С этими метаклассами связаны дополнительные свойства.

schema:AbstractClass – подкласс schema:Class, позволяющий выделить линию одиночного наследования во множественном наследовании классов rdfs:subClassOf. Понятие «абстрактного класса» используется при сопоставлении схемы с теми языками программирования, в которых запрещено множественное наследование, в частности Java. При генерации Java-кода, каждому schema:Class соответствует класс Java, а каждому schema:AbstractClass – Java-интерфейс. Соответственно, генератор не допускает наследования schema:Class от более чем одного не-абстрактного класса.

schema:property – свойство класса schema:Class, сопоставляющее со schema:Class набор допустимых атрибутов schema:Property, таким образом определяя структуру хранимых Java-классов репозитория.

schema:inverseOf – свойство schema:Property, задающее «обратное отношение» к данному свойству. Например, «isir:job» имеет обратное отношение «isir:hired», а «isir:author» -обратное отношение «isir:authorOf». Аналогичное свойство имеется в языках описания онтологий – DAML+OIL, OWL.

schema:minCardinality, schema:maxCardinality – минимальная и максимальная мощность свойства, то есть ограничения на минимальное и максимальное количество значений этого свойства. В DAML+OIL и OWL эти ограничения указываются в виде локальных ограничений на свойство в классе.

Ядро ИСИР предоставляет различные встроенные услуги по управлению хранимыми объектами, такие как автоматическая проверка прав доступа, аудит и пр. Для того, чтобы к хранимому классу была подключена некоторая услуга, он должен расширить соответствующий предопределенный «абстрактный класс». Так, для подключения системы безопасности и возможности конфигурации персональных прав доступа к объектам класса, достаточно сделать класс наследником kernel:SecureObject. Благодаря использованию множественного наследования, к классу можно подключить несколько услуг одновременно (например, «зависимый объект» и персональные права доступа).

При описании RDFS-подсхемы прикладных классов для системы ИСИР РАН был сформирован набор базовых прикладных классов и свойств, характерных для многих информационных систем. Например, класс core:File предназначен для отражения длинной текстовой или бинарной информации. Конкретный способ хранения этой информации зависит от конфигурации системы и указанного «режима». Файл может представлять собой как web-ссылку (URL), по которой может быть получено его содержимое, так и CLOB или BLOB в реляционной БД (когда хранилищем является RDBMS), либо файл локальной файловой системы. С файлом может быть связана различная метаинформация, такая как размер, MIME-тип и пр. Описанная функциональность класса File обеспечивается за счет скрытой в нем прикладной логики. «Файловая» информация широко используется в конкретных прикладных системах (документы). Имеются компоненты, которые обеспечивают загрузку файлов на сервер, организацию работы с zip-архивами файлов, например, для хранения html-документа с картинками. Эти системы классов, возможно, их функциональная поддержка из ИСИР РАН могут быть использованы при реализации системах для других предметных областей.

Специализированные системы метаданных и их использование

Специализированные системы метаданных, предназначенные для организации информационных ресурсов определенного вида или относящихся к определенной тематической области могут строиться и как частичные расширения (спецификации) универсальных систем, и как самостоятельные системы описания тех или иных особенностей информационных объектов. В первом случае упор делается на развитии наборов допустимых значений отдельных универсальных типов метаданных в рамках общей методологии построения метаописаний.

Так, одно из практических приложений методологии ИСИР для создания системы метаданных экспериментальных исследований по гидроакустике описано в работе [57]. Ниже приводится ее сокращенное изложение.

Цель создания комплекса метаданных для описания экспериментальных наблюдений состоит в том, чтобы обеспечить единую терминологию и набор понятий при формировании электронных информационных материалов сопровождающих научные исследования.

К широкому классу исследований, относящихся к общей предметной области, относятся науки о Земле. Направленные на изучение различных свойств одного объекта, науки о Земле оперируют с аналогичными терминами и понятиями: географические карты, пространственные разрезы, физические поля (магнитное, гравитационное, акустическое и т.д.); используют подобные методы сбора и обработки данных. Взаимосвязи между различными областями исследований хорошо прослеживаются на различных пространственных и временных масштабах и, находя отражения в абстрактных схемах потоков данных, указывают на необходимость создания общей структуры и стандартизации наборов метаданных.

Разнообразие научного материала и специфика областей исследования предполагает сложную структуру метаданных и эволюционное развитие базовых набора, учитывающее потребности специализации.  Качественное представление о масштабах работы по стандартизации описания экспериментальных данных в науках о Земле можно получить на основе материалов ряда организаций, прежде всего, FGDC (Federal Geographic Data Committee США). Выработанные стандарты являются удобным базисом для создания и развития схем метаданных с целью оформления научной специализации.

Одной из принципиальных задач, возникающих при формировании информационной системы любого типа, является интеграция с уже имеющимися научными ресурсами. Решить такую задачу возможно при использовании общей технологии обработки метаданных, к числу которых относятся технологии, разработанные в рамках проекта ИСИР. Исходя из наличия этой технологии, обеспечивающей интеграцию ресурсов и быстрое развертывание информационной системы для широкомасштабного использования, представляется перспективным расширение схем метаданных ИСИР с использованием опыта работ таких организаций как FGDC.

Для обоснования схемы метаданных сформулируем основные цели распределенной информационной системы управления экспериментальными исследованиями. Эти требования удобно сгруппировать согласно типу «конечного потребителя». Принципиально отличаются два типа:  человек и компьютерная программа. Для пользователя-человека функции информационной системы заключаются в том, чтобы:

предоставить экспериментаторам возможность структурировать и каталогизировать  экспериментальные данные, результаты измерений, обработки и моделирования, метаданные о тех и других, информацию о проектах, в рамках которых получены данные, об участниках этих проектов и т.п., интегрировать сопутствующую информацию, обеспечить поиск, просмотр информации о заявках исследователей на проведение измерений;

предоставить исследователям широкие возможности поиска и просмотра экспериментальных данных в диалоговом режиме как локально, так и через Internet, доступа к данным и метаданным экспериментов в соответствии с правами и условиями доступа, возможности публикации и поиска полнотекстовых отчетов и документов, обеспечить публикацию заявок о своих потребностях в экспериментальных данных;

предоставить функции информационного обслуживания работы групп, занятых в получении и обработке экспериментальных данных, служить механизмом поддержки деятельности по сбору, обработке и анализу экспериментальных данных;

обеспечить экспертам возможность поиска и аннотирования информации, мониторинга запросов исследователей, публикации экспертных заключений.

Перечисленные требования обеспечиваются расширениями метасхем, используемых для разработки инновационных порталов с учетом специфики экспериментальных работ.

Второй тип «конечного потребителя» данных – «компьютерная программа» - характерен для информационных систем, используемых непосредственно в ходе экспериментальных исследований. В этом случае потоки данных алгоритмизированы и связаны с вводом и обработкой данных, статистическим и другими методами анализа, компьютерным моделированием. Задачи информационной системы в данной ситуации состоят в том, чтобы:

обеспечить синхронизацию потоков данных;

согласовать передачу данных между вычислительными модулями;

обеспечить визуальный контроль хода эксперимента;

протоколировать ход работ и т.д.

Логично разделять информационные системы, решающие столь различные задачи, но было бы крайне удобно использовать единую базовую схему метаданных, на основе которой проводить интеграцию информационных комплексов.

Использование общих шаблонов, наследование свойств, определение специфики области исследований отчетливо выявляет иерархическую схему метаданных.

Нижние уровни предполагают самое общее описание, независимо от направления исследований. Задача 0-го, технического уровня, состоит в том, чтобы описать и сформировать структуры и агрегаты информации, которые послужат базой для описания предметной области. Типичными представителями нижнего уровня являются объекты «Набор данных», «Таблица», «Исследование», «Документ», «Публикация» и т.п.

Существует достаточное количество образцов, из которых можно выбрать наиболее подходящие для нужд конкретной информационной системы. Одним из подробных руководств для формирования описания наборов данных, является Content Standard for Digital Geospatial Metadata Workbook FGDC.

Первый уровень несет общий для всех областей технических исследований слой информации о совокупности оборудования. На этом уровне определяется библиотека измерительных приборов, датчиков и их параметров (например: передаточные функции и др.).

На основе детализации исходной диаграммы классов и использования наследования и полиморфизма формируется объектная модель экспериментальных исследований частного вида. Соответственно расширяется и уточняется RDF-схема.

В структуре RDFS выделяются модули, отвечающие за описание объекта исследований и соответствующей проблематики. В случае геофизических исследований, таким объектом является полигон, на котором проводятся эксперименты и совокупность целей и задач выполняемых работ. С этой информацией связаны сведения об организациях и группах, выполняющих работы, публикации и иные отчетные сведения, обобщающие накопленные знания об объекте. Для описания подобных сведений об организациях  и группах, выполняющих работы, а также перечне публикаций используются шаблоны ИСИР.

Следующий уровень метаданных сопровождает информацию о проектах и экспериментальных исследованиях, проводимых на объекте. Эти метаданные структурируют информацию о состоянии работ, текущей отчетной информации, проблематике и т.п. Базовые шаблоны метаданных также содержатся в составе библиотеки ИСИР.

Описание объекта исследований требует использования сведений о пространственном расположении, геологической структуре, сетке наблюдений и т.п. Для их описания логично строить расширения стандартизованных метасхем, предлагаемых FGDC.

Поскольку сложные эксперименты, как правило, подразделяются на этапы, то следующий слой метаданных описывает информацию, детализирующую сведения об этапах и конкретных конфигурациях эксперимента: частные задачи, совокупность оборудования и его расположение, оперативную отчетную информацию.

Дальнейшая детализация приводит к метаданным, сопровождающим сведения об аппаратуре и ее настройках, данных, получаемых в результате предварительной обработки, параметрах математических моделей и т.п.

Самый глубинный слой метаданных имеет отношение к программно-аппаратному комплексу, применяемому в эксперименте. Предполагается, что совокупность программного обеспечения организована на принципах, подобных J2EE, и обмен в системе ввода, обработки и визуализации осуществляется по XML-технологии.

Ниже приводится ряд схем метаданных, образующих базис для описания  некоторого объекта и проводимых на нем экспериментальных работ. Оригинальные классы получены на основе анализа объектной модели и практического опыта разработки информационной системы, ориентированной на гидрофизические приложения. Список таких классов в составе RDF-схемы имеет прямые аналоги в составе объектной модели.

В схемах используются элементы, разработанные и рекомендованные к применению в рамках проекта ИСИР и стандартов FGDC. Вчастности, этометаклассы «Organization», «Publication», «Resource», Description, «Time Period», «DataSet» инекоторыедругие. Использование элементов стандартных схем метаданных позволяетобеспечить интероперабельность данных в различных системах и интеграции в данных во внешние ресурсы.

Другим примером использования международного стандарта метаданных длясоздания реестров специализированных научных коллекций являются работы исследователей САО РАН [58]. Основная модель метаданных предложена Международной виртуальной обсерваторией (IVOA) [59]. Эта модель предполагает иерархическую организацию, где на верхнем уровне отмечается наличие ресурса иуказывается ответственный за него. На более низких уровнях метаданные существенно расширяются и усложняются, что позволяет не только описать ресурс, но и определить синтаксис запроса к ресурсу, протокол доступа и политику использования. Клиент и сервер должны придерживаться стандартных протоколов и форматов метаданных, чтобыклиент имел возможность манипулировать удаленными данными.

Реестры содержат метаописания ресурсов, таких как базы данных, архивы, сервисы, программные средства, проекты. Распределенная модель реестров включает 3 типа реестров. Глобальный поисковый реестр содержит описания всех ресурсов, имеющихся в виртуальной обсерватории, и предназначен для работы пользовательских приложений. Этот реестр пополняется из множества локальных публикуемых реестров, которые отличаются от поисковых тем, что не поддерживают поиск, а просто выставляют описания для поисковых реестров. Третий тип реестров – локальные поисковые реестры. Они используются для поиска приложениями конечных пользователей, но не содержат всей информации, имеющейся в виртуальной обсерватории. Локальные поисковые реестры могут специализироваться для конкретных типов ресурсов или для научных тем, например, исследование сверхновых.

Рабочая группа по регистрам разрабатывает стандартный набор метаданных для описания ресурсов. Для этого используется XML schema. В центре модели общий класс Resource, метаданные которого содержат понятия, которые могут применяться ко всем ресурсам. Специализированные классы ресурсовунаследуют ядро и добавляют дополнительные понятия. Примерами специализированных классов ресурсов могут служить коллекции данных, организации, сервисы. Эти расширения определены в специальных схемах, так что приложения могут выбирать, какое расширение использовать.

В настоящее время открыто два прототипа публикуемых реестров – Caltech и NCSA. В каждом имеется веб-форма, которую можно использовать для регистрации своих ресурсов. При желании провайдер, обладающий достаточным количеством ресурсов, может инсталлировать групповой публикуемый реестр на своем сайте.

Указанная модель применяется в САО РАН не только для регистрации своих ресурсов в Международной виртуальной обсерватории, но и для организации реестров собственных архивов и других информационных ресурсов.

Одновременно исследователями САО РАН проводится работа по интеграции ресурсов САО РАН в общее информационное пространство РАН на основе технологии ИСИР, рассмотренной выше. Пока разработаны соответствующие модели метаописания для ресурсов, содержащих публикации и другие текстовые документы.

Российские исследователи активно участвуют также в Международной системе космической информации INFEA (Information of Earth Observation), созданной в Европейском космическом агентстве [60]. В этой системе на основе стандартов ИСО и собственных стандартов INFEA разработана система метаданных, реализованная на двух уровнях. На первом уровне поддерживается справочник спутниковых информационных ресурсов IDN (International Directory Network), где содержатся метаописания индивидуальных архивов. На этом уровне пользователь может узнать, в каком архиве находится интересующая его информация и затем обратиться в этот архив, если он доступен он-лайн и повторить поиск. Более высокий уровень поиска предоставляется Каталогом Электронной библиотеки космической информации. В этом каталоге пользователь может непосредственно искать в распределенных электронных архивах.

Соответственно в системе представлено два уровня метаданных: описывающих коллекции и непосредственно данные. Примером метаданных, непосредственно описывающих данные, могут быть область исследований, временной интервал, пространственное ограничение и др.Поиск по метаданным реализован с использованием протокола Z.39.50.

Еще один пример международного сотрудничества российских ученых по созданию системы метаданных для специализированных коллекций приведен в работе [61]. Система метаданных для моделирования химически реагирующих потоков разработана в рамках проекта CMCS (Collaboratory for Multi-Scale Chemical Science). Этот проект обеспечивает междисциплинарное сотрудничество при моделировании процессов горения. Для исследователей этой проблемы крайне важно располагать не только данными, полученными на разных уровнях модели (т.е. полученных в рамках различных дисциплин и методик), но и сведениями об источниках данных, погрешностях, дате и способе получения, методе обработки и т.д. Особое внимание участники проекта уделили вопросам происхождения данных, что должно дать возможность проследить происхождение и погрешностьлюбых параметров моделей имеющихся в системе. Для реализации этой задачи в рамках проекта, кроме службы метаданных, создана служба «репутации» ресурса, в рамках которой производится оценка качества представленных данных.

Представляется, что эта идея имеет большие перспективы для любых проектов предполагающих интеграцию информационных ресурсов, полученных из различных источников.

На протяжении последних трех лет в рамках межведомственной научно-технической программы «Вакцины нового поколения и диагностические системы будущего», объединяющей более 90 организаций и направленной на разработку новых иммунологических препаратов, ведутся интенсивные работы по информационному обеспечению этого проекта. При разработке системы особое внимание уделялось интеграции в единое информационное пространство федеративных распределенных информационных ресурсов. Выбранное программное обеспечение (ПО Gozelle) поддерживает два каталога: баз данных и метаданных.

В ходе разработки каталога был рассмотрен ряд существующих форматов. Для обеспечения текущих и перспективных потребностей ИС были выбраны несколько форматов метаданных, однако на текущем этапе развития ИС реализована поддержка только Дублинского ядра. Поля метаданных заполняются непосредственно авторами и разработчиками информационных ресурсов и заносятся в каталог метаданных. Благодаря этому пользователь имеет возможность перед переходом к непосредственному просмотру ресурса ознакомиться на портале с информацией как о его создателе, тематике, формате, так и с датой последнего обновления ИР. Имплементированы также некоторые другие форматы, например vCard, разрабатывается специальный формат для описания концептов и реляций онтологий.

Приведем более краткие описания ряда зарубежных и международных систем метаданных, специализированных для описания информационных ресурсов и систем, различающихся как по сфере, так и по целям использования.

CDF

Общий формат данных (Common Data Format) используется для хранения, манипуляции и доступа к многомерным наборам данных.

Организация-разработчик- US National Space Science Data Center

CDF является программным интерфейсом, который предоставляет платформо-независимый взгляд на модели данных CDF. Последние базируются на многомерных массивах, которые классифицируют данные по различным переменным, соответствующим одному из наблюдаемых параметров. Наборы данных CDF соответствуют базовой структуре (basic grid structure), в которой позиция каждой задается индексами.Так называемая Z-структура CDF позволяет определять переменные независимо от базовой структуры или остальных переменных. Словарь данных используется для уникальной идентификации переменных. Библиотека данных CDF поддерживает две физических схемы кодирования: используемой операционной системы и формата IEEE-754. Последний является форматом общего обмена данными CDF.

Разработанный NASA как часть американской космической программы, CDF широко используется для обмена между научными базами данных.

CERIF

Общий европейский формат для исследовательской информации (Common European Research Information Format) применяется для обмена информацией о научных проектах.

Организация разработчик - Европейская комиссия (European Commission).

Определяет набор обязательных и дополнительных полей, которые должны использоваться для описания научных проектов, финансируемых ЕС, включая название проекта, абстракт (project role), руководители проекта (director and principal investigators), контактный адрес, наименование финансирующей организации и ключевые слова. Дополнительная информация включает ссылки на другие проекты и опубликованные результаты. В качестве приложения к спецификации публикуются списки кодов для предметных областей.

Несмотря на то, что спецификация опубликована еще в 1991, многие исследователи не знали о ее существовании. После обновления в 2000 году была создана специальная рабочая группа, которая занимается распространением этого формата.

CIF

Файл кристаллографической информации (Crystallographic Information File).

Применяется для передачи кристаллографических данных между лабораториями, журналами и базами данных.

Организация-разработчик - International Union of Crystallography (IUCr).

Файл CIF состоит из имени поля данных, собственно значения и утилиты для повторяющихся значений. Имена полей данных иерархические, 32-значные самоописательные (self-descriptive) и образуют категории данных. Отсортированный список имен полей вместе с их точными определениями образуют словарь CIF. Базовый словарь CIF покрывает большинство основных и наиболее часто используемых типов данных, используемых в кристаллографии.

GRIB

Система Grid in Binary предназначена для хранения и обмена информацией о погоде в бинарной форме между элементами метео-грид.

Организация-разработчик - World Meteorological Organization (WMO)

Каждая запись GRIB предназначена для передачи или хранения единственного параметра вместе со значениями, которые представляют собой массив точек или набор спектральных коэффициентов одного уровня, кодированных в виде непрерывного потока битов. Запись логически разбивается на «секции», каждая из которых содержит контрольную информацию или данные. Запись GRIB состоит из 6 секций, две из которых необязательны:

(0) Indicator Section

(1) Product Definition Section (PDS)

(2) Grid Description Section (GDS) - optional

(3) Bit Map Section (BMS) - optional

(4) Binary Data Section (BDS)

(5) '7777' (ASCII Characters)

Предложенный в 1985, GRIB был усовершенствован в 1988, 1990 (Edition 1) и 1994. К сожалению, стандартизован он не полностью, часть организаций использует свои собственные версии GRIB.

JCAMP-DX

Стандарты обмена объединенного комитета по атомным и молекулярным физическим данным (Joint Committee on Atomic and Molecular Physical Data Exchange Standards).

Область применения - обмен спектральной информацией в машиночитаемой форме.

Организация-разработчик - рабочаягруппаИЮПАК (International Union of Pure and Applied Chemistry Working Party on Spectroscopic Data Standards (JCAMP-DX)).

JCAMP-DX представляет собой эволюционирующий открытый протокол, основанный на ASCII и предназначенный для обмена данными между компьютеризированными лабораторными инструментами. Протокол машинонезависим, самодокументируется и открыт для завершения (open-ended). JCAMP-DX определяет структуру файлов с данными и не является программой. Файлы формата могут редактироваться в стандартных текстовых процессорах.

Файл JCAMP-DX построен в виде связной последовательности меток-данных-записей (Labeled-Data-Records, LDRs). Каждая LDR начинается с метки данных (Data-Label), которая состоит из краткого, но осмысленного обозначения, начинающегося с ## и заканчивающегося знаком=, например: ##TITLE=, ##DATATYPE=, ##XYDATA=. Собственно данными могут быть отдельные слова, например, ABSORBANCE, отдельные значения, например 40023, огромные числовые массивы или параграфы текстового описания.

Большинство производителей научных инструментов и программного обеспечения в указанной предметной области поддерживают этот формат.

SEDRIS

Спецификация для представления и обмена данными об искусственном окружении (Synthetic Environment Data Representation and Interchange Specification).

Область применения - обмен данными о моделях в симуляторах военного назначения. Используется в армии США.

Организация-разработчик - US Defense Modeling and Simulation OfficeиISO/IEC JTC1/SC24 WG8

SEDRIS состоит из модели данных, набора API и отдельных программных утилит. Модель данных предоставляет средства для определения всех элементов данных и их взаимосвязей, необходимых для создания искусственной среды. API используются на различных уровнях сложности. Утилиты используются для поиска и проверки в посланиях SEDRIS (в специально разработанном формате) для помощи разработчику и пользователю.

VICAR

Передачаипоисквидеоизображений (Video Image Communication And Retrieval).

Формат предназначен для работы с изображениями со спутников.

Организация-разработчик - Multimission Image Processing Laboratory (MIPL) at the Jet Propulsion Laboratory (JPL)

Файл в формате VICAR состоит из двух главных частей: меток, описывающих данный файл и области изображений, содержащей реальные данные. Метки делятся на две группы, одна в начале, другая в конце файла, хотя в норме достаточно меток в начале.

Метка состоит из последовательности «ключевое слово=значение», которая описывает изображение в формате ASCII. Первое ключевое слово LBLSIZE указывает размер области меток в байтах. Значения меток могут быть трех типов: целое, натуральное или последовательность.

Метаописания Web-сервисов. Спецификация UDDI.

Несмотря на развитие порталов и распределенных информационных сетей, проблемы со стандартизацией научных Web-сервисов решаются медленно, поскольку для фундаментальной науки характерно еще и ограниченное финансирование. Поэтому более значимых успехов в глобальной стандартизации разработки и использования Web-сервисов добились коммерческие организации (компании), которые могут позволить себе инвестировать в это перспективное направление большие суммы денег. В рамках коммерческих проектов появились и разработки систем описания интернет-услуг. В 2000 году группа таких известных компаний как Microsoft, Hewlett-Packard, IBM и другие, являющиеся ведущими игроками на рынке электронного бизнеса, создали спецификацию UDDI (Universal Description, Discovery and Integration). Она представляет собой универсальный метод описания, обнаружения и интеграции Web-сервисов для B2B систем электронной коммерции. Основным элементом UDDI является бизнес-регистр, который представляет собой базу данных общего пользования, в которой компании сами себя регистрируют провайдерами услуг и заносят информацию о собственном, преимущественно электронном бизнесе.

Бизнес-регистр UDDI не имеет ограничений на тип услуг, например, в нем может быть находиться информация о предприятиях, которые предоставляют различные услуги: автоматизированные, ручные, транспортные, образовательные, коммунальные. Но, прежде всего, бизнес-регистр задуман как основа для поддержки любых сетевых услуг и Web-сервисов. С помощью функциональных возможностей, заложенных в UDDI, можно найти информацию о Web-сервисах, предоставляемых провайдерами, можно выяснить, являются ли технологии потенциального партнера совместимыми с вашими. Если нет, то можно сконструировать интерфейс, который обеспечит обмен данными с Web-сервисом провайдера. Возможно бизнес-регистр UDDI (или его клон) будет использован в качестве репозитория Web-сервисов фундаментальной науки.

В настоящее время разработаны три версии спецификации UDDI (http://www.uddi.org/specification.html), на основе которых в 2003 году был принят официальный стандарт международным консорциумом OASIS (Organization for the Advancement of Structured Information Standards, www.oasis-open.org). Консорциум OASIS являетсяавторитетной и компетентной некоммерческой организацией в области разработки открытых стандартов электронного бизнеса. Членами консорциума OASISявляются более 140 организаций, среди которых выделяются такие гранды как Microsoft Corporation, IBM Corporation, Hewlett-Packard Company, NEC Corporation, Hitachi, Oracle, Sun Microsystems, SAP и др. В качестве международного стандарта UDDI предназначен для обеспечения единой среды взаимодействия в рамках информационной инфраструктуры произвольного масштаба - как корпоративной, так и глобальной.

В идеале бизнес-регистр UDDI можно рассматривать как дополнение к существующим торговым площадкам и поисковым машинам для поиска бизнесов и услуг, а также их использования на основе стандартизованных форматов представления данных и способов доступа к ним. Наиболее подходящей аналогией для бизнес-регистра UDDI является гипотетическая "глобальная телефонная книга по Web-сервисам". Она включает в себя названия бизнесов, почтовые адреса, контактные персоны, номера контактных телефонов, факсов и адреса электронной почты, URL предоставляемых Web-сервисов, метаданные, описывающие программные интерфейсы к Web-сервисам и т.д.

Спецификация UDDI позволяет провайдерам услуг публиковать информацию о себе, своих Web-сервисах и интерфейсах с целью организации связи с этими сервисами. По существу, бизнес-регистр UDDI состоит из трех основных компонентов, представляющих собой разные электронные страницы – «белые», «желтые» и «зеленые». «Белые страницы» содержат основную контактную информацию, «желтые» - более подробную информацию о компаниях и описание электронных услуг, предлагаемых ими торговым партнерам, «зеленые» - описывают стандарты и программные интерфейсы, совместимость с которыми должна быть обеспечена, чтобы организовать электронное взаимодействие с использованием XML в качестве общего для всех языка. “Зеленные страницы” можно рассматривать в качестве репозитория (хранилища) метаописаний предоставляемых услуг. Рекомендуется поэтапное описание Web-сервисов: сначала заполняется “белая”, затем “желтая” страницы и, наконец, выполняется детальное описание интерфейса сервиса путем заполнения “зеленой страницы” или использования уже имеющихся метаописаний из репозитория.

Спецификация UDDI является набором правил для метаописания Web-сервисов с помощью языка XML и одновременно методом нахождения и использования Web-сервисов на основе метаописаний. В UDDI в общих чертах намечены способы поиска провайдера услуг и установления связи с предоставляемым им Web-сервисом, но не определены конкретные протоколы и языки для обмена данными. Например, описание услуг может быть выполнено на естественном языке, а для доступа может быть указан номер телефона провайдера или один из программных протоколов: ebXML Message Service, COM+, DCOM, e-Speak, XML-RPC, CORBA, Java RMI и др. Но чаще всего UDDI используется совместно с протоколом SOAP и языком описания Web-служб (Web Services Description Language – WSDL). Образно выражаясь, по замыслу консорциума OASIS спецификации SOAP/WSDL/UDDI являются “святой троицей” для стандартизации Web-сервисов [62].

При помощи XML-описаний, хранимых в UDDI-регистре, можно узнать, поддерживает ли Web-сервис провайдера такие известные API-интерфейсы, как, например, Sun ONE, или Microsoft Visual Studio .NET, или WebLogic Workshop фирмы BEA Systems, или WebSphere Business фирмы IBM, или HP Web Services Platform, учитывающие спецификации SOAP/WSDL/UDDI. Определив какой API-интерфейс использует провайдер, ИТ-персонал компании (“приемник”) может организовать связь с выбранным Web-сервисом. Только после этого обе компании смогут обмениваться данными через Интернет посредством протокола SOAP, даже если их оконечные системы будут от разных производителей. Если провайдер использовал уникальный инструментарий для разработки Web-сервиса и подробно не описал Web-интерфейс, программная организация обмена может быть затруднена.

Причина задержки использования спецификации UDDI в полном объеме (т.е. включая сведения «зеленых страниц») является не только разнообразие ПО для разработки Web-сервисов, но и отсутствие стандартов безопасности, которые должны помочь провайдерам ограничить доступ к информации о способах подключения к их Web-сервисам. Эта информация должна быть доступна только доверенным и зарегистрированным партнерам, поскольку доступ часто предоставляется на платной основе. Информационная безопасность научных Web-сервисов также актуальна, но финансовая составляющая здесь играет меньшую роль по сравнению с бизнес-услугами. Большую опасность представляет несанкционированное изменение экспериментальных и расчетных данных, поскольку это может привести к катастрофическим последствиям (например, для ядерных экспериментов, расчетов сложных конструкций и т.д.). Подобная исходная и результирующая информация, использующие их научные Web-сервисы должны быть надежно защищены.

По сообщению представителей UDDI.org (структура OASIS, непосредственно занимающая UDDI), окончательная версия стандарта UDDI включает предложения по обеспечению безопасности при использовании Web-сервиса на основе электронной цифровой подписи, технологии шифрования, каталогизации прав доступа и пр. Кроме того, консорциумом OASIS разработан стандарт WS-Security (http://docs.oasis-open.org/wss/2004/01/oasis-200401-wss-soap-message-security-1.0.pdf), который расширяет протокол SOAP для обеспечения безопасности на уровне передачи данных.

На сегодняшний день компании Microsoft, IBM, SAP и NTT уже создали общедоступные узлы UDDI, объединенные в единый регистр, называемый Universal Business Registy (UBR). Таким образом, узлы UBR находятся на восточном и западном побережьях Северной Америки, в Европе и в Азии, а бизнес-регистр UDDI является распределенной базой данных. Каждый из операторов узлов UBR содержит и обслуживает отдельную реплику (полную динамическую копию) всего бизнес-регистра и поддерживает полный общий набор программных интерфейсов (API). Это позволяет регистрироваться и работать с любым узловым оператором, не опасаясь несовместимости или же утраты информационной целостности.

Пользователи могут получить доступ к бизнес-регистру не только с помощью программных API-интерфейсов, но и через обычные Интернет-браузеры. В последнем случае эффективный поиск в регистре UDDI проводится с использованием стандартных промышленных классификаций (международных таксономий UNSPSC, NAICS, SIC), которые вполне точно определяют предприятие (провайдера, в случае сетевых услуг), его услуги и типы услуг. Описание предприятия устроено таким образом, что, в конечном счете, есть возможность идентифицировать его по признакам принадлежности к определенной промышленной отрасли, категории продукции, географическому местонахождению и т.д.

Таким образом, спецификация UDDI дает возможность компаниям представлять информацию о Web-сервисе в стандартном виде для восприятия на двух уровнях – человеческом и программном. Основой перехода на программный уровень работы с Web-сервисами является библиотека моделей описания услуг (tModel) и язык WSDL. Для любой услуги, например логистики, создается набор моделей, описывающих эту услугу. Провайдер, предлагающий Web-сервис по логистике, получает возможность описать предоставляемые услуги в стандартной форме, пользуясь библиотекой моделей как конструктором. Каждая модель имеет уникальный код и привязана к стандартным классификаторам, которые могут быть не только международными, но и региональными, отраслевыми и собственными. Если в библиотеке tModel отсутствует необходимая модель услуги (или классификатор), реализована процедура ее регистрации как новой. После регистрации модель услуги доступна для свободного использования наряду с другими, уже имеющими в библиотеке tModel. Бизнес-регистр UDDI позволяет искать не только провайдеров услуг и Web-сервисы, но и зарегистрированные tModel, которые можно было бы использовать в качестве “кирпичиков” для стандартного описания Web-сервисов.

Параллельно с разработкой бизнес-регистра UDDI ведутся работы по стандартизации конструирования бизнес-процессов на основе Web-сервисов [63]. Сегодня компании, решившей использовать Web-сервисы от разных провайдеров в едином бизнес-процессе, недостаточно знать только их интерфейсы в виде WSDL, нужно учитывать и особенности взаимодействия (так называемую “хореографию” выполнения сервисов): последовательность функционирования Web-сервисов, асинхронный или синхронный способы передачи данных, отработка ситуаций в случае ошибки одного из Web-сервисов и т.д. С этой целью сначала Sun, BEA Systems, Intalio и ряд других компаний представили проект спецификации, стандартизирующей совместную работу Web-сервисов, под названием Web Service Choreography Interface (WSCI), а потом IBM, Microsoft и опять же BEA Systems опубликовали альтернативный документ под названием BPEL4WS (Business Process Execution Language for Web Services). В настоящее время консорциумы W3C и OASIS пытаются организовать работы по формированию единого стандарта на основе этих двух спецификаций [64, 65].

Следовательно, для организации универсального, независящего от платформы функционирования и средств разработки, взаимодействия Web-сервисов с помощью стандартных протоколов Интернета (прежде всего, HTTP) следует решить следующие ключевые задачи:

Использование функциональности одного Web-сервиса в других за счет предоставления его программного интерфейса (Application Programming Interface – API);

Форматирование сообщений с помощью языка XML;

Обмен XML-сообщениями между сервисами средствами простого протокола доступа к объектам (Simple Object Access Protocol – SOAP);

Публикация интерфейсов Web-сервисов на языке WSDL (Web Services Description Language);

Регистрация Web-сервисов с помощью универсального стандарта предметного описанияи интеграции UDDI;

Формирование “хореографии” выполнения Web-процессов на основе спецификации BPEL4WS или WSCI.

В тоже время, несмотря на очевидные преимущества, которые можно получить от использования спецификаций SOAP/WSDL/UDDI, практическая реализация глобального бизнес-регистра проходит медленно. Основные причины этого:

Не решен вопрос прав на сведения UBR в целом. В тоже времяэти сведения доступны операторам узлов UBR, что вызывает неудовольствие среди некоторых участников OASIS и владельцев Web-сервисов. Так, например, корпорация Hewlett-Packard охладела к реализации глобального бизнес-регистра именно по этой причине.

Ввод сведений “белых” и “желтых” страниц бизнес-регистра практически не контролируется. Поэтому в регистр может попасть заведомо ложная, ошибочная и противоречивая информация, что может привести к затруднениям при поиске нужной информации.

Плохо проработан вопрос актуализации сведений глобального бизнес-регистра. Может оказаться, что найденный провайдер уже не существует или номенклатура предлагаемых им услуг изменилась.

Если посмотреть, что делается в научных сообществах для описания используемых ими Web-сервисов, то можно с уверенностью говорить о близости подобных работ со спецификациями WSDL/SOAP/UDDI. Так, например, в рамках формирования общей информационно-коммуникационной среды IVOA (International Virtual Observatory Alliance), включающей различные астрономические информационные сервисы, предлагается разработать многоуровневую систему метаописания: на верхнем уровне (аналог “белых” и “желтых страниц” UDDI-регистра) – минимум информации, чтобы первоначально отметить только наличие сервиса и его провайдера; на более низких уровнях (“зеленые страницы”) метаданные более расширены и сложны, что позволяет описать синтаксис запроса, протокол доступа и политику использования сервиса [64].

Центром компетенции UDDI в России является компания UnitSpace (http://unitspace.ru), член международного консорциума OASIS (комитеты по стандартам UDDI и eGoverment). В начале 2004 года компания UnitSpace завершила пилотный проект по созданию “Регистра деловой информации ” (РДИ), выполненной в рамках Федеральной Целевой Программы «Электронная Россия (2002-2010 годы)» по заказу Министерства экономического развития и торговли РФ. РДИ должен стать единой точкой входа в деловое информационное пространство России. В Регистре содержатся данные о государственных и негосударственных организациях регионов, предоставляемых ими товарах и услугах. РДИ основан на международном стандарте UDDI, что позволяет интегрировать его с мировыми деловыми информационными ресурсами.

В настоящее время реализована региональная пилотная версия РДИ для предприятий Чувашской Республики и Архангельской области. РДИ поддерживает классификацию и поиск компаний по таким критериям, как сфера деятельности, предоставляемые товары и услуги, местонахождение. Благодаря поддержке действующих российских классификаторов товаров и услуг - ОКВЭД, ОКПО, ТНВЭД и др. - обеспечивается совместимость Регистра с федеральными и отраслевыми ресурсами деловой информации. В РДИ также предусмотрена возможность поддержки любых международных классификаторов, в частности, UNSPSC, NAIC и SIC. Таким образом, в РДИ полностью реализованы “белые и желтые страницы” бизнес-регистра UDDI, однако описание Web-сервисов в нем пока не осуществлено.

Весной 2002 г. при Министерстве РФ по связи и информатизации была создана рабочая группа по выработке единых российских стандартов для электронного бизнеса. Целью деятельности этой рабочей группой, в частности, является разработка концепции использования единых стандартов для представления и обмена информацией в системах, которые разрабатываются по ФЦП "Электронная Россия". Концепция предусматривает не только необходимость интеграции между собой федеральных информационных систем на уровне обмена данными и создания единого информационного пространства России, но и возможность вхождения этих систем в мировое информационное пространство. Именно поэтому предпочтение в ФЦП "Электронная Россия" отдается самым передовым технологиям и стандартам, в частности, UDDI.

4.6. Разработка интерфейсов к разнородным ресурсам на основе стандартов метаданных

Современные веб-технологии весьма удобны для организации различных тематических порталов (которые могут также называться электронными библиотеками), на которых представлена разнородная информация, как подготовленная создателем сайта, так и получаемая из Интернета. Организация интерфейса к таким порталам естественно, предполагает использование некоторой системы метаданных, при помощи которой могут быть описаны и представлены ресурсы, имеющиеся на портале. Иногда, если разнородность сводится к содержанию документов или их виду, создатели сайта ограничиваются простыми или иерархически организованными перечнями этих ресурсов. Однако когда информации на портале действительно много и параметры, отражающиеее разнообразие, достаточно многочисленны, появление той или иной системы метаданных становится неизбежным. Впрочем, сами создатели порталов при их описании далеко не всегда осознают, что они предлагают новую систему метаданных и даже не используют это понятие.

Рассмотрим в качестве примера Научно-образовательный портал THERMOPHYSICS.RU, создаваемый специалистами ИВТ РАН и МЭИ, который предоставляет сетевой пространство для научной, информационной и образовательной поддержки отечественных теплофизиков [66].

На этом портале, при помощи технологии моделирования веб-сайтов PHP-NUKE была осуществлено структурирование всех документов, размещаемых на портале, а также выбирать его структуру и сервисы, предназначенные для дифференцированного обслуживания различных категорий пользователей. Созданная система метаданных включает 3 атрибута: предметная область (включает 8 предметных областей), категория ресурса (включает 2-уровневую классификацию назначения и видаресурсов) и возможность использования (документ, документ для дискуссий, ссылка, файлы для загрузки).

Авторы указывают, что подобная система позволяет вести эффективное индексирование ресурсов, и организовать поиск и комфортную визуализацию найденных данных.

Важный аспект применения метаданных для организации интерфейса к разнородным данным рассматривается в работе [67]. В Тихоокеанском океанологическом институте им. В.И. Ильичева ДВО РАН создается корпоративная ГИС по дальневосточным морям и северо-западной части Тихого океана.

В этой системе представлены как открытые данные, полученные из источников, распространяемых на носителях или в Интернете, так и данные ограниченного доступа, права пользования которым первоначально принадлежит только владельцам данных, а постепенно передается в доступ другим сотрудникам института или другим организациям. В связи с проблемой открытостиданных возникла также потребность различения уровней доступности для разных уровней абстракции данных. Наиболее критичны требования по доступу к оригинальным данным, которые могут представляться пользователям в виде файлов данных. Менее критичны требования к защищенности картографических образов данных. Последние имеют в своюочередь различные уровни доступа, различающиеся по уровню разрешения. В результате возникает достаточно развитая система метаданных, описывающих условия доступа различных пользователей к различным ресурсам. Она включает иерархическую классификацию типов ресурсов, режимы доступаи тип «политики доступа», связанной с категорией пользователей.

Некую элементарную систему метаданных для поиска в разнородные БД по минералогии предлагает Минералогический портал [68]. Он включает:

наименование минерала, унифицированное по списку минералов, утвержденному международной минералогической ассоциацией

состав химических элементов и их комбинаций, входящих в состав минерала или отсутствующих в нем.

При помощи «генерального запроса», содержащего эти метаданные, пользователь может входить в более чем 20 разнородных минералогических БД, получая как сведения л минералах, таки ссылки на БД-источники.

Одна из наиболее развитых отечественных информационных систем – УИС РОССИЯ, также предлагает некоторую внутреннюю систему метаданных, используемую для интерфейса пользователя с разнородными ресурсами, представленными на различных серверах []. Вокруг УИС РОССИЯ уже образовалось некоторое профессиональное сообщество, использующее единый интерфейс на основе общих средств автоматического индексирования и рубрицирования документов разных типов с использованиемтехнологии автоматического лингвистического анализа (АЛОТ). В это сообщество, кроме собственного сервера УИС РОССИЯ, входят информационные системы «Бюджетная система РФ», Соционет, Портал ГУ ВШЭ, газета «Поиск», программа «Университеты России, журналы «Демоскоп» и «ПолИс». В систему метаданных распределенного ресурса, кроме средств лексического поиска входят наиболее распространенные рубрикаторы в сфере социально-политических и экономических наук. Планируется также дополнить систему метаданных УИС РОССИЯ стандартными средствами Дублинского ядра.

Таким образом, использование метаданных как элемента интерфейса для входа через тематические порталы в разнородные информационныенаучные ресурсы, носит весьма разнообразный характер. Большинство таких решений носит локальный, предметно-ориентированный характер, хотя начинают появляться тенденции использования для таких решений стандартных систем метаданных, прежде всего Дублинского ядра.

Литература

1.Волков Ю. Метаданные для чайников. http://ngo.org.ru/ngoss/support/MetadataForDummies.shtml

2.Бездушный А.Н., Меденников А.Н., Серебряков В.А. Подход к интеграции информационных коллекций ИСИР РАН. // Труды второй всероссийской конференции «Электронные библиотеки: перспективные методы и технологии» 2000 г. Протвино.

3.Бездушный А.Н., Жижченко А.Б., Кулагин М.В., Серебряков В.А., Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек. // Программирование, № 4,  2000. С. 3-14.

4.Агошков С В., Бездушный А Н., Галочкин М.П., Кулагин М В., Меденников А.М., СеребряковВ.А. “Интегрированная Система Информационных Ресурсов (ИСИР) РАН – подход к созданию интегрированных электронных библиотек”, Электронные библиотеки: перспективные методы и технологии, электронные коллекции, 1-я всероссийская конференция, Санкт-Петербург, 1999.

5.Бездушный А.А., Бездушный А.Н., Жижченко А.Б., Кулагин М.В., Серебряков В.А. RDF схема метаданных ИСИР. Роль технологий Semantic Web в архитектуре ИСИР. // Информационное обеспечение науки: новые технологии, X научно-практический семинар, Таруса, 1-5 сентября 2003г, сборник научных трудов, , Москва 2003, С.141-159; http://www.benran.ru/Magazin/cgi-bin/Sb_03/pr03.exe?!19

6.Бездушный А.А, Бездушный А.Н., Нестеренко А.К., Серебряков В.А., Сысоев Т.М.RDFS как основа среды разработки цифровых библиотек и Web-порталов// Электронные библиотеки, 2003, том 6, вып 3.

7.Нестеренко А.К., Сысоев Т.М., Бездушный А.А., Бездушный А.Н., Серебряков В.А., Архитектура и технологии RDFS-среды разработки цифровых библиотек и Web-порталов. // Электронные библиотеки, 2003, Том 6, Выпуск 4.

8.Бездушный А.Н., Лопатенко А.С., Серебряков А.М., Филиппова А.А. Метаданные ИСИР: определение и использование. // Электронные библиотеки 2001; том 4, вып 4.

9.Сысоев Т. М., Нестеренко А. К., Бездушный А. А., Кулагин М. В. Semantic Web и OWL-онтологии в разработке ИСИР-систем/ Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г.Новороссийск).- М.: Изд-во МГУ, 2004, С. 188-191.

10.Когаловский М.Р. Энциклопедия баз данных. Москва: Финансы и статистика, 2002, 800 с.

11.Когаловский М.Р Интеграция данных в информационных системах. Сб. трудов Третьей Всероссийской конференции "Стандарты в проектах современных информационных систем", Москва, 23-24 апреля 2003 г.

12.Когаловский М.Р Стандарты XML и электронные библиотеки. Электронные библиотеки. Институт развития информационного общества. - 2003. - Том 6 - Выпуск 2.

13.Когаловский М.Р Перспективные технологии информационных систем. - М.: ДМК Пресс, 2003. - 288 с.

14.Когаловский М.Р Особенности научных электронных библиотек. Тезисы докладов научной конференции, посвященной 10-летию РФФИ "Электронные библиотеки и информационное обеспечение научной деятельности", Москва, 25-26 ноября 2002 г. Российский фонд фундаментальных исследований, Центр фотохимии РАН, 2002.

15.Kalinichenko L.A. et al. Digital Libraries in Education. Analytical Survey, UNESCO Institute for Information Technologies in Education. Moscow. 2003. p. 68.

16.Манцивода А.В. Малых А.А. Система МЕТА и открытые модели знаний/ Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г.Новороссийск).- М.: Изд-во МГУ, 2004, С. 173-175.

17.ЛопатенкоА.Н. Guide to Metadata for Science and Research http://derpi.tuwien.ac.at/~andrei/Metadata_Science.htm

18.Хохлов Ю.Е., Арнаутов С.А., Обзор форматов метаданных. М.: Институт развития информационного общества, http://www.elbib.ru/index.phtml?page =elbib/rus/methodology/md_rev

19.Антопольский А.Б. Лингвистическое обеспечение электронных библиотек – М.: НТЦ «Информрегистр», 2003. –302 с.

20.Захаров И.В., Соколинский Л.Б. БИТ: электронная библиография по информационным технологиям с индексами цитирования. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.163-164.

21.Андреев Л.Н., Андрюсенко В.В. и др. ГИС-интерфейс информационно-поисковой системы “Ботанические коллекции России и сопредельных государств”. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.76-77.

22.Зинькина Н.Л., Любарский С.Е. Электронная коллекция лекарственных растений гербария Казанского университета. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.77-79.

23.Ляпин С.Х., Куковякин А.В. Электронная библиотека в Интернет-архитектуре с гибким параметризируемым полнотекстовым поиском для гуманитарных исследований и образования. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.166-168.

24.Варламов Д.А. Принципы формирования баз экспериментальных данных (с WWW-интерфейсом) в области наук о Земле. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с. 245-247.

25.Федоров А., Елманова Н. Internet-технологии в цифрах и фактах. //Компьютерпресс, № 6, 2003.

26.Деникин А.С., Загребаев В.И., Самарин В.В., Алексеев А.П., Кожин А.Ю. Сетевая база знаний по низкоэнергетической ядерной физике. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.14-17.

27.Левашов П.Р., Хищенко К.В., Ломоносов И.В. База экспериментальных данных и расчеты термодинамических свойств по управлениям состояния веществ при высоких давлениях и температурах через Интернет. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с. 164-165.

28.Головков С.Л., Рубин А.Г., Смирнов В.К. Монитор поддержки параллельных научно-технических задач в сети Интернет. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.79-82.

29.Букатов А.А., Дацюк В.Н., Дацюк О.В., Хачкинаев Г.М. Опыт создания высокопроизводительного кластера с использованием двух коммуникационных сетей. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.110-112.

30.Галюк Ю.П., Золотарев В.И., Мемнонов В.П.GRID: отказоустойчивая схема многокластерных MPI-вычислений. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.87.

31.Ермаков А.В. Некоторые проблемы ГРИД-администрирования. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с. 3.

32.Гергель В.П., Свистунов А.Н. Разработка интегрированной среды высокопроизводительных вычислений для кластера Нижегородского университета. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.102-104.

33.Абрамов С.М. и др. Кластерные системы семейства суперкомпьютеров “СКИФ”. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.147-151.

34.Степанова М.М., Стесик О.Л., Сурков А.Г., Чернышева Л.В. Разработка параллельной версии программного комплекса “АТОМ” и ее испытание на экспериментальном GRID-кластере. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.172-173.

35.Антонов А.С., Крысанов Б.Ю. Сравнение характеристик кластерных систем при помощи Вычислительного полигона. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.342-345.

36.Прохоров В.В., Прохоров И.В., Косарев В.А. Программные средства Веб-видеоконференций на базе компонентной технологии. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.347-351.

37.Капранов В.А., Горохов С.А., Кашин С.В. Интернет-трансляция живых событий. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.182-183.

38.Корухов С.В. Комплекс видеоконференций и дистанционного обучения в реальном времени. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.190-192.

39.Афонин А.Ю., Бабешко В.Н., Булакина М.Б. и др. Образовательные Интернет-ресурсы. Под ред. А.Н. Тихонова и др.; ГНИИ ИТТ “Информика”. – М.: Просвещение, 2004. – 287 с.

40.Балдина Е.А., Чалова Е.Р. Аэрокосмическое дистанционное образование – проблемы обеспечения учебными материалами. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.4-6.

41.Антопольский А.Б., Антипова Е.А. Вопросы разработки навигационных систем по научно-техническим информационным ресурсам. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.204-209.

42.Патаракин Е.Д. Информационные ресурсы коллективного авторства. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.151-153.

43.Комаров В.В. ТВ комплекс 6М оптического телескопа БТА как элемент дистанционных астрономических наблюдений. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.18-19.

44.Шергин В.С. Доступ из Интернета к управлению БТА в реальном времени наблюдательного цикла. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.153-155.

45.Букеткин Б.В., Зимин А.М., Шумов А.В. Учебная Интернет-лаборатория “Испытания материалов”. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.101-102.

46.Давыдов А.Н., Ишханов Б.С., Кэбин Э.И. Виртуальный практикум по физике ядра и частиц. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.59-60.

47.Паринов С.И. Интернет технологии 2-го: осознанные необходимости. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.101-102.

48.Интернет-порталы: содержание и технологии. Сб. науч. ст. Вып. 1. Ред. А.Н. Тихонов и др. ГНИИ ИТТ “Информика”. – М.: Просвещение, 2003, 720 с.

49.Чепурнов В.М., Вязилов Е.Д., Белов С.В., Сухоносов С.В. Методы и средства реализации доступа к океанографическим данным с использованием Web-технологий. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с.71-72.

50.Тирас Х.П., Ильясов Ф.Э., Воеводин В.В. Виртуальный биологический музей: на пути к распределенному информационному ресурсу. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). –М.: Изд-во МГУ, 2003. с. 232-235.

51.Воройский Ф.С. Основы проектирования автоматизированных библиотечно-библиографических систем .- М.: Физматлит, 2002 – 384 с.

52.Application profile for the Government Information Locator Service (GILS). www.gils.net/prof_v2.

53.Наук Т. В.Формирование экспериментальной метабазы Навигационной системы ГСНТИ: итоги работы / Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 125-127.

54.Игнатова И. Г. Система интеграции разнородных коллекций информационных ресурсов на основе объединения метаописаний. / Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 240-242.

55.Паринов С.И.Логика развития корпоративных порталов (на примере портала ГУ Высшая Школа Экономики) / Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 77.

56.Бородкин Л.И. Гарскова И.М. Тематические ресурсы по истории: информационный контент, метаданные, веб-сервисы) / Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 256-258.

57.Р.А. Коротченко, И.О. Ярощук, А.Н. БездушныйВерсия схемы метаданных экспериментальных исследований с приложением в гидроакустике. / Электронные библиотеки. 2004 т. 7 вып. 2.

58.Малхасян С. В., Желенкова О. П., Витковский В. В., Пляскина Т.А., Малькова Г.А Использование локального реестра для интеграции астрономических ресурсов обсерватории/ Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г.г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 209-211.

59.Нanish W. and NVO Metadata Working Group. Resource and Service Metadata for the Virtual Observatory: 2002, draft, htpp://www.us-vo.org.

60.Кудашев Е.Б., Балашов А.Д. Интеграция электронной библиотеки спутниковых данных в международную систему космической информации. - Труды Пятой Всероссийской научной конференции ?Электронные библиотеки 2003?, СПБ: Изд-во СПБ университета, 2003. С. 45-46.

61.Белов Г. В., Потапкин Б. ВО наполнении содержанием информационных инфраструктур для междисциплинарных исследований/ Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г.г. Новороссийск).- М.: Изд-во МГУ, 2004. С.32-33.

62.Черняк Л.SOAP и REST, вместе или порознь? //Открытые системы, № 9, 2003.

63.Ньюкомер Э. Веб-сервисы для профессионалов. – СПб.: Питер, 2003.

64.Макмиллан Р. Хореография Web-служб. //ComputerWorld, №8, 2003.

65.Желенкова О.П. Использование данных различной природы и представления для решения астрофизических задач. //Научный сервис в сети Интернет: Труды Всероссийской научной конференции (22-27 сентября 2003 г.г. Новороссийск). – М.: Изд-во МГУ, 2003. с. 360-362.

66.Еркимбаев А. О., Зицерман В. Ю., Трахтенгерц М. С., Кобзев Г. А., Фокин Л. Р., Попов В. Н., Ягов В. В. Научно-образовательный портал THERMOPHYSICS.ru. WEB-технология размещения и использования аналитических и вычислительных средств/ Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 35-37.

67.Голик А.В. Фищенко В.К. Корпоративная географическая ГИС ДВО РАН: разработка и реализация политик доступак информационным и аналитическим ресурсам/ Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 122-124.

68.Валаамов Д.А. Чичагов А.В. Российский минералогический Интернет-портал / Научный сервис в сети Интернет: Труды Всероссийской научной конференции (20-25 сентября 2004 г. г. Новороссийск).- М.: Изд-во МГУ, 2004. С. 230-231.

Личный кабинет

 

Информационные ресурсы




Новые поступления электронных изданий