MedLine – это крупнейшая библиографическая база данных, содержащая более 75% мировых периодических изданий в области биомедицины, которая принадлежит Американской национальной медицинской библиотеке [1]. Именно она в настоящее время держит мировое лидерство среди подобных баз данных как по количеству и качеству предоставляемой информации, так и по удобству и бесплатности оказываемого сервиса.
На момент написания статьи в базе данных MedLine имелись цитаты статей из 5835 мировых журналов. В том числе большое количество журналов урологической и андрологической тематики, куда входят такие издания, как Andrologia, BJU International, British Journal of Urology, European Urology, International Journal of Andrology, The Journal of Sexual Medicine, The Journal of Urology, Urologiia (Moscow, Russia), и многие другие.
База MedLine представлена несколькими разделами. Собственно MedLine, которая охватывает около 12 миллионов цитат (цитата – это краткая информация о публикации) и абстрактов статей, опубликованных в международных биомедицинских журналах с 1966 года. OldMedLine, которая содержит 1,7 миллиона цитат и абстрактов статей, опубликованных с 1950 по 1965 годы. PreMedline – содержит библиографическую информацию и рефераты публикаций, еще не вошедшие в Medline, которая обновляется ежедневно. Каждый год в MedLine добавляется около полумиллиона новых цитат и абстрактов.
Для создания системы поиска информации недостаточно лишь одной базы данных, необходим интерфейс доступа к этим данных. Самым удобным является доступ с использованием Интернета. Для этого и создана система PubMed, которая, в свою очередь, является библиографическим компонентом поисковой системы Entrez [1].
PubMed не единственный сервис, дающий возможность поиска в базе данных MedLine. Среди наиболее известных поисковых машин стоит отметить следующие: Ovid, Scopus, CDL MEDLINE (ранее - MELVYL MEDLINE). Каждая их перечисленных имеет свои особенности, всесторонне раскрывающие возможности научной работы с накопленной информацией.
PubMed – свободный ресурс. Он был создан и поддерживается национальным центром биоинформационных технологий (NCBI – National Center for Biotechnology Information) и Американской национальной медицинской библиотекой (NLM – U.S. National Library of Medicine), входящих в состав национального института здоровья (National Institutes of Health) США.
Система поиска PubMed предоставляет возможность поиска не только в библиографической базе данных MedLine, но и в ряде других источников данных: электронных книгах, материалах клинических исследований и в прочих смежных с медицинской специальностью изданиях.
Поисковый сервис PubMed представлен двумя видами интерфейса. Основной, который доступен по адресу: http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed, а также по адресу http://www.pubmed.com/ (это один и тот же сайт). И облегченный («текстовый»), на который можно перейти по ссылке «Text Version» из основного интерфейса, или набрав в адресной строке Вашего браузера путь к нему: http://www.ncbi.nlm.nih.gov/entrez/queryd.fcgi?linkbar=plain.
При входе на сайт PubMed Вы сразу попадете в основное окно программы, откуда можно осуществлять запросы к базе MedLine.
Основной интерфейс PubMed
Текстовая версия PubMed
Рисунок 1. Вид основного и облегченного интерфейсов системы PubMed
Система PubMed представляет следующие возможности.
1. Формирование простых запросов к базе данных MedLine
2. Формирование сложных запросов с множеством инструментов, которыми можно тонко регулировать его параметры.
3. Создание запросов на основе ключевых слов с использованием контролируемого словаря-тезауруса MeSH®
4. Создание личной страницы, которая предоставляет ряд дополнительных возможностей: сохранение запросов и результатов поиска, дополнительные настройки сервиса, настройка автоматического поиска с отправкой результатов на Ваш электронный ящик (мониторирование базы MedLine).
5. Получение результатов поиска в виде цитат или абстрактов в различных электронных форматах, которые можно потом отправить на электронный почтовый ящик.
6. Переход по предложенным ссылкам на страницы электронных представительств изданий, где можно ознакомиться с полнотекстовой версией статьи. Некоторые издательства предоставляют эту возможность бесплатно, но в большинстве случаев за полную статью придется заплатить.
7. Службы доставки документов.
8. Система помощи, с удобными видео фрагментами, иллюстрирующими основные этапы работы PubMed.
Все эти услуги предоставляются бесплатно.
Для формирования простого запроса к базе данных MedLine достаточно ввести поисковое слово или фразу в окно запроса и, не изменяя ничего в остальных опциях сайта, нажать кнопку «Go». В случае несложных условий поиска этого бывает достаточно, но сложные задачи требуют более детального изучения возможностей языка запросов системы PubMed.
Рисунок 1. Строка запроса в системе PubMed
В основе этого языка лежит Булева логика, представляющая собой математическую систему, названную в честь английского математика Джорджа Була. Эта логика связывает термины с помощью нескольких языковых конструкций – логических операторов: AND (И), OR (ИЛИ), NOT (НЕТ).
По умолчанию, если Вы набрали запрос, состоящий из нескольких слов, система разбивает его на отдельные слова и между каждым словом вставляет оператор AND. Например, Вы набрали в строке запроса «cancer penis», поисковая машина прежде, чем отправит запрос в базу данных, представит его в виде «cancer AND penis», что на машинном языке означает: «найти в базе информацию по раку И половому члену, содержащуюся в одной статье».
Оператор AND, стоящий между словами, означает, что в возвращаемом запросе должна быть цитата статьи, где будут встречаться все слова из этого запроса, связаны оператором AND.
Оператор OR означает, что пользователь ищет информацию, в которой будет встречаться или одно или другое слово, при этом не обязательно, чтобы они были расположены в одной статье вместе. Например, если Вы хотите найти все статьи по раку полового члена или по раку уретры, то вы должны поставить между этими словами оператор OR.
Оператор NOT дает указание системе, чтобы она возвратила информацию, где не будет встречаться термин, который расположен справа в строке запроса. Например, надо найти статьи, где бы говорилось об УЗИ предстательной железы, кроме случаев рака предстательной железы, запрос будет выглядеть так: «prostate AND ultrasound NOT cancer».
Запросы можно группировать, объединяя их круглыми скобками. Например, предыдущий запрос может выглядеть так «(prostate AND ultrasound) NOT cancer». Запросы могут быть очень сложными за счет комбинирования операторов, объединения слов в группы и вложения групп друг в друга.
Для того, чтобы в результатах поиска слова были только рядом друг с другом и только в той последовательности, в которой Вы их ввели в запросе, то их необходимо пометить в кавычки «"prostate cancer"». Если неизвестна часть слова или необходимо найти все словоформы термина, то вместо изменяемой части слова укажите оператор – знак «*», например «uro*».
Система предоставляет удобную возможность указать, где искать те или иные слова в цитате статьи. Для этого есть несколько инструментов.
Интуитивно понятным является использование ограничения поиска (вкладка «Limits» на странице поиска). На этой дополнительной странице можно указать конкретных авторов, чей материал вы ищете; журнал; содержание терминов в абстракте; дату и язык публикации; тип статьи и специальные ограничительные теги, которые будут описаны далее. После того, как Вы определите границы поиска, можно нажать кнопку «Go», чтобы система начала поиск в базе данных с новыми параметрами.
Другим инструментом, позволяющим сузить границы поиска, являются поисковые теги. Они представляют собой строго определенные буквенные сокращения команд для поиска, заключенные в квадратные скобки. Например, [AU] – этот тег, который является сокращенным название поля «автор» («Author») цитаты статьи. Теги ставятся справа от вводимого слова в запросе и определяют принадлежность этого слова к категории. Слово «Debruyne[AU]» с тегом [AU] будет означать, что мы хотим, что бы в нашем запросе одним их авторов статьи был Debruyne.
Таблица 1. Краткое описание тегов, используемых в поисковых запросах системы PubMed
Полный перечень и подробное описание тегов можно найти на странице помощи системы PubMed по адресу:
http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=helppubmed.section.pubmedhelp.Search_Field_Descrip
Очень гибкой системой поиска является контролируемый словарь терминов MeSH [2]. Это словарь представляет собой иерархический словарь, состоящий из 16 основных ветвей, таких как: анатомия; организмы; заболевания; химические вещества и лекарственные препарат; диагностика, лечение, терапевтическая техника и оборудование; здравоохранение; географические термины и ряд других. Этот словарь содержит 25 тысяч основных терминов, 172 тысячи дополнительных терминов и порядка 100 тысяч вспомогательных терминов. Более «высокие» ветки в иерархии словаря «распадаются» на более мелкие, уточняя какое-либо определение. Так, например, термин простатит (prostatitis) входит в ветку «заболевания → заболевания мужчин → заболевания предстательной железы → простатит»
Рисунок 2. Место термина простатит (prostatitis)в иерархии словаря MeSH
Каждая цитата при помещении ее в базу данных MedLine соотносится с терминами, которые содержатся в этом словаре, т.е. статья классифицируется. С позиции базы данных этот процесс называется индексацией статьи. Статья, как правило, соотносится не с одним термином, а с несколькими. Это порядка 5-25 терминов на одну статью.
С основной страницы системы PubMed имеется ссылка «MeSH Database» на раздел поиска с использованием словаря MeSH. На этой странице Вы можете ввести поисковое слово или фразу, которая, по Вашему мнению, является ключевой при поиске информации. Система выведет на экран все связные термины из словаря MeSH и у Вас появится возможность более углубленно просмотреть возможные варианты поиска, «перемещаясь» по ссылкам ветвей словаря, при этом детализируя свой запрос или расширяя его.
Справа от каждого термина словаря MeSH находится активная ссылка «Links», нажав на которую из выпадающего меню, можно выбрать источник поиска и перейти на страницу с результатами. На этой странице будут показаны цитаты статей, связанные с этим термином.
Так как над составлением словаря трудится большая команда специалистов инженеров по знаниям со специализацией в предметной области «медицина», и индексация статей проводится с использованием технологий искусственного интеллекта [3], поэтому поиск с использованием MeSH относится к наиболее эффективному методу поиска информации в базе данных MedLine.
После того, как Вы составили и выполнили запрос, система PubMed выведет на главную страницу результаты поиска в виде списка найденных цитат статей. В верхней части этой страницы расположены инструменты, с помощью которых можно управлять цитатами. С помощью этой панели можно выполнить следующие действия.
* Изменить формат вывода цитаты на экран. Можно вывести информацию в сокращенном варианте, показать абстракт, XML формат и еще ряд других полезных вариантов.
* Изменить количество цитат, выводимых на одной странице.
* Сортировать результаты поиска по дате, по авторам, по названию журнала
* Отправить статью на принтер, в текстовый файл, в буфер обмена, на электронную почту, в RSS канал.
* Можно осуществлять навигацию по страницам, выбрав ссылку «Next» (следующая страниц) или введя в окно номер страниц и нажав кнопку «Page» (страница).
Рисунок 3. Навигация по странице результатов поиска
Ниже меню навигации расположена страница, содержащая найденные цитаты. По умолчанию (режим вывода «Summary») отдельная цитата представлена пиктограммой, по которой визуально можно определить, содержит ли найденная цитата абстракт и есть ли ссылка на бесплатный полнотекстовый материал, доступный в Интернете. Каждой цитате система автоматически присваивает порядковый номер в ряду найденных материалов. Цитата содержит следующие поля, которые отмечены на рисунке 4:
* авторы статьи, в виде активной ссылки, нажимая на которую можно перейти на страницу, где будут содержаться все имеющиеся в базе MedLine цитаты статей выбранного автора;
* название статьи;
* краткое название журнала, где была опубликована эта статья;
* даты публикации статьи;
* номер выпуска журнала и страницы, где была напечатана статья.
Рисунок 4. Страница с результатами поиска
Дополнительные опции расположены на странице во вкладках. На вкладке «Limits» имеется возможность сузить результаты поиска, о чем было написано выше.
На вкладке «Preview/Index» к Вашему запросу можно добавить дополнительные ограничивающие термины и индексы с тегами и логическим операторами поиска [4]. Нажав на кнопке «Preview», можно предварительно просмотреть какое количество цитат будет найдено по созданному Вами запросу. Перейдя по активной ссылке на количество найденных цитат, Вы можете более подробно ознакомиться с полученными результатами. Таким образом, этот инструмент позволяет быстро сформировать тактику и стратегию поиска без перегрузки страницы цитатами, при этом различные варианты запросов остаются видны на одной странице.
Вкладка «History» сохраняет результаты последних запросов, выполненных Вами в системе PubMed. Нажав на кнопке «Clear History» можно очистить это список.
Вкладка «Clipboard» представляет собой удобный инструмент временного сохранения запросов, который работает по аналогии с буфером обмена в операционной системе Windows. Выделив нужные Вам цитаты на странице результатов поиска, можно поместить их в буфер обмена для временного хранения. Для этого в выпадающем меню вывода цитат («Send to») выберите опцию «Clipboard», цитаты поместятся на временное хранение и будут доступны в этой вкладке даже в течение восьми часов после Вашего выхода из системы. В буфер обмена можно поместить не более 500 цитат. Помещенные сюда цитаты статей остаются подсвеченными зеленым цветом, как в самом буфере обмена, так и в результатах поиска.
Вкладка «Details» позволяет детально просматривать запрос к базе данных, корректировать его в случае громоздких и сложных конструкций.
Во вкладке «Authority Index» можно ввести поисковое слово и просмотреть найденных авторов по их индексам, созданным в системе. Нажав на ссылке имени автора можно перейти на страницу с библиографическим списком цитат их статей.
Чтобы попасть на страницу с детальным описанием одной из статей, надо нажать на пиктограмме в виде маленькой странички, условно изображающей журнал.
На этой странице, в случае, если цитата содержит абстракт статьи, можно ознакомиться с его описанием (рисунок 5). Здесь же, справа от абстракта, содержится ссылка на полнотекстовую версию, и имеются тематические ссылки, которые, по мнению разработчиков поисковой системы, семантически (по смыслу) связаны с этой статьей.
Рисунок 5. Страница с детальным описанием статьи
На индивидуальной странице цитаты имеется набор опций, аналогичный с тем, что есть на общей странице результатов поиска. С помощью его Вы можете изменить представление цитаты и сохранить ее, поместить в буфер обмена или отправив по электронной почте.
Дополнительные возможности появляются при открытии личной страницы в системе PubMed (на сайте она называется «My NCBI»). Для этого достаточно пройти несложную регистрацию, перейдя по ссылке «Register», расположенной в правом верхнем углу главной страницы PubMed. После этого у Вас появится логин (имя в системе) и пароль, с помощью которого Вы сможете авторизироваться на сайте – ссылка «Sign In» (рисунок 6).
Рисунок 6. Верхняя часть основного окна системы PubMed с модулем «My NCBI»в правом углу
Регистрация на сайте не является обязательной, но может значительно облегчить частую работу по поиску информации в базе MedLine.
После входа на свою личную страницу (пункт A на рисунке 7) у Вас появится возможность сохранить результаты поиска. Для этого осуществите поиск и нажмите на ссылку «Save Search» (пункт B на рисунке 7).
Рисунок 7. Вход на свою страницу и сохранение результатов поиска
В отдельном окне система предложит ввести название сохраняемого поиска, чтобы его можно было в дальнейшем идентифицировать (рисунок 8). В этом же окне можно настроить автоматическое получение новых результатов запроса на Ваш адрес электронной почты.
Рисунок 8. Выбор названия запроса и подписка для получения новых результатов на электронный адрес
После сохранения результатов поиска у Вас накопится некоторое количество запросов, которые будут храниться на Вашей личной странице. Вы можете вновь ознакомиться с найденными материалами, нажав на ссылке с названием запроса (пункт A на рисунке 9), увидеть, как давно происходило последнее обновление (пункт B на рисунке 9), настроить автоматическую отправку обновлений по электронной почте (пункт C на рисунке 9) или самостоятельно проверить, что нового появилось в базе данных MedLine, установив «галочки» рядом с названием запроса, и, нажав на кнопке «What’s New for Selected» (пункт D на рисунке 9).
Рисунок 9. Управление сохраненными результатами поиска
При всем многообразии и больших возможностях PubMed порой не так просто найти нужную нам информацию. В ряде случаев это связано со слабым знанием многими урологами и андрологами английского языка. Но существуют и такие проблемы, которые невозможно преодолеть на сегодняшнем этапе развития информационных технологий. Это в первую очередь связано с накоплением огромного количества информации, которая при этом является слабо структурированной, неоднородной и неточной [5,6,7]. Несколько нужных исследователю статей могут утонуть в необъятном море информации, особенно если изучаемый вопрос очень специфичен.
Для решения подобных проблем необходимо весь этот поток информации организовать и структурировать, и что самое сложное и важное – создать семантическую связь разрозненных фрагментов знаний [5,6,7].
По этому пути идет развитие базы данных MedLine. Создание управляемого словаря терминов MeSH и индексация цитат согласно созданной структуре позволит в дальнейшем наделить хранящиеся данные самоописанием с возможностью их программного анализа. Американская национальная медицинская библиотека объединила усилия многих научных направлений, создав UMLS (Unified Medical Language System) – унифицированный язык медицинских систем, на основе которого можно создавать базы медицинских знаний, принципиально отличающиеся от баз данных.
Практическая ценность создания баз знаний будет состоять в возможности формирования вопроса системе на привычном нам языке. При этом будет получен адекватный требованиям исследователя ответ с объяснением сделанного вывода, каким бы он не был сложным.