N-T.ru / Раритетные издания / Николай Чурсин

Популярная информатика

Николай ЧУРСИН

Выход в автоматизации?

Знакомьтесь: автоматизированные ИПС

Используя закономерности рассеяния и старения информации, мы можем существенно ограничивать поток информации, с которой целесообразно знакомиться. Однако та часть потока информации, в которой с наибольшей вероятностью сосредоточены нужные нам сведения, все же содержит несметное множество документов. В этом множестве необходимо отобрать те документы, которые соответствуют нашим информационным потребностям.

Здесь мы сталкиваемся с проблемой информационного поиска – одной из важнейших проблем информатики Информационный поиск – это процесс отыскания в каком-то множестве документов тех, которые посвящены указанной в информационном запросе теме (предмету) или содержат необходимые потребителю факты, сведения.

Информационный поиск осуществляется при помощи информационно-поисковых систем (ИПС) и выполняется вручную или с использованием соответствующих средств механизации и автоматизации.

Информационно-поисковые системы могут быть реализованы посредством библиографической картотеки селектора, содержащего перфокарты с краевой или внутренней перфорацией, ЭВМ и т.д. Для применения ИПС необходима систематизация и классификация документов.

Классифицировать документы можно по отрасли науки, виду документа, автору или по другому признаку. Одной из самых распространенных классификаций в настоящее время является универсальная десятичная классификация (УДК), созданная на основе десятичной классификации М. Дьюи по инициативе бельгийских ученых Поля Отле и Анри Лафонтена. Все знания, накопленные человечеством, разбиты в ней на 10 классов: 0. Общий отдел; 1. Философия; 2 Религия; 3 Общественные науки; 4 Свободный отдел; 5 Математика. Естественные науки; 6 Прикладные знания. Медицина. Техника; 7 Спорт. Фотография. Зрелища; 8 Языкознание. Филология. Художественная литература. Литературоведение; 9 Краеведение. География. Биография. История.

Каждый из этих 10 классов делится на 10 подклассов, затем еще на десять и т.д. – классификация является иерархической (Иерархия – это такое отношение, при котором один класс является подклассом другого, более широкого). Для обозначения классов, подклассов в УДК применены арабские цифры, абсолютно однозначные для всех людей, независимо от их языка или алфавита. Эта классификация применяется более чем в 50 странах.

П. Отле и А. Лафонтен видели в УДК лишь средство для достижения совершенной системы организации знаний. Их основной идеей была гениальная догадка о необходимости упорядочения всемирной системы научной коммуникации. Эта идея и сегодня остается актуальной, поскольку цели, впервые сформулированные П. Отле на рубеже нашего века, и идеи, развивавшиеся им вплоть до середины 40-х годов, далеко еще не реализованы и ныне, а потребность в создании более совершенной системы научной коммуникации в человеческом обществе ощущается сейчас значительно острее, чем в прошлые десятилетия. Его почин в создании универсальной десятичной классификации послужил прочной основой для дальнейшей коллективной разработки этой классификации.

Наряду с УДК, в нашей стране широко используются библиотечно-библиографическая классификация (ББК), международная классификация изобретений (МКИ), классификаторы промышленной продукции и т.д.

Широкое распространение классификаций объясняется их удобством при информационном поиске. Простейшая поисковая система представляет собой каталог, организованный по алфавиту, УДК или по любой другой классификации. В этом случае поиск осуществляется в массиве самих документов, представленных в виде каталожных карточек. После нахождения нужной карточки в каталоге дальнейший поиск сводится к изъятию документа с полки, где он хранится. Кажется, все просто и удобно. Действительно, информационно-поисковые системы, организованные без применения каких-либо средств механизации поиска, оправдывали себя в течение длительного периода.

С возрастанием потоков информации резко увеличились и объемы каталогов. На поиск информации стало уходить значительно больше времени, чем прежде. Пока величина массива, в котором производился поиск, не превышала нескольких тысяч документов, мириться с увеличением времени поиска было еще можно. Когда же объем массивов стал измеряться десятками тысяч документов, а в настоящее время в крупных информационных органах такими цифрами измеряется только ежегодный прирост фондов, ручные методы поиска, оказались малопригодными.

Первые попытки уменьшить время поиска документов с помощью механизации этого процесса относятся к началу века, когда появились (1904 г.) карты с краевой перфорацией, положившие начало применению полумеханизированных ИПС. В 1915 г. американский ученый Г. Тейлор получил патент на способ поиска информации с помощью так называемых суперпозиционных перфокарт. Однако практическое применение эти перфокарты нашли только в 1939 г. С тех пор перфокарты заслужили добрую славу как верные помощники людей в поиске той или иной информации.

Уже в середине 50-х годов в СССР была практически осуществлена идея использования перфорационных вычислительных машин для поиска документальной информации.

Если на заре развития вычислительной техники для информационного поиска эффективнее было использовать людей, даже если для этого требовалось их все больше и больше, то вскоре положение круто изменилось. Взоры специалистов в области информатики обратились на ЭВМ. В информационном поиске началась эра автоматизации.

Механизация и особенно автоматизация библиотечных и информационных процессов – это жизненная необходимость. Следуя этой необходимости, в настоящее время в нашей стране и за рубежом разработано большое число автоматизированных информационно-поисковых систем (АИПС). Остановимся на описании таких систем подробнее.

Автоматизированные ИПС в зависимости от объектов поиска можно разделить на две группы: документальные и фактографические.

Документальные системы ограничивают свои цели поиском документов, фактографические – поиском самых разнообразных числовых характеристик, фактов, данных и т.д. Имея много общего, эти типы ИПС обладают и рядом существенных отличий. В автоматизированных системах научно-технической информации наиболее широкое применение в нашей стране получили документальные ИПС. Этот факт отражает ведущее положение документа в процессе распространения информации.

Любая документальная ИПС – от ручной до автоматизированной – включает следующие элементы: информационно-поисковый язык (ИПЯ), правила перевода текстов документов и запросов с естественного языка на ИПЯ, формальные правила (алгоритмы) поиска, технические устройства, реализующие алгоритмы поиска, фонд документов (или их адресов), записанных на каких-либо носителях информации.

Лингвистические проблемы...

При поиске нужных документов с использованием каталогов мы ориентируемся не на полные тексты документов, а на их сокращенные названия, позволяющие судить о содержании документов. Эти сокращенные описания могут быть индексами УДК или какой-либо другой классификации, перечнем авторов документа, тематическими рубриками и т.д. При переходе от документа к такому сокращенному его описанию с целью использования этого описания для последующего поиска, мы как бы переводим документы на ИПЯ. По определению А.И. Михайлова, А.И. Черного, Р.С. Гиляревского, информационно-поисковый язык – это специализированный искусственный язык, предназначенный для выражения основного смыслового содержания документов или информационных запросов с целью отыскания в некотором множестве документов таких, которые отвечают на поставленный информационный запрос.

Описание содержания документа с помощью ИПЯ представляет собой поисковый образ документа (ПОД), а описание содержания запроса – поисковый образ запроса (ПОЗ). Правила составления поисковых образов документов и запросов являются правилами перевода текстов с естественного языка на ИПЯ.

При наличии массива документов и соответствующих им ПОД поиск отвечающего на запрос документа сводится к сопоставлению поисковых образов документов и запросов. Для того чтобы оценить степень их соответствия, необходимо сформулировать критерий смыслового соответствия – формальное правило, по которому поисковые образы документа и запроса считаются совпадающими или несовпадающими. При формальном совпадении ПОД и ПОЗ документы считаются отвечающими на запрос. Однако такое совпадение не означает содержательного соответствия выданного документа запросу. Документ, смысловое содержание которого соответствует информационному запросу, называется релевантным этому запросу. Но если ИПЯ неточно выражает смысл документов и запросов, то может оказаться, что близкие по смыслу документы и запросы обладают разными поисковыми образами и, наоборот, у далеких по смыслу друг от друга документов поисковые образы оказываются сходными. В этом случае не все документы, формально соответствующие запросу, соответствуют ему в действительности, т.е. релевантны. Явление, при котором в ответ на запрос система выдает документы, не соответствующие запросу, называется поисковым шумом. По тем же причинам может оказаться, что часть документов, релевантных запросу, все же оказалась невыданной, тогда говорят о потерях информации. Информационный шум и потери информации могут быть выражены количественно с помощью коэффициентов полноты и точности поиска, являющихся показателями технической эффективности ИПС.

Коэффициент полноты поиска R определяется отношением числа выданных в результате поиска релевантных документов к общему числу релевантных документов, как выданных, так и оставшихся невыданными;

R = a / (a + c).

Коэффициент точности поиска P представляет собой отношение количества выданных релевантных документов к общему числу документов в выдаче: P = a / (a + b), где a – число релевантных документов в выдаче; c – число релевантных документов, оставшихся невыданными (потери информации); b – число выданных нерелевантных документов (поисковый шум).

В результате сказанного возникает вопрос: возможен ли такой ИПЯ, который бы точно передавал смысл документа, т.е. ИПЯ, обеспечивающий максимальные точность и полноту поиска? Ответ на этот вопрос очень важен для понимания специфики документальных ИПС. Компьютер может мгновенно распечатать содержание накладной №201375, хранящейся в его памяти, или из сотен фамилий работников предприятия безошибочно отыскать и начислить Сидорову Ивану Петровичу месячную заработную плату. Поиск такого рода широко используется в АСУ. В этом случае поиск производится по внешним признакам объектов: номеру накладной, фамилии и т.д. Если применить этот же принцип к поиску научных документов, то по формату и количеству страниц ЭВМ укажет адрес в хранилище всех книг и журналов конкретного формата (если, конечно, они введены в память ЭВМ).

Совершенно иначе обстоит дело с поиском документов по их содержанию. Информация, содержащаяся в научных документах, объективно подчиняется закону рассеяния. Это значит, что в одном случае в ответ на запрос ИПС может выдать несколько профильных публикаций, точно отвечающих на него, не выдав релевантную информацию, рассеянную среди большого количества других источников, в другом – может выдать и релевантную информацию. Полнота поиска возрастет. Однако в этом случае будет иметь место больший поисковый шум. Исходя из этого можно сделать вывод о принципиальной невозможности одновременного достижения стопроцентной полноты и такой же точности при поиске научных документов. Увеличивая полноту поиска, мы неизбежно уменьшаем его точность и наоборот, увеличивая точность поиска, уменьшаем его полноту.

Точному переводу содержания документа на ИПЯ – индексированию – препятствует субъективное восприятие содержания выполняющим перевод. В результате одни и те же документы могут быть проиндексированы по-разному. Неточность описания содержания документов при помощи любого ИПЯ не может не сказаться при их поиске.

Отсюда следует, что для документальных ИПС не может быть разработан ИПЯ, который обеспечивал бы стопроцентную полноту и точность выдачи документов. Однако это не значит, что не следует стремиться к максимально точной передаче содержания документов при переводе их на ИПЯ. Именно от этого во многом зависит качество работы всей ИПС. Поэтому при разработке автоматизированных ИПС большое внимание необходимо уделять выбору ИПЯ.

В настоящее время разработано большое количество информационно-поисковых языков, различных по назначению и принципам построения. Существуют, например, информационно-поисковые языки, основанные на различных классификациях, так называемые ИПЯ классификационного типа. Работа ИПС с таким ИПЯ схематично может быть представлена следующим образом.

Каталог крупной библиотеки, организованный, например, по УДК, записывается на машинный носитель информации. Запросы, поступающие от потребителей информации, также индексируются по УДК. Машина выполняет процесс сравнения ПОЗа и ПОДа, выраженных на одном и том же ИПЯ – УДК. При совпадении индексов документов с индексом запроса машина выдает ответ на запрос. Если необходимо увеличить полноту выдачи документов, то мы можем потребовать не полного, а частичного совпадения индексов УДК ПОДов и ПОЗов, изменяя таким образом критерий смыслового соответствия. Таким путем мы можем управлять процессом поиска, добиваясь нужных его характеристик.

Информационно-поисковые языки классификационного типа широко используются в автоматизированных ИПС промышленного назначения, применяемых, например, при поиске аналогов проектируемых деталей с целью заимствования технологического процесса для их обработки. Однако применение ИПЯ, основанных на той или иной классификации, в автоматизированных документальных ИПС ограничивается тем, что введение новых сложных многоаспектных понятий требует бесконечного расширения классификации, что, конечно, невозможно.

Поэтому в последнее время в автоматизированных ИПС предпочтение отдается так называемым ИПЯ дескрипторного типа. Дескрипторы – это термины естественного языка, выражающие определенные понятия. Словарь дескрипторов с указанными между ними смысловыми отношениями, охватывающий определенную область знания, называется информационно-поисковым тезаурусом (ИПТ). Идея применения ИПТ для информационного поиска документов состоит в описании содержания документов и запросов с помощью дескрипторов, входящих в его состав. На практике эта идея реализуется следующим образом. Текст документа, вводимого в ИПС, уменьшается до объема реферата, в котором выделяются слова, несущие основную смысловую нагрузку, так называемые ключевые слова. При помощи ключевых слов достаточно точно передается содержание документа. После этого каждое слово заменяется близким ему по смыслу дескриптором информационно-поискового тезауруса.

Совокупность терминов тезауруса-дескрипторов, заменивших ключевые слова, образует поисковый образ документа. Точно так же на язык дескрипторов переводится и запрос. Поиск документов после этого уже можно поручить машине. ЭВМ с присущей ей быстротой просматривает массивы ПОДов и сравнивает их с ПОЗом. Цель такого сравнения – выявить дескрипторы, принадлежащие одновременно ПОДу и ПОЗу, т.е. найти пересечение множеств дескрипторов ПОДа и ПОЗа. Чем больше зона пересечения, тем точнее соответствие документа запросу. Минимальная величина зоны пересечения оговаривается принятым критерием смыслового соответствия. Изменяя его, можно варьировать точность и полноту поиска в зависимости от нужд потребителей информации.

Таковы принципы работы ИПС с ИПЯ дескрипторного типа. Качество их работы во многом зависит от совершенства применяемого информационно-поискового тезауруса. Поэтому требования к ИПТ очень высоки. В нем не должно быть, например, терминов, выражающих одно и то же понятие, т.е. синонимов – это привело бы к потерям информации при поиске. Кроме этого, должны быть зафиксированы некоторые отношения между терминами (род – вид, часть – целое и другие), служащие целям повышения точности и полноты поиска.

Обычно информационно-поисковые тезаурусы оформляются в виде книг. Лексику тезаурусов составляют не только дескрипторы, но и их синонимы, которые не являются дескрипторами. Присутствие в тезаурусе синонимов имеет большое значение. Поясним это на примере.

Пусть имеется два термина: «Абразивы порошкообразные» и «Порошки абразивные». Ясно, что они выражают одно и то же понятие. Но одно понятие не может быть представлено в тезаурусе двумя различными терминами! Это значило бы, что при поиске документов на запрос, содержащий термин «Абразивы порошкообразные», поисковая система не выдала бы документы, содержащие в поисковом образе термин «Порошки абразивные», хотя они подлежат выдаче, так как соответствуют запросу.

Использование синонимичных терминов приводит к потерям информации. Чтобы предотвратить это, из двух (в данном случае) синонимов в качестве дескриптора выбирают один – термин «Абразивы порошкообразные», – а другой снабжают отсылкой к первому (пометкой): см. «Порошки абразивные». Такая пометка означает, что вместо одного термина при составлении поисковых образов документов или запросов следует использовать другой, являющийся дескриптором. Именно так ликвидируется в тезаурусах синонимия.

Если из нескольких синонимов один выбран в качестве дескриптора, то остальные (в нашем случае это термин «Порошки абразивные») при этом получают название ключевых слов. Наличие в тезаурусе ключевых слов с отсылками к соответствующим дескрипторам облегчает индексирование документов, обеспечивает быстрый поиск нужного термина, способствует повышению качества функционирования ИПС.

Тезаурус является необходимым лингвистическим пособием любой механизированной или автоматизированной информационно-поисковой системы, использующей ИПЯ дескрипторного типа.

Первые тезаурусы, удовлетворяющие специфическим задачам информационного поиска, были разработаны в начале 60-х годов нашего века.

В соответствии с тематическим профилем различают многоотраслевые, отраслевые и узкотематические тезаурусы. Наиболее известны из информационно-поисковых тезаурусов следующие:

  • тезаурус АСТИА (Агентство службы технической информации США) – 1-е издание в декабре 1962 г.;
  • тезаурус технических и научных терминов, наиболее крупный из существующих тезаурусов (23364 слова, из которых 17810 слов выступают в качестве дескрипторов). Этот труд, вышедший в свет в декабре 1967 г., представляет собой совместное издание Документального центра Министерства обороны США и Объединенного совета инженеров;
  • тезаурус научно-технических терминов под общей редакцией Ю.И. Шемакина (М., Воениздат, 1972 г.). Этот тезаурус, включающий 19000 терминов, из которых 15000 являются дескрипторами, может служить примером отечественного многоотраслевого тезауруса.

К многоотраслевым тезаурусам можно отнести также тезаурусы международных информационных служб по атомной энергии. Тезаурус Евратома, изданный в 1966 и 1967 гг. и Тезаурус Международного агентства по атомной энергии в Вене («ИНИС»-Тезаурус), 6-е издание которого вышло в свет в 1974 г.

Примерами тезаурусов отраслевого масштаба могут служить: словарь дескрипторов по химии и химической промышленности, изданный НИИТЭХИМ в 1973 г. (1033 дескриптора, 5373 ключевых слова), тезаурус дескрипторов по образованию, используемый в автоматизированной системе Информационного центра в области народного образования США (1967 г.).

Даже этот небольшой перечень может дать представление о том, насколько велика роль информационно-поисковых тезаурусов в поиске информации. В настоящее время во всем мире ведется интенсивная работа по построению ИПТ различного назначения.

Для соединения «слов» тезаурусов в «фразы» применяются грамматические средства ИПЯ – правила составления поисковых образов с помощью дескрипторов ИПТ. Грамматики, применяемые в ИПЯ, бывают самыми различными. Одни регламентируют порядок дескрипторов в ПОДах и ПОЗах, другие – приписывают каждому дескриптору числа, характеризующие их значимость для поискового образа, третьи – указывают на роль каждого дескриптора при помощи специальных указателей и т.д. Применение грамматических средств в некоторых случаях позволяет более точно передавать содержание документов и тем самым улучшать поисковые характеры ИПС.

Подробное освещение классификационных и дескрипторных ИПЯ, информационно-поисковых тезаурусов и лингвистических (т.е. языковых) аспектов автоматизированных ИПС объясняется тем, что они оказывают решающее влияние на функционирование ИПС. Какой бы мощной и современной ЭВМ мы ни располагали, без правильно выбранного поискового языка вся система будет работать неэффективно.

Совершенствование ИПЯ во многой зависит от достижении в области теории семантической информации и направлений лингвистики. Поэтому появление автоматизированных ИПС послужило толчком к интенсивным исследованиям в области этих наук. Очень заманчиво, например, поручить вычислительной машине такую трудоемкую операцию, как реферирование документов. Одним из способов реализации этой идеи является выделение машиной в тексте таких предложений, которые содержат наиболее значимые для данной области знаний термины (а таковыми являются дескрипторы тезауруса этой области знаний, который хранится в памяти машины). Из этих предложений формируется реферат документа.

Другой, более сложный путь состоит в синтезе самих предложений после выделения в тексте наиболее значимых терминов. Все это требует от ЭВМ обширных «познаний» в области лингвистики. Решение все новых и новых проблем теоретической и прикладной лингвистики имеет конечной целью улучшение «взаимопонимания» между человеком и ЭВМ, а следовательно, и более полное использование возможностей вычислительной техники.

В последнее время в информатике прочно утвердился термин «лингвистическое обеспечение», который обобщает все те проблемы лингвистического характера, которые необходимо решить для обеспечения деятельности автоматизированных информационно-поисковых систем. Лингвистическое обеспечение – необходимый и очень важный элемент любой автоматизированной ИПС.

И проблемы технические

Вычислительные машины не сразу нашли широкое применение в информационном поиске. Причиной этому послужила высокая стоимость и низкая эффективность работы первых ИПС. Однако такое положение длилось не долго. Прогресс вычислительной техники сделал применение ЭВМ к поиску научной информации не только целесообразным с точки зрения эффективности поиска, но и выгодным экономически.

Автоматизированные ИПС (АИПС), реализованные на ЭВМ, появились на рубеже 60-х годов. Уже в 1961 г., по данным Центра по обработке научной информации Евратома, из 121 ИПС, созданных в разных странах мира, 16 были реализованы на ЭВМ. За прошедшие годы число АИПС неизмеримо возросло. Стремительным был и качественный рост АИПС, обусловленный с одной стороны, быстрым совершенствованием технических средств, с другой – развитием теоретических работ в области информатики.

Роль технических средств в обработке научной информации настолько велика, что само становление и развитие информатики связывают с ходом работ по механизации и автоматизации процессов обработки информации. В развитии информатики в связи с этим можно проследить три периода.

Первый период (1950-е годы) связан с первоначальными исследованиями и опытно-конструкторскими разработками, получившими широкое признание и заложившими здание современной информатики.

В течение второго периода (1960-е годы) в широких масштабах началось промышленное внедрение АИПС. К концу периода потребителей обслуживали сотни крупных информационных систем различных типов.

В настоящее время мы переживаем третий период развития информатики. В чем же его особенность?

Уже к концу 1960-х годов стала очевидной малая экономичность большого числа независимых (автономных) информационных систем, зачастую обрабатывающих сходными методами одну и ту же информацию для решения сходных задач Продолжающийся рост объемов информационных массивов требовал дальнейшего снижения себестоимости информационных процессов.

В поисках решения возникших проблем выяснилось, что гораздо экономичнее хранить документ в памяти ЭВМ как бы разобранным на отдельные фрагменты и при необходимости предоставлять эти фрагменты потребителю в самых разнообразных и удобных для него сочетаниях.

Информационная система, построенная по такому принципу, фактически объединяет, интегрирует в себе сразу несколько информационных систем, предназначенных для выполнения только определенной функции.

Системы, которые при однократной исчерпывающей обработке документальных источников научной информации и однократном вводе результатов этой обработки в машину в дальнейшем позволяют многократно использовать эту информацию для решения самых разнообразных задач, называются интегральными информационными системами (ИИС) К задачам, решаемым с помощью ИИС, относятся:

  • ретроспективный поиск информации, при котором ИПС отыскивает документы с необходимыми сведениями, фактами во всем накопленном массиве таких документов, причем это делается по разовым информационным запросам, т.е. в режиме «запрос-ответ».
  • избирательное распространение информации – поиск по постоянным запросам некоторого ограниченного числа потребителей (абонентов), который осуществляется через установленные промежутки времени только в массиве документов, поступивших в ИПС за этот период времени, причем между данной системой и ее абонентами постоянно поддерживается обратная связь.
  • подготовка реферативных журналов с различными указателями (авторскими, алфавитно-предметными и т.д.).
  • подготовка бюллетеней сигнальной информации, назначением которых является быстрое (не более 1...2 недель с момента получения оригиналов) оповещение потребителей обо всех новых публикациях по интересующим их отраслям (дисциплинам), проблемам или предметам.

Помимо этих основных функций многие ИПС выполняют различные вспомогательные операции, например, статистическую обработку ключевых слов с целью автоматизированного построения тезауруса, автоматический перевод на информационно-поисковый язык – автоматическое индексирование. При автоматическом индексировании ЭВМ сама выбирает наиболее подходящие для поискового образа документа термины из его текста (для осуществления автоматического индексирования в память ЭВМ приходится вводить полные тексты рефератов документов).

Появление интегральных информационных систем – важная, но не единственная сторона процесса интеграции обработки научно-технической информации. Другой стороной этого процесса было объединение при помощи каналов связи отдельных информационных систем в комплексы – так называемые сети.

Разработка теоретических принципов построения информационных сетей различного уровня и назначения и их практическое создание составляют содержание третьего, современного периода развития информатики.

Многофункциональные системы, какими являются ИИС, объединенные в сети, обеспечивают несравненно большую эффективность процессов обработки научной информации.

Три периода развития информатики достаточно точно совпадают во времени с периодом распространения очередных поколений ЭВМ (50-е годы – I поколение, 60-е – II, 70-е – III поколение), что еще раз свидетельствует об огромной роли средств вычислительной техники в реализации задач информатики. Здесь мы наблюдаем единство в развитии технических средств обработки информации и научной дисциплины, изучающей природу, свойства и распространение самого важного на сегодня вида информации – научной информации.

Какие же характеристики современного состояния вычислительной техники имеют первостепенное значение для решения задач информатики, выполнение которых «возложено» на автоматизированные ИПС?

Для потребителя информации при его взаимодействии с АИПС наиболее важным является форма обращения к ней и скорость, качество и форма выдачи ответа на запрос. Остановимся подробнее именно на этих моментах функционирования АИПС – вводе и выводе информации.

Ввод информации, в том числе и запросов потребителей, может осуществляться в настоящее время либо с промежуточных носителей (перфокарт, перфолент), либо путем непосредственного ввода сигналов, получаемых от технических средств через каналы связи, либо через устройства прямой связи человека с ЭВМ при помощи пультов.

Особенно интересным представляется третий способ ввода информации, так как после появления систем, работающих в режиме разделения времени (первые такие системы появились в 1963...1964 гг.), появилась возможность одновременного доступа к системе сразу нескольких пользователей, зачастую удаленных от ЭВМ на большие расстояния.

Режим разделения времени позволил пользователю вступить в непосредственный «диалог» с информационно-поисковой системой, используя для этого клавиатуру пишущей машинки: и запрос, и ответ системы на него печатались на бумаге.

Одним из наиболее удобных средств для связи человека с машиной являются экранные пульты – дисплеи. Но возможность работать с дисплеем не является единственным перспективным способом доступа пользователя к информации. Вывод информации из системы может быть осуществлен не только на экран, но и на традиционные носители, например на бумагу.

Для связи человека с машиной могут использоваться совокупности методов и технических средств копирования и размножения документов. Предположим, что система в ответ на запрос выдала (распечатала на бумаге, высветила на экране дисплея) названия тех документов, которые отвечают на запрос, может быть даже воспроизвела на экране весь текст нужного документа. Но как пользоваться в дальнейшем этой информацией? Выход один: снять с документа копию. Здесь на помощь приходят средства ретрографии. С помощью этих средств современные информационные системы копируют огромное количество документов. При этом скорости отдельных копировальных аппаратов могут достигать скоростей полиграфического оборудования (до 3600 копий/ч) при высоком качестве воспроизводимых копий.

Легкость воспроизведения документов породила, как ни странно, новую проблему. Если ученый или специалист получил от АИПС копии всех релевантных документов, то вряд ли он сможет решить проблему их хранения. Ведь это, по сути дела, те же самые документы, ведь копии-то выполнены на бумаге!

С течением времени человечество решило и эту проблему путем резкого уменьшения физического объема документов (копий документов) с помощью микрофильмирования. Этот способ хранения документов был известен почти сто лет назад. Уникальные практические возможности микроносителей продемонстрировал парижский фотограф Дагрон. В 1870 г. между французским правительством в Type и осажденным прусскими войсками Парижем курсировала оригинальная почта. Телеграммы и письма в Париж пересылались на микропленке голубями. Письма проецировали на экран, с которого затем переписывали. Всего почтой Дагрона в осажденный город было доставлено более 115 тыс. телеграмм и около полумиллиона писем! Так микрофильм сдал экзамен на практичность. Однако в течение длительного времени микрофильм в силу ряда причин не находил широкого применения.

Достойное место среди других носителей информации микрофильм нашел в наше время, когда появились читально-копировальные аппараты, которые позволяют не только просмотреть микрокадр, но и получить увеличенную его копию на специальной бумаге. Такие устройства широко используются в крупнейших библиотеках и информационных центрах, например, в ГПНТБ СССР, Всесоюзной патентно-технической библиотеке.

В настоящее время документы на микроносителях составляют значительную часть фондов библиотек. Так, в Государственной библиотеке СССР им. В.И. Ленина ежегодно микрофильмируется 30 млн. книжных и журнальных страниц. В США в 1969 г. в фонде каждой научно-технической библиотеки в среднем на каждые 100 книг приходилось 28 микроносителей.

Главным преимуществом микрофильма является его малый объем. При достигнутых сверхвысоких кратностях уменьшения (до 150...250 крат), реализованных с помощью так называемых ультрамикрофиш или ультрафиш, стало возможным уменьшение в 62 500 раз! При таком уменьшении в пачке пленок форматом 75×125 мм и высотой 8 см можно разместить 1 млн. страниц текста!

Если фонд АИПС хранится в виде микрофильмов, то работа такой системы организуется следующим образом: с помощью ЭВМ определяются адреса релевантных документов, затем с помощью специального устройства эти документы отыскиваются по их адресам в массиве микрофильмов, а уже потом с них получают копии обычных размеров, либо просматривают на читающем устройстве. Если же массив документов хранится в АИПС на машинных носителях, например на магнитных лентах или дисках, то после непосредственного вывода информации на экран дисплея последний может быть сфотографирован. Так в настоящее время осуществляется вывод информации из ЭВМ на микрофильм.

Особое значение в этом плане приобретают скоростные микрофотопечатающие устройства типа «СОМ» (Computer Output Microfilm), обеспечивающие непосредственную регистрацию данных с ЭВМ на различного рода микрофильмы (рулонные микрофильмы, микрофиши и т.п.). Примером может служить скоростная микрофильмирующая система «СОМ-90» с производительностью 90 тыс. знаков в секунду. Такая скорость позволяет «печатать» за 1 минуту 300...500 страниц, каждая из которых содержит 64 строки по 132 знака.

При подготовке тиражных изданий в автоматизированных ИПС до последнего времени узким местом был набор, на который затрачивалась значительная часть технологического времени. В современных интегральных информационных системах сейчас используются быстродействующие фотонаборные машины высокой производительности. Например, машина Ultra-Digiset набирает текст со скоростью 8 тысяч знаков в секунду, машина IBM-2680 – 6 тысяч, а фотонаборная машина Linotron-1010 имеет быстроту действия до 100 тысяч знаков в секунду.

Совершенное техническое оснащение систем научной и технической информации требует и соответствующего уровня лингвистического обеспечения этих систем. Это особенно важно в период интеграции информационных систем, когда последние переходят к более тесному взаимодействию. Например, в настоящее время технически несложно организовать обмен информацией между автоматизированными системами при помощи машинных носителей. Предположим, сформированный в одной системе массив информации записывается на магнитную ленту, доставляется в другую ИПС, в массиве которой осуществляется поиск. Такой обмен информацией резко повышает эффективность систем. Однако он требует их совместимости. Это значит, что системы должны использовать сходные ИПЯ, математическое обеспечение, ориентироваться на определенную группу технических средств. В таких случаях особую сложность часто представляют лингвистические проблемы.

Автоматизированные информационно-поисковые системы широко применяются в народном хозяйстве нашей страны, осуществляя как ретроспективный поиск, так и текущее информирование потребителей.

Вот уже несколько лет в приборостроении функционирует автоматизированная система научно-технической информации (АСНТИ) «Реферат», стержнем которой является автоматизированная информационно-поисковая система. АСНТИ «Реферат» обеспечивает все категории потребителей информацией документального характера по тематике отрасли и работает в режимах ретроспективного поиска и избирательного распространения информации.

Документальный фонд АСНТИ «Реферат» ежегодно увеличивается на 110...115 тыс. документов. Рефераты документов наносятся на специальные реферативные бланки, которые затем микрофильмируются. Поисковые образы и номера этих документов вводятся в память ЭВМ. В режиме избирательного распространения информации поиск проводится раз в месяц на массивах новых поступлений (10 тыс. документов). Процесс обслуживания включает: сбор и индексирование запросов, т.е. формирование их поисковых образов; ввод поисковых образов запросов в систему; поиск номеров соответствующих документов на ЭВМ; поиск микрофотокопии нужного реферативного бланка в автоматизированном накопителе микрофильмированной информации; изготовление копии реферативного бланка на бумаге; рассылку копий документов абонентам (по почте или с помощью средств оперативной передачи данных).

С 1973 г. обслуживание абонентов системы ведется на договорных началах. В 1976 г. АСНТИ «Реферат» осуществил обслуживание 274 коллективных абонентов. Система удобна тем, что в начале предоставляет потребителям рефераты документов, отвечающих на запрос, которые позволяют решить, нужно ли затребовать сам документ (его копию). Вполне возможно, что знакомство с полным текстом документа и не потребуется, ибо реферат содержит важнейшие данные о нем.

Примерами автоматизированных систем НТИ, находящихся в промышленной эксплуатации, могут быть система «АСИНИТ», функционирующая во Всесоюзном научно-техническом информационном центре (ВНТИЦентре), АСНТИ «Электротехника», обслуживающая многочисленных абонентов электротехнической промышленности. Эти системы насчитывают в своих поисковых массивах от 600 тыс. до 1 млн. документов. Ежегодный прирост массивов исчисляется сотнями тысяч документов.

В настоящее время в нашей стране в промышленной эксплуатации насчитывается более двух десятков крупных автоматизированных ИПС. Множество таких систем работает в экспериментальном режиме.

С каждым годом в области автоматизации обработки НТИ происходят заметные перемены.

Исследования в области автоматизации процессов обработки НТИ интенсивно ведутся не только в нашей стране, но и во многих других странах мира, где создаются высокоэффективные информационные службы. Так, в США разработана автоматизированная система MEDLARS, которую часто называют прообразом систем будущего. Эта гигантская система, работающая в области медицины, ежемесячно «впитывает» в себя данные по 15 параметрам из 2300 медицинских журналов, которые издаются на земном шаре. Операции по вводу информации осуществляются как в США, так и еще в 9 странах – с которыми система соединена каналами прямой связи. В год эта система аккумулирует информацию из 20000 статей и 16000 монографий. Получить доступ к системе можно во многих городах США: терминалы установлены в десяти медицинских библиотеках, в 500 больницах, институтах и других учреждениях. Система имеет также региональные центры в различных странах мира. Например, автоматизированный центр биохимической информации в Швеции является региональным центром MEDLARS для скандинавских стран. Многоязычная структура массива системы позволяет использовать его в международном масштабе. Потребители получают возможность «беседовать» с системой, формулируя свои вопросы на естественном языке и в самой различной форме, касаясь самых различных аспектов медицины. Система MEDLARS имеет техническую базу, включающую ЭВМ IBM-370/155 и фотонаборные машины. Выпускаемое системой ежемесячное информативное издание содержит сведения более, чем о 14000 публикациях.

В 1976 г. завершилась автоматизация одной из старейших действующих систем информационного обслуживания – информационной службы Американского химического общества CAS (Chemical Abstracts Service). В систему введена информация о 3,36 млн. химических веществ. Здесь обрабатывается около 14 000 периодических научно-технических изданий из 134 стран на 56 языках, патенты 26 стран и другие материалы. Ежегодно в систему поступает около 100 тыс. документов. Основой информационного обслуживания службы CAS является реферативный журнал по химии и химической технологии на английском языке. Выпускается ряд других информационных изданий. Наряду с периодическими изданиями, эта служба издает инструкции, руководства, справочники, а также сборники рефератов, ориентированных на небольшие группы потребителей, поскольку благодаря высокой степени автоматизации и механизации подготовка и издание таких сборников стали экономически выгодными. Все издания готовятся к печати с помощью фотонабора на базе ЭВМ.

С 1970 г. вступила в действие созданная по инициативе СССР и США Международная система ядерной информации (INIS), объединившая национальные информационные системы по атомной науке и технике. В 1972 г. система обрабатывала около половины мировой литературы в этой области знаний. Тематический охват системы весьма обширен: ее тематика сейчас включает практически все разделы мирного использования атомной энергии.

Крупные информационные органы (CAS – США, Excerpta Medica Foundation – Нидерланды и другие) в последнее время перешли к распространению подготовленных в централизованном порядке информационно-поисковых массивов на магнитных лентах.

Автоматизация, внедряясь в сферу обработки научной и технической информации, увеличивает «управляемость» информационных потоков, способствует установлению контроля человека над ними.

Плюс аналитико-синтетическая обработка!

Автоматизация процесса поиска документов в огромных массивах современных информационных центров и библиотек не избавляет потребителей информации от неприятностей, связанных с информационным кризисом. Парадоксально, но она... только видоизменила его. Если до применения автоматизированных ИПС потребитель терялся среди огромной массы ненужной информации, то ЭВМ обратила его внимание на поток, максимально отвечающий его потребностям. Но, к сожалению, информации все же слишком много, чтобы успевать просматривать ее, оставляя время хотя бы для сна.

Информационный кризис не был бы принципиально преодолим вообще, если бы научная информация не обладала важнейшим свойством – кумулятивностью. Так, содержание научной статьи может быть кратко изложено в реферате, многие пространные выводы сведены до лаконичных математических формул. Достижения науки были бы гораздо скромнее, если бы каждый ученый не мог воспользоваться теми знаниями, которые накоплены обществом до него, если бы он открывал законы природы заново. И поскольку воспользоваться этими знаниями, а следовательно, и внести в прогресс что-либо новое невозможно без обращения к научным документам, то каждое поколение ученых занято не только получением новых научных данных, но и специальной работой по систематизации, оценке и обобщению научной информации, которая и основана на ее кумулятивности. Такая работа основана, с одной стороны, на анализе научной информации, с другой – на синтезе новой информации. Поэтому эта работа называется аналитико-синтетической обработкой (АСО) информации Ее можно сравнить с той, которую проводят пчелы, собирая нектар с тысяч цветов и превращая в конце концов его в целебный мед.

Извлечь из документа его основной смысл, как это делается при составлении рефератов, обобщить информацию, содержащуюся в десятках публикаций в одном сжатом обзоре – вот задачи аналитико-синтетической обработки научных документов, решение которых позволяет не только уменьшить физический объем документов при сохранении их основного содержания, но и синтезировать новую информацию.

Наряду с автоматизацией процессов обработки документальной информации большое внимание уделяется и АСО: растет количество всевозможных обзоров, каталогов, указателей, реферативных журналов, пользование которыми значительно облегчает труд ученых и специалистов. Эти документы, созданные в результате аналитико-синтетической обработки других, называются вторичными.

Некоторые виды вторичных изданий могут быть подготовлены автоматически (авторские, предметные указатели и т.д.). Однако основной формой документа, отражающего результаты анализа и синтеза информации, является обзор. Подготовка обзоров, в том числе высшей их формы – аналитических обзоров, разумеется, под силу только высококвалифицированным специалистам. Существуют и объединяющие их усилия организации, которые выполняют работу по подготовке обобщенной научно-технической информации. Они получили название центров анализа научно-технической информации.

В начале шестидесятых годов в нашей стране были созданы информационные органы, которые осуществляли аналитико-синтетическую переработку источников информации и подготавливали на этой базе информационные издания, содержащие фактографические данные. В настоящее время свыше 30% информационных органов предприятий группы машиностроительных отраслей имеют в своем составе подразделения анализа и обобщения информации, укомплектованные специалистами по тематике предприятия.

Подразделения анализа информации успешно развиваются, прежде всего, в составе отделов НТИ крупных головных институтов, однако в ряде организаций такие подразделения являются самостоятельными отделами головных НТИ, использующими фонды и справочный аппарат ОНТИ.

Наиболее крупные центры анализа и обобщения информации действуют в составе отраслевых и подотраслевых информационных органов.

Деятельность центра анализа информации позволяет руководству принимать обоснованные управленческие решения на информационной и экономической основе, существенно повышать уровень разработки планов – от годового до перспективного. Совершенно исключительное значение имеет эта деятельность для прогнозирования развития отрасли.

За рубежом также уделяется большое внимание деятельности центров анализа и обобщения информации. Небезынтересно отметить, что, по данным США, эффект от деятельности центров анализа информации составляет 4,2 доллара на 1 доллар затрат.

Итак, по мере нарастания потоков научной и технической информации человечество предпринимает все более энергичные меры, чтобы уберечь мир от информационного хаоса. За короткий срок – каких-нибудь тридцать лет – технические средства обработки научно-технической информации претерпели революционные изменения.

В результате на сегодняшний день потребитель информации располагает целым арсеналом средств, позволяющим ему эффективно ориентироваться в потоках информации. О появившихся новых публикациях по интересующей его проблеме ему сообщит бюллетень сигнальной информации. Поближе познакомиться с новинками он может, просмотрев реферативный журнал, причем если его интересуют публикации определенных авторов или публикации по узким конкретным вопросам – к его услугам авторский, предметный и другие указатели, обычно прилагаемые к журналу. Потребитель может непосредственно взаимодействовать с автоматизированной ИПС при поиске как документальной, так и фактографической информации. Наконец, весьма ценную информацию он почерпнет из обзорных документов, подготовленных наиболее квалифицированными специалистами той области знаний, в которой он работает. Если представить себе потребителя информации погруженным в своеобразную «информационную среду», из которой он черпает необходимую информацию, то надо признать, что в настоящее время она стала для него гораздо более «комфортной». Однако, как известно, «комфортность информационной среды» требует от общества весьма значительных затрат. Можем ли мы, например, ожидать, что по любому выбранному нами тематическому направлению мы обязательно встретим обзорный документ? Конечно, нет. Вторичные документы обзорного характера должны быть рассчитаны на широкий круг потребителей и посвящены ключевым вопросам науки и техники.

Выбрать эти ключевые вопросы, точно рассчитать силы и средства для обеспечения максимального эффекта от аналитико-синтетической обработки документов, как и от автоматизации обработки документальной информации, можно только в том случае, если регулировать эти работы в государственном масштабе.

В нашей стране эти функции возложены на Государственную систему научно-технической информации.

Что Вы знаете о ГСНТИ?

Все, что может человечество противопоставить информационному кризису, объединяется понятием «научно-информационная деятельность».

Под этим понятием подразумевается разновидность научного труда, заключающаяся в сборе, аналитика-синтетической обработке, хранении и поиске закрепленной в документах научной информации, а также в предоставлении этой научной информации ученым исследователям и специалистам в кратчайшее время и в удобной для них форме.

В давние времена ученый сам ставил эксперименты, обобщал их и создавал теории. С течением времени в науке, как и в любой другой области деятельности, наметилось разделение труда. Выделилось теоретическое и экспериментальное направления. Мы являемся современниками становления третьего самостоятельного вида научного процесса – научно-информационной деятельности.

Ученые, занимающиеся научно-информационной деятельностью, – это не пассивные поставщики информации для теоретиков и экспериментаторов. Занимаясь обработкой, хранением и распространением научных знаний, они участвуют в научных открытиях, внося в качестве научного вклада все то, что они сумели рассмотреть в структуре и динамике научных знаний.

Основные направления научно-информационной деятельности – АСО и автоматизация обработки НТИ – связаны с большими материальными затратами. Аналитико-синтетическая обработка требует, например, привлечения самых квалифицированных специалистов, а создание автоматизированных ИПС высокого уровня – самых современных быстродействующих ЭВМ с огромным объемом запоминающих устройств.

Научно-техническая информация представляет собой один из национальных ресурсов, который должен быть использован с максимальным эффектом – от этого во многом зависит социально-экономическое развитие страны. Наиболее прогрессивной формой реализации научно-информационной деятельности является Государственная система НТИ. В отличие от капиталистических стран, в СССР государственный контроль над использованием этого ресурса в интересах всего общества стал реальностью, воплотившейся в ГСНТИ.

Коммунистическая партия Советского Союза и Советское правительство уделяют постоянное внимание развитию и совершенствованию Государственной системы НТИ. В последние десять лет ЦК КПСС и Совет Министров СССР приняли ряд важных постановлений, определивших принципы ее создания и развития. В результате в СССР создан единый комплекс информационных служб, оказывающих большое влияние на повышение эффективности общественного производства. Что же представляет собой ГСНТИ?

Структура ГСНТИ в значительной степени соответствует системе управления народным хозяйством. Это значит, что каждому уровню управления – министерству (ведомству), объединению, научно-исследовательской или проектно-конструкторской организации, ВУЗу, предприятию соответствует звено системы информации, которое в своей деятельности взаимосвязано с другими звеньями. Звенья эти не что иное, как органы НТИ различного уровня. Таких уровней в системе четыре.

Первый уровень охватывает 10 всесоюзных органов НТИ, которые централизованно обрабатывают мировой поток НТИ по соответствующим видам документов и информируют потребителей о достижениях науки и техники.

Исключительное место в этой десятке по праву принадлежит Всесоюзному институту научной и технической информации (ВИНИТИ). Этот, не имеющий себе равных в мире, информационный орган занимается аналитико-синтетической обработкой 1,5 млн. первичных источников информации по естественным и техническим наукам. Результаты этой огромной работы печатаются в различных изданиях ВИНИТИ. Основное место в них занимает «Реферативный журнал». В нем в виде рефератов ежегодно публикуется информация более чем о миллионе статей, описаний изобретений, книг и других видов документов из 131 страны мира на 66 языках. Реферативный журнал, (РЖ), являющийся в настоящее время основой информационного обслуживания в государственной системе, выходит в виде 26 сводных томов, 148 выпусков – составных частей этих сводных томов, а также 48 отдельных выпусков. Это уникальное издание имеет 500 тыс. подписчиков. Специалист, просматривая РЖ, получает обширную информацию об интересующем его предмете; кроме того, он может при необходимости заказать копию первоисточника, реферат которого опубликован в РЖ.

ВИНИТИ публикует также ежегодные обзоры «Итоги науки и техники» (свыше 80 в год), отражающие наиболее важные достижения в ключевых направлениях мировой науки и техники. Некоторые обзоры охватывают более тысячи публикаций. Это требует огромных затрат интеллектуального труда. Поэтому работу по составлению обзоров выполняют обычно крупнейшие специалисты. О качественном составе специалистов, занятых обработкой НТИ, свидетельствуют данные о внештатных сотрудниках ВИНИТИ: в настоящее время здесь работает свыше 23 тыс. ученых и специалистов, среди которых академики и члены-корреспонденты АН СССР, доктора и кандидаты наук.

Однако деятельность ВИНИТИ не ограничивается этим видом обработки документов. Институт проводит большую работу и в области автоматизации процессов обработки документальной информации. Так, при ВИНИТИ создана интегральная автоматизированная система «АССИСТЕНТ» (автоматизированная справочно-информационная система по науке и технике). В настоящее время эта система переходит на использование ЭВМ Единой системы и других современных средств информационной техники. Предназначается она для подготовки информационных изданий разных типов, выпускаемых ВИНИТИ, а также для других видов информационного обслуживания: избирательного распределения информации (распространение информации по постоянно действующим запросам), ретроспективного поиска документов (поиска по разовым запросам во всем массиве документов), подготовки баз данных на магнитных лентах и т.д. Вычислительная техника в системе «АССИСТЕНТ» работает в комплексе с мощными фотонаборными машинами, позволяющими набирать текст со скоростью 250...300 символов в секунду – только так и можно в сжатые сроки обработать и представить в виде удобных и ставших такими привычными для нас РЖ лавину документов, которые обрабатывает ВИНИТИ. Кроме РЖ и ежегодных обзоров «Итоги науки и техники», ВИНИТИ издает еще бюллетени сигнальной информации, призванные быстро оповещать ученых и специалистов обо всех без исключения научных публикациях, поступивших в ВИНИТИ за истекшие две недели. Здесь выпускаются «Экспресс-информация» – бюллетени расширенных рефератов только иностранных публикаций, представляющих интерес для советских ученых и специалистов, а также библиографические и реферативные картотеки и, кроме того, перфокартотеки по некоторым отраслям науки и техники. Создание (1952 г.) и развитие ВИНИТИ представляет собой наглядную демонстрацию эффективности социалистической системы хозяйствования в области распределения важнейшего национального ресурса – научно-технической информации.

«Сколько миллиардов рублей, сколько десятков тысяч человеко-лет сложных исследований и разработок сэкономила эта система России, останется неизвестным. С другой стороны, нужно ли удивляться, что при наличии такой системы русская наука и техника быстро так догнала нас?» – писал американский журнал «Air Force Magazine» о ВИНИТИ в 1957 году.

Видное место в ГСНТИ занимает Всесоюзный научно-технический информационный центр (ВНТИЦентр), который осуществляет государственную регистрацию и учет законченных и выполняемых в стране научно-исследовательских и опытно-конструкторских работ (НИР и ОКР). Фонд ВНТИЦентра насчитывает более 300 тысяч отчетов, кандидатских и докторских диссертаций. Его информационными услугами пользуются не менее 17 тыс. организаций!

Во ВНТИЦентре разработана, введена в промышленную эксплуатацию и успешно функционирует автоматизированная система информации по науке и технике по неопубликуемым источникам (АСИНИТ). Так как количество проводимых в стране научно-исследовательских и опытно-конструкторских работ (НИР и ОКР) из года в год увеличивается, растет и роль ВНТИЦентра, способствующего широкому обмену информацией, устранению дублирования в исследованиях и разработках. ВНТИЦентр издает «Бюллетень регистрации НИР» и «Сборник рефератов НИР».

Ни одна из стран в настоящее время не может успешно развиваться без использования передового опыта, накопленного другими странами. В 1972 г. в СССР был создан Всесоюзный центр переводов (ВЦП), осуществляющий перевод научно-технической литературы и документации более чем с 30 языков. На ВЦП возложена и задача координации переводческой деятельности в масштабе всей страны. В ВЦП работают 5 тыс. внештатных сотрудников. Ежегодная продукция ВЦП – десятки тысяч авторских листов переводов – более 60% централизованно выпускаемых в стране переводов. Здесь издаются каталоги переводов, терминологические словари, технические справочники и пособия для переводчиков.

Центральный научно-исследовательский институт патентной информации (ЦНИИПИ – головная организация в системе патентной информации, являющейся частью ГСНТИ. Этот институт обрабатывает материалы по советским и зарубежным изобретениям и организует справочно-информационное обслуживание потребителей патентной информацией, проводит полную обработку патентных фондов, включая микрофильмирование, координирует работу по переводу патентных материалов, занимается вопросами механизации и автоматизации патентного поиска. ЦНИИПИ выпускает Бюллетень «Открытия, изобретения, промышленные образцы, товарные знаки», ежегодник «Открытия в СССР», библиографический указатель «Внедренные изобретения» и другие издания.

Ведущим в ГСНТИ институтом по нормативно-технической документации, вопросам классификации и кодирования является Всесоюзный научно-исследовательский институт классификации и кодирования (ВНИИКИ). В его ведении информация о государственных стандартах и технических условиях на изготовленные в СССР изделия, о решениях Совета экономической взаимопомощи по стандартизации и рекомендациях международной организации стандартизации (ИСО). ВНИИКИ разрабатывает единую общегосударственную систему классификации и кодирования в СССР и выполняет ряд других важных функций. Публикует широкий круг информационных изданий.

В число всесоюзных институтов информации входят также Государственная публичная научно-техническая библиотека (ГПНТБ СССР) – самая крупная в стране библиотека по всем отраслям науки и техники. Ее фонд насчитывает свыше 10 млн. печатных единиц. ГПНТБ СССР – центр библиотечно-библиографического обслуживания по естественным наукам и технике. Здесь сосредоточена информация по каталогам на выпускаемое в стране и за рубежом промышленное оборудование.

Важным условием повышения теоретического уровня научно-исследовательской работы является развитие системы научной информации по общественным наукам. Эту задачу выполняет созданный в 1969 г. Институт научной информации по общественным наукам Академии наук СССР (ИНИОН АН СССР). Здесь обрабатываются отечественные и зарубежные источники по философии, истории, экономике, праву, научному коммунизму и другим общественным наукам; 1 выпускаются реферативные, библиографические издания, аналитические обзоры по актуальным проблемам общественных наук. Институт ежегодно публикует свыше 700 отдельных выпусков научно-информационных изданий, в том числе РЖ «Общественные науки в СССР» и «Общественные науки за рубежом».

Всесоюзная книжная палата (ВКП), созданная в 1935 г., ведет учет всей выходящей в СССР печатной продукции, издает текущую библиографическую информацию. В информационных изданиях ВКП ежегодно публикуется около 600 тыс. библиографических записей. В функции ВКП входит и централизованная каталогизация всей входящей литературы, разработка вопросов теории и методики библиографии. К изданиям ВКП относятся «Книжная летопись», «Летопись журнальных статей», «Летопись газетных статей», журнал «Советская библиография» и т.д.

Методическое руководство обменом информацией между предприятиями и организациями различных отраслей промышленности – межотраслевым обменом информацией – осуществляет Всесоюзный научно-исследовательский институт межотраслевой информации (ВИМИ). Он значительными тиражами издает информационные листки (ИЛ), которые распространяются без ограничений между промышленными предприятиями различных отраслей народного хозяйства.

Наконец, Выставка достижений народного хозяйства СССР (ВДНХ СССР) является всесоюзным органом по пропаганде научно-технических достижений и передового производственного опыта. Здесь проводится обучение работников всех отраслей народного хозяйства новым методам производства. О значении ВДНХ говорят масштабы ее деятельности: в 1976 г., например, во всех разделах выставки демонстрировалось более 100 тыс. экспонатов, с которыми ознакомились более 11 млн. человек.

Даже из такого краткого описания функций всесоюзных органов НТИ виден один из основных принципов построения ГСНТИ: специализация органов НТИ на основе четкого распределения функций между ними. Специализация всесоюзных органов информации по виду документов позволяет принципиально снять дублирование в процессе обработки основных потоков литературы и документации. Главная задача всесоюзных органов НТИ – создание потока вторичной информации и доведение его до потребителя как непосредственно, так и через всю информационную сеть страны.

Второй уровень ГСНТИ составляют центральные отраслевые органы информации (ЦООНТИ), основной задачей которых является обеспечение предприятий, организаций, ученых и специалистов страны своевременной и полной информацией по проблемам, решаемым в соответствующей отрасли. Практически каждое министерство и ведомство имеет свой центральный отраслевой институт или центр НТИ, который и возглавляет отраслевую систему НТИ.

Центральные отраслевые органы информации принимают информационный поток материалов, подготовленных всесоюзными органами информации, и проводят его дальнейшую аналитико-синтетическую обработку в соответствии с закрепленной за ними тематикой.

Формы информационного обслуживания потребителей, применяемые ЦООНТИ, весьма разнообразны, но наиболее эффективной из них является избирательное распространение информации, получившее всеобщее признание у потребителей. В настоящее время ЦООНТИ активно переходят к автоматизированным способам обработки информации. Это позволяет не только расширить сферу информационных услуг, но и значительно сократить сроки доведения информации до потребителя.

Эффективно работают, например, отраслевые автоматизированные системы НТИ (АСНТИ) в электротехнической промышленности, приборостроении и в ряде других отраслей. ЦООНТИ часто называют основой ГСНТИ – так велика их роль в информационном обеспечении исследований и разработок, проводимых в нашей стране.

В отличие от второго уровня ГСНТИ, где находятся отраслевые органы НТИ, третий уровень представлен территориальными органами информации. Это республиканские институты НТИ (РИНТИ), межотраслевые территориальные центры НТИ и пропаганды (ЦНТИ) в автономных республиках, краях, областях.

Основной задачей межотраслевых территориальных органов НТИ является информационное обеспечение предприятий и организаций, расположенных на обслуживаемой ими территории, независимо от их ведомственной подчиненности. Межотраслевые территориальные органы выступают связующим звеном между всесоюзными и центральными отраслевыми органами НТИ, с одной стороны, и информационными службами НТИ, КБ и предприятий, расположенных в данном регионе, с другой стороны. Они обеспечивают заинтересованных потребителей технической документацией (рабочими чертежами) на оборудование, приспособления и оснастку, не выпускаемые централизованно промышленностью. Ежегодно ими рассылается по запросам предприятий и организаций около 200 тыс. комплектов рабочих чертежей общим объемом 1,5 млн. листов. Кроме прочих форм информационного обслуживания межотраслевыми территориальными органами НТИ широко используются радио, телевидение, кино.

Четвертый уровень ГСНТИ состоит более чем из 11 тысяч органов информации в НИИ, КБ, вузах и на предприятиях, так называемых низовых органов научно-технической информации. Низовые органы занимают особое место в ГСНТИ. Именно они находятся в прямом контакте с потребителями информации. В конечном итоге их деятельность в значительной степени определяет эффективность всей ГСНТИ в целом. Без этих служб все наши многомиллионные документальные фонды почти в полном бездействии будут покоиться на стеллажах. Отделы и бюро НТИ, используя печатную, устную и наглядную информацию, способствуют созданию в короткие сроки и при минимальных затратах новых систем, устройств, аппаратов, приборов, материалов, методов организации производства, прогрессивной технологии, отвечающих современным требованиям. При этом они выполняют еще одну очень важную функцию – организуют так называемый «восходящий» поток информации, т.е. передачу сведений о научно-технических достижениях своего предприятия или организации соответствующим ЦООНТИ и межотраслевым территориальным органам НТИ. Так формируется фонд сведений об отечественных научно-технических достижениях и передовом опыте.

Всю ГСНТИ, таким образом, можно представить себе в виде пирамиды, вершину которой составляют всесоюзные органы информации, а основание – тысячи низовых служб НТИ. От основания к вершине пирамиды движется восходящий поток документальной информации. Там эта информация подвергается аналитико-синтетической обработке и в виде упорядоченных потоков устремляется в обратном направлении от вершины к основанию.

Система НТИ нашей страны, как можно видеть из описания ее уровней, сочетает территориальный принцип информационного обслуживания с отраслевым. Это обеспечивает системе необходимую гибкость, что очень удобно для потребителей информации.

Но, пожалуй, самое важное свойство ГСНТИ – это ее динамичность. Один за другим входят в строй отраслевые и межотраслевые автоматизированные центры НТИ, в разных отраслях создаются более мелкие автоматизированные ИПС, услугами которых пользуются все большее число потребителей. Этот процесс сопровождается непрерывным совершенствованием технических средств обработки информации, что позволяет перейти к новому этапу развития ГСНТИ – созданию сети взаимосвязанных автоматизированных центров НТИ (САЦНТИ). В перспективе же намечаются контуры Государственной автоматизированной системы научной и технической информации – ГАСНТИ, которая обеспечит наиболее полное удовлетворение информационных потребностей ученых и специалистов нашей страны. Преимущества централизованной системы научно-технической информации, которая создана в СССР, перед децентрализованными, существующими во многих капиталистических странах, бесспорны. Это заставляет зарубежных исследователей все чаще обращаться к опыту организации информационного обеспечения в СССР и других социалистических государствах, где в настоящее время созданы национальные системы НТИ.

Социалистические государства показывают пример и в области международного обмена научно-технической информацией. Их совместный опыт в сфере информационной деятельности позволил в 1969 г. создать Международный центр научной и технической информации, а несколько позже (1971 – 1975 гг.) – и международную систему НТИ (МСНТИ), предусмотренную комплексной программой дальнейшего углубления и совершенствования сотрудничества и развития социалистической экономической интеграции стран – членов СЭВ.

Международная система НТИ развивается на основе кооперирования национальных систем, деятельности международных информационных подсистем по отраслям и специальным видам информации, а также на основе деятельности МСНТИ. В настоящее время в рамках МСНТИ действуют семь международных специализированных систем (МСИС) и 17 международных отраслевых систем НТИ (МОСНТИ). Создание МСНТИ отвечает задачам развития экономики стран – членов СЭВ, способствуя повышению эффективности общественного производства.

Человечество уже осознало необходимость создания организации, которая бы регулировала информационную деятельность в масштабе всей планеты. В последние годы ЮНЕСКО активно занимается созданием Всемирной системы научно-технической информации (ЮНИСИСТ). Деятельность ЮНИСИСТ направлена на кооперацию и равноправное сотрудничество между развитыми и развивающимися странами в области научно-технической информации в противовес многократному, весьма дорогостоящему и неоправданному дублированию огромных интеллектуальных усилий и материальных затрат. Опыт стран – членов СЭВ, накопленный в МСНТИ, будет способствовать созданию глобальных автоматизированных систем научно-технической информации.


 

Оглавление

 

Дата публикации:

25 июля 2000 года

Текст издания:

Николай Николаевич Чурсин. Популярная информатика.
К.: «Техника», 1982.

Дата обновления:

4 мая 2001 года

Электронная версия:

© НиТ. Раритетные издания, 1998



В начало сайта | Книги | Статьи | Журналы | Нобелевские лауреаты | Издания НиТ | Подписка
Карта сайта | Cовместные проекты | Журнал «Сумбур» | Игумен Валериан | Техническая библиотека
© МОО «Наука и техника», 1997...2013
Об организацииАудиторияСвязаться с намиРазместить рекламуПравовая информация
Яндекс цитирования