N-T.ru / Раритетные издания / Николай Петрович

Люди и биты. Информационный взрыв: что он несет

Николай ПЕТРОВИЧ

Вулкан уже пылает

Электронный Шерлок Холмс

Заглянем на минутку в наш самый величественный храм мысли человеческой, в Государственную библиотеку СССР им. В.И. Ленина. Так как мы это делаем мысленно, то нас не задержит непрерывный поток людей, который с утра и до позднего вечера, даже в дни отдыха, стремится туда.

Мы обязательно там заметим посетителей, озаренных и поглощенных некой своей мыслью. Они абсолютно не замечают окружающих и ведут упорный «штурм» каталогов: систематических, алфавитных, генеральных, вспомогательных.

Часто, не добившись успеха, они вместе с дежурными библиографами идут на повторную атаку неприступной библиографической крепости.

Если крепость так и не взята, то мы увидим их в справочном отделе библиотеки, окруженных горой индексов, библиографических списков, справочников, указателей...

Я люблю наблюдать за этими людьми, прислушиваться к их вопросам библиографам, когда надоело читать и просто бродишь по библиотеке. Это, как правило, те, у кого появилась новая идея, новое решение, новая конструкция, новая гипотеза.

Она их будоражит, сверлит, не дает покоя. Хочется скорей узнать, известна ли она человечеству. Может быть, она уже давно валяется на великой свалке ложных идей. Ведь их было так много. Начиная с вечного двигателя и кончая разной чепухой – шляпа с вентилятором, зонт с перископом, рюмка для питья на брудершафт... А может быть, новая идея полезна, но уже давно придумана. Наконец, может быть, он первый на своей планете в своей совсем молодой, по космическим масштабам, цивилизации пришел к этому простому и полезному решению.

Больно видеть, когда один из таких посетителей уходит к концу дня из храма усталый, осунувшийся, с потухшим взором, так и не получив ответа на свой вопрос.

Из этой характерной ситуации и явствует основная наша проблема: как быстро получить исчерпывающую информацию по интересующему вопросу в мировых потоках информационной лавы?

Мы уже установили, что эти потоки стремительно нарастают по экспоненте.

Но ведь и число людей информационной службы тоже растет.

Действительно, число «солдат» этой службы, которые пытаются совладать с потоками, тоже растет и, вероятно, по тому же закону.

Среди них есть поразительно преданные своему делу и поразительно талантливые люди. Знание многих языков, безошибочная и мгновенная ориентировка в каталогах, справочниках, индексах, понимание ищущего с полуслова, доброжелательность и искренность в желании помочь. Но даже они, если бы их были не единицы, а тысячи и десятки тысяч, к сожалению, не в состоянии сегодня справиться с вулканом.

Может быть, проблему удалось бы решить традиционным способом, если разделить все население планеты на две равные части.

Первая работает, строит, выдумывает, изобретает, сочиняет, исследует, пишет, публикует. Вторая занята только информацией: классифицирует, систематизирует, концентрирует, дает справки. Но ведь это утопия! Только слаженная работа человека и умных кибернетических систем, в которых используются быстродействующие ЭВМ с огромной памятью, может решить проблему. Одним из примеров таких помощников могут служить уже действующие информационно-поисковые системы (ИПС).

Построение теории таких систем и их разработка являются одним из направлений науки, получившей название информатики. Эта наука изучает структуру и общие свойства научной информации, ее хранение, переработку, поиск и использование в различных сферах человеческой деятельности.

– Что понимается под термином «научная информация»?

– Это информация, объективно отображающая наиболее общие законы природы, общества и мышления. Это и законы, устанавливаемые в ходе развития частных наук – физики, химии, математики и т.д. Это и результаты деятельности человека по преобразованию природы и общества.

– Можно ли сюда отнести научную гипотезу?

– Несомненно. Научные гипотезы подлежат проверке на практике, в результате чего они либо превращаются в теории, либо отбрасываются как ошибочные. Так, Д. Максвелл выдвинул гипотезу о существовании радиоволн. Эксперименты Г. Герца и А. Попова блестяще подтвердили эту гипотезу.

– Не является ли теория информации, которая обсуждалась выше, одним из направлений информатики?

Эти две науки, несомненно, связаны между собой. Коренное различие между ними состоит в том, что теория информации, игнорируя содержание передаваемого сообщения, исследует возможности его передачи по системам связи с наименьшими искажениями, а информатика основное внимание уделяет содержанию информации и ее использованию. Например, при построении информационно-поисковых систем важно знать степень рассеяния публикаций той или иной науки в журналах, книгах, отчетах. Информация по возникающим новым направлениям в науке часто концентрируется в очень малом числе печатных изданий, а публикации по научным направлениям, которые теряют свое значение, начинают рассеиваться по большому числу изданий. Изучение подобных объективных законов информационных потоков, зафиксированных в книгах, периодических изданиях, патентах, отчетах, является предметом одного из направлений информатики.

– Как себе представить в целом, минуя детали, работу информационно-поисковой системы?

– Очень просто. Вообразите гипотетического человека, который знает все работы и исследования, например в области электросварки, знает авторов, названия работ, где опубликованы или где хранятся, даты выполнения и, что очень важно, даже основную их суть.

– Почему гипотетического? Разве память одного человека не может все это вместить?

– Вполне может. Как мы уже подсчитывали, человеческий мозг мог бы хранить в памяти абсолютно всю информацию фондов даже нескольких огромных библиотек. Но «входные устройства» человека работают черепашьими темпами и не в состоянии поспевать за мировым потоком информации даже в одной узкой области.

У этого человека, гиганта памяти, хранителя всей истории и всех последних новинок электросварки, в личном общении, по почте, по телефону, по телеграфу, по видеотелефону, по телевидению... все жаждущие получают краткую концентрированную информацию. Это буквально клад для разработчиков новых устройств, исследователей, изобретателей, новаторов. Не говоря уже об аспирантах и докторантах, которые часто тратят месяцы, а то и годы на обзор чужих работ, готовясь к собственному, львиному, как им кажется, прыжку в неизведанное.

– А разве нельзя эту гипотетическую личность заменить точно таким устройством, но созданным на базе самых быстродействующих современных ЭВМ?

– К сожалению, нет! Ибо для этого надо было бы «всего лишь» построить электронную модель мозга. То есть знать все его тайны: как он запоминает, сохраняя главное, отбросив второстепенное, как он формирует образы и опознает их, как мгновенно находит нужное, не перебирая все, чем «набита» голова.

Грубо говоря, нам не известен в деталях тот удивительно совершенный язык, на котором работает наше мышление, наша память, не известен алгоритм перевода нашего естественного языка на этот внутренний, не известны тончайшие устройства, практически реализующие все это в каждом человеке.

Поэтому основным вопросом при создании информационно-поисковых систем является построение упрощенного искусственного языка или выбор из уже имеющихся, который в той или иной мере позволит решить поставленную задачу.

С искусственными языками мы сталкиваемся в жизни часто, не всегда замечая это. Например, язык команд управления космическим кораблем, библиографический язык УДК, язык дорожных знаков.

Известны попытки создать единый для всех народов земли язык, который бы уничтожил языковые барьеры. Первым таким языком был воляпюк. Более совершенным и более простым оказался эсперанто. Хотя на нем сегодня издается во всем мире свыше 100 журналов и газет, ведутся радиопередачи, но и он не достиг поставленной цели.

Я как-то увлекся этим языком. Переписывался на нем с зарубежными эсперантистами. Но отсутствие прелести, свойственной естественным национальным языкам, погасило этот порыв.

Подробно разработан даже язык для беседы с... инопланетянами – «линкос».

– А они знакомы с этим языком?

– Насколько я знаю, им он абсолютно не известен.

– Но ведь они просто не поймут нас! Не говоря уже о беседе, то есть обмене информацией и мыслями.

– Автор «линкоса» – голландский математик Г. Фрейденталь решал эту, казалось бы, невозможную задачу. Язык включает курс примитивного заочного обучения при наличии только односторонней связи от учителя к ученику.

Конечно, для такого заочного обучения «линкосу» инопланетяне должны иметь образ мышления, подобный нашему, знать числа, уметь считать.

Вместе с рождением ЭВМ появились на свет искусственные «машинные» языки. Это известные многим, хотя бы по названию, КОБОЛ, АЛГОЛ, ФОРТРАН, ПЛ-1 и др. Они служат для общения человека с ЭВМ. На одном из этих языков вводится решаемая задача, а в памяти машины записываются правила, по которым надо ее решать.

Люди творят и фиксируют информацию на своих естественных национальных языках. Использование ее людьми также осуществляется на этих же естественных языках.

Сложные кибернетические системы, какими являются ИПС, пока не в состоянии работать на естественных языках. Причин много: неоднозначность значений слов и их сочетаний, сложность их грамматики, огромный словарь.

Поэтому ИПС «разговаривают» на специально созданных для них искусственных языках.

– Но ведь есть же кибернетические устройства, управляемые голосом?

– Действительно, есть такие устройства. Черепашка, которая выполняет команды «направо», «налево», «стой», «вперед». Автовахтер, который анализирует произносимую пришедшими стандартную фразу, и если Ваш голосовой «почерк» есть в его запоминающем устройстве, то он пропускает вас. Для ленивцев есть телевизоры, управляемые голосом; «включись», «выключись», «громче», «тише». Есть и более сложные: робот, выполняющий пару десятков голосовых команд, ЭВМ, способная вести простой диалог с человеком.

Информационно-справочные системы неизмеримо сложнее этих устройств. Но исследования по их переводу в будущем на естественные языки интенсивно ведутся.

– Что же представляет собой искусственный язык ИПС, на который можно перевести информацию? Ведь известно, что проблема машинного перевода с одного естественного языка на другой до сих пор не решена.

– Действительно, оптимистические надежды на машинный перевод текстов с одного языка на другой пока не оправдались.

Как ни странно, оказалось, что люди, тысячелетиями общающиеся на своих национальных языках, очень мало знают о них. Это, правда, отнюдь не мешает им писать чарующие стихи или захватывающую прозу, произносить пламенные речи или вести остроумнейшую беседу.

Но ведь языком кибернетических систем в конечном итоге является язык математики. Оказалось, что современная лингвистика пока не в состоянии перейти полностью на язык математики, то есть формализовать грамматику естественного языка, его смысловую структуру. Поэтому для ИПС приходится разрабатывать свои искусственные языки. Одна из групп их получила название дескрипторных.

Дескрипторы – это слова, отобранные по определенным правилам из естественного языка, в определенной области знаний, у которых искусственно устранено то, что мешает формализации. Составляется словарь дескрипторов, называемый тезаурусом. Это как бы расширенный двуязычный словарь для перевода с естественного языка на дескрипторный и обратно. В нем формализованное представление о совокупности знаний в данной области, перечень терминов и связей между ними.

Поступивший на вход системы для ввода документ на естественном языке подвергается обработке. Главным здесь является составление поискового образа документа, адреса его хранения и описание основного смыслового содержания. Все это выполняется уже на языке ИПС. В поисковый образ входят основные, ключевые слова, раскрывающие суть документа. Вся информация, поступившая в ИПС, хранится в памяти системы, в так называемом поисковом массиве. ИПС может иметь два контура поиска. В памяти первого контура, например, находятся только поисковые образы и адреса их хранения. В памяти второго контура хранятся сами документы на естественных языках, компактно записанные. Это могут быть микрофильмы, запись на магнитных лентах, пластинки с голографической записью и т.д.

Достигнутая в настоящее время плотность записи информации, где бьет рекорды голография, составляет поражающие воображение цифры – порядка сотен миллионов бит на 1 кв. мм. Это позволяет включать в память ИПС целые библиотеки и существенно ускорить поиск нужного документа.

Запрос абонента, поступающий на естественном языке, переводится на входе на язык системы, и формируется поисковый образ запроса. Далее первый контур ИПС начинает отыскание в поисковом массиве документов, образы которых совпадают или близки к образу запроса. Эта информация (часто в виде аннотированного библиографического списка) выдается потребителю. Последний выбирает из нее необходимое. Второй контур по этим данным извлекает нужные записи, и они или тут же снимаемые с них копии поступают к абоненту. Может быть осуществлена передача найденных документов к абоненту по каналу связи.

– Значит, ИПС полностью решают проблему поиска информации? Надо только создать побольше их. Так?

– К сожалению, не совсем так. Уже созданные ИПС охватывают очень ограниченные области информации. Обработка информации, поступающей в массив, и запроса абонента производится не автоматически, а людьми на клавишных или других аналогичных устройствах. Не решена задача автоматического считывания вводимого текста в машину, то есть не созданы надежные считывающие автоматы. Это сильно ограничивает скорость работы ИПС. Наконец, применяемые искусственные языки в силу своей неизбежной пока примитивности не всегда обеспечивают правильность поиска. Вместе с полезными документами абонент может получить кучу почти или совсем бесполезных.

В связи с этим оценка эффективности ИПС делается по ее релевантности и пертинентности.

Релевантность оценивает смысловую близость между содержанием документа, найденного системой, и информационным запросом. Введен даже термин «поисковый (информационный) шум», количественно оценивающий релевантность. В некоторых реализованных ИПС этот шум достигает 25...30%.

Пертинентность оценивают по соответствию найденного документа информационной потребности абонента: Ясно, что для потребителя в конечном счете важна пертинентность системы.

Оба показателя, зависящие от совершенства языка системы, стратегии поиска информации в массиве и от ряда других факторов, еще не достигли нужного уровня.

Вместе с тем и у нас, и за рубежом создан целый ряд информационно-поисковых систем, которые успешно решают отдельные частные задачи быстрого отыскания нужных документов в некотором информационном массиве.

Есть уже экспериментальные библиотеки, оснащенные таким электронным Шерлоком Холмсом. На рабочем столе читателя пульт с клавиатурой, телефон, телеэкран. Минуя бесконечные каталоги, которые поглощают много времени и сил, можно заказать интересующую литературу непосредственно с рабочего стола. Более того, не успеет читатель, например, полюбоваться через окно чарующей гармонией архитектуры Московского Кремля, как это делают многие читатели в Ленинской библиотеке, ожидая заказ, как на телеэкране появляется четкое изображение разыскиваемой статьи, краткой справки и т.д. Но и это еще не весь информкомфорт, так нужный сегодня людям. Нажатием кнопки на пульте можно мгновенно снять копию с изображения на экране и взять ее домой для дальнейшей работы. Конечно, сегодня искусственные языки еще несовершенны, что создает сильный информационный шум, недостаточна память, что ограничивает поисковый массив, не преодолены трудности быстрого автоматического наполнения массива текущей информацией и т.д.

Но принципиально задача имеет решение. Уже создаются электронные помощники человека, которые примут на себя нарастающие потоки информации и не допустят хаоса, потери информации, информстресса.

Высокий темп нарастания информации будет подхлестывать и без того быстрые темпы совершенствования ЭВМ и ИПС. Начало третьего тысячелетия ознаменуется, вероятно, широким внедрением информационно-справочных систем. При этом наряду с совершенными ИПС потребуется оснастить планету информационными «нервами» – каналами связи. Ведь информация творится, печатается, накапливается на разных континентах, в разных странах, в разных городах, научных центрах, библиотеках, хранилищах. А ее потребители также расселены по всей планете и хотели бы получать нужную информацию без большой потери времени. Лучше всего непосредственно на своем рабочем столе на работе или даже дома.

И чаще потребитель запрашивает не ту информацию, которая накапливается в его городе, соседних городах, его стране, а ту, которая получена в других странах, на других континентах.

Следовательно, создание полноценной информационно-справочной службы планеты или хотя бы в части стран потребует большого числа быстродействующих надежных каналов связи.

Как мы уже разбирали, использование спутниковой связи позволяет создать такую глобальную систему связи между любыми странами, городами, отдельными пунктами, с необходимым быстродействием и надежностью.

– Но как информацию доставить на рабочий стол потребителя?

– Тут тоже открылись новые возможности. Наряду с традиционными способами передачи по телефонным проводам, радио, телевидению появился новый многообещающий путь – это передача информации по стеклянным проводам. Или, говоря более точно, использование лазерных линий связи с передачей сигналов не в открытом пространстве, а по световодам или стеклянным волокнам.

– Эти волокна делают из обычного стекла? Они очень хрупкие?

– Стекло это необычное. Волокно должно быть сверхпрозрачным, чтобы сигнал слабо затухал. Поэтому его изготовляют из стекла, полученного в результате реакции между сверхчистым хлоридом кремния и кислородом. Из этого стекла вытягивают тонкие длинные волокна. Им можно придавать любую форму, не боясь сломать.

Световод состоит из сердечника и оболочки. Толщина сердечника измеряется микронами и имеет больший коэффициент преломления, чем оболочка.. Оболочка делается из такого же волокна, но с меньшим коэффициентом преломления. Ее диаметр больше, измеряется миллиметрами. Благодаря полному внутреннему отражению лучей от поверхности раздела сердечника и оболочки свет движется по световоду, не выходя наружу.

Один из выпускаемых одноволоконных световодов с сердцевиной толщиной в человеческий волос способен одновременно передавать 33 тысячи телефонных разговоров. Обычно оптические кабели содержат ряд волокон-световодов. Так, уже выпускаемый промышленностью кабель из шести световодов внешне очень напоминает шнур для электропроводки.

Пока велики затухания сигнала в световоде. Это требует установки промежуточных усилителей на протяженных трассах. Но несомненно, эти трудности будут преодолены Так, разрабатываемый в Англии трансатлантический световодный кабель ТАТ-8 должен вступить в строй в 1988 году. Его промежуточные усилители будут расположены на расстоянии 50 километров друг от друга. ТАТ-8 будет передавать 557 миллионов бит цифровой двоичной информации в секунду по своим четырем световодным нитям.

Таким образом, в тех самых потоках информации, с которыми сегодня сражается человек, уже наметились и решения проблемы – проблемы создания электронных Шерлоков Холмсов для поиска информации и проблемы «бегунов», которые доставят ее в нужную точку планеты, на рабочий стол.

Заглянем мысленно в дом будущего. Наряду с традиционным санузлом, кухней мы обязательно увидим нечто новое: информузел. Там будет домашняя ЭВМ, о которой мы уже говорили, пульт связи с информационно-поисковыми системами, телеэкран для воспроизведения полученной информации, просмотра передающихся телепрограмм или специально запрошенных и имеющихся дома в записи.

Как много сил и времени будет экономить этот узел! Учиться при желании можно будет в основном дома, подключаясь к обучающим ЭВМ. Значительную часть работы можно будет исполнять в тиши домашнего кабинета, не тратя сил и времени на ежедневные поездки на работу.

С родственниками или товарищами, находящимися далеко от тебя, можно будет повидаться и поговорить с помощью того же информузла.

Но это отнюдь не значит, что люди третьего тысячелетия станут домоседами, прикованными к своему информузлу, людьми, живущими еще более «статически», чем мы во втором тысячелетии. Наоборот, сэкономленное время и силы благодаря быстродействующим электронным системам и каналам разветвленной связи будут использованы для гармоничного физического и духовного развития личности.

 

Заслонку в кратер!

Оглавление

 

Дата публикации:

4 августа 2001 года

Текст издания:

Петрович Николай Тимофеевич. Люди и биты. Информационный взрыв: что он несет. М.: Знание, 1986.

Дата обновления:

21 апреля 2005 года

Электронная версия:

© НиТ. Раритетные издания, 1998



В начало сайта | Книги | Статьи | Журналы | Нобелевские лауреаты | Издания НиТ | Подписка
Карта сайта | Cовместные проекты | Журнал «Сумбур» | Игумен Валериан | Техническая библиотека
© МОО «Наука и техника», 1997...2013
Об организацииАудиторияСвязаться с намиРазместить рекламуПравовая информация
Яндекс цитирования