Представление
В терминах Клода Шеннона информация - это нечто способное снижать для наблюдателя энтропию наблюдаемой системы. Информацию о своей системе один “наблюдатель” может передать другому “наблюдателю”, чтобы помочь “коллеге” снизить энтропию его системы. Естественно, что это возможно, если системы эквивалентны в аспекте передаваемой информации.
Пример. Причиной повышенного износа колеса автомобиля как правило является нарушение параметров наклона колеса в горизонтальной плоскости - так называемого угла “схождения”. Наличие информации об этом у начинающего автомобилиста позволит быстрее установить и устранить причину проблемы.
Мы исходим из того, что нашу - “земную” - информацию можно представлять только с помощью знака, “записанного” на каком-то носителе. Улыбка - это тоже знак, носителем которого выступает наше выражение лица. Но здесь мы будем рассматривать информацию, передаваемую в виде наборов символов - текста. Такой текст, который обычно имеет определенную структуру (например, табличную или вложенных списков), мы будем назвать данными.
Естественно, что информация должна быть записана в данных так, чтобы быть понятной адресату. Для этого у собеседников (отправителя и адресата) должно быть соглашение о том, как представлять информацию с помощью набора знаков. Это соглашение устанавливает связь между “информационной сущностью” и набором знаков для ее отображения. Полный набор таких соглашений, достаточных для обмена информацией между отправителем и получателем, можно назвать языком. Здесь мы рассматриваем язык чисто утилитарно, как средство кодирования информации в виде знаков для целей хранения, обработки и передачи. “Атомы” - “слова” - составляют семантику языка. Семантические единицы с помощью правил грамматики языка образуют высказывания - конструкции собственно и передающие информацию.
На основании приведенных утверждений может показаться, что достаточно иметь соглашения о семантике и грамматике для продуктивного обмена информацией. Но вот, что происходит на практике:
Мы были оба.
Я у аптеки!
А я в кино искала вас!
Так, значит, завтра
На том же месте, в тот же час!
Явно, что в этом высказывании еще чего-то не хватает. Не хватает соглашения о том, что собеседники понимают под указанием на “то же место”. Соглашение о семантике и грамматике никак не помогает разрешить данное затруднение. Для разрешения данного затруднения нужна еще некоторая информация, которой должны обладать собеседники до того, как начнут кодировать и расшифровывать высказывание. Такую информацию, необходимую для интерпретации (расшифровки) высказывания, можно назвать контекстом.
Передача
context-unbound data
Современные системы и стандарты передачи информации создавались и развивались как средства взаимодействия военных, и уже постольку-поскольку становились частью “гражданского оборота”. Теоретические основы, прикладные методы и конкретные стандарты передачи информации разрабатывались известными теперь учеными как К. Шеннон, А. Тьюринг, В. Котельников в интересах армии (здесь, например, мы можем вспомнить судьбу теоремы “Уиттекера-Котельникова-Шеннона”). Это важное замечание, которое, на взгляд автора, открывает путь к пониманию нынешнего странного состояния гражданских систем организации, хранения и передачи данных, а также проблем управления современным информационно-насыщенным (правильнее - энтропийно-насыщенным) общевойсковым боем.
При передаче информации между военными принципиально важно сделать сообщение недоступным для расшифровки (мы скажем - содержательной интерпретации) в случае его перехвата противником. Такая задача защиты является для военных заказчиков даже более значимой, чем собственно задача передача информации. В самой основе взаимодействия предполагается, что военные “собеседники” обладают полным контекстом, необходимым для понимания высказывания, переданного в сообщении. При этом для целей сокрытия часто достаточно применить формулировку, которая была бы сильно связанна со специфически контекстом, чтобы даже незашифрованное высказывание не могло быть понято посторонним лицом.
«Малая Касательная 16 Александру Корейко графиня изменившимся лицом бежит пруду»
телеграмма О. Бендера. "Золотой теленок" И. Ильф и Е. Петров (1931)
«Мы используем наш национальный язык, а именно тувинский, чтобы в случае радиоперехвата противник не смог понять, о чем идет речь», — из интервью инструктора отделения связи Николая Чамьяна.
Таким образом, создаваемые системы передачи информации (а вместе с ними и хранения, и обработки) не только не заботились о развитии способов передачи контекста, но наоборот старательного его скрывали. Поэтому и гражданские решения, “питавшиеся” разработками военных, вынужденно строились по такому же принципу: обмен контекстом должен происходить отдельно от передачи информации. Поэтому принципы и методы записи информации не только не заботились о “привязке” сообщений к контексту, но и избегали даже случайной возможности такого развития событий. Соответственно и системы хранения данных (их еще часто называют “системы хранение информации”, что верно лишь от части) “заточены” на работу с такими “свободными” от контекста - “безконтекстными” - данными (context-unbound data).
Для случаев, когда мы хотим передать информацию незнакомому с контекстом адресату такие данные и способы их организации создают значительную проблему. Для ее решения в “классических” гражданских, а по сути “допиленных” квази-военных, системах используют так называемые “метаданные”, которые построены по тем же принципам, что и сами данные. Поэтому те из вас, кто читает настоящий текст с самого начала, резонно спросят: “А как же интерпретировать метаданные не имея метаданных о метаданных?”. В общем, понятно, что наличие метаданных тоже дает решение лишь частичное - теоретически позволяет уменьшить объем контекста, который надо передавать вне каналов обмена информацией. Но появление отдельно живущего массива метаданных создает другую существенную проблему - поддержание их в актуальном состоянии.
Вот здесь мы привели примеры того, какие проблемы в жизни создают “бесконтекстные” системы работы с информацией.