Информационные потоки, скрытая информация и связность

Предупрежу заранее — это будет длинный текст, по принципам работы с информацией, причём не последний из этой темы поскольку за один раз всего не охватить.

Рассмотрим некоторые вопросы:

  • Как мы думаем когда мы думаем?
  • Влияет ли то о чём мы думаем на то как мы это делаем?
  • Что именно — опыт, информация, контекст или внутреннее состояние оказывает наибольший вклад на решение?

Казалось бы всё это исключительно — психология, социология и иные гуманитарные науки на них основанные и с ними связанные. Но это не совсем так, поскольку логика мышления очень тесно пересекается с вопросами извлечения скрытой информации.

Рассмотрим такой пример. Всегда существовало множество способов общения между людьми — письма, встречи и разговоры, телефонные звонки плюс интернет добавил такие возможности как email, средства обмена быстрыми сообщениями, видеотелефония и так далее.

Я думаю что никто не будет спорить что общение через Интернет и общение вживую отличается существенно, а также все различные способы общения имеют свою степень . Вопрос в том как именно оно отличается иначе говоря в систематизации этих отличий и понимании почему кто-то предпочитает общаться вживую, а кому-то этого очень не хочется.

Далее я буду использовать термины информационный канал и информационный поток — они ненаучны, но подходят для описываемой ситуации. Важно не путать их с ИТ понятиями передачи информация — сходства есть, но только сходства, не соответствие. Точно также будут встречаться другие термины которым я пока не могу подобрать нужные научные названия, поэтому буду их разъяснять по ходу текста.

Информационный канал (в общении) — это способ передачи информации от человека к человеку. Информационный канал обладает рядом характеристик и может содержать одновременно несколько информационных потоков.

Информационный поток (в общении) — это информационный срез процесса общения основанный на принципах восприятиях, способах передачи информации, «скрытой и сопроводительной» информации общения.

Несколько примеров. Когда Вы переписываетесь по электронной почте, то электронная почта как средство общения — это информационный канал. Посредством его Вы можете переслать текст, получать письма (тексты) при этом общение может и будет происходить с задержками.

Физиологически электронная почта как информационный канал — это руки-глаза. Руками набирают текст, глазами его отправляют. Вы можете закрыть уши, заткнуть нос, погрузить тело в ванну с температурой тела так чтобы его не ощущать и только рук и глаз Вам будет достаточно чтобы работать с данным каналом информации.

Информационно электронная почта — это текст, в подавляющем большинстве случаев ограниченного набора компьютерных шрифтов, требующий умственной активности на период распознавания символов и слов, а далее на смысловое осознание и подготовки ответа. Что важно — электронная почта асинхронна и не является моделью «ступенчатого общения» когда

Электронные письма, при этом составляют информационный поток который можно охарактеризовать количественными характеристиками, темпоральной (временной) моделью, интенсивностью, объёмами и многим другим. Значительную часть из этих характеристик задаёт информационный канал, но сознательно элементы информационного потока и канал разделены так как те же электронные письма можно распечатать, сохранить в почтовых списках (mailing list), опубликовать как часть других материалов (документов /записей в блогах) и отследить эти взаимосвязи можно лишь изначально разделив эти понятия на ряд элементарных объектов.

Рассмотрим другой пример — общение по телефону. Телефон — это информационный канал. Физиологически — это рот-уши-руки. Можно говорить закрыв глаза, заткнув нос и погрузившись в ванну. При этом телефон скорее даже только рот-уши — поскольку далеко не всегда необходимо держать трубку руками, есть Bluetooth. Информационно телефон — это голосовой канал реального времени общаясь с человеком по телефону и Вы и он ограничены во времени реакций в диалоге в рамках этого общения.

Голос в телефоне — это уже информационный поток. Именно голос, а не звук как может показаться. Звук — это характеристика канала, а голос — это основной информационный поток через который Вы воспринимаете собеседника. При этом в звуке могут присутствовать и другие потоки — голоса людей рядом, шумы, звуки вокруг Вашего собеседника. Всё это один или несколько дополнительных информационных потоков в рамках одного информационного канала.

Что важно для голоса время является его неотъемлимой характеристикой. Можно рассматривать отдельные временные участки, но нельзя взять «одну точку» — информация в ней будет отсутствовать. Это кардинально отличается, и от текста, и от видео где одна временная точка является по сути фотографией и обладает информационным наполнением.

Но время не единственное что его отличает. Так когда мы говорим и слушаем, на самом деле, передаётся значительное число скрытой и дополнительной информации которая включает:

  • акцент собеседника;
  • его эмоциональное состояние;
  • тембр голоса и глубину голоса;
  • паузы между словами и фразами;
  • и прочее и прочее

Часть это информации мы осознаём сразу же в процессе разговора — так по голосу можно определить пол и при мерный возраст человека, то что гораздо сложнее сделать на основе текста. А часть информации идёт в так называемых скрытых информационных потоках когда в процессе общения мозг автоматически обрабатывает сопровождающую разговор информацию и корректирует форму общения в соответствии с этой информацией. К тому же мы не только считываем информацию мы считываем и реакцию на ключевые фразы диалога которые можно скрыть в «ступенчатом общении», но трудно скрыть в общении в реальном времени.

Отсюда информационная нагрузка любого телефонного разговора значительно выше чем у общения по электронной почте. Телефонный разговор даёт куда больше и Вам и собеседнику возможностей узнать друг о друге больше информации, но большая её часть идёт в неосознаваемой форме — это скрытые данные, что бы понять которые необходимо, либо иметь длительный опыт анализа собственного восприятия, либо систематизировать результаты общения.

Подумаем на чём основана наша способность извлечь эти скрытые данные. Как мы определяем по голосу что он принадлежит женщине? Как мы определяем эмоциональное состояние человека?

Особенность в том что мы определяем всю эту информацию на основе предварительного обучения. Мозг автоматически классифицирует поступающую информацию и в момент диалога предоставляет классификацию собеседника по этой выборке. Да, в основе работы мозга лежат биологические нейросети, но до того как информация в них поступит, она должна быть классифицирована и разделена. Иначе говоря мы воспринимаем различные информационные потоки и обладаем не только обучением классификации информации, но и обучаемся классифицировать типы информации поскольку именно так определяем что именно глубина голоса важна для определения того кто этот человек. Но, большая часть этого процесса извлечения, классификации и принятия решения происходит без сознательного участия. Даже перестройка поведения под эту информацию бывает бессознательной, но вполне заметной окружающим.

Что мешает перевести извлечение и осознание скрытой информации из интуитивного восприятия в явное? Главное — это время и понимание собственного мышления. Понимание почему приходя к определённым выводам — мы приходим именно к ним. Выстраивание цепочки (дерева) решения и соотнесение её с накопленным опытом.

Иначе говоря — невозможно описать то что невозможно понять. Любой перенос классификационных и способов принятия решения алгоритмов начинается со структуризации собственной интуиции и понимания и переносу их на компьютерные модели. Так можно создать прибор который бы автоматически определял пол и эмоциональное состояние собеседника при разговоре, но помимо его коммерческой применимости, до тех пор пока извлечение скрытой информации и её классификация мозгом не будут перенесены в технологическую форму — добиться этого не получиться. (Да, конечно важно отметить что такие разработки есть и ведутся, но области их применения пока не очевиды).

Абстрагировавшись от форм общения людей и приходя к скрытым данным в общем случае можно с уверенностью сказать, что они присутствуют практически во всём, главное — это способность их разглядеть и подвергнуть последующей обработке. Скрытые данные могут быть как в скрытых информационных потоках — шумы вокруг голоса, так и внутри основного информационного потока — например, выявление ошибок в текстах.

При этом выявлять эту информацию можно очень по разному. Можно использовать механизмы машинного обучения с кластеризацией и классификацией признаков для чего существуют множество инструментов начиная с WEKA и RapidMiner и продолжающихся множеством коммерческих продуктов.

Можно использовать экспертный подход перенося логику принятия решения от человека в алгоритм. Таких алгоритмов много, например, анализ синтаксиса предложений и иной лингвистической информации в большинстве случаев неполон без последующей экспертной оценки специалиста.

И, наконец, то о чём я часто пишу в своём блоге — механизм построения модели связности информационных объектов. Что есть связность? В первую очередь — это принципиальный отказ от рассмотрения чего бы то ни было вне контекста окружающей информации и связи рассматриваемого объекта с другими сущностями. Классификация и кластеризация объектов в этому случае возможна посредством анализа их связей и итеративного анализа ранее классифицированных связанных объектов. Математически это предельно просто — это сложно лишь на понятийном уровне.

В пример классификации с использованием связности информации — исследование Pyalling A., Maslov M., Braslavski P. Automatic geotagging of Russian web sites. In Proceedings of the 15th International Conference on World Wide Web

Скрытая информация извлекается набором весьма простых алгоритмов и сбором необходимой связанной (классификационной) информации.

К вопросу о том в чём отличие моего алгоритма выявления ссылок от близким по описанию контентных алгоритмов — в том что я не использовал и не использую для этих целей математических инструментов кроме самых простых операций. Всё работает исключительно на простых правилах и правильной связности их классификационными срезами. Это то что я ранее писал про то что расширение данных бьёт лучшие алгоритмы и итоговая многоуровневая классификация позволяет свести логику исключительно к деревьям решений.

И вновь возвращаясь к способом коммуникации между людьми — я никак не затронул вопросы видео конференций и живого общения где, как вы догадываетесь, справедливо всё описанное выше — большее число скрытых информационных потоков, больше интуитивных данных которые мы принимаем, но подробнее об этому уже в другой раз.

About This Author

Яндекс.Метрика