Мир как поток и совокупность информации. О аспектах и особенностях кодирования информации и отдельных кодов

Формы создания и обмена информацией

В своих рассуждениях о Формах представления информации я не раз касался темы того что практически вся производимая людьми информация соответствует ограниченному числу шаблонов. Эти шаблоны проистекают из множества причин и факторов как то ограничения человеческого организма на восприятие информации, его обучение определённым подходам к усвоению информации, его социальная среда,  накопленный опыт по уже существующим принципам кодирования информации как часть обучения.

Всё это в совокупности определяет, то что для большинства людей существует лишь ограниченная свобода как восприятия, так и создания воспринимаемого. Любая социальная среда лишь усиливает эти тенденции сужая области отклонений от принятых стандартов. Причём воздействие среды вполне ожидаемо так как получение и передача информации завязаны на взаимодействие более чем одного человека и требуют от участников общения умения понимать того что им пытаются передать другие. Это умение, вернее совокупность умений, являются социальными протоколами обмена информацией. Такими протоколами можно назвать — речь, язык жестов, обмен записками, электронными письмами и чат в системах обмена короткими сообщениями. Каждый такой протокол, также, является некой формой кодирования информации, а ещё точнее кодирования форм представления информации поскольку дальнейшая расшифровка покажет что элементы речи — слова, символы языка жестов и написанный текст также являются формами представления информации. В свою очередь каждая из этих форм содержит дополнительные формы характеризующие принципы и условия кодирования отдельных их частей. Например, порядок слов в предложениях и выбранные их сочетания позволяют их, также определять как формы. Безусловно в дальнейшем можно провести более чёткую классификацию этих форм, их вложенности и соотнесения с более понятными понятиями, но главным за всем этим является, то что все средства создания и обмена информацией подчиняются ограниченному числу правил. В свою очередь для различных задач кодирования и анализа информации достаточным будет анализ данных правил на опеределённом их уровне вложенности и сложности. Далее я приведу рассмотрение подобных правил для анализа информации о кодировании реестровых номеров и справочной информрации. Это небольшая, частная и, сравнительно простая задача по сравнению с задачами анализа форм в общем случае

Шаблоны записи кодов

Если проанализировать такие коды как ИНН, КПП, IMSI, UUID, социальные номера, номера банковских карт и множество других уникальных и справочных кодов, то можно убедиться что все они обладают высокой степенью сходства по структуре и логике их применения. Все они находятся на одном уровне восприятия и ограничены, как средой их применения, так и областями их использования, восприятия их создателей и тех для кого они создавались. Все эти совокупные ограничения и детализация того что в обыденной жизни и работе с информацией может показаться очевидным позволяет заглянуть чуть глубже в эти формы кодирования и систематизировать эти шаблоны в основные принципы.

Далее я изложу некоторые свои размышления и наблюдения по структуре большинства кодов которые в дальнейшем будут систематизироваться и раскрываться:

  1. Все уникальные коды кодируются с использованием ограниченного числа микроформ представления информации. В рассматриваемых далее случаях этими микроформами являются символы и фиксация кода в письменном виде.
  2. Подавляющее число идентификационных кодов, справочных или реестровых номеров обладают чётко заданной длиной — числом используемых микроформ (символов) для кодирования
  3. Микроформы (символы) для кодирования уникальных кодов находятся в пределах общепринятых и понимаемых каждым человеком — как то, например, знаки цифр или алфавита известными каждому. Для кодирования уникальных кодов используется ограниченная выборка из узнаваемых микроформ.
  4. Совокупное множество микроформ (символов) представляющих уникальный код обладают не только значением, но и порядковым номером. Порядковый номер символа определяется правилами чтения символов, а то есть является результатом предварительного обучения. К примеру, мы воспринимаем как данность то что слова пишутся и читаются слева направо (или справа налево у арабов и евреев), но мы не допускаем что кодирование порядковых номеров букв может не подчинятся данным инкрементальным правилам позиционирования.
  5. Кодирование информации в уникальных, реестровых и справочных кодов сегментировано, причём сегментирование, в подавляющем большинстве случаев обладает направлением и иерархией слева-направо, когда каждый последующий сегмент является уточняющим к предыдущему.
  6. Также, сегментирование частично или полностью может определятся не иерархией уточняющих кодов, а внеиерархическими атрибутами данного кода.
  7. Сегменты обладают ролями/типами определяющими их применимость. Сегмент кода может быть: кодом справочника, инкрементальным числом, статическим значением, произвольно сгенерированным числом (для UUID) или проверочным кодом.
  8. В подавляющем числе случаев сегменты обладают  фиксированной или переменной длиной.
  9. Поскольку каждый сегмент является совокупностью микроформ (символов) обладающих порядковыми номерами, то и сегменты обладают порядковыми номерами.
  10. Сегменты кода могут обладать отношениями зависимости от других сегментов в части границ их допустимых значений, длины или того и другого вместе.
  11. Отношения между сегментами могут быть сформулированы как правила их проверки и наполнения.

Систематизация

Как некий итог рассуждений выше рассмотрим результаты рассуждений как некий набор метрик которыми обладают уникальные коды, реестровые записи и справочники.

Код обладает следующими метриками:

  • число длина от — минимальное допустимое число символов в коде;
  • число длина до — максимальное допустимое число символов в коде. Всегда больше чем длина от;
  • флаг переменность длины — флаг проставляемый автоматически при длина до > длина от.
  • число число сегментов — общее число сегментов из которых состоит данный код;
  • число|uri|уникальный идентификатор тип кода — уникальное значение по справочнику характеризующее принципы построения данного кода. Тип кода может соответствовать понятиям: справочный код — для простых кодов справочников не обладающих переменной (инкрементальной частью), реестровая запись или уникальный идентификатор. Последнее относится к кодированию таких кодов как GUID и UUID.
  • описание Сегментов из которых код состоит.

К коду может быть привязано одно или большее число правил проверки и правил формирования.

Сегмент (часть) кода обладает следующими метриками:

  • число позиция — определяет положение сегмента относительно других сегментов в рамках одного кода.
  • число длина от — минимальное допустимое число символов в сегменте;
  • число длина до — максимальное допустимое число символов в сегменте. Всегда больше чем длина от;
  • флаг переменность длины — флаг проставляемый автоматически при длина до > длина от.
  • число|uri|уникальный идентификатор тип сегмента — уникальное значение по справочнику определяющее один из типов сегментов: инкрементальное число, справочное значение, статическое значение, произвольное значение.
  • структура связи отношение — структура описывающая связь сегмента с другими с другим кодом/справочным значением в случае если тип сегмента — справочное значение или же ссылка на справочник из которого берётся статическое значение для кода.
  • набор символов значение — статическое значение если сегмент является статическим.

Разумеется перечисленные правила и принципы кодирования не покроют всех существующих примеров кодирования, но это уже вопрос к систематизации вопросов и решений по выявлению форм представления не соответстсвующих задаваемой моделью по их анализу.

Резюме

Этот пример систематизации форм, причём форм довольно простых — это не более чем пример, но пример подкреплённый практикой и применимостью. Несмотря на то что в подавляющем большинстве случаев внешнее связывание данных, в частности для кодов, позволяет выявить больше информации чем анализ структуры и увязку её в общую модель, тем не менее есть случаи когда анализ принципов кодирования информации позволяет проивзодить дальнейшее её обогащение и связывание со справочниками и информационными массивами.

About This Author

Яндекс.Метрика