Систематизация расшифровки кодов и управление справочниками
Проанализировав ещё пару десятков кодов я убеждаюсь что сам процесс расшифровки, предварительный анализ и наглядное представление результатов поддаются систематизации. Причём как систематизации процесса — в виде описания необходимых шагов для структуры кодов, так и построение онтологии кодов.
Эту онтологию, в первом приближении, мне даже удалось подготовить, но, подтвердилось одно немаловажное опасение — без построения реестра справочников, без организации управления ими и без систематизации их классификации и использования полноценной онтологической модели расшифровки кодов не выходит. Проблема здесь в том что лишь очень малая часть кодов не содержат сегментов провязанных на справочники, причём зачастую эти справочники могут быть очень простыми, иногда нигде не документированными, но учитывать их необходимо.
При том что, конечно, можно пойти по пути упрощения информационной модели вцелом и отказаться от «глобальной систематизации» сведя расшифровку кодов к множеству частных решений / справочников / функций, тем не менее это будет тупиковым подходом. Частные решения будут работать лишь до определённого их количества. Пока кодов для расшифровки десяток, проблем не будет. Когда их число дойдёт хотя бы до 50, с числом сегментов по каждому от 2 до 6, то без систематизации просто не обойтись никак.
Но управление справочниками, а точнее построение систематизированного реестра справочников, возможно, связанных друг с другом — это задача из задач. Сколько я не видел систем управления НСИ — все были, либо слишком сложными, либо слабофункциональными, не говоря уже о том что все они стоят немалых денег. В то же время их основная задача организовать ведение справочников, а их связность уже вторична. Моя же задача создать связную структуру в одном пространстве имён достаточно сложную чтобы обеспечить решение классификационных задач и задач по расшифровке кодов, но предельно простую по принципам построения, расширяемости структур и визуализации.
В принципе же, справочники используемые для классификации, имеют или должны иметь ряд отличий от эталонных заключающихся в связке с формами их представления и непосредственно в провязке справочников между собой. Казалось бы более всего здесь годится использование онтологий, хранение в RDF и OWL, но без чётко сформулированной вышестоящей онтологии которая описывала бы структуру, характер наполнения и поддержания справочника, использования онтологий будет недостаточно. Это будет набор очередных частных решений.
И добавлю что онтология расшифровки кодов, есть ни что иное как часть онтологии поиска скрытых (неявных) фактов и часть онтологии извлечения информации. Последняя же напрямую связана с моими предыдущими заметками по теме «Мир как поток и совокупность информации’. Несмотря на то что в некоторых из них я описываю, возможно, вполне очевидные понятия, тем не менее в них и здесь я преследую цели которые и требуют таких повторений. Мои исследования/размышления лежат не в области оцифровки несистематизированного, а в области дешифровки ранее систематизированного и обладающего формами представления.
Поделиться в соц. сетях
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- blogging (61)
- couchdb (3)
- data.gov.ru (250)
- datasets (104)
- diagramming (11)
- e-Government (928)
- eGov (947)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (198)
- opensource (56)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (15)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (12)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (20)
- госзаказ (172)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (52)
- открытые данные (11)
- поиск (93)
- почти несерьёзно (16)
- размышления (127)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (45)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (946)
- юзабилити (25)
- юмор (14)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability






