Для новоприбывших — о чём я пишу и чем занимаюсь

После моего последнего поста про соц. сеть Минздрава и ссылки с блога гражданина Навального вдруг пошло массовое френдование моего журнала, так что я решил что пора описать то чем я занимаюсь и о чём пишу чтобы небыло неоправданных ожиданий.

Общее

1. Я пишу на следующие темы — электронное государство, государство вообще, госзакупки, ИТ технологии, обработка и анализ данных, алгоритмы.

2. Мой основной блог ivan.begtin.name и его зеркало в ЖЖ ivbeg.livejournal.com, трансляция в Twitter — http://twitter.com/#!/ibegtin, во FriendFeed — http://friendfeed.com/ivbeg и мой блог в ГосБук’е http://www.gosbook.ru/user/blog/71. Всё что я пишу публично, никаких закрытых и подзамочных постов у меня нет.

3. Большая часть моих публикаций не содержит выводов. Я предпочитаю работать с фактами и их анализом даже когда знаю что за ними стоит. Это сознательно выбранная форма подачи материалов нацеленная на аудиторию способную интерпретировать информацию самостоятельно.

4. Я не интересуюсь политикой, политическими партиями, движениями и так далее. Для меня нет разницы между Единой Россией, Справедливой Россией или маршами несогласных. Я интересуюсь конкретными темами и общаюсь с людьми желающими разбираться в проблемах, а не говорить лозунгами.

5. Я занимаюсь коммерческой, некоммерческой и экспертной деятельностью. Возглавляю небольшую компанию разработчика ИТ проектов в области «общественного блага» (common goods), а то есть гражданских проектов нацеленных на общественную пользу.

Про госзакупки и госрасходы

1. Я являюсь создателем, возглавляю компанию разработчика «Лаборатория интеллектуального анализа данных», проекта РосГосЗатраты (http://www.rosspending.ru/) ставшим публичным в июле 2010 года на Тверском экономическом форуме и предоставляющим наглядную и понятную базу по всем госконтрактам в Российской Федерации на основе открытых данных. Этот проект был инициирован и создан по заказу Института Современного Развития (www.insor-russia.ru).

2. Я в теме госзакупок последние 5 лет в самых разных формах — от автоматизации процессов госзакупок у различных госзаказчиках, до исследований в этой области и гражданского активизма в виде постов в моём блоге.

3. В июне 2009 года я поднял тему по латинице в госзакупках (http://ivbeg.livejournal.com/216668.html), честно говоря не ожидая резонанса который она вызвала. И тем не менее, резонанс получился.

4. Относительно различных заметных закупок вроде «золотых кроватей» и «подарочных шампуров» я отношусь к активностям вокруг подобного с большим пессимизмом — о причинах почитайте в моих постах по тэгу госзаказ. Если коротко, то подобные закупки находятся в матрице рисков госзаказчиков и составляют не более тысячной процента от основных средств по госзрасходам.

5. Далеко не всё чем я занимаюсь по этой теме публично и далеко не всё что я знаю озвучиваю. Чаще всего если я затрагиваю какую-то острую тему — значит случай какой-то уж очень вопиющий или же тема меня сильно зацепила. Все мои публикации по теме госзакупок доступны по соответствующему тэгу госзаказ у меня в блоге .

Электронное государство

1. Тема электронного государства одна из основных в моём блоге и посты по ней можно узнать найти по соответствующему тэгу электронное государство у меня в блоге.

2. По этой теме я в той или иной форме участвую в нескольких гражданских, медийных и государственных проектах.

3. Я являюсь экспертом по нескольким темам в экспертной сети ГосБук (www.gosbook.ru)

4. Я являюсь руководителем проекта Государственные люди (www.goslyudi.ru). Этот проект является структурированным аггрегатором блогов чиновников, депутатов, руководителей госпредприятий и других гослюдей. И он включает рейтиги, каталоги по группам, возможности удобной подписки и так далее. Проект был разработан по заказу издания Полит.Ру (www.polit.ru)

5. Кроме того, в мае-июле этого года лабораторией был запущен ещё один проект Государственная сеть (www.govweb.ru) опять же по заказу Полит.Ру. В данном проекте собираются и структурируется информация по всем государственным сайтам в Российской Федерации, а также формируется структура органов власти как она есть по факту.

6. Во многих публикациях я пишу на тему государственных сайтов, их соответствия 8-ФЗ и достоверности публикуемой на них информации.

Открытые данные

1. Один из первых и основным моих проектов — это портал OpenGovData.ru: Государство и его информация. Который посвящён тематике открытых данных в России. Также я занимаюсь евангелизмом по теме открытых данных у себя в блоге и на профильных мероприятиях.

2. Открытые данные — это основа основ. Это самый главный тренд публичности государственных органов и международных организаций в мире. Открытые данные публикуют — правительство США, правительство Великобритании, ООН, Всемирный банк и многие другие. В Европе инициатива порталов PSI (Public Sector Information) является одной из ключевой и быстро распространяющихся. Мы же сильно в этом отстаём.

3. Сколько у меня хватает времени от других дел — я стараюсь помогать другим проектам в этой области и активно ищу тех кто интересуется развитием открытых данных в России.

Государство

1. Кроме активностей относящихся к созданию веб-проектов я, когда есть свободное время, я занимаюсь формированием моделирование онтологии Российской Федерации. О чём можно почитать здесь по ссылке — онтология структуры органов власти, а скачать онтологию можно по ссылке — разработка геополитической онтологии.  Для работы с онтологией потребуется знание OWL/RDF и основных понятий из Semantic Web.

Технологии и алгоритмы

1. Помимо прочего я специализируюсь на разработке различных алгоритмов по работе с данными и текстом. Одним из публичных примеров таких алгоритмов является сервис Скиур (http://www.skyur.ru/) позволяющий извлекать новости в формате из любой веб-страницы где RSS нет, а список новостей есть. Как правило я пишу только о тех алгоритмах, направлениях — по которым ещё нет промышленных результатов.

2. Технологии на которых специализируюсь я и компания которую я возглавляю — это Django, Python, использование NoSQL баз, обработка большого объёма данных, обогащение и верификация данных. Пишу я о них редко, но пишу.

3. Другие алгоритмы над которыми я работал/работаю — распознавание пола и этноса по ФИО, разбор почтовых адресов, автоматическая классификация предметов закупок, автоматическая тематическая классификация организаций, идентификация CMS на веб-сайтах, построение объектных карт веб-сайтов. Часть из них завершены и используются в тех или иных проектах, часть так и остались на уровне незавершённых изысканий.

About This Author

  • DmitriyUstyugov

    Существуют ли проекты по семантической разметку законов государства? Некоторого такого корпуса нормативных документов. С целью выявления логических ошибок, улучшения поиска, исследовательских целях?

    • http://ivan.begtin.name Ivan Begtin

      Есть проекты где законы размечаются, например, в docs.pravo.ru. Есть несколько мировых проектов, например, похожий проект есть в британии.

      Но корпусы таких текстов мне неизвестны, во всяком случае публично доступными я их не встречал.

      • DmitriyUstyugov

        Спасибо.
        Я больше имею ввиду разметку семантическую, например, средствами OWL. Имеет ли это перспективы?

        Пример такой:
        Закон №1 действует в некотором субъекте федерации и противоречит в пункте N федеральному закону. В конституции установлено главенство федеральных законов. Если законы семантически размечены, то возможно автоматически проверить законы на совместимость.

        • http://ivan.begtin.name Ivan Begtin

          Переспективы, безусловно имеет, но требует очень большой работы.
          В США были работы по Legal XML http://lists.w3.org/Archives/Public/www-rdf-interest/1999Nov/0006.html и тут http://www.legalxml.org/
          Как я помню у этих работ было продолжение в виде RDF/OWL описания, но навскидку не помню где я их видел.

Яндекс.Метрика