Июл 09 2010

Про то что важно и интересно читать в РосГосЗатратах

Tag: из жизниivbeg @ 6:37 дп

Короткий блиц-тур по сайту

1. Топ системных интеграторов - http://www.rosspending.ru/reports/it/integrators/

Без учёта холдинговых структур – перечень организаций поднявших более всего денег от государства с 2007 по 2009 год. Не обязательно что все деньги пошли именно им, наверняка многие работали через субподрядчиков, однако картина именно такова. Пока без учёта холдинговой структуры, только как отдельные юр. лица.

2. Крупнейшие поставщики по отраслям - http://www.rosspending.ru/reports/contractors/

Группа отчетов с крупнейшими поставщиками по избранным отраслям – здравоохранение, атомная промышленность, военно-промышленный комплекс, лесная промышленность, химическая промышленность и так далее.

3. Гранты - http://www.rosspending.ru/grants/oprf/

Собственно в проекте не только госконтракты, а _все_ публичные расходы. Пока гранты представлены в виде базы всех грантов с 2007 по 2009 годы и с ними не так удобно работать как с госконтрактами, но всё будет улучшаться.

4. Рейтинги аффилированности – http://www.rosspending.ru/reports/common/

Доли средств полученных поставщиком от крупнейшего заказчика и доля средств пошедших у заказчиков на основных поставщиков. Это, разумеется, совершенно не означает однозначной коррупционности поскольку есть области где вообще нет рынка. Например, расходы РосКосмоса можно отнести к таковым – для них по всем крупнейшим контрактам 94-ФЗ это скорее обуза чем польза, поскольку опыт всех основых игроков известен заранее да и отрасль очень специфическая.

—-

И, в принципе, сайт разрабатывался, насколько только это возможно, без канцелярита, перегрузки терминами в


Июн 17 2010

Про проекты и «Общественное благо»

Tag: из жизниivbeg @ 2:15 пп

Запустив уже несколько проектов – OpenGovData.ru, ГосЛюди и Государственная сеть я решил собрать свой собственный опыт и подход по проектам нацеленным на «Общественное благо» и описать его в одном посте.

Может быть из этого текста станет понятнее что, зачем и почему делается.

Итак, мой подход к подобным проектам и почему они запускаются именно в тех форматах что Вы видите и никак иначе:

1. Никакой политики – только государство

В том смысле что вообще никакой. Никаких ссылок на на политические партии, общественные движения и так далее и тому подобное. Приложением интересов является только государство, вне зависимости от того кто, как и посредством чего им руководит и в него входит.

2. Создание «Общественного блага» сродни волонтёрству

Только оно ИТ-шное. Да, конечно, многих удивляет откуда берутся люди готовые делать что-либо «бесплатно» в форме «общественного блага». Но проекты с открытым исходным кодом, тем не менее, вполне себе живут и в России тоже есть open source разработчики.

Так вот – это некоторое отношение к жизни.

3. Партнёрство

Очень важно начиная какой-либо проект иметь партнёра с которым его начинать или же, даже, делать проект в пользу этого партнёра.  В случае с OpenGovData.ru мне пока так и не удалось этого сделать, а вот проекты ГосЛюди и Государственная сеть прекрасно живут как проекты Полит.Ру.

В принципе, такие проекты могут существовать всего в нескольких форматах:

  • как государственные, со всеми вытекающими проблемами их сопровождения, модерации и понимания сотрудниками госорганов того как они могут или не могут существовать. Это очень редкая и сложная форма существовать подобных проектов.
  • от некоммерческих организаций – так существует большая часть проектов зарубежом. Но в России, как я писал ранее, некоммерческие организации, либо не дошли до понимания важности технологий, либо испытывают острый дефицит средств.
  • коммерческие – в этом случае у проекта на общественное благо есть ещё и коммерческое приложение. Скажу честно, я считаю этот путь неправильным. Единственную форму его существования я могу понять когда отдельно существует некоммерческий проект, и отдельно (но не часть!) коммерческий продукт или сервис. Например, так работает MySociety.org (http://www.mysociety.org) – они не торгуют общественным благом, а строят центр компетенций и предлагают свои услуги. Точно также как и OKFN.org. Хуже когда
  • медийные – это формат Guardian и New York Times для которых открытые данные и open government это часть их позиционирования для читателей. Точно также и проекты которые сейчас создавались от Полит.Ру – это медиа влияние и это вполне себе неплохая форма для подобных проектов.

Во всех формах есть свои плюсы и недостатки. В России пока самые выживающие – это проекты коммерческие. Некоммерческих очень мало, государственных также совсем немного, в некотором смысле, почти нет.

4. Фан

Да, это ещё и фан. Это возможность личного влияния на жизнь общества и есть люди которым это важно, интересно и, главное, азартно.  И, чем дальше, тем ещё и конкурентнее и это очень и очень хорошо и правильно. Фан определяет ещё одну важную вещь – деньги это не приоритет. Тем кто  мечтает стать миллионерами стоит подумать о бизнесе, в случае же создания «общественного блага» приоритетно оно, а бизнес лишь одна из форм его создания.

5.  В первую очередь технологии

А то есть проекты не должны быть преимущественно контентными. Всё что возможно – должно быть автоматизировано. Сюда входят всевозможные: классификация данных, автоматическая аггрегация, алгоритмы извлечения и разбора данных и так далее.

Контента у нас уже очень много – хорошей его обработки всё ещё мало.

6. Вовлечение

Обязательно наличие обратной связи от пользователей. Комментарии к публикациям, форумы, формы обратной связи, блог, сообщества, рассылки и так далее. Но обязательно наличие _публичной_  и _открытой_ обратной связи.

7. Простота

Все проекты должны быть очень простыми, ни в коем случае не больше чем разработка прототипа одним разработчиком за один месяц. И не больше трёх месяцев чтобы сделать его публичным. Простые, но легко интегрируемые проекты.



Май 07 2010

SEO’шники Тульского госзаказа

Tag: из жизниivbeg @ 8:19 пп

Вот на сайте госзакупок Тульской области (http://www.goszakaz.tula.ru/) обнаружился «замечательный» пример с размещением SEO ссылок на госсайтах.

Собственно эти самые ссылки спрятанные за display:none видны и сейчас на главной странице сайта. Некрасивая история получается, прямо скажем. Как впрочем и во всех случаях размещения коммерческой рекламы на государственных веб-ресурсах

А за ссылку на скриншот спасибо Роману Рыбальченко (http://roma.net.ua/)


Май 07 2010

Автоматизированное выявление порнографии?

Tag: бывает и такое, из жизниivbeg @ 7:16 пп

Я тут в сообществе ifap_ru углядел интересный пост про разрабатываемую в Саратовском государственном университете методику экспертизы для выявления порнографии. Вот тут можно её прочитать – http://www.sgu.ru/node/51877

а некоторые фразы оттуда достойны внимания:

В лаборатории математического моделирования правовых явлений и процессов Саратовского государственного университета имени Н.Г. Чернышевского ведется разработка методики нового вида экспертизы – экспертизы кино- и видеоматериалов порнографического характера. Методика содержит формализованную оценку динамики изображения порнографического характера на основе автоматизированного способа выявления классификационных признаков.

Меня лично больше всего «прёт» от формализованной оценки немного-немало, а динамики! и от автоматизированного способа. Нет, конечно, очень нравится что способ не автоматический, а то, не дай Бог, придумает кто-нибудь как выявлять порно автоматически и лишат миллионы людей развлечения.

Просто интересно, сколько же фильмов отсмотрели специалисты лаборатории для составления этого списка признаков? Список то там немалый и весьма подробный.


Апр 24 2010

Умственные разминки

Tag: из жизниivbeg @ 8:43 пп

В продолжение поста ранее про паттерны управлением временем, ещё одна тема на уровне систематизации рефлексии. Как и прошлый раз – мысли вслух.

Есть один вопрос который прошлый раз я не затронул – способы переключения сознания между разнородной деятельностью. Лично я не знаю какого, либо универсального способа и ранее этого не систематизировал.

Однако как вижу сейчас, то пользуюсь следующими простыми практиками:

  • вначале от 30 cекунд до 1 минуты  закрыть глаза, расслабиться и ни о чём не думать.
  • далее:
    • для аналитической деятельности – оглядываюсь на окружающую действительность и систематизация очевидного. Выцепление какого-нибудь объекта и формирование его «информационной карты». Например, смотришь картину на картину на стене, а в голове рисуешь Concept Map из объектов: художник, картина, метаданные, наблюдаемые объекты и так далее. Главное тут не переувлечься.
    • для исследовательской и производственной деятельности – отрисовка в голове её workflow _до_ начала и что-то вроде обновления микроплана в голове каждые часа 2
    • для евангелизма, практически всегда есть о чём написать, нужен лишь порыв и азарт. Эдакий контролируемый поток эмоций. Не слишком много эмоций чтобы текст или выступление были бессистемными, но и не слишком мало чтобы текст был сухим. Лично я пользуюсь двумя способами. Первый – думать матом и просторечными выражениями, второй писать матом.  В первом случае всё просто – создание быстро выходит из официоза, но продолжает думать. Второй способ точно также, главное потом не забыть поубирать матерные слова из текста. А то будут казусы.
  • альтернативные варианты в основном для тела,  не для ума:
    • наведение порядка, но не рефлекторное,  осознанное и не посередине работы и не в промежутках, а именно как способ переключения сознания
    • медитация, прислушиваться к собственному дыханию, запахам и так далее – смысл один расслабление организма и сознания.
    • изменение окружающей среды. Раньше, когда я активно курил – достаточно было, выкурить сигарету и это отлично концентрировало. Бросив курить вариантов стало меньше – выйти на улицу подышать воздухом, выпить чашку кофе или чая и так тому подобное. У всех этих способах есть свои ограничения как и во всех воздействиях на собственный организм.

Например, вот этот текст я набросал как раз в один из таких промежутков как маленькую задачку систематизации. И по этой же причине обычно когда я пишу тексты в ЖЖ, я редко реагирую на комментарии сразу же. Поскольку обычно текст пишется на порыве или в рабочую паузу, после чего переключение на другую задачу и где-то через пол часа или чуть дольше проверка по незримому таймеру.

Из всего этого неправильно только одно – если что-либо из перечисленного происходит неосознанно, то деятельный ритм нарушается.


Апр 24 2010

Про паттерны управления временем

Tag: из жизниivbeg @ 11:05 дп

Вновь и стремительно почувствовал что эта тема для меня стала актуальной уже по второму кругу. Если раньше я просто планировал и, по большей части, решал задачи простыми трюками из GTD – вроде «если что-то можно сделать за 5 минут – сделай это немедленно», ведением приоритетов дел и так далее, то сейчас уже требуются корректировки. Во первых изменились активности если раньше я в основном занимался производственной деятельностью – управление проектами, аналитика, проектирование проектов и лишь изредка сетевая активность в блогах. То сейчас больше _разной_ деятельности.

Поэтому этот пост нечто вроде систематизации рефлекции, но без выводов, просто рассуждения вслух.

После недолгой систематизации, я выявил следующие свои активности:

  • производственная – создание проектов в части проектирования, анализа, разработки и контроля результатов. Коммерческие и некоммерческие – все вместе.
  • аналитическая – собственно все статьи что идут через Полит.Ру, мой блог и некоторое количество непубличных материалов
  • исследовательская – это алгоритмы вроде Скиура и построения рейтингов, построение онтологий в OWL, сбор «первички» для разработки новых алгоритмов
  • чтение нового – я сейчас читаю много материалов по законодательству и госуправлению
  • организационная – формулирование требований, подбор людей, встречи и так далее
  • евангелистическая – выступления на семинарах, конференциях и тому подобное.

Ну и конечно ещё есть личная жизнь и культурный досуг. Итого: вся без исключения деятельность разноплановая и от того порой непросто переключиться быстро с одной на другую.

А некоторые результаты просто становятся хуже, например, мне не нравятся собственные презентации, но объективно понимаю что для подготовки их с лучшим качеством нужна система или порыв / состояние сознания.

Частично решается за счёт определения интервалов непрерывной деятельности с последующей реприоритизацией. Когда задаёшь промежуток времени в течении которого занимаешься только одной выделенной задачей. Как только задача заканчивается, на краткий промежуток времени необходимо переключиться на что-то ещё, вернуться к списку задач и продолжать.

Однако нюансы. Первое с чем я лично сталкиваюсь с тем что невозможно на все случаи наложить лишь одну схему принятия решений. Фактически, здесь та же ситуация как с громкостью звонка на телефоне которую можно настроить разной в зависимости от того где ты находишься – в помещении, в на улице, в транспорте и так далее.

Так же и здесь, есть ряд индивидуальных и обобщённых особенностей который приводят к тому что я бы назвал: паттернами самоорганизации или паттернами управления времени.

Я приведу некоторые факторы:

1. Собственное физическое состояние – можно расписать детально, но можно сразу упростить. Состояние можно разделить как адекватное и со значительным отклонением. Первое – это естественное ежедневное состояние, второе – повышенная аллергия, простуда, какая-либо другая зараза и так далее.

2. Время суток - в разное время суток различная деятельность оказывается более эффективной. Чаще всего это индивидуально. У меня лично наиболее продуктивные периоды периоды времени с 22:00 до 2:00 и c 6:00 до 9:00, у других людей по другому.

3. Внешние раздражители – резкие запахи, шумы, свет, яркие цвета и так далее. По большому счету это всё – информационный шум для мозга, с той лишь разницей что определённая длительность воздействия того или иного раздражителя может влиять на физическое состояние. Например, от курения поблизости у некурящих может болеть голова и так далее.

4. Эмоциональное состояние - эмоции не особо и не всем поддаются управлению, однако их влияние на то какая работа может иметь результат, а какая нет – очень заметно. Например, рутинную работу можно выполнять в почти в любом состоянии, а вот аналитическую работу можно проводить далеко не всегда.

5. Наличие жёстких сроков, сильное внешнее давление – простой пример, когда что-то нужно сделать вчера. А то есть в условиях жёстких и даже жесточайших сроков. Когда какие-то задачи обладают максимальным приоритетом.

6. Управляемость потоком задач – это, тоже, характеристика внешнего давления. Фактически это оценка вероятность и последствия возникновения новых задач вне планов, предугадать которые на 100% очень сложно. Например, заказчик даёт новые вводные по проекту. Или в круге общения есть ряд людей/заказчиков/партнёров  встречи с которыми необходимы и их временем управляете не Вы. Сюда же можно отнести друзей и родственников которые могут срочно попросить что-то «отвезти», «помочь», «позвонить» и так далее.

7. Ограничения среды

Например, сложно проектировать систему за рулём автомобиля, или же писать коммерческое предложение стоя в метро и так далее. В разные периоды времени  местонахождение и окружающая среда накладывают свои ограничения.

Continue reading «Про паттерны управления временем»


Апр 15 2010

Новый сайт ГУСП (Главное Управление Специальных программ Президента)

Tag: из жизниivbeg @ 4:18 пп

Оказывается у ГУСП обновился официальный сайт

Плюсы у него несомненно есть, например, дизайн улучшился, страницы стали посиматичнее.

Я же о минусах:
1. Нет RSS! Да и новостей там нет… Но хотя бы к публикуемым нормативным документам можно было бы прикрутить RSS.
2. Половина экрана – статическая картинка

Правда, конечно если честно, то ГУСПа как и других закрытых ведомств деятельность непубличная и большая её часть публичной быть не может в принципе.


Мар 31 2010

Всякие разъяснения

Tag: из жизниivbeg @ 11:47 дп

Поскольку мне тут в очередной раз задают повторяющиеся вопросы, я в одном посте на них поотвечаю предельно честно.

1. Несмотря на то что я изредка публикуюсь на Полит.Ру и то что некоторые СМИ (http://www.newsru.com/russia/30mar2010/sajti.html) называют меня там обозревателем – это не так. Я работаю не в Полит.Ру, а делаю и веду для Полит.Ру проект Гослюди.Ру , статьи же дело инициативное. В любом случае я журналистом я не являюсь и планов таких нет.
2. Не являясь журналистом, сейчас я занимаюсь технологиями обработки и анализа данных в небольшой компании/стартапе в качестве CTO. Некоторые результаты этой деятельности доступны публично, например, Скиур, некоторые пока недоступны, а некоторые врядли будут доступны когда либо.
3. Про госзакупки, госсайты, госблоги и так далее я пишу по той причине что интересуюсь государством (не политикой!) и многим из перечисленного плотно занимаюсь. Пока рано говорить как и что будет результатами, но они будут.
4. Я не ищу работу по найму и чем я занимался когда-либо можно узнать в моём профиле http://ivbeg.moikrug.ru/.
5. Я представляюсь создателем проектов Гослюди.Ру и OpenGovData.ru – по той причине что привлекаю к ним внимание. Могу представляться и иначе, но пользы от этого не вижу.

Как то так.


Мар 29 2010

Freebase Gridworks

Tag: из жизниivbeg @ 12:59 пп

Любопытный скринкаст внутреннего сервиса в FreeBase по очистке и трансформации структурированных данных в виде CSV файлов. Что

Freebase Gridworks 1.0 beta Overview from David Huynh on Vimeo.


Мар 27 2010

Примеры работы с геополитической онтологией

Может быть кто-то помнит, в январе месяце я публиковал OWL описание геополитической онтологии России вот тут – http://ivbeg.livejournal.com/252756.html.

И тогда были вопросы, а как же с ней работать.
Чтобы немного упростить эту задачу приведу несколько способов
1. OpenLink Data Expolorer
Открываете ссылку http://linkeddata.uriburner.com/ode/

и вбиваете туда http://schema.opengovdata.ru/core/regions.owl
в результате появится интерфейс для различных способов навигации по онтологии
выглядящий примерно вот так

В правой панели можно настраивать фильтры по свойствам, что я и делал как можно увидеть на скриншоте. Например, можно увидеть какие регионы в каких часовых поясах и так далее

2. RedLand Rasqal RDF Query
Это инструмент для исполнения SQARQL запросов онлайн и доступный тут http://librdf.org/query. В качестве эндпоинта ему задаётся http://schema.opengovdata.ru/core/regions.owl, а в качестве скрипта запрос который хотелось бы исполнить.
Например, такой:

PREFIX reg:
select ?x ?taxCode ?nameEN ?nameRU ?codeOKATO ?codeKLADR where { ?x
reg:taxCode ?taxCode;
reg:nameEN ?nameEN;
reg:nameRU ?nameRU;
reg:codeOKATO ?codeOKATO;
reg:codeKLADR ?codeKLADR;
} ORDER BY ?taxCode

3. Пример кода на Python
И для тех кто ищет как попроще и что-то готовое

Прилагаю скрипт на Python который извлекает список регионов из OWL отпечатывает в TSV формате. Всё что для него нужно это библиотека RDFLib


#!/usr/bin/env python
# -*- coding: utf-8 -*-
import csv
from StringIO import StringIO
from rdflib.Graph import Graph
from rdflib.sparql.bison import Parse

def convert_regions():
g = Graph()
g.parse('http://schema.opengovdata.ru/core/regions.owl')
parsed_query = Parse("""
PREFIX reg:
select ?x ?taxCode ?nameEN ?nameRU ?codeOKATO ?codeKLADR where { ?x
reg:taxCode ?taxCode;
reg:nameEN ?nameEN;
reg:nameRU ?nameRU;
reg:codeOKATO ?codeOKATO;
reg:codeKLADR ?codeKLADR;
} ORDER BY ?taxCode
""")
resp = g.query(parsed_query).serialize('python')

io = StringIO()

wr = csv.writer(io, delimiter='\t')
for o in resp:
wr.writerow(o[0:4])
print io.getvalue()

if __name__ == "__main__":
convert_regions()


Следующая страница »


Rambler's Top100