Посты в категории: web

Ссылки. Открытые данные в мире

  • Microsoft инциировали Open Government Data Initiative http://www.microsoft.com/industry/government/opengovdata/default.aspx где они собирают открытые данные, пока исключительно из США, на своей платформе. Инициатива интересная, жаль лишь что охватывает только GSA (General Services Administration) и Округ Колумбия.
  • Data Catalog Distict of Columbia (http://data.octo.dc.gov/) открытые данные публикуемые округом Колумбия. Я упоминал их и и ранее и

    Читать больше

Guardian Open Platform — доступ к базе новостей

В Guardian, британской газете, анонсировали открытую онлайновую платформу через которую можно получить доступ к их материалам — http://www.guardian.co.uk/open-platform 

Посредством API они отдают данные и дают доступ в некоторые из своих медиа-массивов, с примерами доступа на Python, Ruby, PHP, Java. 

Фактически, что я лично наблюдаю, Guardian идёт тем же путём что и New

Читать больше

Веб данных

Не так давно Amazon выложил в открытый доступ огромный массив данных, в несколько террабайт — Public Data Sets on AWS 

Правда самих выборок там немного, но они огромны и весьма интересны. 

А я напомню какие ещё интересные подборки данных есть в Веб:

Official SEC Feeds (официальные RSS ленты раскрытия данных SEC)

Как можно увидеть на скриншоте SEC (US Securities and Exchange Comission) официально начало предоставлять RSS ленты по отдельным организациям что позволяет отслеживать документы публичных организаций обязанных отчитываться в SEC, практически сразу же.

screenshot081

Это к вопросу о том как небольшие технические изменения

Читать больше

Эффективное создание файлов Sitemap для моделей Django

Я обычно пишу мало про практическое программирование потому как не так часто им давно уже занимаюсь,  но некоторые трюки и подходы могут быть полезны особенно тем кто программирует на Python и Django.

Например, в публичном репозитарии Поискуна теперь доступен Django sitemap generator скрипт по генерации файлов sitemap включая индексы sitemap’ов для

Читать больше

OpenGovData. Спецификации раскрытия данных

Продолжая тему открытых данных и OpenGovData.ru проект продолжает развитие маленькими, очень маленькими, но верными шагами. Сейчас я предлагаю к обсуждению спецификацию и принципы раскрытия информации плюс непосредственно пару массивов опубликованных по этой спецификации.

Скажу заранее — подготовка спецификаций и продумывание способов работы с данными проходили по принципу упрощения всего что только

Читать больше

Дизайн vs. Информационная архитектура

Чтобы понять разницу между дизайном и информационной архитектурой — мало объяснений нужны и примеры.

Недавно у меня перед глазами такой пример образовался — обновился официальный сайт закупок Воронежской области, http://zakaz.gfu.vrn.ru

Точнее вместо старого сайта появился новый.

Причём к новому сайту в плане дизайна у меня серьёзных претензий нет — доводилось видеть как хуже

Читать больше

Xenocode: песочница из браузеров

На днях наткнулся на интересную и бесплатную подборку виртуализироанных браузеров — Xenocode browsers

Фактически это один из примеров Application Virtualization, что, (обычно), куда быстрее чем полная виртуализация или паравиртуализация.

В случае же с браузерами удобство в возможности проверять веб-сайты в браузерах разных версий, к тому же «в песочнице».

Ещё один плюс —

Читать больше

Ссылки на 14.02.2009. Не-реляционные базы данных

Базы данных

  • CouchDb — бесплатная документо-ориентированная система управления данными с открытым исходным кодом и входящая в состав проектов Apache Foundation
  • Project Voldemort — совсем недавно появившаяся система ориентированная на горозонтальную расширяемость
  • Mongo — система очень похожая на CouchDb, но приближающаяся к хранению объектов
  • Drizzle — движок на базе MySQL 6.0

    Читать больше

Датасеты от Mozilla. Почему удаляют Firefox

На днях обнаружил что Mozilla на сайте survey.mozilla.com публикуют информацию и (что немаловажно!) полные датасеты в CSV с описанием причин и числа удалений Firefox’а с рабочих компьютеров.

Например, можно посмотреть почему удаляют Mozilla Firefox 2.0 и скачать этот датасет в CSV

В полных датасетах содержатся не просто причины удаления браузера,

Читать больше

Яндекс.Метрика