Посты в категории: datasets

Ссылки: Алгоритмы и массивы данных

Data.gov.ru — размышления и обобщённая основа создания ресурса

Продолжая тему возможности пояления data.gov.ru предлагаю к публичному обсуждению мои собственные мысли на эту тему. Описания неуглублённые, а именно что общие для понимания направления действий. По возможности я постарался избежать бюрократической терминологии, но полного отсутствия вогонечности официальных терминов всё равно не удаётся.

Дальнейшие рассуждения я разделю на следующие разделы:

Читать больше

Датасеты. Автомобили для госзакупок

Пока я работаю над общим списком массивов данных, выкладываю тут датасет с переченем легковых автомобилей ранее опубликованный МинПромТоргом в приказе N78 от 20 февраля 2009 года. Там фигурирует вордовый документ, который тут присутствует в преобразованном в CSV виде. 

Желающием могут попробовать посводить этот список с другими массивами данных — может кто

Читать больше

Инструменты работы с данными. Мысли и наблюдения

В последнее время много времени уделяю различным инструментам работы с информацией — очистка, обработка, конвертация, визуализация и всё что с этим связано. Общее число инструментов весьма велико, как и число их возможных применений.

Просуммирую собственные размышления:

  • большая часть инструментов работы с большими массивами информации написаны на Java. То же самое можно сказать

    Читать больше

Ссылки на 11.03.2009. Источники данных.

Пока я собираю полный перечень источников различной статистической информации и просто массивов данных и API, приведу несколько интересных ссылок оттуда:

Веб данных

Не так давно Amazon выложил в открытый доступ огромный массив данных, в несколько террабайт — Public Data Sets on AWS 

Правда самих выборок там немного, но они огромны и весьма интересны. 

А я напомню какие ещё интересные подборки данных есть в Веб:

Яндекс.Метрика