LiWA: Живые веб-архивы
Оказывается ещё в 2007 году Евросоюзе запустили проект LiWA: Living Web Archives (http://liwa-project.eu) в рамках которого нацелились на разработку технологий архивации веб-сайтов. Что, в общем-то, логично электронных документов, в том числе публикуемых онлайн, сейчас становится больше чем бумажных.
Готовых продуктов я там не увидел, зато есть масса исследований разной степени полезности. От анализа изменений в терминологии при работе с архивными документами, до непосредственно презентации LiWA. Загляните в раздел Публикации, может быть и найдёте что-то стоящее.
Однако я хочу обратить внимание на следующее:
1. Как пример того как делаются НИР в рамках одной темы: участвуют только университеты, никакого госзаказа, а только гранты, публичность результатов, обязательное участие в отраслевых мероприятиях и даже видеозаписи лекций и презентаций результатов.
2. Важна изначальная цель — архивация именно веб-сайтов. Кстати, найдёт ли кто-нибудь в России требования к долгосрочному электронному хранению документов и обязательному сохранению архивов? Не думаю. А вот ряд законов где явно прописан ограниченный срок хранения документов и отсутствуют какие-либо требования по архивации после этого срока имеются.
А вот если бы до/вместо Национальной Поисковой системы построили бы Национальную Архивную систему - была бы совсем другая история. Был бы огромный массив информации, по которому и искать было бы не стыдно. Конечно, нужен не только он, но что нужен безусловно.
И, конечно, у этой темы есть и коммерческое развитие. Например, PageFreezer (http://pagefreezer.com/) и WebsiteArchive (http://www.website-archive.com)
Поделиться в соц. сетях
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- blogging (61)
- couchdb (3)
- data.gov.ru (250)
- datasets (104)
- diagramming (11)
- e-Government (925)
- eGov (944)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (197)
- opensource (56)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (15)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (12)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (20)
- госзаказ (172)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (49)
- открытые данные (8)
- поиск (93)
- почти несерьёзно (16)
- размышления (127)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (45)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (943)
- юзабилити (25)
- юмор (14)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability







