Вопросы: Датасеты с миллионами ссылок

Однажды я, по моему, уже спрашивал, но может быть кто-то подскажет где бы взять хотя бы несколько миллионов, а лучше больше, ссылок по сайтам в Рунете? Интересуют ссылки хотя до 2-го уровня, но лучше глубже.

По аналогии такие выборки есть для UK в их WEBSPAM выборке — http://www.yr-bcn.es/webspam/datasets/ плюс несколько больших выборок в проекте Webgraph (сейчас недоступен), но ничего такого  для Рунета я не встречал. Оговорюсь сразу — я сейчас ищу только ссылки, без хостграфов и вебграфов.

About This Author

  • Дядя Федор

    Поиск по гуглу+граббер ссылок :-)

Яндекс.Метрика