Лингвистика. Частотный анализ и простая каптча
Про анализ текстов и частот букв в частности я писал ранее в «Лингвистика. Частотный анализ — 2«.
Сейчас же приведу пример для чего создаются и могут применяться частотные таблицы и позиционно-частотные таблицы. Одна и наиболее напрашивающихся областей применения — это преодоление блокировки каптчей.
Например, если для каптчи используются слова английского или русского языка, то даже распознав лишь пару букв, желательно хотя бы первую и последнюю буквы, можно преодолеть каптчу сильно ограничив число вариантов перебора.
Вообще же я считаю что преодоление каптчи — это задача на стыке обработки изображений и анализа криптоалгоритмов и зависят исключительно от алгоритмов и аппаратных возможностей. Поэтому, судя по развитию технологий, скоро обычные каптчи станут неэффективными.
Поделиться в соц. сетях
-
Grau-welf
-
http://ivan.begtin.name ivbeg
-
http://russian-seo.ru/ koreshochek
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- apps4russia (1)
- blogging (61)
- couchdb (3)
- data.gov.ru (273)
- datasets (115)
- diagramming (11)
- e-Government (993)
- eGov (1012)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (218)
- opensource (57)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (16)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- whenyouknowthereasonswhy (1)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (13)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (21)
- госзаказ (173)
- задачки (1)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (116)
- открытые данные (70)
- поиск (93)
- почти несерьёзно (16)
- размышления (128)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (46)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (1016)
- юзабилити (25)
- юмор (15)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability






