Фото: depositphotos.com

Украинская компания Promo создала программу DeepCaptcha для разгадывания капчи (Completely Automated Public Turing test to tell Computers and Humans Apart). Об этом сообщил глава команды разработчиков Дмитрий Литавский.

Разработчики наводят пример, когда нужно пройти 10 000 страниц, на которые может выскочить 1000 капч.

Это значительно замедляет рабочий процесс - в среднем на одну капчу уходит 30 секунд. То есть 1000 капч = 500 минут = более восьми часов или один рабочий день.

Раньше для разгадывания капч существовали сервисы, работающие только в полуавтоматическом режиме - они отправляли капчу реальному человеку, который ее разгадывал и отправлял обратно.

Новая разработка помогает исключить человеческий фактор и значительно оптимизировать процесс: теперь парсинг может проходить не только быстрее, но и дешевле. Предполагается, что сервис в несколько раз ускорит работу с большими данными. 

DeepCaptcha разгадывает 1000 капч приблизительно за 30 грн, в то время как полуавтоматические аналоги обойдутся в среднем $2-3 за такое же количество. Его действия согласованы со всеми требованиями политики конфиденциальности Google.

Программа создана с применением технологий автоматизированного обучения. Она состоит из трех основных блоков:

1. программная части логики сервера (back-end);
2. кликера - программы, которая кликает на изображения;
3. нейронных сетей — интеллектуальная часть, которая распознает конкретные изображения на картинках.

Команда Big Data SEO занималась разработкой около полугода. Средняя точность разгадывания со второй попытки на сегодня - 98%.

Сервис работает в тестовом режиме. Сейчас есть возможность бесплатно его протестировать.