Антистартап из Днепра: как очистить суды от "нерухомого лайна"

За короткие 2 года команда проекта Суд на ладони успела многое. Умудрилась создать аналог Prozorro для украинской судебной системы. Выиграла 1,5 млн грн в трех конкурсах. Без рекламы за пару месяцев обросла сотнями постоянных пользователей. На днях создатели заканчивают тестирование и начнут зарабатывать на государственных данных.
При всем этом они упрямо называют себя “антистартапом”.
Журналист LIGA.net познакомился с соучредителями проекта Кириллом Захаровым и Ольгой Бугай на VII Судебном форуме. И допросил их с пристрастием: о деньгах, об ошибках в судебном реестре и о том, что же в команде такого антистартаперского.
Что это и как работает
Суд на ладони - это такой себе Google по судебному реестру. Пользователь может вбить в поисковую строку запрос, а система роет его по судебному реестру и множеству смежных. Как Prozorro - только для судебных решений и связанной с ними информации.
Вообще-то подобный поиск работает и в государственном судебном реестре, который и так доступен любому украинцу. Но, как говорится, есть нюанс.
“Мы работаем со связанными данными - и это важно, - указывает Кирилл Захаров, соучредитель и разработчик Суда на ладони. - В реестре судебных решений фигурируют только юрлица. У юрлиц есть учредители и руководители, которые есть в Едином реестре. Мы тянем оттуда информацию обо всех. В тексте судебных решений ни учредители, ни руководители не упоминаются и не могут быть упомянуты. А мы предоставляем возможность все это сопоставлять”.
Поэтому, если, к примеру, запросить у Суда на ладони “Порошенко Петро Олексійович”, получится полный список судебных решений по компаниям, в которых действующий президент является бенефициаром или руководителем.
Результаты поиска - ссылки на судебные решения с предпросмотром. К ним сразу предлагается множество фильтров и статистика - как в интернет-магазине при поиске техники.
Например, можно искать решение с указанным запросом в конкретных судах. Сразу видно и суды, и количество решений, которые были приняты конкретными судьями по конкретным категориям дел. Доступны номера дел, производства, имена конкретных адвокатов, арбитражных управляющих, нотариусов.
Все это можно кликать и свой первичный запрос уточнить ровно до того момента, который интересует пользователя больше всего.
“У нас не только судебный реестр. Еще реестр адвокатов, арбитражных управляющих. Адвоката тоже можно найти полнотекстовым поиском: по месту расположения, по фамилии, по делам, в которых он участвует. Это можно сделать буквально в 3 клика мышью. По адвокату можно увидеть всю статистику: категории дел, выигранные и проигранные дела”, - говорит разработчик.
В сентябре 2018-го команда вылила в общий доступ полнофункциональное демо. Суд на ладони уже интегрирован с Prozorro и Dozorro. Есть меморандум о сотрудничестве с Clarity Project. На днях заканчивается тестирование и стартует коммерческая версия продукта.
А началась история еще 6 лет назад.
Откуда сами?
Кирилл Захаров, Ольга Бугай и их коллега Елена Данцева живут и работают в Днепре. С ходу вообще не понятно, что их привело к судебной теме. У Захарова - психологическое и физико-техническое образование (“Я в теории умею строить жидкостные ракетные двигатели”, - улыбается Кирилл). Ольга - филолог и культуролог. Елена - тоже психолог.

В 2012 году компания занималась политическим консалтингом. Тогда же к команде впервые обратились с вопросом по реестрам. Заказчик хотел находить все судебные решения по компаниям, которые судятся в Днепропетровской области. Но помочь тогда было трудно - необходимая информация просто была недоступна.
“Среди наших клиентов были не только политики, но и юристы, юридические компании, адвокатские объединения. Одним из наших соучредителей был адвокат. Мы не оказывали юридические услуги, но видели, с какими проблемами сталкиваются юристы, на что есть внутренний запрос”, - рассказывает Ольга Бугай.
А в 2015 году Кабмин инициировал массовое открытие государственных данных. Очень многие госорганы начали публиковать интересные наборы информации для обработки.
Наконец, в начале 2017 года судебная администрация опубликовала весь текстовый архив судебных решений. К этому времени команда уже понимала, что такое судебные решения, как работает судебная система, как применяется право.
По словам Кирилла Захарова, сам текст судебного решения - это полуструктурированная информация. Он пишется по определенным правилам, канонам, с соответствующими “штампами”. А значит к тексту можно подойти с определенными правилами. И с помощью этих правил извлекать из него те или иные значимые элементы.
Антистартап на интересе
Почти одновременно с открытием судебного реестра начался Open Data Challenge - конкурс среди стартапов, работающих с открытыми данными. По утверждению соучредителей, им просто стало интересно попробовать себя в этой теме. О бизнесе на данных речи еще не было.

На конкурс соучредители приехали с двумя идеями по извлечению информации из судебных решений. А уехали озадаченными. За два дня работы стало понятно, что вместо 3 используемых реестров понадобится 10.
“Было примерно так: наша ментор-юрист рассказывала, что она ищет в реестре, какие проблемы там находит, а мы говорили: “Да! И это мы сделаем! И это тоже!” Когда ментор вышла, я сказал: “Оля, мы что-то столько всего наобещали…” - смеется Кирилл Захаров.
Параллельно Open Data Challenge команде попались еще два конкурса для юридических стартапов: Hiil и Aequo Legal Tech Challenge. Во всех трех конкурсах Суд на ладони одержал победы, будучи при этом единственной командой без юриста. Как говорит Кирилл Захаров, даже те, кто поверил в презентации и дал команде приз, первые полгода не знали, получится ли из этого хоть что-то.
“Поэтому я нас называю антистартапом. Менторы настраивают стартапы на решение какой-то конкретной маленькой проблемы и бурный рост. Как говорится, “раз-раз - и в продакшн” - только вместо “раз” сами знаете что, - улыбается Ольга Бугай. - Но мы решили: сделаем нормальный большой проект”.
Очистка данных от “лайна”
На первый взгляд работа проекта понятна. Раз в сутки судебная администрация публикует полную таблицу с метаинформацией обо всех судебных решениях. Нужно скачать этот архив, распаковать, выбрать заменившиеся записи. Потом скачать все новые решения и разобрать их в системе.
Главный подвох - в самих данных. В текстах часто полно опечаток. Из-за этого нужные решения не попадали в поисковую выдачу.
Поэтому, прежде чем перейти к алгоритмам извлечения, команда много времени потратила на препроцессинг - максимальное исправление всех возможных ошибок в текстах.
“Мы берем текст судебного решения, очищаем его и уже очищенный сохраняем у себя. К этой версии и применяем алгоритмы. Это позволяет нам по сравнению с другими аналогичными сервисами достичь как минимум большей точности”, - объясняет Кирилл Захаров.
Сейчас, применив алгоритм, Суд на ладони сразу видит, где в решениях судьи ошибаются. Из смешного: можно встретить номера уголовных производств, которые по кодам, вшитым в номер, начались в 3012 году. Или увидеть, что в Украине есть “державний реєстр нерухомого лайна”.

Кирилл полностью писал код сам. Из-за возни с препроцессингом, долгое время людям было нечего показать. По его словам, когда дело дошло до первых набросков front end, многие выдохнули.
У работы с госданными есть и другая проблема.
“К сожалению, ни один стартап не может давать информацию оперативно, - объясняет Захаров. - Некоторые решения могут долго не публиковаться судами. Некоторые могут зависать на уровне информационных систем судебных администраций. О реалтайм-оповещениях речь идти не может”.
Проверь судью
Соучредители говорят, что одна из главных фишек Суда на ладони - можно увидеть типичные и атипичные решения.
К примеру, человек знает, что его дело попадет к конкретному судье. Он может настроить поиск по фильтрам: судья, законодательство, конкретная статья. Посмотреть статистику по принятым и отклоненными искам. И понять, как судья понимает конкретную норму, трактует и применяет ее.
Отклонения в такой статистике тоже видны. Если в действиях судьи что-то не совпадает с более ранними решениями, это либо специфические кейсы, либо никаких оснований нет и нужно копать глубже.
“Так мы хотели предоставить юристам возможность найти предыдущие решения, показать практику конкретных судей и судов при рассмотрении дела”, - объясняет Кирилл Захаров.
А что мешает юристам это делать без Суда на ладони?
Собственно, ничего. Как говорят соучредители, если есть какое-то дело, и нужно разобраться в практике, обычно берут младших юристов, садят их за существующий судебный госреестр, и те проводят там по 24 часа в сутки, пытаясь накопать то, что им надо. “В итоге найденное не претендует на полноту. Сделать однозначный вывод с опорой на статистику - в принципе невозможно, потому что люди максимум просто собрали куски текста”, - говорит Захаров.
Эту монотонную и полную потенциальных ошибок работу проект и пытается автоматизировать.
На вопрос, кому нужен продукт, Кирилл и Ольга хором отвечают: “Всем!”. Но, конечно, в первую очередь адвокатам, юристам, судьям, нотариусам, прокурорам, следователям, арбитражным управляющим, судебным экспертам. А еще журналистам, антикоррупционным инициативам - для них полный доступ будет бесплатным.
По словам Ольги Бугай, с начала тестового периода у проекта набралось 1000 уникальных пользователей, а 28% возвращаются. На всех них приходится 10 000 уникальных сеансов. Партнеры считают, что это отлично - ведь проект вообще не давал никакой рекламы, только приглашал отдельные группы к тестированию.
Потратить и заработать
Развивали проект соучредители на свои - брали из основного бизнеса. По их словам, это стоило порядка $5-7 тысяч в месяц. Пришлось затянуть пояса: говорят, уровень жизни упал вдвое.
Потом начали поступать призы от конкурсов. $20 000, 10 000 евро и 500 000 грн - суммарно около 1,5 млн грн.

От инвестиций Суд на ладони отказался. Ольга Бугай говорит, что предложений было очень много - и корпоративных, и индивидуальных. По словам ее партнера, для такого сервиса важно, чтобы у пользователей была уверенность в его независимости. Никакая компания, тем более юридическая, не должна влиять на его политику.
А что же сейчас с независимостью?
“Мы не зря ведем довольно активную публичную деятельность и демонстрируем полную прозрачность - все публично взятые наши обязательства заставляют нас по-прежнему держаться. И Суд на ладони, и мы с нашей деятельностью - полностью на ладони”, - говорит Кирилл Захаров.
Что касается заработка, для индивидуальных пользователей продукт обойдется в эквивалент $20 в месяц. Для корпоративных клиентов - отдельные программы. Также будет вариант доступа на день и особенные условия для регулярных пользователей системы.
Об окупаемости говорить не спешат. Ольга Бугай уверена: реальные прогнозы можно будет делать после хотя бы полугода продаж.
А вот в спросе соучредители не сомневаются. В стране они насчитали порядка 500 000 потенциальных пользователей: юридических и коммерческих компаний, 44 000 адвокатов, 10 000 судей.
“Даже если от них взять 2-5%, это не только покроет затраты, но и позволит достаточно интенсивно развиваться”, - считает Кирилл Захаров. К примеру, применять машинное обучение с технологиями распознавания языка, а не делать систему, построенную на правилах. Можно будет выстраивать прогнозные системы решений. И выходить на мобильные платформы со специфическими функциями.
Конкуренты не дремлют
Конечно, судебный реестр - лакомый кусочек не только для команды из Днепра.
“Благодаря оцифровке всех судебных решений у украинских legal tech разработчиков появился громадный массив "сырых" данных, на базе которых можно разворачивать множество продуктов”, - говорит Александр Попов, руководитель юридического направления ЛІГА:ЗАКОН. У компании есть решение, которое работает с тем же архивом и той же идеей, что и у Суда на ладони.
По словам Попова, нынешние продукты ЛІГА:ЗАКОН уже позволяют достаточно быстро, в течение буквально 15-20 минут, обнаруживать "нетипичные" решения, выявлять закономерности рассмотрения определенных категорий дел, определять позиции конкретных судей в тех или иных делах. “А значит общество может задавать более предметные вопросы о мотивах принятия тех или иных судебных решений”, - утверждает представитель ЛІГА:ЗАКОН.
Также есть система Прецедент. Она дает возможность полнотекстового многоступенчатого поиска. Там можно ввести запрос, уточнить еще одним текстовым запросом, использовать минус-слова - в общем, всячески фильтровать результаты до искомого.
Смежным маршрутом с проектом идут коллеги по конкурсам - Опендатабот и Vkurse. Также - YouControl и Contragent. Они в том числе работают с судебным реестром, правда, фокусируются на аналитике по юридическим лицам.
“Любые новые подходы к анализу открытых государственных данных, разработка решений для бизнеса - это очень хорошо. Такие проекты мы всегда поддерживаем и помогаем с экспертизой”, - говорит Алексей Иванкин, основатель Опендатабот. Он добавляет, что для развития экосистемы важно не только качество и количество продуктов, но и максимальный охват аудитории.
Суд на ладони кажется компании достаточно сложным инструментом. По словам Иванкина, Опендатабот в этом году запустил поисковик по судебному реестру Бабушка - с ним, дескать, точно разберется и бабушка, и подросток.
О тех, с кем на рынке придется потолкаться локтями, партнеры говорят спокойно и открыто. “Одна из причин, почему мы не спешили выливаться в продакшн - знали, что выходим на рынок, где есть очень серьезные и толковые продукты”, - говорит Кирилл Захаров.
Ошибки и планы
Кирилл Захаров смеется (не без горечи) и называет дедлайны своим ключевым факапом. Ведь с ходу было непонятно, с какими грязными данными придется работать. На скорости разработки это очень отразилось.
“Дедлайны - это не кокетство, это реальный факап, - добавляет Ольга Бугай. - Это и истощение собственных моральных ресурсов и мотивации, время, за которое растут конкуренты, время без поступления денег, риск снижения доверия от тех, кто ждет ресурс. В конце концов, риск выхолащивания идеи - когда о ней были только разговоры, но не было продукта”.
Но это во многом позади. А впереди - новые идеи.
Например, одна из вещей, которая стартует с релизом, - анализатор документов WINCOURT. В него можно будет залить любой исковой или процессуальный документ. По тексту пробежит алгоритм, находя все сущности. Так пользователь сможет себя проверить, правильно ли он все заполнил.

Тот же алгоритм смотрит судебные решения, которые содержат похожую текстовую часть. По ним сразу предоставится вся связанная статистика. То есть косвенно можно будет оценить вероятность того, какое будет принято решение. А если человек в законодательстве вообще не ориентируется, он может получить рекомендации, что ему при такой постановке дела следует просмотреть - вплоть до конкретных статей и частей.
По его словам, сделанное на сегодня - только первая часть. Есть план развития сервиса года на два. А так как система выстроена по принципу API First, Суд на ладони готов сотрудничать с командами, которым интересно поработать с его данными.
Страха, что однажды государство сделает такой же функционал бесплатно, у проекта тоже нет. Бизнес, мол, всегда развивается немножко быстрее государства.
По словам разработчика проекта, команда уже нашла 5 бизнес-идей, где можно применить алгоритм, который создан для вытягивания различных сущностей из текста, и заработать на этом.
"Фактически, плотно работая и с научным комьюнити, и с практиками, всегда можно быть на шаг впереди государства. А государству отдавать то, что не позволяет выстроить систему как бизнес", - уверен Кирилл Захаров.