ОТЗЫВЫ ПОД ПРИСМОТРОМ
Кто и как следит
за нашими Словами
в интернете и сми?

ЛІГА.tech
11.03.2019
ОТЗЫВЫ ПОД ПРИСМОТРОМ
Кто и как следит
за нашими Словами
в интернете и сми?

ЛІГА.tech
11.03.2019
Бренды, компании и политики тщательно мониторят все, что о них говорят в интернете и СМИ.
Даже если мы ругаем сервис, смартфон или Тимошенко глубоко в комментариях
Евгений Шишацкий
корреспондент ЛІГА.tech
Close
Close
0. ПРОЛОГ
- кейс, знакомый каждому
- о чем этот текст?

1. КТО
- украинский рынок мониторинга и несколько его представителей
- как компании отстраиваются друг от друга?
- как можно различить поставщиков?

2. КАК
- этапы работы систем: сам мониторинг, поиск, анализ
- почему так сложно работать именно с текстом?

3. КОМУ
- с кем работают мониторинговые компании?
- что говорят сами клиенты?
- за что платятся деньги?
- кейс посложнее

4. ЗАЧЕМ
- как еще теоретически может использоваться мониторинг?
- соблюдается ли этика работы с данными?

5. ЭПИЛОГ
ВНУТРИ
0. ПРОЛОГ
- кейс, знакомый каждому
- о чем этот текст?


1. КТО
- украинский рынок мониторинга и несколько его представителей
- как компании отстраиваются друг от друга?
- как можно различить поставщиков?


2. КАК
- этапы работы систем: сам мониторинг, поиск, анализ
- почему так сложно работать именно с текстом?


3. КОМУ
- с кем работают мониторинговые компании?
- что говорят сами клиенты?
- за что платятся деньги?
- кейс посложнее


4. ЗАЧЕМ
- как еще теоретически может использоваться мониторинг?
- соблюдается ли этика работы с данными?

5. ЭПИЛОГ
Содержание также доступно по круглой кнопке внизу справа
0. ПРОЛОГ
Ольга очень зла. Вчера на своем мобильном счету она внезапно обнаружила долг в 40 грн. Из-за этого заблокировались исходящие звонки. Ольга попробовала позвонить в саппорт, но дважды запуталась в голосовом меню. К тому же за соединение с "живой" поддержкой нужно было снова-таки заплатить деньги, которых и так минус.

Выручил сайт оператора — там жалобу Ольги наконец-то приняли. Но прошли уже сутки, а звонки все так же заблокированы. Рассерженная, Ольга пишет пост на Facebook, и, не стесняясь в выражениях, ругает мобильщиков. Пусть и другие узнают о таком свинстве. Пара друзей поддерживают ее такими же возмущенными комментариями.

Через пару часов до Ольги доходит, что она забыла затегать страничку паразитов. Ведь так же ничего не увидят! Она открывает пост для редактирования, но под ним с удивлением обнаруживает комментарий от некоего Игоря:

"Добрый день, Ольга. Приносим свои извинения за созданные неудобства. Сложности со связью устранены, возврат средств произойдет в течение пары дней. С уважением, эксперт оператора ХХХХХ".

Ольга проверяет звонки — да, работают. Авансом лайкает комментарий Игоря. А в перепалку с экспертом оператора вступает ее подруга, у которой невесть почему снялись деньги за мелодию вместо гудка...

~
Этот кейс (с измененными именами) списан журналистом с реального поста. Такие ситуации сотнями встречаются в соцсетях, форумах, интернет-магазинах. Примеры можно увидеть здесь, здесь и здесь. А недавно и под постом страницы ЛІГА.tech случился микрокейс с участием Vodafone Ukraine.
Так это выглядит в реальности. Даже без тегания компании сотрудник службы поддержки Vodafone пришел с ответом.
Скорость реакции — 1 час.
Мониторингом упоминаний в СМИ и интернете и — важно — тональности этих упоминаний сейчас занимаются очень многие. Конечно, не только мобильные операторы. Похвалили тебя где-то — поставил себе плюсик, клиента поблагодарил. А если поругали или влили в сеть черный PR, возможно, система поможет тебе вовремя потушить пожар. Иногда достаточно извиниться. Иногда это сигнал, чтобы устранить проблемы в сервисе или плохом продукте. А иногда можно упредить происки конкурента.

Особенно эта штука популярна у производителей электроники, косметики, ритейла, фармы. Конечно, наблюдают за впечатлениями клиентов банки, рестораны, предприятия из сферы развлечений. В последнее время мониторингом занялись госучреждения, муниципалитеты. А во время предвыборной гонки (которая, на самом деле, почти не прекращается) активизируются политики.
~
Как системы умудряются вылавливать упоминания даже без явной отметки? Действительно ли мониторить содержимое СМИ и отзывы о себе стало так же обыденно, как закупить в офис бумагу? И почему при этом многие пользователи таких систем не хотят "светиться"?

LIGA.net решила приоткрыть завесу украинского мониторингового рынка.

Журналист пообщался с несколькими компаниями. Узнал, как они появились и развиваются. Поговорил с пользователями о кейсах (кто не постеснялся о них рассказать). А также обсудил этичность использования такого инструментария.
1. КТО
мониторит украинский интернет?
Следить за тем, что публикуют СМИ — занятие не новое. По разным данным, этим занимались еще в XVIII-XIX веках. Сначала больше по указке властей — вдруг какое-то издание возьмет и напечатает о них клевету (или просто что-нибудь неугодное)? Со временем в гонку за отслеживанием упоминаний включились и предприниматели. Печатная пресса, радио, ТВ и, наконец, интернет стали не просто вещателями. Почти все их содержимое тщательно препарируется.

В последние годы мониторинг перерождается. Нейронные сети позволяют автоматизировать сбор и анализ данных. Мощные серверы хранят и обрабатывают терабайты текстовых и графических сообщений, спокойно работая в сотнях километрах от самих аналитиков. Но и поток данных захлестывает все больше. Как минимум потому, что каждый пользователь соцсети превратился в маленькое СМИ.
~
На украинском рынке мониторингом занимаются еще с начала 90-х — с разной степенью успеха.

По разным оценкам, сейчас в стране - до двух десятков компаний, которые так или иначе зарабатывают на анализе СМИ и/или соцмедиа. Даже поверхностный поиск выводит на YouScan, Semantrum, LOOQME, SemanticForce, Noks Fishes, Corestone, Mediapulse, Ecosap, Центр контент-анализа, InfoStream. Есть и российские системы, вполне доступные у нас: BrandAnalytics, Kribrum, Babkee, Медиалогия.

Как именно они делят наш рынок, понять сложно. Сами компании делают предположения, есть впечатления клиентов. Но независимых исследований на эту тему нет.

Ниже — о нескольких распространенных украинских сервисах (нажмите на карточку, чтобы узнать подробности).
YouScan
"YouScan стал первой SaaS системой на рынке СНГ, специализированно разработанной для мониторинга социальных медиа", рассказывает основатель и CEO компании Алексей Орап.

Разработка продукта началась в 2009 году, и уже в начале 2010 года у проекта появились первые коммерческие клиенты. Сооснователи YouScan Алексей Орап, Александр Сирач, Леонид Литвиненко.

На начальном этапе в проект были проинвестированы средства основателей, включая его самого, а также seed-финансирование от европейского венчурного фонда The OpenFund. Проект также привлекал финансирование от американского стартап-акселератора 500 Startups на развитие своего второго продукта, LeadScanr (был закрыт в 2018 году).

В 2015 году компания привлекла дополнительные инвестиции от шведских фондов Kinnevik и Vostok New Ventures. СМИ тогда сообщили, что сервис отзывов и рекомендаций Yell.ru купил контрольный пакет акций YouScan, выкупив доли предыдущих инвесторов. Сумма сделки не разглашалась, но известно, что Yell планировал вложить $1 млн в развитие компании. При этом бренд YouScan сохранился, а основатели продолжили развивать компанию, оставшись миноритарными акционерами.

Обороты и оценки стоимости компания не разглашает. Как и планы по дополнительному привлечению инвестиций.

YouScan предоставляет услуги в Украине, России (на российском рынке компания работает с международными брендами, вроде Nestle, PepsiCo и другими, которым интересен мониторинг пользовательских дискуссий в русскоязычном сегменте социальных медиа), Казахстане и других странах СНГ. Также у YouScan есть клиенты из Евросоюза, Великобритании и США.

В команде проекта сегодня более 80 человек.
Semantrum
Semantrum — около 4 лет. Это персональный сервис мониторинга всех типов СМИ и соцмедиа. Здесь занимаются анализом медиа, тональности, репутации, PR-метрик, делают маркетинговые исследования. Бенефициары — Сергей и Марина Бондаренко, сооснователи Группы компаний ЛІГА.

Как рассказывает продакт менеджер Елена Шабунина, возникла компания от объединения части команды ЛІГА:ЗАКОН и специалистов, которые 15 лет занимались сбором и обработкой неструктурированной новостной информации из web-пространства. В самой ЛІГА:ЗАКОН 23 года до этого занимались глубокой обработкой неструктурированной текстовой информации (например, нормативно-правовых актов).

Первоначальное инвестирование — несколько сотен тысяч долларов — от Группы компаний ЛІГА. На самоокупаемость проект вышел в 2017 году.

"Для Semantrum сегодня существует два основных вида дохода: деньги от рынка от продажи SaaS-решения (каковым и является Semantrum) и проекты с крупными заказчиками, которые мы доделываем стандартный Semantrum по их требованиям и "под них", — объясняет Елена Шабунина. Назвать представителей второй части нельзя по условиям контрактов.

Большую часть денег приносят отдельные крупные проекты, но доля денег от рынка постоянно растет. В компании надеются, что второй источник в течение полутора лет станет превалировать над проектными деньгами.

Продукт, по словам Елены Шабуниной, сейчас находится в состоянии, которое позволяет легко масштабировать его на разные рынки и на разные страны. Уже в 2019 году планируется ряд мероприятий по поиску партнеров в других странах и представление продукта профильным портфельным инвесторам.

"Среди этих партнеров и инвесторов не будет никого из России. Мы не будем работать с российским рынком и с российскими деньгами до окончания агрессии — это наша принципиальная позиция, хотя этот рынок нам "взять" проще всего", — говорит продакт-менеджер компании.

В команде Semantrum 35 человек: разработка, сбор и обработка информации, маркетинг, поддержка, системное администрирование и т.д.
SemanticForce
Продукт зародился еще в 2005 году. Тогда основатель SemanticForce Всеволод Гаврилюк, еще работая в компании Pad2Pad, вместе с коллегами создал систему, которая позволяла отслеживать изменения на любых сайтах. А с 2009 года, когда в Украине наметился тренд развития соцмедиа, Всеволод Гаврилюк полностью ушел в мониторинг.

"Мы точно не первая мониторинговая система. Но, наверное, первая на рынке СНГ комплексная система, где есть и соцмедиа, и СМИ в одном флаконе. Продолжаем этот вектор развивать", говорит CEO SemanticForce.

Первые клиенты у компании были из телекома например, в 2010 году SemanticForce отслеживала слияние Киевстар и Билайн. Дальше, как говорит Всеволод Гаврилюк, классика: рост, экспансия на другие рынки. Сейчас у компании есть клиенты из Казахстана, России (по словам предпринимателя, только международные бизнес-заказчики вроде Samsung и Nestle), Киргизии, Таджикистана, Армении, Азербайджана, стран Балтии. Есть и западные клиенты тоже в основном бизнес.

По словам основателя компании, в 2009-2010 годах в бизнес было вложено около $250 000. Он основной акционер, ряд коллег имеет опционы. В плюс вышли небыстро через 4 года. Как говорит основатель, SemanticForce развивалась органически, без инвестиций и кредитов. Часть прибыли постоянно реинвестируется в развитие.

Цифры заработков и оценки компания не раскрывает. "Предложения о покупке компании есть, но мы торопимся постепенно. Понятно, что они не от локальных игроков", комментирует Всеволод Гаврилюк.

Сейчас в команде больше 50 человек: инженеры-разработчики, аналитики, администратор, аккаунт-менеджеры, продажники. В этом году SemanticForce может сильно вырасти за счет сегмента по анализу рисков.
LOOQME
Компания появилась в мае 2017 года после слияния двух мониторинговых агентств — Контекст Медиа и LookSMI. При этом первая компания была основана еще в 1999 году, вторая — в 2012-м. LOOQME в первую очередь работает на рынке медиа-мониторинга.

"При слиянии мы изменили позиционирование и обновили продукт — перешли на модель SaaS, существенно проработали функционал, чтобы клиенты использовали систему в качестве основного инструмента для анализа коммуникаций", — рассказывает Виталий Сидоренко, CEO LOOQME и один из учредителей LookSMI в прошлом.

В итоге компания принадлежит четырем сооснователям из объединившихся агентств: Виталию Сидоренко, Оксане Кононовой, Александру Тоичкину и Андрею Гусаку.

По словам Виталия Сидоренко, компания развивается за счет реинвестирования прибыли и активов объединившихся компаний, а ARR (средняя норма прибыли) приближается к $1 млн . Привлечение внешних инвестиций — в планах.

LOOQME работает в Украине, Польше и Молдове. "Также уже сделали релиз продукта в США и ждем обратную связь от первых пользователей из Штатов. Планируем получить первый трекшн платящих клиентов в ближайшем квартале для подтверждения конкурентоспособности продукта на рынке", — говорит CEO компании. После — привлечь внешние инвестиции для масштабирования и роста в США, а также удвоиться до конца 2019 года.

В команде проекта 42 человек, не считая кодировщиков тональности на аутсорсе. Как говорит Мартын Ковалко, CMO LOOQME, структура менялась несколько раз за последний год и наверняка поменяется еще.
Чем выделяются компании
и как они сегментируют рынок?
На первый взгляд, все "мониторщики" делают примерно одно и то же.

Если посмотреть глубже, у каждого сервиса есть несколько свои задачи, рынки и фишки. Об этом говорят и сами компании — надо же как-то друг от друга отстроиться. Ценники, выходит, тоже разные. Сравнивать их в лоб не очень корректно.

Как говорит Всеволод Гаврилюк, основатель SemanticForce, отличий между компаниями много — начиная от подхода к сбору данных: "Многие компании собирают упоминания в онлайн СМИ. А тех, кто собирает комментарии (мы с ними заморачиваемся с 2010 года), уже гораздо меньше. Тех, кто собирают изображения к статьям, еще меньше". Почти никто, по его словам, не умеет собирать darkweb.

Также в последние годы SemanticForce активно занимается новым растущим сегментом — Digital Risk Protection.

Алексей Орап, соучредитель и CEO YouScan условно делит рынок на несколько сегментов: мониторинг традиционных медиа (оффлайн и онлайн СМИ), а также мониторинг социальных медиа. Категории разные — и небольшие агентства, которые мониторят прессу вручную, и технологические компании, которые развивают "умное" ПО для мониторинга и анализа больших данных (к ним Орап относит и свою компанию). Есть и те, кто где-то посередине.
Независимой аналитики по обьему рынка нет, но, исходя из нашего анализа, в сегменте мониторинга социальных медиа мы занимаем доминирующую позицию.
Алексей Орап
CEO YouScan
В Semantrum выделяют два основных кластера сервисов — social listening и медиа-мониторинг. Первые направлены на мгновенное оповещение о возникшем кризисе, который требует экстренной реакции - например, на посты и комментарии в соцсетях.

"Потребности в таком виде мониторинга нужны в основном сервисам, которые работают напрямую с потребительским опытом: магазины, службы доставки, рестораны и т.д. В этом классе уже долгие годы безусловным лидером остается YouScan", - отмечает Елена Шабунина, продакт менеджер Semantrum.

Она относит Semantrum ко второму классу, который больше целится в B2B и закрывает другие задачи. Системы помогают отслеживать эффективность проведенных PR-кампаний, готовить отчеты и проводить глубокую аналитику, чтобы выстраивать долгосрочную стратегию развития бренда и антикризисных коммуникаций. Анализ также важен, если вдруг на бизнес идет атака через СМИ, лидеров мнений в соцсетях, "сливные бачки". Тогда нужно понять целевую аудиторию, скорость распространения, охваты.

Виталий Сидоренко, CEO LOOQME, год назад писал о том, что сервис — не конкурент системам по мониторингу социальных сетей. Мол, таких систем уже слишком много, конкурировать с ними нет смысла. Компания позиционирует себя как сервис для эффективного PR. И тоже сражается в сегменте медиа-мониторинга.
Немного о конкурентских играх
Общий рынок мониторинга из-за разношерстности оценить сложно. По словам Елены Шабуниной из Semantrum, объем отдельно украинского рынка медиа-мониторинга до 2 млн евро. И он растет.

Похожую цифру называет Мартын Ковалко, CMO LOOQME.

"Сложно оценить размер украинского рынка, так как в Украине все данные закрыты. По нашим подсчетам, он близок к $3-4 млн в год", говорит собеседник. Соответственно, компания оценивает свою долю рынка медиа-мониторинга в 30% и движется в глобальную конкуренцию.
Как же все-таки различить поставщиков?
Даже после объяснений остается много непонятного. Все мониторинговые компании говорят об использовании искусственного интеллекта, оперативных оповещениях, интеграциях и удобных отчетах для клиента. Поддерживают несколько языков. Инструментарий похож. Рынки так или иначе пересекаются.

Только по описанию с ходу разницу понять сложно. Выход пробовать.

Бизнес так и делает. Для выбора поставщика он, как правило, объявляет тендер и всем участникам дает одинаковое тестовое задание.
Поставщики предоставляют примеры найденных упоминаний и отчетности. Мы тестируем пробную версию и определяем, кто соответствует / не соответствует / лучше соответствует требованиям.
Виктория Павловская
пресс-секретарь Vodafone Украина
У оператора смотрят на количество найденных постов, скорость попадания в систему, процент нецелевых публикаций, качество определения тональности.

А для Укртелекома основные критерии функционал (единственный интерфейс для всех страниц соцмедиа, отправка файлов, ответы на e-mail, единое окно ответа), скорость и стабильность работы, скорость синхронизации, аналитика, техническая поддержка.

В IT-компании EPAM добавляют к этим критериям наличие выделенного аккаунт-менеджера, адекватное соотношение цены-качества и планы по развитию функциональности системы.

"Если партнер не сможет ответить на вопрос, что в ближайшие полгода будет добавлено/изменено/улучшено, вероятность нашего сотрудничества очень низка", говорит Нина Василева, директор по коммуникациям EPAM.

Для нескольких других собеседников редакции цена главный определяющий фактор. Кстати, нередки и случаи, когда под разные задачи заказчик заключает контракт с разными подрядчиками. Как бы признавая косвенно, что у одного все не может получаться идеально.
Фото: YouScan
2. КАК
"четкий экранчик" превращается в "экран позитив"?
Внутреннюю кухню своей работы мониторинговые компании раскрывают с разной степенью откровенности. Но можно попробовать описать процесс простыми словами.

Он состоит из нескольких условных этапов.
1

Собственно мониторинг
Прежде всего система должна поймать само упоминание. То есть уметь следить за состоянием сотен, тысяч, десятков тысяч сайтов и страниц. Желательно в реальном времени. Ведь мало кому интересно узнать, что его уже пару дней "мочат" где-нибудь в Facebook особенно во времена, когда одним твитом можно обвалить акции. Такое лучше выявлять в зародыше.

К примеру, в LOOQME говорят о мониторинге более 38 000 источников. "Каждые 15 минут в базу добавляются около 3825 новостей", делится данными Виталий Сидоренко, CEO компании. Причем, в одной базе собираются и офлайн- и онлайн-медиа.

Елена Шабунина говорит, что в системе Semantrum на сегодня больше 15 000 открытых веб-источников из различных стран, профили лидеров мнений и публичных страниц пяти социальных сетей.

Да, мониторить в современном изложении = забрать к себе. Система копирует на свои сервера содержимое огромного количества разных интернет-страниц: СМИ, форумов, интернет-магазинов, отзовиков, соцсетей. Вероятно, по отдельным сообщениям. Причем, как говорит Всеволод Гаврилюк из SemanticForce, за одно сообщение считается и одна статья, и один комментарий. В доступном индексе, по словам основателя компании, 5 млрд сообщений. Здесь для сбора даже есть отдельный продукт под названием Kindexer. Эта разработка обрабатывает неструктурированные виды медиа, где нет API. API есть, например, у YouTube, поэтому его относительно легко собрать.

В LOOQME данные собирают в MongoDB, в которой все хранится и ничего не меняется. По словам Виталия Сидоренко, интернет-ресурсы парсятся (то бишь копируются и структурируются) напрямую, данные из офлайн-медиа забираются из FTP-серверов, а соцсети по API. Поисковый движок Solr. Он, мол, отлично справляется со сложными запросами.

В YouScan информация собирается через официальные API социальных платформ, а также с помощью собственных технологий сбора данных. Также компания лицензирует часть контента у провайдеров данных, специализирующихся на определенных типах медиа например, онлайн-СМИ.

А как же быть с более традиционными источниками: ТВ, радио, печатной прессой?

В Semantrum объясняют, что эта информация закупается у партнеров. Это уже готовые расшифровки аудио, видео и сканированных копий. Издания приходят, разобранные по статьям. Видео и аудио по смысловым сюжетам.

"То есть пользователь не читает полотно текста часового выпуска новостей видит только тот кусок, внутри которого упоминалась нужная клиенту тема", рассказывает Елена Шабунина.
Если собирать статьи - задача хитрая, но решаемая более-менее понятно, то с соцсетями все веселее.

"Допустим, есть FB-страница газеты "Приазовский рабочий". Наша задача если в комментариях под ее постами критикуют L'Oreal, найти это. Чтобы это найти, нам желательно это собирать. И повторить это упражнение 100 000 раз для разных страниц", объясняет Всеволод Гаврилюк из SemanticForce.

По его словам, Facebook индексируется очень плохо и так было практически всегда. Компания использует порядка 10 разных технологий, которые позволяют собирать детище Цукерберга. Здесь приходится быть аккуратными: что-то можно получить через стандартное API Facebook, но усердствовать нельзя соцсеть за излишнюю активность наказывает. Приходится использовать нестандартные подходы. Например, просто прийти на страницу и спарсить ее содержимое.

"Эти схемы могут называть серыми. И так работает у всех систем. Если ты полностью "белый" в плане подхода ко сбору данных, ты бесполезен при текущем состоянии технологий", говорит CEO SemanticForce. И добавляет: перестраиваться под изменения алгоритмов глобальных платформ вроде Google и Facebook это постоянные битвы и бессонные ночи.
2
Поиск объекта
Дальше алгоритм ищет в тексте сообщения упоминание объекта. Поэтому мониторинговым системам, которые затягивают данные из соцмедиа, не так и важно, тегали компанию в посте/комментарии или нет. В целом, это влияет только на то, ответит вам бренд с официальной страницы, или же к вам в комментарии придет кто-то из сотрудников.

Уже здесь есть пространство для фантазии. Нужно учесть десятки прямых и переносных вариантов написания объекта.

Как рассказывает CEO SemanticForce, работа аналитического отдела компании - в том числе описать, что, например, "двигатель" это "двигун", "двиган", "движок", "двигло" и т.п.

Написать "Киевстар", "Порошенко" или "Новая Почта" тоже можно множеством способов - с учетом разговорных, и обидных (указывать не будем, чтобы не обидеть).

После система анализирует, с каким настроением объект упомянули.
3
Анализ тональности
Тональность одна из самых сложных задач. Особенно для наших просторов. Во-первых, в славяноязычной группе нет жесткого порядка слов, и любая запятая (особенно пропущенная) может полностью поменять смысл предложения. Если в статьях правила еще соблюдаются, то комментарии и отзывы вообще пишутся как попало, со сленгом и опечатками.

Во-вторых, один и тот же текст может быть негативной тональности по теме. При этом объект-1 в нем могут упомянуть нейтрально, а объект-2 - позитивно. Понятно, что просто шлепнуть ярлык "негатив" и пойти дальше некорректно. Или, например, если про кандидата в президенты пишут хвалебные оды российские СМИ это позитив или негатив?

В-третьих, отдельные компании занимаются разбором не только статьи/поста, но и дискуссией под ними. А в ней, особенно многоуровневой, могут обсуждаться еще несколько объектов. Если человек в комментарии написал "нормально, но я это не куплю", к чему это отнести? К телефону, описанному в статье? Или к пылесосу, который упомянули комментарием выше? Здесь у машины просто взрывается мозг.

Подходы к проблеме определения тональности разные.

С одной стороны, никуда без автоматизации. Однако в ней, как и в любом конвейере, есть смысл только на высокочастотных кейсах.

"Об одном Samsung в месяц только в украинском, русском и казахском интернете несколько миллионов сообщений: комментарии, статьи, посты, комментарии на YouTube, Rozetka, 4PDA. Там есть пространство для автоматизации", объясняет Всеволод Гаврилюк.

Так, сообщения типа "четкий экранчик" система учится распознавать как "экран позитив". Или "нормально стартует" должно трансформироваться в "двигатель позитив".
Чтобы все четко
На низкочастотных кейсах до 5-10 тысяч упоминаний в год вроде "рыбалка в Ржищеве" машину обучать дорого, утверждает CEO SemanticForce. Поэтому задействуется ручная аналитика. Компания инвестирует в нейросети: для сбора данных, анализа сообщений, категоризации и поиска тональности.

О подобном подходе говорят и в YouScan. В блоге компании говорится, что новая нейросетевая модель, запущенная в 2018 году, умеет правильно маркировать даже сложные кейсы вроде "Coca-Cola помогла хорошо отмыть кастрюлю". Людям и кастрюлям здесь позитив, но вот для Coca-Cola...

В Semantrum тональность изначально определялась по оригинальному эвристическому алгоритму; с учетом близости тем и объектов, которые мониторятся, к словам, «окрашенным» позитивно или негативно. Потом подключилось машинное обучение. А аналитики выявляют нюансы, когда готовят отчет клиенту. По словам Елены Шабуниной, автоматически отдельные тонкости выявить пока невозможно, но модели машинного обучения совершенствуются и развиваются.

В LOOQME пошли другим путем. Ранее тональность там тоже проставляли смешанным способом. Теперь же полностью отказались от автоматической составляющей в пользу распределенной сети кодировщиков. Это система, при которой каждый интернет-пользователь мог бы подключаться к сети компании, читать новости, проставлять характеристики и получать за это деньги.

Видимо, компания решила, что человек поймет контекст лучше самой лучшей машины. Однако здесь наверняка есть и другие стороны, присущие человеческому фактору: организованность, влияние настроения, уровень внимательности.

Всеволод Гаврилюк добавляет, что пока нет нормальной культуры в том, какими параметрами оперируют компании, продавая продукт.

То же заявление "точность нашей системы 90%" можно понять по-разному. Допустим, в систему поступило 1000 сообщений, из которых 100 с негативной тональностью. Если даже система нашла только одно и угадала, ее точность считается 100%-ной. Но полнота всего 1%, ведь остальные 99 остались не найденными. Поэтому нужно внимательно всматриваться в то, что презентуют продукты.
~
И это все только о текстах. В последние годы мониторинговые компании например, YouScan и SemanticForce добавляют к анализу еще и изображения. Хотя, по утверждению специалистов, с картинками ситуация куда как легче (об этом ниже).

Разумеется, под такие задачи нужно аппаратное оснащение. Компании, как правило, используют гибридные варианты. К примеру, публичное облако Microsoft Azure плюс свои или арендуемые серверы в датацентрах в разных пропорциях. В Semantrum, например, облачная архитектура продукта спроектирована так, что мощность железа может линейно расширяться в зависимости от количества данных и количества пользователей.

"На первых порах за облачные вычислительные мощности мы платили несколько сотен долларов, на сегодняшнем этапе несколько тысяч долларов в месяц и можем нарастить эти мощности в любой момент", объясняет Елена Шабунина.
Один из кейсов работы с изображениями поиск логотипов
"Да он козел!", или
Почему "Войну и мир" не опишешь математикой?
Журналисту LIGA.net стало интересно, насколько глубоко закапываются системы. Если объект, например, упоминается в видеоролике? Или всплывает в комментариях в какой-нибудь совершенно левой теме?

Анализировать видео и аудио пока не так просто, рассказывает Всеволод Гаврилюк. Расшифровывать руками — дорого. А алгоритмы транскрибирования аудио в текст хорошо работают для прилагательных, но с объектами теряются. В итоге "Янукович" превращается в "Янукяна", а "Порошенко" в "Рошен" или того хуже.

"Картинку и звук видео мы пока не анализируем. В целом, если в описании к видео, заголовке и хештеге нет упоминания объекта, то оно, скорее всего, для нас не очень-то и критично. А если хоть в чем-то из перечисленного есть, то наверняка найдем", — рассказывает CEO SemanticForce.
С комментариями отдельная история. Человек может в совершенно левой теме написать "Киевстар — классные ребята" или "Киевстар — гады". Системы вряд ли смогут выловить это на любой странице.

Однако если будут некоторые нужные признаки, это тоже может попасть в выдачу. Например, если дискуссия происходит на Facebook-странице СМИ. Мониторинг не охватит весь украинский сегмент соцсетей. Но это и не нужно. В конце концов, далеко не все Facebook-страницы обладают таким уж мощным социальным влиянием.
Главные проблемы остаются в обработке естественного языка. По словам Всеволода Гаврилюка, изображение анализировать гораздо проще: на нем либо есть закат или лого бренда, либо нет. Но нет математического базиса, который описывал бы "Войну и мир".

С той же тональностью можно подходить а) к текстам в целом; б) на уровне объектов; в) на уровне факторов. Просто статья о чем-либо может быть околопозитивной. Но объект в ней упоминают нейтрально, а в контексте цен негативно. "На всех трех уровнях мы работаем в зависимости от запроса", говорит CEO SemanticForce.

"Алгоритм определения тональности автоматически находит объект мониторинга в тексте и определяет тональность не по всему тексту, а по тому фрагменту, который находится рядом с объектом мониторинга", пишут в YouScan. При сравнении с конкурентами тональность будет получаться разной, в зависимости от того, какой именно бренд мониторится.

Чтобы не пропустить упоминания, в компаниях ориентируются на "вселенные", которые описывают объект, и пространство связей.

К примеру, если следить за ключевыми словами, то можно упустить сообщения типа "порох негодяй". Как объясняет Всеволод Гаврилюк, это сообщение однозначно в данном контексте, хоть слово "порох" и омоним.

Условно, в итоге система должна выхватить, что "порох подгорел" пишет пользователь охотничьего форума Житомира, а "подгорает у пороха" совсем другой "охотник". На нынешнем уровне развития нейросетей это возможно.

Проблема, как уже говорилось, возникает, когда это не конечный текст, а огромная дискуссия, где в 145-м комментарии написано "да он козел!". Человек поймет, кто именно "козел". Машина нет.

По мнению Всеволода Гаврилюка, в ближайшие лет 10 не будет нормальной системы понимания языка. По улицам будут ездить машины без людей, будут прекрасно распознаваться спектрограммы и рентгенограммы. Машина, дескать, отлично делает все, где есть конечное пространство состояний: доказано шахматами и го.
Май 2017 год. Программа AlphaGo, разработанная компанией Google DeepMind, громит лучшего в мире игрока в го, 19-летнего Ке Цзе из Китая
"Даже на современных конференциях в Нью-Йорке и Кремниевой Долине выступают компании, которые делают глубинный анализ текста. И все равно там звучит фраза "in the end of the day you have to read that shit". Это текущее состояние индустрии", — объясняет CEO SemanticForce.
3. КОМУ
в Украине нужен мониторинг упоминаний?
Версия систем
Как уже говорилось выше, основной потребитель мониторинговых услуг — бизнес, персоны и учреждения, которым часто приходится иметь дело с прессой, общественностью и/или розничным клиентом.

Например, у SemanticForce ключевые секторы — потребительская электроника (порядка 25%), фарма (около 20%), потом идут телеком, бьюти, фуд и т.д. Доли меняются все время. Конкретные названия Всеволод Гаврилюк называет исключительно off the record, сославшись на коммерческие договоренности.

В YouScan журналисту сообщили, что приоритетный для компании сегмент — крупные потребительские бренды из различных отраслей: FMCG, ритейл, банки, e-commerce, и другие. Алексей Орап охотно называет среди них Новую Почту, Samsung, Ощадбанк, McDonald's и других.

Semantrum обозначила только одного публичного клиента — Секретариат Кабинета Министров Украины. По словам Елены Шабуниной, остальные — ведущие игроки из энергетики, финансов, промышленности, гос- и правоохранительных органов — под NDA.

В LOOQME назвали цифру в 180 клиентов в Украине. Среди них Эпицентр, OLX, Альфа-Банк, Prozorro.
Потенциальные клиенты мониторинговых компаний
Бренды
Производители товаров, особенно массового потребления, о которых много говорят
Компании
Бизнес, особенно работающий с массовым сегментом розничных клиентов
Организации
Фонды, исследовательские компании
Госучреждения
Муниципалитеты, министерства,
правоохранительные органы
Политики
Партии и персоны
ПубЛичности
Лидеры мнения, эксперты, общественные деятели
PR-агентства
Специалисты по коммуникациям, репутационные менеджеры
Журналисты
Расследователи, обзорщики
В год выборов кажется логичным, что должен был рвануть вверх спрос от политиков. На удивление, компании говорят примерно одно и то же: особого всплеска нет, но этот сектор и не является приоритетным.

SemanticForce оценивает заработки от "политики" меньше, чем в 10% от общих. По словам основателя, компания работает с рядом партий и персон, которые приходят сами. Бывает, что могут обратиться "конкурирующие фирмы" — и они об этом знают.

"Вы можете прийти в один оружейный магазин, купить там 2 винтовки и пойти на дуэль. Но это же не проблема оружейного магазина", — говорит на это Всеволод Гаврилюк.

Политиков интересует тональность упоминаний, контексты, состояние "скелетов в шкафу". Скелетов находит сама система. "Иногда обращаются олигархи, хотят подписать NDA, а мы ко встрече успеваем подготовить 17 объектов для анализа. Все довольно предсказуемо", — улыбается CEO SemanticForce.

В Semantrum добавляют, что большинство клиентов из политики не связаны с предстоящими выборами, а остаются с компанией уже на протяжении длительного периода времени.

Так что, возможно, политиков забрали другие системы. А, может быть, даже при наших предвыборных активностях аппетиты бизнеса все равно в разы больше.

Мониторинговые компании также отмечают, что расширяется область применения. Если раньше инструмент был нужен только PR-менеджерам, то сейчас это могут быть и маркетологи, и HR, и службы безопасности.

Используется мониторинг и для некоммерческих целей.

"В 2014-2015 годах мы давали благотворительным организациям возможность отслеживать переселенцев, которым нужна помощь. Наши коллеги по цеху помогают организации Donor.UA отслеживать тех, кому нужна кровь. Мы для Unicef делали аналитику проблематики отношения к вакцинации", — рассказывает Всеволод Гаврилюк.
~
Версия клиентов
Отслеживать упоминания, вроде как, не зазорно. Интересуешься тем, что о тебе пишут — значит, стремишься улучшать продукт и сервис.

Однако мало кто говорит об этом бодро и в открытую — по разным причинам. Елена Шабунина из Semantrum, к примеру, отмечает, что сам факт пользования мониторинговыми системами — уже норма. Но практически никто не хочет «светить» темы, которые они мониторят, ведь по ним понятно, каких конкурентов компания или конкретный пользователь считают ключевыми для своего бизнеса.

Возможно, повлияло и то, что журналист LIGA.net попал на тендерный период — люди меняли поставщиков и не готовы были делиться мнениями.

Первым все же откликнулся телеком. Vodafone Украина до конца февраля работал с SemanticForce.

"Помочь отловить и успешно отработать комментарии клиентов — одна из основных задач таких систем. И наш центр обслуживания активно пользуется этим инструментом в своей повседневной работе", — говорит Виктория Павловская, пресс-секретарь Vodafone Украина.

По ее словам Павловской, как у любой системы, работающей на базе ИИ, здесь есть определенные сложности с автоматическим определением тональности, упоминаний и т.д. Оператор в процессе сотрудничества вносит свою лепту в развитие этих функций.

В Укртелекоме для коммуникации в соцсетях используют платформы, которые позволяют совмещать спектр социальных сетей в единый интерфейс и отвечать из единого окна.
В 2016 году Semantic Force была единственной системой в поле нашего зрения с единой поддержкой наиболее популярных в то время соцсетей. Поэтому тогда она и была выбрана нами для работы.
Михаил Шуранов
директор по коммуникациям Укртелеком
Позже оператор проанализировал рынок и по ряду факторов выбрал Brand Embassy.

Carlsberg Ukraine работает с LOOQME, отслеживая с ее помощью информацию в масс-медиа и Facebook.

"В основном мониторинговое агентство помогает нам не в первоначальном выявлении негатива, а в мониторинге его посева — насколько сильно разошелся, на каких ресурсах. Дает понимание масштаба проблемы, угрожающей репутации компании", — комментирует Евгения Поддубная, старший директор по корпоративным отношениям компании. А первичное выявление идет через Facebook - больше самостоятельно.

В Новой Почте и украинском офисе Samsung подтвердили работу с YouScan. Особыми подробностями не делились, но выделили систему, как одну из самых мощных по части мониторинга соцсетей.

Алина Кобец, диджитал менеджер L'Oreal Украина, рассказывает, что подразделение продукции массового спроса компании использует SemanticForce уже более 3 лет.

"Мы получаем от команды SemanticForce качественные отчеты с детальными выводами практически под каждый запрос и можем оценить реакцию пользователей на наши локальные и глобальные активности", — говорит диджитал менеджер L'Oreal Украина.

Она вспоминает свежий кейс: перед запуском сухих шампуней в L'Oreal анализировали упоминания по данному продукту в интернете и пытались понять причины и ситуации, в которых потребители используют данный продукт. По словам Алины Кобец, анализ помог более эффективно выстроить коммуникацию, донести преимущества продукта на языке пользователя.

В PR-агентстве Newsfront не первый год работают с LOOQME. По словам аккаунт-директора Ольги Габулян, агентство специализируется на антикризисных коммуникациях, и благодаря системе удается выявить большинство кризисов.
Cервис LOOQME позволяет установить дополнительные настройки по ключевым словам и алерты. Поэтому, как только публикация с негативной тональностью появляется в сети, мы сразу же получаем оповещение на почту и оперативно реагируем на ситуацию.
Ольга Габулян
аккаунт-директор Newsfront
Нина Василева из EPAM Украина тоже остановилась на LOOQME. А самые запоминающиеся кейсы, по ее мнению, были в период аннексии Крыма и событий в Донбассе (Василева в те годы работала в Укртелеком и ПУМБ). Благодаря в том числе мониторингу можно было получить информацию о потере активов, повреждениях имущества и других событиях.

"Также с помощью мониторинга можно было наблюдать, как разворачивалась работа пропагандистких медиа на территории Донецкой и Луганской областей. Еще до объявления так называемых ЛНР и ДНР уже вовсю работали созданные под них региональные информагентства на нескольких языках", — говорит директор по коммуникациям EPAM.
А еще в одной IT-компании поделились забавным, но практическим применением мониторинга. Как только на сайте e**noe.it, который славится сплетнями и "разносами" айтишного мира, выходит материал с упоминанием компании, система в течение 10 минут отправляет уведомление пиарщику.

Причем благодаря быстрой реакции руководству удалось решить несколько оргпроблем.
Скептическим отзывом на условиях анонимности поделились в одном украинском маркетинговом агентстве. В свое время там перепробовали много разных систем и пришли к выводу, что все они — на довольно плохом уровне, особенно по части тональности. К тому же, несколько приукрашивают свои возможности, чтобы лучше продать услуги. Как говорят собеседники редакции, "лучшими из худших" агентство в итоге выбрало российскую BrandAnalytics (для соцсетей) и LOOQME (для СМИ).

Политики, как и предполагалось, на запрос журналистов LIGA.net отреагировали скудно. Штаб действующего президента не ответил. А в команде Юлии Тимошенко сообщили, что пользуются сразу несколькими системами. Но называть их не стали. В паре мэрий запрос просто затерялся.
~
За что клиенты платят деньги?
Ценники и пакеты услуг у всех компаний отличаются. Но в целом механизм со стороны пользователя выглядит так.

Скажем, вы хотите отслеживать свой бренд и 4 бренда конкурентов, а также 5 общих тематик. К примеру, вы в сегменте электромобилей представляете Toyota Prius, при этом вам нужно следить за Nissan Leaf, Tesla и тем, что происходит в сегменте в целом. Все это — отдельные объекты мониторинга. В зависимости от их количества клиент и платит определенную подписку.

Часть денег компенсирует сбор данных, часть — аналитику. Аналитика бывает самая разная: или полностью автоматическая, или гибридная, в которой задействуется аналитический отдел.

Чек зависит от потребностей. Если небольшой бизнес может поместиться и в пару сотен долларов, то крупным придется выложить от $500. Верхний предел точно обсуждается индивидуально — здесь могут встречаться долларовые суммы с четырьмя нулями. А если вдруг компании из одного сегмента, но разного размера пришли в одну мониторинговую компанию, ценник за услуги у них почти не отличается — ведь хотят они примерно одно и то же.

Как правило, клиент следит за объемом упоминаний в своем аккаунте на специальном веб-портале. Отдельные поставщики делают дашборды — интерактивные панели, где видна вся картина в реальном времени. Для оперативных оповещений есть интеграции с почтой, мессенджерами и т.д.

В отчетах клиент может получать картинку по факторам. Например, "эту модель смартфона за последний месяц критиковали в контексте такого-то свойства". Такой фокус, конечно, возможен не только с телефонами, а и с любыми объектами, у которых много разных свойств.

Отчет может собираться раз в неделю. Но телеком-операторы и большие бренды требуют ежедневный. У операторов даже есть отдельные helpdesk-системы для оперативных ответов в разные каналы: соцсети, форумы, мессенджеры, отзовики.
~
Другие сферы применения, или
247 Иванов Петровых против одного премьер-министра
Но не потребсегментом единым.

Есть, например, условный банк Аваль, рассказывает Всеволод Гаврилюк из SemanticForce. Банк переживает, чтобы завтра не появилось 20 доменов aval.org.ua, на которых кто-то занимается фишингом. Чтобы не появилось 20 мобильных приложений, мимикрирующих под Аваль. Чтобы в Facebook не возникло 47 страниц Аваль. Чтобы не родилась "левая" страница их руководителя в LinkedIn, которая рассылает сотрудникам банка фишинговые сообщения. И прочие прелести социальной инженерии.

Конечный клиент здесь — уже не пиарщик или маркетолог, а комплайенс или секьюрити офицер.

Допустим, вы — премьер-министр Австралии. И зовут вас не как-то сложно, а Иван Петров. C этим проблема: в LinkedIn и Facebook постоянно появляются новые Иваны Петровы. А служба безопасности понятия не имеет: этот конкретный Иван Петров — это плотник из Харькова или злоумышленник, который завтра будет публиковать порно у себя в ленте и сольет данные о секретных агентах, чтобы скомпрометировать вас?

"Наша задача — подсказать СБ, что эти 247 Иванов Петровых- нормальные ребята, а вот за этими 3-мя лучше приглядывать" — объясняет Всеволод Гаврилюк.

С таким реальным кейсом к SemanticForce обратились зарубежные партнеры. Конечно, зовут заокеанского премьера не Иван Петров, а Скотт Моррисон. Впрочем, от этого его СБ никак не легче — ребят с таким именем в сети тоже сотни.

Подобные истории — уже из сферы так называемого Digital Risk Protection, куда компания стремится все больше. Здесь и задачи посложнее, и рынок пошире, и ценник повыше.
4. ЗАЧЕМ
еще может пригодиться инструмент мониторинга и кто в нем заинтересован?
То, что за нами следит Facebook и Google, для многих уже привычная вещь. За удобство сервисов мы платим данными. Как например, обучаем нейросети Google обработке изображений, загружая в Photos свой контент. Или участвуем в Facebook-фотофлешмобах, хотя не исключено, что у них есть вполне прагматичная цель.

Но осознание, что нашими данными, пусть даже в формате наблюдения, пользуются и многие другие, некоторых может заставить поежиться. По мнению Виталия Сидоренко из LOOQME, каждый человек, который делает публичный пост в социальных сетях, должен понимать его общедоступность. Мониторинг "видит" эти данные, а бренды используют, чтобы усиливаться.

Как говорит Всеволод Гаврилюк, любое сообщение, которое украинец публикует в Facebook или Twitter, через минуту-час реплицируется в кучу индексов.
На наших просторах с десяток систем пишет все, что у нас происходит. Северный сосед (РФ — Ред.) пишет. Западные ребята пишут. Надо это понять и принять. И не писать чересчур сокровенные вещи в Facebook — или писать с конечной целью. Приватности как таковой нет.
Всеволод Гаврилюк
CEO SemanticForce
В октябре 2016 года российской компании Kribrum уже вменяли создание ПО для поиска экстремизма в соцсетях и предсказыванию действий неблагонадежных граждан.

А осенью прошлого года произошел кейс с другой российской компанией — Social Data Hub. Facebook заподозрил ее в скрейпинге — нелегальном сборе и анализе данных пользователей. Основателем компании Social Data Hub является Артур Хачуян, который также руководит предприятием Fubutech. До 2014 года Хачуян возглавлял отдел кибернетики рекламного агентства Апостол Тины Канделаки.

И Social Data Hub, и Fubutech занимаются сбором, обработкой и анализом данных. Причем первая выполняет коммерческие заказы, а вторая специализируется на госзаказах.

В октябре Facebook попытался повлиять на компанию Хачуяна. Соцсеть забанила странички, связанные с Social Data Hub, включая несколько аккаунтов сотрудников, написала, что Social Data Hub обязана прислать серверы. Но все осталось на уровне разговоров — дотянуться до российской компании сотрудникам Цукерберга оказалось сложно.

Не исключено, что, сотрудничая с государством РФ, компания используется и как оружие информвойны с Украиной. Но при этом Артур Хачуян говорил, что компания работает с госорганами по вопросам «поиска педофилов, дезертиров и других плохих людей». У этой медали, как и у многих других, две стороны.
~
Оружие в чужих руках
Та же история касается и наших систем. Судите сами. Они умеют быстро собирать огромное количество данных. Анализировать смысловые контексты. Выводить закономерности в посеве и разгоне информации. Систематизировать настроения. Быстро уведомлять заказчиков о кризисе.

При этом ничьи права не нарушаются, ведь компании всего лишь обрабатывают то, что болтается в сети в открытом виде.

Весь этот набор легко можно использовать не только для коммерции. Например, для помощи спецслужбам. Или для сливания своих выводов кому-не-надо. Что о таком использовании думают в самих компаниях?

Там в первую очередь говорят о пользе для бизнеса.

"Мы собираем информацию про упоминания брендов. Мы не собираем данные про то, какой рисунок у человека сегодня на латте или какого цвета помада на селфи. Если человек пишет в публичном пространстве о бренде, скорее всего он хочет, чтобы бренд об этом посте узнал, тем
или иным способом. Можно сказать, что мы помогаем этому случиться", — объясняет Елена Шабунина из Semantrum.

Виталий Сидоренко из LOOQME считает, что от своевременной реакции компании на гневный пост о ее плохом сервисе выиграют все — и обиженный потребитель, и сама компания. Алексей Орап из YouScan тоже акцентирует: наличие прямой связи между клиентом и компанией позволяет потребителям в конечном счете получать от компаний продукты и услуги более высокого качества.
Если же говорить о мониторинговых инструментах, которые анализируют не публикации пользователей, а именно их действия, предпочтения, интересы — это другая история. Мы этим не занимаемся.
Виталий Сидоренко
CEO LOOQME
По его мнению, мониторинг, как и многое другое, может использоваться и в хороших целях, и наоборот. Как обычная реклама, например.

А основатель YouScan говорит, что компания строго соблюдает все законодательство, связанное с защитой персональных данных (в т.ч. GDPR), правила доступа соцсетей к их данным.

"Мы мониторим только публично доступный контент, а также внимательно следим за тем, чтобы наши клиенты в свою очередь не использовали данные для противоправных или неэтичных целей", — отмечает Алексей Орап.

По его словам, со спецслужбами компания не сотрудничает ни в каком виде и не получает от них запросов для, например, выявления потенциальных преступников или пропавших детей. Алексей Орап ссылается на один из внутренних корпоративных принципов — "этичное отношение к данным пользователей".
Конечно, мониторинговые системы могут использоваться для анализа медиа-пространства вокруг определенной темы, что также может служить нехорошим целям — выявить, к примеру, слабые позиции в аргументации противника. Но это скорее исключение, чем правило использования.
Елена Шабунина
Продакт менеджер Semantrum
Чаще, говорит она, инструмент используется как раз для противодействия подобным информационным атакам. То есть компании или персоны могут вовремя реагировать на зарождающийся негативный всплеск, определить источник "вброса", измерить силу и разгон информационной волны.

"Но мониторинговая система не дает возможности делать информационные вбросы, которые являются основными инструментами информационной войны, — объясняет Елена Шабунина.

Есть, правда, еще один момент, связанный с приватностью и безопасностью. О нем — ниже.
5. ЭПИЛОГ
Технологии в последние годы явно обгоняют регуляторку. К примеру, только вокруг одного Facebook уже несколько лет крутятся конфликты, связанные с защитой данных (привет, Cambridge Analytica). Детищу Цукерберга также пытаются вменить ответственность за тех, кто находится в депрессивном, предсуицидальном состоянии, а алгоритмы новостных лент усугубляют его.

Над всем этим размышляет Всеволод Гаврилюк из SemanticForce. По его мнению, сам факт того, что Facebook не дает доступ службам спасения детей или безопасникам, косвенно ложится на совесть владельцев соцсети за суициды и расстрелы людей в публичных местах.

"У них зарегистрирован 1 млрд человек. И везде разные проблемы. Причины самоубийств в Дании совсем не такие, как в Краматорске или Шри-Ланке. Ты не можешь, сидя в Кремниевой Долине, где у тебя под боком стартапчики и Tesla, понимать, почему человек хочет покончить с собой в Шри-Ланке", — возмущается предприниматель.

С другой стороны, возражает журналист LIGA.net, человек использует инструмент так, как выбирает. Молотком можно забить гвоздь, а можно проломить голову.

Да, соглашается Всеволод Гаврилюк, Facebook не может отвечать за все. Но там знают о проблеме. И знают, что есть ряд методов машинного обучения, которые могут довольно достоверно угадать по постам в публичной ленте, что у человека не все идеально. Что есть элементарные инструменты для предотвращения разноса фейков тысячами виртуальных пользователей. А действий нет.
Апрель 2018 года. CEO Facebook Марк Цукерберг отвечает перед американским Сенатом за утечку данных пользователей в Cambridge Analytica и использовании их в предвыборной кампании Дональда Трампа
По мнению CEO SemanticForce, сам факт того, что фокус Facebook остается на таргетинге рекламы, не решая проблемы более ценностного характера, говорит о том, что у соцсети не все хорошо. А ценностная история так и будет их неизбежно "колбасить".

Акцентируя социальную ответственность, Всеволод Гаврилюк говорит, что его компания через партнеров оповещает Facebook об "оригинальных уродцах" — не совсем адекватных людях, найденных на просторах соцсети.

К примеру, тенденция последнего времени в том, что люди сначала пишут, что идут убивать, а затем реально идут убивать. Основатель SemanticForce вспоминает случай расстрела в керченском колледже: "Человек сначала в личке Вконтакте написал однокласснице, что завтра придет и всех расстреляет". Убийца 11 человек в Питтсбурге тоже писал о своем намерении — в Gab, американской соцсети, промотирующей свободу высказываний.
Мне кажется, спецслужбы обязаны иметь доступ как к публичным данным в Facebook, так и к личной переписке. Или хотя бы подвыборке сообщений по смысловым контекстам, в которых угрожают кого-то убить. Важно: только в случае, если службы адекватны и корректны, а доверие к ним со стороны общества высокое.
Всеволод Гаврилюк
CEO SemanticForce
При этом, по его словам, тот же Facebook обязан в каждой стране иметь подразделение, которое контролировало бы корректность использования данных — что они используются именно для детектирования тех, кто хочет либо убить кого-то, либо убить себя. А не для решения бизнес-задач.

Всеволод Гаврилюк признает, что грань между цензурой и демократией очень сложная. И искушение все-таки использовать инструмент для других кейсов у спецслужб может быть сильным. Поэтому взаимное доверие первично.

"Я бы, например, был не против, чтобы спецслужбы слушали мой телефон. Предотвратить создание Аль-Каиды, теракт и т.п. или обеспечивать полную демократию? — задается вопросом предприниматель. — Да нет демократии и приватности. На Западе про любого человека можно купить кучу информации абсолютно публично. Так что мы выбираем?"
Disclaimer: Объявление о возможном конфликте интересов

Компания Semantrum, у которой журналист взял комментарий, является структурным подразделением Группы Компаний ЛІГА, частью которой также является Ligamedia с порталом LIGA.net.
Инициатива взять комментарии исходила от редакции.
Текст написан на общих редакционных основаниях с целью рассказать, как работает украинский мониторинговый рынок.

Текст: Евгений Шишацкий
Фото: открытые источники, Pixabay, EPA
Дата публикации: 11.03.2019
© 2019 Все права защищены. Информационное агентство ЛІГАБізнесІнформ
[email protected]
Made on
Tilda