Достаточно быстро платформы искусственного интеллекта (ИИ) перешли из разряда новинки в обычный инструмент работы многих людей. Тот же ChatGPT-4 многие воспринимают как воплощенную в жизнь "магию", но это не мешает тиражироваться фобиям о том, что ИИ может обвалить рынок труда.

О наиболее актуальных вопросах и опасениях, касающихся нейросетей, Liga.Tech пообщалась с Сергеем Саутой, директором по развитию ИИ в компании NetPeak Group.

Сергей Саута, источник: NetPeak Group

Какие виды искусственного интеллекта существуют?

Искусственный интеллект можно разделить на несколько основных видов, каждый из которых имеет свои особенности и применение.

Первый тип – это узкий или слабый ИИ. Например, когда ты даешь ему задачу вроде "создай текст", он делает это. Такой ИИ выполняет одну конкретную задачу, но не может выйти за ее рамки. Он ограничен инструкциями, и его результаты зависят от того, насколько четко ты сформулировал задачу.

Второй вид – это общий ИИ, которого еще не существует в полной мере. Это система, которая сможет выполнять задачи не только из одной сферы, но и любые интеллектуальные задачи на уровне человека. К примеру, создавать текст, видео, музыку, что выглядят как плод работы человека.

Третий тип – это суперинтеллект, который может превышать человеческие возможности.

Теоретически, этот ИИ сможет делать все гораздо лучше, быстрее и эффективнее человека, но это задача отдаленной перспективы.

Если смотреть на текущие системы, то кроме моделей с одной или несколькими модальностями, такими как текст или аудио, или изображение, существуют также генераторы изображений, как MidJourney или Leonardo. Они создают картинки на основе текстовых запросов. Но здесь есть свои нюансы – чем подробнее ты даешь инструкцию, тем точнее должен быть результат, но здесь кроется слабое место этих систем.

Другое направление – это ИИ для работы с видео. К примеру, сервисы типа Runway могут создавать и редактировать видео на основе текстовых инструкций. Это новая развивающаяся сфера, но уже сейчас ты можешь дать простую задачу, и ИИ создаст видео, которое будет выглядеть как полноценная сцена.

Как можно сделать и обработать фото с помощью ИИ?

Чтобы создать или обработать изображение с помощью искусственного интеллекта, вам не нужно быть гуру графического дизайна или владеть сложными приложениями. Сегодня возможности ИИ позволяют это сделать быстро и легко.

Если у вас есть доступ к GPT‑4 или подобным инструментам, вот что нужно сделать. Например, вы просто пишете запрос: "Создай мне изображение робота, символизирующего искусственный интеллект", и искусственный интеллект генерирует изображение на основе вашего текста.

Если ИИ скажет, что не может создавать изображение (да, бывает и такое), можно немного подкорректировать запрос, например: "Ты можешь создавать изображение?" Это кажется курьезным, но стоит помнить, что искусственный интеллект – это еще не вполне сознательная сущность, и иногда он сам не понимает, на что способен.

Дальше – еще интереснее. Созданные изображения можно изменить. К примеру, вы можете убрать фон, превратить себя в мультяшного персонажа или даже анимировать изображение.

Источник: Pexels

Для задач по редактированию имеются более продвинутые инструменты. Эти функции подробно рассматриваются в модуле 3 нашего бесплатного курса Netpeak Group "От новичка до эксперта по ИИ", поддерживаемого Минцифрой. В этом модуле мы учимся не только создавать контент с помощью ИИ, но и улучшать его.

Итак, ИИ, который рисует и обрабатывает изображение, – это уже не научная фантастика, а наше настоящее. И этим инструментом может воспользоваться практически каждый.

Умеет ли ИИ создавать сайты? Оставит ли он без работы разработчиков сайтов?

Да, искусственный интеллект уже умеет создавать сайты, и делает это достаточно эффективно. Вы можете поручить ему написать код для веб-страницы, используя HTML, CSS, или даже JavaScript, и ИИ сделает это за считанные минуты.

Все, что нужно – это четкий запрос. Например, вы можете сказать: "Создай мне страницу с контактной формой", и ИИ напишет код, объяснит, как он работает и даже покажет примеры.

Инструменты на основе ИИ, например GPTs, уже могут не только создавать код, но и предложить веб-дизайн. Возможно, вы слышали о no-code и low-code платформах – теперь все стало намного проще и доступнее. No-code инструменты позволяют создавать сайты вообще без знания кода, а low-code только с минимальным привлечением программирования.

Представим такую ситуацию: вы открыли свой "Кофейный уголок" и хотите, чтобы о нем узнало больше людей. ИИ легко создаст сайт для вашего бизнеса – от макета до полноценного веб-ресурса с функционалом. И да, ИИ не отнимет у вас кофе, но точно упростит жизнь с веб-дизайном!

Однако разработчикам сайтов не стоит спешить переучиваться на новую профессию: хотя AI предоставляет мощные инструменты, окончательное слово в вопросах креатива и персонализации страниц все равно остается за людьми. ИИ – это инструмент, и хотя он способен взять на себя много рутинных задач, настоящее мастерство, эмоциональный контекст и сложные творческие решения пока лучше выполняет человек.

Как ИИ может заменить дикторов: какие сервисы, как работает и т.д.?

ИИ уже умеет работать "голосом". Существует несколько сервисов, которые делают это на разных уровнях. Основная идея заключается в превращении текста в речь. Ты даешь платформе текст, а она его озвучивает либо синтетическим "робоголосом", либо может даже использоваться голос идеального человека.

В идеале человек должен предоставить на это свое разрешение и получать за это процент. Однако сеть уже завалена фейковыми диалогами с участием звезд шоубиза, политиков и т.д.

Одним из самых популярных решений является Voice.ai, позволяющий создавать кастомный голос. Нужно лишь предоставить несколько минут, после чего ИИ на его основе озвучивает любой текст. Он также использует задачу по озвучке видео: загружаешь файл, добавляешь текст, а дальше нейросеть создаст аватара, тот сделает всю работу диктора за человека.

Используется ИИ для обратного процесса. Так, есть инструмент Whisper, который "расшифровывает" аудио и с достаточно высокой точностью выдает текст сказанного в файле. Далее, по желанию, этот текст можно заново озвучить одним из доступных голосов. То есть ИИ может выполнять широкий спектр задач в этой сфере: от распознавания речи до ее воспроизведения.

Эти инструменты открывают новые возможности: цифровые аватары могут озвучивать новости, вести презентации или даже имитировать голос диктора в видео. Технология все еще несовершенна и напоминает дипфейк, но она нацелена на автоматизацию рутинных процессов и предоставление новых возможностей для создания контента. Ну и значительно упрощает работу, например, новостным каналам, которые не хотят все подавать исключительно через бегущую строку.

В этом году, например, Министерство иностранных дел Украины впервые в истории создало с использованием технологий искусственного интеллекта цифровое лицо, официально комментирующее консульскую информацию для СМИ.

Все наслышаны про чат-боты, но как они вообще работают? 

Чат-боты – это некие цифровые ассистенты или агенты, работающие на основе нейросетей. Основные их задачи: вести переписку, выполнять запросы, отвечать на вопросы и помогать в разных задачах.

Существуют два основных типа чат-ботов:

  1. Ассистенты . Это более продвинутые чат-боты, которые могут выполнять более сложные задачи. Могут понимать контекст, адаптировать ответы под пользователя и даже учиться с каждым новым взаимодействием. Ассистенты обычно требуют немного кода для настройки (low-code), поскольку они интегрируются с разными системами, могут анализировать данные и предоставлять индивидуальные ответы. Примером может служить персонализированный бот для технической поддержки или голосовой ассистент типа Siri или Google Assistant.

  2. Агенты . Это более простые боты, не требующие кодирования (no-code), но тоже выполняющие полезные задания. Они обычно работают по сценариям: ты задаешь им определенный набор вопросов и ответов, и бот отвечает на них в пределах установленных правил. Это идеально подходит для базовой автоматизации, например, для ответа на типовые запросы в интернет-магазине или на сайте поддержки.

Максимально упрощенный принцип работы можно описать так: чат-бот анализирует текст, определяет ключевые моменты – что ты хочешь узнать. Если это агент, он сравнивает твой запрос с заранее прописанными вариантами ответов и выбирает наиболее подходящий. Если это ассистент, он использует искусственный интеллект для понимания более глубокого контекста и адаптирует свой ответ на основе обученной модели.

В процессе работы такие роботы постоянно анализируют новые данные и совершенствуются. К примеру, если ты часто задаешь одни и те же вопросы, ассистент будет запоминать твои предпочтения и в дальнейшем давать более персонифицированные ответы.

Назовите пять правил наиболее эффективной работы с ИИ

Во-первых, просто спросите у самого ИИ, как с ним лучше всего работать. Искусственный интеллект – это хоть и инструмент, но инструмент, который сам озвучивает инструкцию к себе. Он сам может подсказать, какие задачи выполняет более эффективно, а в каких его "комптенции" не хватает. Попытайтесь написать ему запрос: "Что ты умеешь? Как лучше тебе задавать вопросы?" – и посмотрите на ответы.

Во-вторых, практикуйтесь и экспериментируйте. Пишите одно и то же разными способами и сравнивайте результаты. Изменяйте формулировку, уточняйте детали и следите за тем, как изменяются ответы ИИ. Важно понимать: чем больше времени вы проводите в работе с ИИ, тем лучше понимаете, как его использовать. Отбрасывайте лишнее, тестируйте новые идеи и ищите оптимальные варианты.

Третье – смотрите, как это делают другие . Читайте промпты (запросы), анализируйте, как они работают с ИИ, смотрите на их результаты. Многие делятся лайфхаками (или, как я их называю, "ШИхаками"), которые могут значительно облегчить вашу жизнь. Многие крутые инструменты доступны в сообществах в Facebook или Telegram, где люди делятся своим опытом и подсказками.

И, конечно, читайте рекомендации разработчика . Каждая платформа, будь то ChatGPT, MidJourney или другой инструмент, имеет собственные подсказки по оптимизации работы с их продуктом. Используйте эти ресурсы, чтобы лучше понять, как получить максимум из ИИ.

Не забывайте о дополнительных инструментах для улучшения запросов. Есть специальные "prompt generators", которые помогут вам более точно формулировать запросы и получать лучшие результаты. Это сервисы, помогающие в настройке и оптимизации ваших запросов.

Поэтому главное – практика, эксперименты и изучение опыта других. Чем больше времени вы инвестируете во взаимодействие с ИИ, тем лучше он будет работать для вас.

Источник: Pexels

Какие, по вашему мнению, могут быть прорывы в этой сфере в ближайшее время?

Будущее ИИ – это больше модальностей в одном месте. Если сейчас для выполнения задач нужен разный ИИ – для текста, для изображений, для аудио – скоро все будет сосредоточено на одной платформе. Не будет необходимости переключаться между инструментами. Сразу используем текст, аудио, видео и картинки вместе.

Еще один важный момент – это развитие "агентов"и "ассистентов". Уже сейчас нужны сервисы интеграции или дополнительный код, чтобы агенты выполняли более сложные задачи. "Ассистенты" примут на себя все больше функций – от автоматизации ежедневных задач до выполнения сложных интерактивных действий, таких как помощь на встречах или управление данными в реальном времени.

Далее –наблюдение и помощь на регулярной основе. Представьте, что ИИ постоянно следит за тем, что вы делаете: исправляет ошибки в реальном времени, дает подсказки и сопровождает на встречах, отслеживая все ваши действия. Он будет всегда "на линии", слушая и помогая в подходящий момент, даже через камеру, если это нужно. Это уже не просто инструмент, а ваш постоянный помощник.

Кроме того, девайсы из ИИ будут интегрированы не только в телефоны или часы. ИИ будет работать в железе, буквально в любых устройствах, которые можно вообразить – от кухонной техники до сложных инженерных систем. Это откроет новые горизонты для интеграции интеллектуальных решений в наши повседневные задачи.

И, наконец, интеграция разных масштабов знаний. ИИ сможет объединять данные из разных источников и работать на уровне интеллектуального агрегатора. Это не просто совокупность знаний, а их соединение в одну мощную систему, помогающую принимать решения и действовать более эффективно в любой сфере.