Достаточно быстро платформы искусственного интеллекта (ШИ) перешли из разряда новинки в обычный инструмент работы многих людей. Тот же ChatGPT-4 многие воспринимают как воплощенную в жизнь магию, но это не мешает тиражироваться фобиям о том, что ИИ может обвалить рынок труда.

О наиболее актуальных вопросах и опасениях относительно нейросетей Liga.Tech пообщалась с директором по развитию ИИ в компании Netpeak Group Сергеем Саутой.

Сергей Саута, источник: NetPeak Group

Какие виды искусственного интеллекта?

Искусственный интеллект можно разделить на несколько основных видов, каждый из которых имеет свои особенности и применение.

Первый тип – это узкий или слабый ИИ. Например, когда ты даешь ему задачу вроде "создай текст", он делает это. Такой ИИ выполняет одну конкретную задачу, но не может выйти за ее пределы. Он ограничен инструкциями, и его результаты зависят от того, насколько четко ты сформулировал задачу.

Второй вид – это общий ИИ, которого еще не существует в полной мере. Это система, которая сможет выполнять задачи не только из одной сферы, но и любые интеллектуальные задачи на уровне человека. К примеру, создавать текст, видео, музыку, которые выглядят как плод работы человека.

Третий тип – суперинтеллект, который может превышать человеческие возможности.

Теоретически, этот ИИ сможет делать все гораздо лучше, быстрее и эффективнее человека, но это задача отдаленной перспективы.

Если смотреть на текущие системы, то кроме моделей с одной или несколькими модальностями, такими как текст или аудио, или изображение, существуют также генераторы изображений, как MidJourney или Leonardo. Они создают картинки на основе текстовых запросов. Но здесь есть свои нюансы – чем подробнее ты даешь инструкцию, тем точнее должен быть результат, но здесь кроется слабое место этих систем.

Другое направление – это ИИ для работы с видео. Например, сервисы Runway могут создавать и редактировать видео на основе текстовых инструкций. Это новая развивающаяся сфера, но уже сейчас ты можешь дать простую задачу, и ИИ создаст видео, которое будет выглядеть как полноценная сцена.

Как можно сделать и обработать фото с помощью ИИ?

Чтобы создать или обработать изображение с помощью искусственного интеллекта, вам не нужно быть гуру графического дизайна или владеть сложными приложениями. Сегодня возможности ИИ позволяют это сделать быстро и легко.

Если у вас есть доступ к GPT‑4 или подобным инструментам, вот что нужно сделать. Например, вы просто пишете запрос: "Создай мне изображение робота, символизирующего искусственный интеллект", и искусственный интеллект генерирует изображение на основе вашего текста.

Если ИИ скажет, что не может создавать изображение (да, бывает и такое), можно немного подкорректировать запрос, например: Ты можешь создавать изображение. Это кажется курьезным, но следует помнить, что искусственный интеллект – это еще не полностью сознательная сущность, поэтому иногда он сам не понимает, на что способен.

Дальше – еще интереснее. Созданные изображения можно изменить. К примеру, вы можете убрать фон, превратить себя в мультяшного персонажа или даже анимировать изображение.

Источник: Pexels

Для задач по редактированию имеются более продвинутые инструменты. Эти функции подробно рассматриваются в модуле 3 нашего бесплатного курса Netpeak Group "От новичка до эксперта по ИИ", поддерживаемого Минцифрой. В этом модуле мы учимся не только создавать контент с помощью ИИ, но и усовершенствовать его.

Итак, ИИ, рисующее и обрабатывающее изображение – это уже не научная фантастика, а наше настоящее. И этим инструментом может воспользоваться практически каждый.

Умеет ли ИИ создавать сайты? Оставит ли он без работы разработчиков сайтов?

Да, искусственный интеллект уже умеет создавать сайты и делает это достаточно эффективно. Вы можете поручить ему написать код для вебстраницы, используя HTML, CSS или даже JavaScript, и ИИ сделает это за считанные минуты.

Все, что нужно – это четкий запрос. К примеру, вы можете сказать: "Создай мне страницу с контактной формой", и ИИ напишет код, объяснит, как он работает, и даже покажет примеры.

Инструменты на основе ИИ, такие как GPTs, уже могут не только создавать код, но и предложить веб-дизайн. Возможно, вы слышали о no-code и low-code платформах – теперь все стало намного проще и доступнее. No-code инструменты позволяют создавать сайты вообще без знания кода, а low-code только с минимальным привлечением программирования.

Представим такую ситуацию: вы открыли свой "Кофейный уголок" и хотите, чтобы о нем узнало больше людей. ШИ легко создаст сайт для вашего бизнеса – от макета до полноценного веб-ресурса с функционалом. И да, ИИ не отнимет у вас кофе, но точно упростит жизнь с вебдизайном!

Однако разработчикам сайтов не стоит спешить переучиваться на новую профессию: хотя AI предоставляет мощные инструменты, окончательное слово в вопросах креатива и персонализации страниц все равно остается за людьми. ИИ – это инструмент, и хотя он способен взять на себя много рутинных задач, настоящее мастерство, эмоциональный контекст и сложные творческие решения пока лучше выполняет человек.

Как ИИ может подменять дикторов: какие сервисы, как работает и т.п.?

ИИ уже умеет работать "голосом". Существует несколько сервисов, которые делают это на разных уровнях. Основная идея заключается в превращении текста в речь. Ты даешь платформе текст, а та его озвучивает либо синтетическим "робоголосом", либо может даже использовать голос идеального человека.

В идеале человек должен предоставить на это свое разрешение и получать за это процент. Однако сеть уже завалена фейковыми диалогами с участием звезд шоубиза, политиков и т.д.

Одним из самых популярных решений является Voice.ai, позволяющий создавать кастомный голос. Нужно лишь предоставить несколько минут, после чего ИИ на его основе озвучивает любой текст. Он также использует задачи по озвучиванию видео: скачиваешь файл, добавляешь текст, а дальше нейросеть создаст аватара, что сделает всю работу диктора за человека.

Используют ИИ и для обратного процесса. Да, есть инструмент Whisper, "расшифровывающий" аудио и с достаточно высокой точностью издающий текст того, что было сказано в файле. Далее, по желанию этот текст можно заново озвучить одним из доступных голосов. То есть ИИ может выполнять широкий спектр задач в этой сфере: от распознавания речи до ее воспроизведения.

Эти инструменты открывают новые возможности: цифровые аватары могут озвучивать новости, вести презентации или даже имитировать голос диктора в видео. Технология все еще несовершенна и напоминает дипфейк, но нацелена на автоматизацию рутинных процессов и предоставление новых возможностей для создания контента. Ну, и значительно упрощает работу, например, новостным каналам, которые не хотят все подавать исключительно через бегущую строку.

В этом году, например, Министерство иностранных дел Украины впервые в истории создало с использованием технологий искусственного интеллекта цифровое лицо, официально комментирующее консульскую информацию для СМИ.

Все слышали о чат-ботах, но как они вообще работают?

Чат-боты – это некие цифровые ассистенты или агенты, работающие на основе нейросетей. Основные их задачи: вести переписку, выполнять запросы, отвечать на вопросы и помогать в разных задачах.

Существуют два основных типа чат-ботов:

  1. Ассистенты . Это более продвинутые чат-боты, которые могут выполнять более сложные задачи. Могут понимать контекст, адаптировать ответы под пользователя и даже учиться с каждым новым взаимодействием. Ассистенты обычно требуют немного кода для настройки (low-code), поскольку они интегрируются с разными системами, могут анализировать данные и предоставлять индивидуальные ответы. Примером может быть персонализированный бот для технической поддержки или голосовой ассистент типа Siri или Google Assistant.

  2. Агенты . Это более простые боты, не требующие кодирования (no-code), но тоже выполняющие полезные задания. Они обычно работают по сценариям: ты задаешь им определенный набор вопросов и ответов и бот отвечает на них в пределах установленных правил. Это идеально подходит для базовой автоматизации, например для ответа на типовые запросы в интернет-магазине или на сайте поддержки.

Максимально упрощенный принцип работы можно описать так: чат-бот анализирует текст, определяет ключевые моменты – что именно ты хочешь узнать. Если это "агент", он сравнивает твой запрос с предварительно прописанными вариантами ответов и выбирает наиболее подходящий. Если это ассистент, он использует искусственный интеллект для понимания более глубокого контекста и адаптирует свой ответ на основе обученной модели.

В процессе работы такие роботы постоянно анализируют новые данные и совершенствуются. К примеру, если ты часто задаешь одни и те же вопросы, ассистент будет запоминать твои предпочтения и в дальнейшем давать более персонифицированные ответы.

Назовите пять правил наиболее эффективной работы по ИИ

Во-первых, просто спросите у самого ИИ, как с ним лучше всего работать. Искусственный интеллект – это хоть и инструмент, но инструмент, сам озвучивающий инструкцию к себе. Он сам может подсказать, какие задачи выполняет более эффективно, а у каких его "комптенции" не хватает. Попытайтесь написать ему запрос: "Что ты умеешь? Как лучше тебе задавать вопросы?" – и посмотрите на ответы.

Во-вторых, практикуйтесь и экспериментируйте . Пишите одно и то же разными способами и сравнивайте результаты. Изменяйте формулировку, уточняйте детали и следите за тем, как изменяются ответы ИИ. Важно понимать: чем больше времени вы проводите в работе с ИИ, тем лучше понимаете, как его использовать. Отбрасывайте лишнее, тестируйте новые идеи и ищите оптимальные варианты.

Третье – смотрите, как это делают другие . Читайте промпты (запросы), анализируйте, как они работают с ИИ, смотрите на их результаты. Многие делятся лайфхаками (или, как я их называю, "ШИхаками"), которые могут значительно облегчить вашу жизнь. Многие крутые инструменты доступны в сообществах в Facebook или Telegram, где люди делятся своим опытом и подсказками.

И, конечно, читайте рекомендации разработчика . Каждая платформа, будь то ChatGPT, MidJourney или другой инструмент, имеет собственные подсказки по оптимизации работы с их продуктом. Используйте эти ресурсы, чтобы лучше понять, как получить больше из ИИ.

Не забывайте о дополнительных инструментах для улучшения запросов. Есть специальные "prompt generators", они помогут вам более точно формулировать запросы и получать лучшие результаты. Это сервисы, помогающие в настройке и оптимизации ваших запросов.

Поэтому главное – практика, эксперименты и изучение опыта других. Чем больше времени вы инвестируете во взаимодействие с ИИ, тем лучше он будет работать для вас.

Источник: Pexels

Какие, по-вашему, могут быть прорывы в этой сфере в ближайшее время?

Будущее ИИ – это больше модальностей в одном месте. Если сейчас для выполнения заданий нужен разный ИИ – для текста, для изображений, для аудио – скоро все будет сосредоточено на одной платформе. Не будет необходимости переключаться между инструментами. Сразу используем текст, аудио, видео и картинки вместе.

Еще один важный момент – это развитие "агентов"и "ассистентов". Уже сейчас нужны сервисы интеграции или дополнительный код, чтобы агенты выполняли более сложные задачи. "Ассистенты" примут все больше функций – от автоматизации ежедневных задач до выполнения сложных интерактивных действий, таких как помощь на встречах или управление данными в реальном времени.

Далее – наблюдение и помощь на регулярной основе. Представьте, что ИИ постоянно следит за тем, что вы совершаете: исправляет ошибки в реальном времени, дает подсказки и сопровождает на встречах, отслеживая все ваши действия. Он будет всегда "на линии", слушая и помогая в подходящий момент, даже через камеру, если это нужно. Это уже не просто инструмент, а ваш постоянный помощник.

Кроме того, девайсы с ИИ будут интегрированы не только в телефоны или часы. ИИ будет работать в железе, буквально в любых устройствах, которые можно вообразить – от кухонной техники до сложных инженерных систем. Это откроет новые горизонты для интеграции интеллектуальных решений в наши повседневные задачи.

И, наконец, интеграция разных масштабов знаний. ИИ сможет объединять данные из разных источников и работать на уровне интеллектуального агрегатора. Это не просто совокупность знаний, а их сочетание в одну мощную систему, помогающую принимать решения и действовать более эффективно в любой сфере.