Содержание:
  1. ChatGPT – первый среди чат-ботов
  2. Gemini (ex-Bard) – преимущества Google
  3. Microsoft Copilot (ex-Bing) – интеграция с Office
  4. Grok – дерзкое творение Маска

Технологические компании агрессивно конкурируют за лидерство в области генеративного искусственного интеллекта. Open Ai, Google и Microsoft регулярно обновляют свои ШИ-продукты так, чтобы те становились умнее и давали пользователям больше возможностей.

Liga.Tech собрала некоторые новые функции ChatGPT, Gemini (экс-Google Bard), Mirosoft Copilot (экс-Bing) и Grok, которые были представлены аудитории в последние месяцы и напоминает, чем отличаются эти инструменты.

ChatGPT – первый среди чат-ботов

  • Чтение вслух

В мае OpenAI представил новую функцию для ChatGPT – чтение вслух, доступную в веб-версии и приложениях ChatGPT для iOS и Android. Эта функция поддерживает 37 языков и автоматически определяет язык чтения.

Чтобы использовать эту опцию, пользователям приложений нужно просто зажать выбранный текст. В веб-версии – такая опция отображается внизу чата, сразу под ответом ChatGPT. На нее указывает соответствующий значок "Динамик".

Что могут ChatGPT, Copilot, Gemini и Grok. Собрали новые функции
Скриншот ChatGPT
  • Память

Вскоре популярный чат станет еще более человечным, благодаря новой функции, которую сейчас тестирует Open AI. В компании обещают, что ChatGPT научится запоминать вещи, которые вы с ним обсуждали, чтобы улучшить пользовательский опыт.

Во время общения вы можете попросить его запомнить что-нибудь конкретное или позволить ему самому собирать детали. Чем дольше вы будете пользоваться этой функцией, тем лучше она будет работать.

Пока эта функция доступна небольшой части пользователей платной и бесплатной версии ChatGPT. Если вы оказались среди выбранной группы, можно отключить память, открыв "Настройки", затем выбрать "Персонализация" и "Память". Также вы сможете попросить чат-бот забыть определенные вещи.

  • Изображение по текстовому описанию

Чат-бот теперь может создавать уникальные изображения по вашим описаниям. Эта новая функция доступна для пользователей платных версий чата – Plus и Enterprise. Пользователи могут попросить чат-бот доработать изображение или создать что-нибудь по примеру имеющихся рисунков и фото.

Возможность обеспечивается генератором изображений DALL·E 3, интегрированным в чат-бот. Это сделало этот инструмент доступным большему числу людей без необходимости учить сложное программное обеспечение.

  • Распознавание изображений и голосовых инструкций

Пользователи ChatGPT Plus и Enterprise могут ставить чат-боту задания голосом и демонстрировать, о чем вы говорите. В компании обещают, что это значительно сэкономит время как в рабочих, так и в бытовых ситуациях. К примеру, чат-бот может предложить вам рецепт ужина за фото, на котором можно рассмотреть актуальное содержание вашего холодильника.

  • Поддержка более 80 языков

Этот инструмент важен не только для пользователей инструментов искусственного интеллекта в разных странах, но и для тех, чей бизнес работает на разных рынках. Это позволяет экономить бюджеты.

Gemini (ex-Bard) – преимущества Google

  • Интеграция с приложениями Google

Gemini теперь интегрирована с такими приложениями Google, как Gmail, Карты и YouTube, чтобы облегчить работу и получать информацию из ваших документов. Пользователь может управлять настройками и решать, к каким программам будет иметь доступ чат-бот.

Вы можете взаимодействовать с Gemini с помощью текста, голоса или изображений, чтобы писать письма, планировать маршруты и т.д. По отзывам пользователей, интеграция с Google дает этому ИИ чат-боту преимущество в поиске и анализе имеющейся информации.

  • Настройка ответов

Последнее обновление, предлагаемое пользователям, возможность настраивать ответы чат-бота. Выберите часть текста, которую необходимо изменить, дайте Gemini соответствующие инструкции и получите результат, который будет ближе к тому, что вы ищете.

  • Работа с Python

Пользователи Gemini Advanced теперь могут редактировать и запускать код Python непосредственно в пользовательском интерфейсе Gemini. Это позволяет экспериментировать с кодом, смотреть, как изменения влияют на результат, и проверять, работает ли код правильно.

  • Создание изображений по описанию

В отличие от ChatGPT, Gemini сделал эту функцию доступной всем. Единственное – пользователи бесплатной версии имеют ограничения на количество изображений за определенный период времени. Чтобы создать изображение – нужно ввести несколько подсказок для чат-бота. Можно установить дополнительные параметры, нажав "Создать больше".

  • Поддержка 40 языков

Gemini постепенно догоняет конкурента и увеличивает количество доступных языков. С недавнего времени этот инструмент поддерживает 40 языков и доступен в 230 странах.

Microsoft Copilot (ex-Bing) – интеграция с Office

  • Бесплатный доступ к премиум-возможностям GPT-4

Microsoft является инвестором OpenAI, поэтому не удивительно, что оба чат-бота работают на основе модели GPT. Но если вам нужен бесплатный доступ к GPT-4 (самая совершенная и мощная языковая модель OpenAI, которая в частности основана на актуальных данных, а не предлагает вам информацию двухлетней давности), Copilot — это ваш путь.

Доступ к GPT-4 через ChatGPT открыт только платным пользователям.

  • Интеграция с продуктами Microsoft

Компания делает ставку на то, что чат-бот Copilot тесно интегрирован с продуктами Microsoft Office. Таким образом вы получаете преимущества ИИ в знакомых вам программах. 

  • Создание музыки по описанию

Благодаря встроенному плагину Suno Copilot научился генерировать музыку по текстовому описанию. Чтобы сгенерировать мелодию, нужно авторизироваться на copilot.microsoft.com, включить Suno и ввести подсказку по жанру и тематике песни.

Эта возможность открыта как пользователям бесплатной версии, так и Copilot Pro. Но, чтобы получить права на музыку и использовать ее, например, с коммерческой целью, нужно стать премиум-пользователем.

Grok – дерзкое творение Маска

  • Интеграция с X (экс-Twitter)

Илон Маск запустил свой чат-бот позже конкурентов. Чтобы усилить позиции своего ИИ-инструмента, техномиллиардер решил продвигать его с помощью других своих продуктов. Так, недавно Grok был интегрирован в социальную сеть X. Воспользоваться им пока могут только премиум-подписчики этой платформы.

  • "Бунтарь" среди ИИ

Бизнесмен пытается применить к чат-боту такой же подход, как он пропагандирует в отношении других своих проектов. Это означает, что Grok имеет меньше ограничений и готов затрагивать темы, которые другие ИИ могут избегать. "Бунтарский" дух чат-бота также отмечается в описании на официальном сайте, где пользователям обещают более приятное и неформальное общение.

В то же время такие возможности имеют обратную сторону, которые делают этот инструмент менее безопасным. В частности, он уже подвергся критике из-за того, что дает советы, которые могут представлять угрозу безопасности людей.

  • Многозадачность

Grok может обрабатывать несколько запросов и задач одновременно, позволяя пользователям плавно между ними переключаться.

  • Обработка информации в режиме реального времени

Благодаря интеграции с платформой X, он имеет доступ к новостям и информации в режиме реального времени. В то же время, Grok пока не всегда может отличить настоящие новости от фейков и шуток, поэтому не стоит доверять ему на 100%.

  • Пространственное понимание реального мира

После последнего обновления Grok умеет понимать изображения, анализировать таблицы, скриншоты и диаграммы. Кроме того, чат-бот получил "пространственное понимание реального мира", позволяющее лучше понять физический мир на изображениях, загруженных пользователями.