ChatGPT, Copilot, Gemini та Grok. Зібрали нові функції інструментів штучного інтелекту
Технологічні компанії агресивно конкурують за лідерство у сфері генеративного штучного інтелекту. Open Ai, Google та Microsoft регулярно оновлюють свої ШІ-продукти так, щоб ті ставали розумнішими та давали користувачам більше можливостей.
Liga.Tech зібрала деякі нові функції ChatGPT, Gemini (екс-Google Bard), Mirosoft Copilot (екс-Bing) та Grok, які були презентовані аудиторії протягом останніх місяців та нагадує, чим відрізняються ці інструменти.
ChatGPT – перший серед чатботів
- Читання вголос
У травні OpenAI представив нову функцію для ChatGPT – читання вголос, яка доступна у вебверсії та застосунках ChatGPT для iOS та Android. Ця функція підтримує 37 мов і автоматично визначає мову тексту для читання.
Щоб скористатися цією опцією, користувачам застосунків треба просто затиснути обраний текст. У вебверсії – така опція відображатиметься внизу чату, одразу під відповіддю ChatGPT. На неї вказує відповідний значок "Динамік".
- Пам'ять
Незабаром популярний чатбот стане ще більш людяним, завдяки новій функції, яку зараз тестує Open AI. У компанії обіцяють, що ChatGPT навчиться запам'ятовувати речі, які ви з ним обговорювали, щоб покращити користувацький досвід.
Поки що ця функція доступна невеликій частині користувачів платної та безплатної версії ChatGPT. Якщо ви опинилися серед обраної групи, вимкнути пам'ять можна, відкривши "Налаштування", далі обрати "Персоналізація" та "Пам'ять". Також ви зможете попросити чатбот забути певні речі.
- Зображення за текстовим описом
Чатбот тепер може створювати унікальні зображення за вашими описами. Ця нова функція доступна для користувачів платних версій чатбота – Plus і Enterprise. Користувачі можуть попросити чатбот допрацювати зображення або створити щось за прикладом наявних малюнків та фото.
Можливість забезпечується генератором зображень DALL·E 3, який було інтегровано в чатбот. Це зробило цей інструмент доступним більшій кількості людей без необхідності вивчати складне програмне забезпечення.
- Розпізнавання зображень та голосових інструкцій
Користувачі ChatGPT Plus і Enterprise можуть ставити чатботу завдання голосом та демонструвати, про що ви говорите. У компанії обіцяють, що це значно заощадить час як у робочих, так і в побутових ситуаціях. Наприклад, чатбот може запропонувати вам рецепт вечері за фото, на якому можна роздивитися актуальний зміст вашого холодильника.
- Підтримка понад 80 мов
Цей інструмент важливий не лише для користувачів інструментів штучного інтелекту в різних країнах, але й для тих, чий бізнес працює на різних ринках. Це дозволяє економити бюджети.
Gemini (ex-Bard) – переваги Google
- Інтеграція з програмами Google
Gemini тепер інтегровано з такими програмами Google, як Gmail, Карти та YouTube, що полегшити роботу та отримувати інформацію з ваших документів. Користувач може керувати налаштуваннями та вирішувати, до яких програм матиме доступ чатбот.
Ви можете взаємодіяти з Gemini за допомогою тексту, голосу або зображень, щоб писати листи, планувати маршрути тощо. За відгуками користувачів, інтеграція з Google дає цьому ШІ чатботу перевагу в пошуку та аналізі наявної інформації.
- Налаштування відповідей
Останнє оновлення, запропоноване користувачам, можливість налаштовувати відповіді чатбота. Виберіть частину тексту, яку потрібно змінити, дайте Gemini відповідні інструкції та отримайте результат, який буде ближчим до того, що ви шукаєте.
- Робота з Python
Користувачі Gemini Advanced тепер можуть редагувати та запускати код Python безпосередньо в інтерфейсі користувача Gemini. Це дозволяє експериментувати з кодом, дивитися, як зміни впливають на результат, та перевіряти, чи код працює належним чином.
- Створення зображень за описом
На відміну від ChatGPT, Gemini зробив цю функцію доступною для всіх. Єдине – користувачі безплатної версії мають обмеження на кількість зображень за певний період. Щоб створити зображення – треба ввести кілька підказок для чатбота. Встановити додаткові параметри можна, натиснувши "Створити більше".
- Підтримка 40 мов
Gemini поступово наздоганяє конкурента і збільшує кількість доступних мов. Віднедавна цей інструмент підтримує 40 мов та доступний у 230 країнах.
Microsoft Copilot (ex-Bing) – інтеграція з Office
- Безплатний доступ до преміумможливостей GPT-4
Microsoft є інвестором OpenAI, тому не дивно, що обидва чатботи працюють на основі моделі GPT. Але якщо вам потрібен безплатний доступ до GPT-4 (найдосконалішої та потужнішої мовної моделі OpenAI, яка зокрема заснована на актуальних даних, а не пропонує вам інформацію дворічної давнини), Copilot — це ваш шлях.
Доступ до GPT-4 через ChatGPT відкритий тільки для платних користувачів.
- Інтеграція з продуктами Microsoft
Компанія робить ставку на те, що чатбот Copilot тісно інтегрований з продуктами Microsoft Office. Таким чином ви можете використовувати переваги ШІ у звичних програмах.
- Створення музики за описом
Завдяки інтегрованому плагіну Suno Copilot навчився генерувати музику за текстовим описом. Щоби згенерувати мелодію, треба авторизуватися на copilot.microsoft.com, увімкнути Suno та ввести підказку щодо жанру та тематики пісні.
Ця можливість відкрита як для користувачів безплатної версії, так і Copilot Pro. Але щоб отримати права на музику та використовувати її, наприклад, з комерційною метою, потрібно стати преміумкористувачем.
Grok – зухвале творіння Маска
- Інтеграція з X (екс-Twitter)
Ілон Маск запустив свій чатбот пізніше за конкурентів. Щоб посилити позиції свого ШІ-інструмента, техномільярдер вирішив просувати його за допомогою інших своїх продуктів. Так, нещодавно Grok було інтегровано у соціальну мережу X. Скористатися ним поки що можуть лише преміумпідписники цієї платформи.
- "Бунтар" серед ШІ
Бізнесмен намагається застосувати до чатбота такий самий підхід, який він пропагує щодо інших своїх проєктів. Це означає, що Grok має менше обмежень та готовий торкатися тем, які інші ШІ можуть уникати. "Бунтарський" дух чатбота також відзначається в описі на офіційному сайті, де користувачам обіцяють більш приємне та неформальне спілкування.
Водночас такі можливості мають зворотний бік, які роблять цей інструмент менш безпечним. Зокрема, він вже зазнав критики через те, що дає поради, які можуть становити загрозу для безпеки людей.
- Багатозадачність
Grok може обробляти кілька запитів і завдань одночасно, дозволяючи користувачам плавно між ними перемикатися.
- Обробка інформації в режимі реального часу
Завдяки інтеграції з платформою X, він має доступ до новин та інформації в режимі реального часу. Водночас Grok поки що не завжди може відрізнити справжні новини від фейків та жартів, тому не варто довіряти йому на 100%.
- Просторове розуміння реального світу
Після останнього оновлення Grok вміє розуміти зображення, аналізувати таблиці, скриншоти та діаграми. Крім того, чатбот отримав "просторове розуміння реального світу", яке дозволяє краще зрозуміти фізичний світ на зображеннях, завантажених користувачами.