Генератор відео, ШІ в смартфоні й окулярах – найголовніше з презентації Google I/O
14 травня відбулася одна з наймасштабніших конференцій Google I/O. Традиційно під час заходу компанія представляє головні новинки року. Цього року практично вся увага була зосереджена на штучному інтелекті.
Наприкінці I/O, генеральний директор Google Сундар Пічаї повідомив, що слово "штучний інтелект" пролунало 121 раз. Це саме те, до чого прагне Google – впровадити ШІ в кожен застосунок і сервіс, якими користуються понад два мільярди людей по всьому світу. Liga.Tech зібрала основні новинки, які Google анонсувала на заході.
Gemini 1.5 Flash
Google анонсувала нову модель штучного інтелекту під назвою Gemini 1.5 Flash, яка, за словами компанії, оптимізована для швидкості й ефективності. Flash знаходиться між Gemini 1.5 Pro і Gemini 1.5 Nano, яка є найменшою моделлю компанії, що працює локально на пристрої.
Google заявила, що створила Flash, тому що розробники хотіли легшу і дешевшу, ніж Gemini Pro, модель для створення застосунків і сервісів на основі штучного інтелекту. Пізніше цього року Google подвоїть контекстне вікно Gemini до двох мільйонів токенів, а це означає, що він зможе одночасно обробляти дві години відео, 22 години аудіо, понад 60 000 рядків коду або понад 1,4 мільйона слів.
Проєкт Astra
Окрім цього Google представила нового асистента на базі штучного інтелекту – Project Astra. Можливості помічника компанія продемонструвала у відео, яке було зняте у лондонському офісі Google.
У ролику співробітниця компанія через камеру демонструє асистенту різні об'єкти та ставить питання або завдання. Як видно на відео, Astra може розпізнавати текст, малюнки, фрагменти коду і його призначення, а також запам'ятовувати предмети. Наприклад, коли помічника запитали, чи не бачив він окуляри, Astra відповіла, що вони знаходяться на краю стола поруч із червоним яблуком.
Компанія стверджує, що ролик знятий одним дублем. Потім співробітниця одягає окуляри й виявляється, що вони також оснащені камерами та дозволяють працювати із Project Astra. Це схоже на натяк, що Google збирається випускати нові окуляри.
Спілкування з Google Photo
Google Photo і до цього мав широкі можливості для пошуку і фільтрації світлин. Проте тепер, завдяки штучному інтелекту, користування застосунком стане більш природним і легким.
Наприклад, передплатник Google One у США зможе запитати у застосунку: "покажи мені найкращу фотографію з кожного національного парку, який я відвідав". Використовуючи інформацію GPS і власні судження про те, що є "найкращим", Google Photo сам підбере варіанти. Також Google Photo допоможе генерувати підписи для публікації фотографій у соціальних мережах.
Veo та Imagen 3
Нові рішення для створення медіа на основі штучного інтелекту від Google називаються Veo та Imagen 3. Veo – це відповідь Google на Sora від OpenAI. За словами Google, він здатен створювати "високоякісні" відео з роздільною здатністю 1080p, які можуть тривати "більш ніж хвилину", і розуміє такі кінематографічні концепції, як таймлапс.
Imagen 3 – це генератор текст-зображення, який, як стверджує Google, обробляє текст краще, ніж його попередня версія, Imagen 2. У компанії стверджують, що результатом є "найякісніша" модель перетворення тексту в зображення з "неймовірним рівнем деталізації" для "фотореалістичних, реалістичних зображень" і меншою кількістю артефактів, що, по суті, вигідно відрізняє його від OpenAI's DALLE-3.
Оновлення пошуку Google
Google внесла значні зміни у роботу своєї пошукової системи.
Зараз така функція доступна лише для користувачів, які зареєструвалися на платформі Search Labs – платформі, що дозволяє людям тестувати експериментальні функції пошуку.
Однак, основною новиною стало впровадження функції "Огляди штучного інтелекту", яку Google тестувала протягом року.
Згідно з оцінками компанії, ця функція стане доступною для понад мільярда користувачів по всьому світу до кінця року.
Gemini на Android
Google інтегрує Gemini безпосередньо в Android 15, який вийде пізніше цього року. Gemini можна буде запустити разом з іншими програмами й отримати більше можливостей, наприклад, Circle to Search. По суті Gemini замінить класичний Google Assistant.
Компанія обіцяє ще багато оновлень. У Google заявила, що додадуть цифрові водяні знаки до відео і тексту, створених штучним інтелектом, зробить Gemini доступним на бічній панелі Gmail і Docs, включить віртуального колегу по команді в Workspace, прослуховуватиме телефонні розмови й визначатиме, чи не намагаються вас обдурити, в режимі реального часу, і багато іншого.