Генератор відео, ШІ в смартфоні й окулярах – найголовніше з презентації Google I/O
Фото: Google
Зміст:
  1. Gemini 1.5 Flash
  2. Проєкт Astra
  3. Спілкування з Google Photo
  4. Veo та Imagen 3
  5. Оновлення пошуку Google
  6. Gemini на Android

14 травня відбулася одна з наймасштабніших конференцій Google I/O. Традиційно під час заходу компанія представляє головні новинки року. Цього року практично вся увага була зосереджена на штучному інтелекті.

Читайте нас в Telegram: головні новини коротко

Наприкінці I/O, генеральний директор Google Сундар Пічаї повідомив, що слово "штучний інтелект" пролунало 121 раз. Це саме те, до чого прагне Google – впровадити ШІ в кожен застосунок і сервіс, якими користуються понад два мільярди людей по всьому світу. Liga.Tech зібрала основні новинки, які Google анонсувала на заході.

Gemini 1.5 Flash

Google анонсувала нову модель штучного інтелекту під назвою Gemini 1.5 Flash, яка, за словами компанії, оптимізована для швидкості й ефективності. Flash знаходиться між Gemini 1.5 Pro і Gemini 1.5 Nano, яка є найменшою моделлю компанії, що працює локально на пристрої.

Google заявила, що створила Flash, тому що розробники хотіли легшу і дешевшу, ніж Gemini Pro, модель для створення застосунків і сервісів на основі штучного інтелекту. Пізніше цього року Google подвоїть контекстне вікно Gemini до двох мільйонів токенів, а це означає, що він зможе одночасно обробляти дві години відео, 22 години аудіо, понад 60 000 рядків коду або понад 1,4 мільйона слів.

Фото: Google
Фото: Google

Проєкт Astra

Окрім цього Google представила нового асистента на базі штучного інтелекту – Project Astra. Можливості помічника компанія продемонструвала у відео, яке було зняте у лондонському офісі Google.

У ролику співробітниця компанія через камеру демонструє асистенту різні об'єкти та ставить питання або завдання. Як видно на відео, Astra може розпізнавати текст, малюнки, фрагменти коду і його призначення, а також запам'ятовувати предмети. Наприклад, коли помічника запитали, чи не бачив він окуляри, Astra відповіла, що вони знаходяться на краю стола поруч із червоним яблуком.

Компанія стверджує, що ролик знятий одним дублем. Потім співробітниця одягає окуляри й виявляється, що вони також оснащені камерами та дозволяють працювати із Project Astra. Це схоже на натяк, що Google збирається випускати нові окуляри.

Спілкування з Google Photo

Google Photo і до цього мав широкі можливості для пошуку і фільтрації світлин. Проте тепер, завдяки штучному інтелекту, користування застосунком стане більш природним і легким.

Наприклад, передплатник Google One у США зможе запитати у застосунку: "покажи мені найкращу фотографію з кожного національного парку, який я відвідав". Використовуючи інформацію GPS і власні судження про те, що є "найкращим", Google Photo сам підбере варіанти. Також Google Photo допоможе генерувати підписи для публікації фотографій у соціальних мережах.

Фото: Google
Фото: Google

Veo та Imagen 3

Нові рішення для створення медіа на основі штучного інтелекту від Google називаються Veo та Imagen 3. Veo – це відповідь Google на Sora від OpenAI. За словами Google, він здатен створювати "високоякісні" відео з роздільною здатністю 1080p, які можуть тривати "більш ніж хвилину", і розуміє такі кінематографічні концепції, як таймлапс.

Imagen 3 – це генератор текст-зображення, який, як стверджує Google, обробляє текст краще, ніж його попередня версія, Imagen 2. У компанії стверджують, що результатом є "найякісніша" модель перетворення тексту в зображення з "неймовірним рівнем деталізації" для "фотореалістичних, реалістичних зображень" і меншою кількістю артефактів, що, по суті, вигідно відрізняє його від OpenAI's DALLE-3.

Фото: Google
Фото: Google

Оновлення пошуку Google

Google внесла значні зміни у роботу своєї пошукової системи. 

Користувачі Google зможуть ставити складні запитання й отримувати детальні відповіді щодо різних сфер життя, як-от пошук студій йоги або пілатесу в певному місті з відображенням розкладу та вступних пропозицій.

Зараз така функція доступна лише для користувачів, які зареєструвалися на платформі Search Labs – платформі, що дозволяє людям тестувати експериментальні функції пошуку.

Пояснюємо складні речі простими словами – підписуйся на наш YouTube

Однак, основною новиною стало впровадження функції "Огляди штучного інтелекту", яку Google тестувала протягом року. 

За замовчуванням, першим, що буде відображатися в результатах запиту – відповідь штучного інтелекту, а потім результати пошуку.

Згідно з оцінками компанії, ця функція стане доступною для понад мільярда користувачів по всьому світу до кінця року.

Фото: Google
Фото: Google

Gemini на Android

Google інтегрує Gemini безпосередньо в Android 15, який вийде пізніше цього року. Gemini можна буде запустити разом з іншими програмами й отримати більше можливостей, наприклад, Circle to Search. По суті Gemini замінить класичний Google Assistant.

Компанія обіцяє ще багато оновлень. У Google заявила, що додадуть цифрові водяні знаки до відео і тексту, створених штучним інтелектом, зробить Gemini доступним на бічній панелі  Gmail і Docs, включить віртуального колегу по команді в Workspace, прослуховуватиме телефонні розмови й визначатиме, чи не намагаються вас обдурити, в режимі реального часу, і багато іншого.

Генератор відео, ШІ в смартфоні й окулярах – найголовніше з презентації Google I/O
Фото: Google