Генератор видео, ИИ в смартфоне и очках – самое главное из презентации Google I/O
14 мая состоялась одна из самых масштабных конференций Google I/O. Традиционно во время мероприятия компания представляет главные новинки года. В этом году практически все внимание было сосредоточено на искусственном интеллекте.
В конце I/O генеральный директор Google Сундар Пичаи сообщил, что слово "искусственный интеллект" прозвучало 121 раз. Это именно то, к чему стремится Google – внедрить ИИ в каждое приложение и сервис, которыми пользуются более двух миллиардов человек по всему миру. Liga.Tech собрала основные новинки, которые Google анонсировала на мероприятии.
Gemini 1.5 Flash
Google анонсировала новую модель искусственного интеллекта под названием Gemini 1.5 Flash, которая, по словам компании, оптимизирована для быстроты и эффективности. Flash находится между Gemini 1.5 Pro и Gemini 1.5 Nano, которая является самой маленькой моделью компании, работающей локально на устройстве.
Google заявила, что создала Flash, потому что разработчики хотели более легкую и более дешевую, чем Gemini Pro, модель для создания приложений и сервисов на основе искусственного интеллекта. Позже в этом году Google удвоит контекстное окно Gemini до двух миллионов токенов, что означает, что он сможет одновременно обрабатывать два часа видео, 22 часа аудио, более 60 000 строк кода или более 1,4 миллиона слов.
Проект Astra
Кроме этого Google представила нового ассистента на базе искусственного интеллекта – Project Astra. Возможности помощника компания продемонстрировала в видео, снятом в лондонском офисе Google.
В ролике сотрудница компания через камеру показывает ассистенту разные объекты и задает вопросы или задачи. Судя по видео Astra может распознавать текст, рисунки, фрагменты кода и его предназначение, а также запоминать предметы. К примеру, когда помощника спросили, не видел ли он очки, Astra ответила, что они находятся на краю стола рядом с красным яблоком.
Компания утверждает, что ролик снят одним дублем. Затем сотрудница одевает очки и оказывается, что они также оснащены камерами и позволяют работать с Project Astra. Это похоже на намек, что Google собирается выпускать новые очки.
Общение с Google Photo
Google Photo и до этого имел широкие возможности для поиска и фильтрации фотографий. Однако теперь, благодаря искусственному интеллекту, использование приложения станет более естественным и легким.
Например, подписчик Google One в США сможет попросить приложение: "покажи мне лучшую фотографию из каждого национального парка, который я посетил". Используя информацию GPS и собственные суждения о том, что "лучшее", Google Photo сам подберет варианты. Также Google Photo поможет создать подписи для публикации фотографий в социальных сетях.
Veo и Imagen 3
Новые решения для создания медиа на основе искусственного интеллекта от Google называются Veo и Imagen 3. Veo – это ответ Google на Sora от OpenAI. По словам Google, он способен создавать "высококачественные" видео с разрешением 1080p, которые могут длиться "больше минуты", и понимает такие кинематографические концепции, как таймлапс.
Imagen 3 – это генератор текст-изображения, который, как утверждает Google, обрабатывает текст лучше, чем его предыдущая версия, Imagen 2. В компании утверждают, что результатом является "самая качественная" модель преобразования текста в изображение с "невероятным уровнем детализации" для "фотореалистических", реалистичных изображений и меньшим количеством артефактов, что, по сути, выгодно отличает его от OpenAI's DALLE-3.
Обновление поиска Google
Google внесла значительные изменения в работу своей поисковой системы.
Сейчас такая функция доступна только пользователям, которые зарегистрировались на платформе Search Labs – платформе, позволяющей людям тестировать экспериментальные функции поиска.
Однако основной новостью стало внедрение функции "Обзоры искусственного интеллекта", которую Google тестировала в течение года.
Согласно оценкам компании, эта функция станет доступной более чем миллиарду пользователей по всему миру до конца года.
Gemini на Android
Google интегрирует Gemini прямо в Android 15, который выйдет Android позже в этом году. Gemini можно будет запустить вместе с другими приложениями и получить больше возможностей, например, Circle to Search. Фактично Gemini заменит классический Google Assistant.
Компания обещает еще много обновлений. В Google заявили, что добавят цифровые водяные знаки к видео и тексту, созданному искусственным интеллектом, сделает Gemini доступным на боковой панели в Gmail и Docs, включит виртуального коллегу по команде в Workspace, будет прослушивать телефонные разговоры и будет определять, не пытаются ли вас обмануть, в режиме реального времени, и многое другое.