20 травня 2025 року в американському місті Маунтін-В’ю стартувала щорічна конференція розробників Google I/O 2025. На заході було представлено безліч оновлень у сфері штучного інтелекту та технологій зв’язку.
Про це розповідає Бізнес • Медіа
Нові технології Google Beam та покращення Google Meet
Серед головних новинок конференції відзначився Google Beam — платформа для відеозв’язку, яка забезпечує реалістичний 3D-ефект присутності. Використовуючи шість камер і штучний інтелект, Google Beam пропонує можливість відтворення з точністю до міліметра при 60 кадрах на секунду, що створює ілюзію спілкування в одному приміщенні. Перші пристрої Beam планується випустити для ранніх користувачів вже у 2025 році.
Крім того, було покращено Google Meet, до якого додано автоматичний переклад мовлення в режимі реального часу. Ця функція відтворює голос, тон і міміку мовця, на даний момент працює з англійської на іспанську у бета-версії для користувачів тарифів AI Pro та Ultra, з подальшим додаванням нових мов.
Генеративні моделі Veo 3 та Imagen 4
Конференція також представила нову генеративну модель Veo 3, яка здатна створювати відео, включаючи звукові ефекти, фоновий шум та діалоги. Ця модель значно покращила якість відео у порівнянні з попередніми версіями і стане доступною з 21 травня у застосунку Gemini для підписників тарифу AI Ultra за $249,99 на місяць.
Окрім того, Imagen 4 — інструмент для генерації зображень, який може створювати фотореалістичні та абстрактні зображення з високою деталізацією, включаючи текстури та природні елементи, у роздільній здатності до 2K.
На заході також анонсували оновлення Gemini Live, яке представило функції універсального ШІ-асистента Project Astra з підтримкою камери та спільного доступу до екрана, вже використовувані для підготовки до співбесід і марафонських тренувань.
Google продовжує працювати над розробкою агентів на базі ШІ, які автоматизують рутинні завдання. Прототип Mariner дозволяє виконувати пошуки житла та інші завдання, доступні розробникам через API Gemini.
«Якщо друг попросить поради про поїздку, Gemini автоматично знайде ваші попередні листи та файли, наприклад, маршрути в Google Docs, та запропонує відповідь, що відповідає вашому стилю та тону» — зазначено у Google.
Крім того, Google анонсувала новий режим AI Mode, що дозволяє ставити довші і складніші запити у пошуку, а також оновлену функцію Deep Research, що тепер підтримує завантаження власних PDF-файлів та зображень.
На завершення конференції Google презентувала Stitch — інструмент для генерації інтерфейсів веб- та мобільних застосунків, який забезпечує створення HTML та CSS-коду на основі певних слів або зображень.
Конференція Google I/O 2025 також включала анонс інвестицій у $150 млн у виробника окулярів Warby Parker, що підкреслює прагнення компанії до інновацій у різних сферах.