16.05.2024
102

Google I/O 2024: ключові моменти

Сергій Островський
Головний редактор ApiX-Drive
Час прочитання: ~6 хв

Конференція Google I/O 2024 відзначилася кількома цікавими анонсами. Ось короткий огляд основних оновлень:

Gemini 1.5 Pro

Генеративну модель штучного інтелекту Gemini було значно оновлено, тепер вона здатна аналізувати довші документи, кодові бази, відео та аудіозаписи. Остання версія, Gemini 1.5 Pro, представлена в приватному попередньому перегляді, може обробляти до 2 мільйонів токенів, подвоюючи попередню потужність.

Gemini Live

Було представлено Gemini Live, що дозволяє користувачам проводити «поглиблені» голосові чати з Gemini на своїх смартфонах. Користувачі можуть переривати чатбот, щоб поставити уточнювальні запитання, а Gemini адаптується до моделей мовлення в режимі реального часу. Крім того, Gemini може бачити та реагувати на оточення за допомогою фотографій або відео, знятих камерами смартфонів.

Gemini on Android

Незабаром Gemini замінить Google Assistant на Android, глибоко інтегруючись із мобільною ОС і додатками Google. Користувачі зможуть перетягувати зображення, створені штучним інтелектом, у Gmail, Google Messages та інші програми. Користувачі YouTube зможуть використовувати функцію «Ask this video», щоб знайти певну інформацію у відео.

Gemini Nano

Google інтегрує Gemini Nano, свою найменшу модель штучного інтелекту, безпосередньо в клієнт Chrome, починаючи з Chrome 126. Це дозволить розробникам використовувати модель на пристрої для покращення власних функцій штучного інтелекту.

Veo

Veo — це модель штучного інтелекту, яка створює відеоролики 1080p тривалістю до однієї хвилини з текстової підказки. Вона використовує різні візуальні та кінематографічні стилі, а також може редагувати наявні кадри.

Firebase Genkit

Новий Firebase Genkit має на меті спростити розробку ШІ-додатків на JavaScript/TypeScript, незабаром з’явиться підтримка Go. Цей фреймворк із відкритим кодом під ліцензією Apache 2.0 дозволяє розробникам швидко інтегрувати штучний інтелект у нові та наявні програми.

Ask Photos

Пізніше цього літа буде запущена функція «Ask Photos» в Google Photos на основі штучного інтелекту Gemini, яка дозволить користувачам шукати свої колекції фотографій за допомогою запитів природною мовою.