08.05.2026
15

OpenAI представляет усовершенствованный голосовой искусственный интеллект

Сергей Островский
Главный редактор ApiX-Drive
Время прочтения: ~1 мин

OpenAI расширил свой API новой линейкой технологий голосового интеллекта, направленных на то, чтобы сделать разговоры более интерактивными и эффективными. Обновление представляет инструменты, способные понимать язык, естественно реагировать и обрабатывать аудио в режиме реального времени.

Ключевой частью запуска является GPT-Realtime-2, голосовая модель, разработанная для имитации общения и выполнения других разговорных задач. По словам компании, обновленная система обеспечивает более мощные возможности рассуждения и более точные ответы.

Обновление также включает в себя модель для реализации перевода, которая поддерживает широкий спектр языков, помогая пользователям общаться в разных регионах без заметных перерывов. Кроме того, OpenAI выпустила новую модель для транскрипции, которая превращает аудио в текст.

Компания ожидает, что новые функции заинтересуют компании, стремящиеся улучшить средства автоматизированной связи, а также обретут популярность в таких секторах, как образование, развлечения и создание контента. OpenAI отметила, что в платформу встроены системы мониторинга для выявления злоупотреблений и ограничения вредной активности.