08.05.2026
18

OpenAI presenta IA de voz avanzada para conversaciones en tiempo real

Sergej Ostrovskij
Editor jefe en ApiX-Drive
Tiempo de leer: ~1 min

OpenAI ha ampliado su API con una nueva gama de tecnologías de inteligencia de voz destinadas a hacer que las conversaciones digitales sean más interactivas y eficientes. La actualización introduce herramientas capaces de comprender el lenguaje hablado, responder de forma natural y procesar el audio en tiempo real.

Una pieza clave del lanzamiento es GPT-Realtime-2, un modelo de voz diseñado para simular la comunicación humana y gestionar tareas conversacionales más complejas. Según la compañía, el sistema mejorado ofrece una mayor capacidad de razonamiento y respuestas más precisas durante las interacciones.

La actualización también incluye un sistema de traducción en tiempo real compatible con una amplia gama de idiomas de entrada y salida, lo que permite a los usuarios comunicarse entre diferentes regiones sin interrupciones perceptibles. Además, OpenAI ha lanzado un nuevo modelo de transcripción de voz que convierte las conversaciones habladas en texto en tiempo real.

La compañía espera que las nuevas funciones atraigan a empresas que buscan mejorar sus herramientas de comunicación automatizada, además de brindar soporte a sectores como la educación, el entretenimiento y la creación de contenido. OpenAI señaló que se integraron sistemas de monitoreo en la plataforma para detectar el uso indebido y restringir actividades dañinas en las interacciones de voz.