OpenAI mejora el modo de voz en ChatGPT, logrando respuestas más naturales y emotivas en tiempo récord
OpenAI impulsa la interacción con mejoras en la naturalidad, expresividad y velocidad del modo de voz en ChatGPT, acercando aún más la conversación a lo humano.

OpenAI presentó el modo de voz avanzado el año pasado junto con el lanzamiento de GPT-4o, una tecnología que utiliza modelos multimodales de forma nativa y que puede responder a entradas de audio en un tiempo récord de solo 232 milisegundos, con un promedio de 320 milisegundos, imitando los tiempos de respuesta humanos en una conversación convencional.
Desde su lanzamiento, se han implementado diversas mejoras para que la expresión vocal sea más natural y auténtica, incluyendo avances en la entonación, las pausas, el énfasis y la capacidad de transmitir emociones como empatía y sarcasmo, lo que hace que las respuestas se perciban como más humanas y menos robóticas.
A principios de este año, OpenAI lanzó una actualización menor que redujo interrupciones en el diálogo y perfeccionó los acentos de la voz. Ahora, se ha presentado una actualización significativa que perfecciona aún más la naturalidad del sonido, logrando que las respuestas tengan una cadencia más realista y expresiva.
Las respuestas incluyen entonaciones más sutiles, pausas y énfasis adecuados, además de una expresividad más precisa para emociones específicas como la empatía y el sarcasmo. Según OpenAI, estas mejoras permiten que la IA no solo hable, sino que también interprete y transmita emociones, generando una interacción que parece más cercana a una conversación con un amigo humano.
Otra novedad importante es la incorporación de soporte para traducción durante las conversaciones. Los usuarios de ChatGPT ahora podrán solicitar que la IA traduzca entre diferentes idiomas en tiempo real, facilitando conversaciones multilingües sin necesidad de utilizar aplicaciones externas de traducción, ya que la función puede mantenerse activa durante toda la interacción hasta que se indique lo contrario.
Por el momento, esta versión mejorada del modo de voz avanzado está disponible solo para usuarios de pago de ChatGPT. OpenAI también ha mencionado que aún existen algunas limitaciones menores en esta actualización, pero los continuos avances apuntan hacia un futuro en el que la línea entre las conversaciones humanas y las interacciones con IA será cada vez más difícil de distinguir.