La actualización del modo avanzado de voz de ChatGPT busca mejorar la interacción, pero aún presenta limitaciones en reconocimiento y transcripciones
La nueva versión del modo avanzado de voz de ChatGPT busca ofrecer una interacción más natural, aunque aún enfrenta limitaciones en reconocimiento y transcripciones precisas.

La última versión del modo avanzado de voz de ChatGPT, disponible para suscriptores Plus, busca hacer la experiencia de interactuar con la inteligencia artificial más natural y envolvente. Esta actualización permite identificar interrupciones, detectar el tono del usuario y ofrecer varias voces tanto para dispositivos móviles como para escritorio, con el fin de mejorar la interacción. Sin embargo, aunque estas funciones representan un avance, su aplicación práctica aún presenta limitaciones notables.
Una prueba reciente ilustró tanto los beneficios como las deficiencias del sistema. Durante una sesión de repostería, una participante solicitó ayuda para preparar un pan de plátano con alto contenido proteico, y el asistente respondió con instrucciones rápidas y detalladas. Aunque en algunos momentos fue necesario pedirle que ralentizara, las indicaciones proporcionadas fueron útiles y permitieron realizar la receta con éxito, resultando en un pan sabroso con textura similar a otras recetas de avena y proteína.
Entre las funciones destacadas estaban la capacidad de leer recetas en voz alta, sugerir sustituciones de ingredientes y ofrecer ayuda en modo manos libres, lo que puede resultar especialmente beneficioso para personas con necesidades de accesibilidad. No obstante, el soporte mediante vídeo no fue completamente funcional: las transcripciones a veces eran incompletas o contenían errores, y algunas interacciones no se registraron con precisión. Por ejemplo, las respuestas automáticas de elogios excesivos y las respuestas que no reflejaban con exactitud el proceso de preparación generaron dudas sobre la fiabilidad del asistente.
El experimento también evidenció que, aunque el sistema puede ofrecer instrucciones útiles en tiempo real y alternativas para sustituciones, aún requiere supervisión humana, especialmente debido a la tendencia del asistente a halagar en exceso y a confundir los pasos con frecuencia. Además, en momentos de agotamiento del límite de vídeo, el asistente dejó de responder con voz y sus transcripciones presentaron fallos, lo que limita su utilidad en tareas prolongadas o complejas.
En resumen, aunque el modo avanzado de voz de ChatGPT representa un avance en la interacción con IA, todavía presenta áreas de mejora significativas. Su utilidad puede ser notable para leer recetas o dar instrucciones de forma dinámica, pero las limitaciones en reconocimiento de vídeo y en la fidelidad de las transcripciones hacen recomendable usarlo con precaución. Para quienes disfrutan de la preparación de recetas, la interacción con una persona real sigue siendo insustituible, ya que la experiencia humana aporta un valor que la tecnología aún no logra replicar completamente.