OpenAI apuesta a la IA de sonido, preparandose para dispositivos personales sin pantalla

HẠO THIÊN (THEO techcrunch) |

OpenAI esta impulsando una estrategia para desarrollar la inteligencia artificial del sonido, no solo para mejorar la capacidad de conversacion de ChatGPT.

OpenAI dat cuoc lon vao AI am thanh va chuan bi cho thiet bi ca nhan khong man hinh. Do hoa: AI
OpenAI apuesta mucho a la IA de sonido y se prepara para dispositivos personales sin pantalla. Grafico: IA

Segun The Information, en los ultimos dos meses, OpenAI ha fusionado muchos grupos tecnicos, productos e investigacion para reestructurar integralmente los modelos de sonido, con el objetivo de preparar un dispositivo personal prioritario para la comunicacion por voz, que se espera que se lance en aproximadamente un año.

Este movimiento refleja la tendencia general de la industria tecnologica, donde el sonido se esta convirtiendo gradualmente en la interfaz central, reemplazando el papel dominante de la pantalla. Los asistentes de voz han aparecido en mas de un tercio de los hogares en Estados Unidos a traves de altavoces inteligentes. Muchas grandes corporaciones tecnologicas tambien estan siguiendo esta direccion.

Meta ha añadido recientemente una funcion de escucha guiada a las gafas inteligentes Ray-Ban, utilizando un sistema de multiples microfonos para ayudar a los usuarios a escuchar mas claramente en entornos ruidosos. Google esta probando la funcion de convertir los resultados de busqueda en resumen en forma de conversacion acustica. Mientras tanto, Tesla integra el chatbot Grok de xAI en los coches electricos, permitiendo a los usuarios controlar muchas funciones con voz natural.

No solo los "gigantes" tecnologicos, muchas empresas emergentes tambien persiguen la ambicion de construir dispositivos de IA sin pantalla. Sin embargo, este camino no es facil. Algunos productos que han llamado la atencion como Humane AI Pin o vong co Friend AI han tenido fracasos o controversias relacionadas con la privacidad, lo que demuestra el gran riesgo de introducir la IA de sonido en la vida personal.

Sin embargo, esta tendencia continua impulsada. Algunas startups, incluida Sandbar y la empresa fundada por Eric Migicovsky, estan desarrollando anillos de IA que permiten a los usuarios chatear directamente a traves de dispositivos portatiles, que se espera que se lancen en 2026.

Segun The Information, el nuevo modelo de sonido de OpenAI, que se espera que se lance a principios de 2026, tendra una voz mas natural, procesara los cortes de voz de forma flexible e incluso podra "hablar en paralelo" con el usuario, creando una sensacion como una conversacion real. Tambien se dice que OpenAI esta imaginando un nuevo ecosistema de dispositivos, que podria incluir gafas o altavoces inteligentes sin pantalla, funcionando como un compañero mas que como una herramienta.

Esta estrategia esta vinculada a la orientacion de diseño de audio prioritario de Jony Ive, ex director de diseño de Apple, quien se unio al departamento de hardware de OpenAI tras la adquisicion de la empresa io por valor de 6.500 millones de dolares. Se dice que quiere reducir la dependencia de la pantalla y ve la interfaz de audio como una oportunidad para remodelar la forma en que las personas interactuan con la tecnologia de consumo en el futuro.

En ese contexto, la IA de sonido ya no es una caracteristica de apoyo, sino que se esta considerando como la base para la proxima generacion de dispositivos personales, donde la voz se convierte en la nueva "superficie de control" de los humanos.

HẠO THIÊN (THEO techcrunch)
Noticias relacionadas

Countdown Hue se animo con una vibrante actuacion de sonido y luces

|

HUE - El programa Countdown Hue comienza con una actuacion de sonido y iluminacion, animando toda la gran plaza.

Google Notebook amplia la capacidad de aprendizaje por audio

|

Google Notebook añade un modo de conferencias de audio de hasta 30 minutos de duracion, lo que ayuda a los usuarios a aprender pasivamente con una voz de lectura fluida y una estructura clara.

Modelo de IA de FPT que detecta sonidos inusuales protegido en Estados Unidos

|

Gracias a su novedad y alta aplicabilidad el modelo de IA (inteligencia artificial) que detecta sonidos inusuales de FPT esta protegido en Estados Unidos.

Explicacion del aumento de los precios de alquiler de viviendas para trabajadores en la comuna de Thien Loc a partir del 1 de enero de 2026

|

Los precios de alquiler en el area de viviendas para trabajadores en la comuna de Thien Loc (Hanoi) aumentaron a partir del 1 de enero de 2026.

Vista panoramica del tunel subterraneo de 778 mil millones de VND en Hanoi antes del dia de la meta

|

Hanoi - El proyecto del tunel subterraneo Kim Dong - Giai Phong valorado en 778 mil millones de VND entra en la fase final, se espera que se complete y se explote a principios de 2026.

Ven aqui, los cuatro pajaros del cielo" y la ruptura por el dinero

|

El hecho de que el concierto en vivo "Ve day bon canh chim troi" se pospusiera justo antes de la hora de la actuacion ha revelado graves lagunas en la organizacion de espectaculos en Vietnam.

Quang Ninh recibe a 380.000 visitantes durante el Año Nuevo Lunar 2026

|

Quang Ninh - Durante el Año Nuevo Lunar 2026, del 31 de diciembre de 2025 al 1 de enero de 2026, Quang Ninh recibio a 380.000 turistas.

Corea del Norte publica imagenes raras de la hija del presidente Kim Jong-un

|

Los medios norcoreanos publicaron imagenes raras, marcando la nueva aparicion de la hija del lider en su visita al Palacio del Sol de Kumsusan.

Countdown Hue se animo con una vibrante actuacion de sonido y luces

PHÚC ĐẠT - NGUYỄN LUÂN |

HUE - El programa Countdown Hue comienza con una actuacion de sonido y iluminacion, animando toda la gran plaza.

Google Notebook amplia la capacidad de aprendizaje por audio

Cát Tiên |

Google Notebook añade un modo de conferencias de audio de hasta 30 minutos de duracion, lo que ayuda a los usuarios a aprender pasivamente con una voz de lectura fluida y una estructura clara.

Modelo de IA de FPT que detecta sonidos inusuales protegido en Estados Unidos

NGUYỄN ĐĂNG |

Gracias a su novedad y alta aplicabilidad el modelo de IA (inteligencia artificial) que detecta sonidos inusuales de FPT esta protegido en Estados Unidos.