Anh Minh Quan, propietario de una tienda de venta online en Hanoi, dijo que antes, al crear imágenes con ChatGPT, la letra a menudo tenía signos incorrectos, fuentes desviadas o era difícil de leer.
Cada vez que creo fotos para publicar ventas, desde banners hasta fotos de productos, la letra casi tiene que ser corregida por completo debido a signos incorrectos, fuentes desviadas o lectura difícil. Algunos días paso una hora solo corrigiendo la letra, por lo que cuesta más tiempo que diseñar yo mismo. Por lo tanto, casi no uso ChatGPT para este trabajo", dijo el Sr. Quan.
Debido a esas limitaciones, el Sr. Quan, así como muchos otros usuarios, están cambiando gradualmente a otras herramientas como Gemini de Google cuando necesitan crear fotos con texto. En comparación con ChatGPT antes, la capacidad de visualización de texto de esta herramienta se considera más estable.

Sin embargo, esta experiencia ha cambiado después de la actualización Images 2. 0 de ChatGPT. Al volver a intentar hacer banners, el Sr. Quan dijo que el resultado era "muy diferente al anterior". Las letras vietnamitas se muestran claramente, con los signos correctos y se pueden usar de inmediato sin tener que editar demasiado.
La Sra. Thu Hang, una diseñadora gráfica en Hanoi, dijo que inicialmente solo intentó volver a probar, pero el resultado la sorprendió. "Hago infografías, así que tengo mucho miedo a los errores de escritura. Antes casi no usaba ChatGPT porque tenía que corregir demasiado. Esta vez, al intentar crear, la escritura era en gran parte correcta, la composición también se mantuvo, solo necesitaba ajustarla ligeramente para poder usarla", dijo la Sra. Hang.
Mientras tanto, el Sr. Duc Anh, creador de contenido en las redes sociales, también se mostró sorprendido al experimentar la nueva actualización de Images 2. 0. "Probé hacer una serie de fotos de citas en vietnamita y los resultados devueltos se mostraron bastante bien, se pueden usar de inmediato sin mucha edición", compartió el Sr. Duc Anh.
Según OpenAI, Images 2. 0 se ha mejorado para procesar mejor pequeños detalles como texto, iconos y diseños complejos. El modelo también integra la capacidad de razonamiento, lo que permite la auto-prueba y la optimización de los resultados antes de la visualización, reduciendo así los errores en componentes difíciles como la escritura.

La visualización precisa de textos por parte de la IA es un gran desafío debido a la naturaleza de la tecnología de difusión, que suele priorizar la reproducción de imágenes generales en lugar de pequeños detalles. Esto hace que la escritura, especialmente en idiomas con signos como el vietnamita, sea propensa a distorsionarse.
Las pruebas prácticas muestran que la nueva versión ha mejorado significativamente esta limitación. El texto largo aún mantiene la claridad y la ortografía correcta en muchos casos.
Sin embargo, la herramienta aún no es completamente estable. Algunos diseños complejos o gráficos con mucha información aún pueden tener errores.
De ser considerado "indispensable" para el vietnamita, ChatGPT está recuperando gradualmente la confianza de los usuarios. La capacidad de mostrar letras con precisión se considera un factor importante que determina si la IA puede entrar en aplicaciones prácticas o no.