Un nuevo informe de la empresa de marketing digital estadounidense Legal Guardian Digital ha llamado la atención al clasificar a Perplexity AI como el chatbot de IA más confiable para tareas diarias.
Este resultado muestra que Perplexity superó a muchos competidores famosos como OpenAI con ChatGPT, Google con Google Gemini o Anthropic con Claude.
Según la investigación, los chatbots de IA se evalúan en función de muchos criterios, incluyendo la tasa de creación de información incorrecta, el nivel de satisfacción del cliente, la coherencia en la respuesta y la estabilidad del sistema.
El informe se publicó en un contexto en el que la IA se está utilizando cada vez más en los lugares de trabajo, cuando se dice que alrededor de una cuarta parte de los trabajadores estadounidenses utilizan regularmente herramientas de IA para apoyar su trabajo.
Los resultados muestran que Perplexity AI tiene la tasa más baja de información "ilusoria" e incorrecta en el grupo de chatbots grandes, solo el 13%, significativamente inferior al promedio de esta industria del 22%.
Esta plataforma también alcanza una tasa de funcionamiento continuo del 100%, es decir, no se registra el tiempo de interrupción del servicio durante todo el proceso de prueba.
En segundo lugar está Grok, desarrollado por la empresa de IA del multimillonario Elon Musk. Grok registra una tasa de creación de información incorrecta del 15% y también alcanza un tiempo de funcionamiento perfecto.
Mientras tanto, DeepSeek ocupa el tercer lugar con una tasa de "ilusión" del 14% y un tiempo de funcionamiento del 99,52%.
Lo más sorprendente de la clasificación es la posición de ChatGPT. Aunque es el chatbot de IA más popular del mundo en la actualidad, ChatGPT solo ocupa el sexto lugar en términos de fiabilidad general.
El informe dice que este chatbot da respuestas inexactas en aproximadamente el 30% de los casos, el doble de la tasa de errores de DeepSeek.
Sin embargo, ChatGPT todavía recibió críticas positivas de los usuarios con una puntuación de satisfacción de 4,7/5.
En posiciones inferiores, Google Gemini ocupa el octavo lugar, mientras que Meta con Meta AI ocupa el noveno lugar.
Claude de Anthropic ocupa el séptimo lugar y se dice que tiene más incidentes operativos que sus competidores.
El equipo de investigación dijo que han combinado muchos factores para calcular la puntuación de confiabilidad general para cada chatbot.
Entre ellos, los factores importantes incluyen la frecuencia de retorno de información incorrecta, la capacidad de respuesta estable a muchos tipos de preguntas, las evaluaciones de los usuarios y el nivel de estabilidad del sistema.
Perplexity AI obtuvo la puntuación de confianza más alta con 85/100 puntos. Grok le siguió con 79 puntos, mientras que DeepSeek obtuvo 76 puntos. ChatGPT solo recibió 50 puntos, mientras que Google Gemini obtuvo 41 puntos.
El informe también menciona el precio del servicio. Se dice que Perplexity AI cuesta alrededor de 40 dólares al mes, Grok alrededor de 30 dólares al mes, mientras que DeepSeek se ofrece actualmente de forma gratuita aunque todavía está en el grupo de chatbots más confiables.
Austin Hunt, CEO de Legal Guardian Digital, comentó que muchas personas consideran a ChatGPT como el chatbot más confiable debido a su ventaja pionera y popularidad global.
Sin embargo, en términos de estabilidad y precisión en el trabajo, las plataformas más pequeñas como Perplexity o Grok están mostrando una mejor eficiencia.