El famoso investigador de inteligencia artificial Andrej Karpathy, cofundador de OpenAI y exlíder de la división de IA de Tesla, acaba de confirmar su incorporación a Anthropic (la empresa de IA detrás del chatbot Claude).
Este movimiento se considera un fortalecimiento notable de Anthropic en la creciente competencia de IA con OpenAI y Google.
En la red social X, Karpathy dijo que se había unido oficialmente a Anthropic y que volvería al trabajo de investigación y desarrollo de grandes modelos lingüísticos (LLM).
Según Anthropic, Karpathy comenzó a trabajar esta misma semana en el grupo de pre-entrenamiento dirigido por Nick Joseph.
Esta es la unidad responsable de las sesiones de entrenamiento a gran escala que ayudan a Claude a construir conocimientos básicos y habilidades básicas.
El pre-entrenamiento se considera una de las etapas más costosas y requiere los mayores recursos informáticos en el proceso de desarrollo de un modelo de IA avanzado.
Anthropic también dijo que Karpathy construirá un equipo especializado en el uso de Claude para apoyar y acelerar las actividades de investigación de pre-entrenamiento.
Los expertos en tecnología evalúan a Karpathy como uno de los pocos expertos que tiene la capacidad de conectar la teoría de modelos lingüísticos a gran escala y la práctica del entrenamiento de IA a gran escala.
El fichaje de Anthropic muestra que la empresa está apostando por una dirección de investigación con el apoyo de la IA, en lugar de depender únicamente de la expansión de las capacidades de computación.
Antes de unirse a Anthropic, Karpathy trabajó durante muchos años en OpenAI centrándose en el aprendizaje profundo y la visión por ordenador.
En 2017, dejó OpenAI para unirse a Tesla, donde dirigió los programas Autopilot y Full Self-Driving (FSD), dos proyectos centrales relacionados con los coches autónomos de esta empresa de coches eléctricos.
Después de dejar Tesla en 2022, Karpathy regresó a OpenAI durante aproximadamente un año antes de seguir yendo en 2024 para fundar Eureka Labs (startup que aplica asistentes de IA en la educación).
Sin embargo, desde su lanzamiento, Karpathy no ha compartido mucha información nueva sobre Eureka Labs. Actualmente no está claro si seguirá participando en la gestión de esta startup.
Además de su trabajo de investigación de IA, Karpathy también es ampliamente conocida en la comunidad tecnológica gracias a cursos y conferencias en profundidad sobre redes neuronales y grandes modelos lingüísticos. Karpathy también posee un canal de YouTube especializado en compartir conocimientos sobre IA y LLM.
Junto con la contratación de Karpathy, Anthropic también añadió al experto en seguridad cibernética Chris Rohlf al equipo de prueba de resistencia de la IA (red team). Este departamento tiene la tarea de evaluar la resistencia de los modelos avanzados de IA a las amenazas peligrosas.
Rohlf tiene más de 20 años de experiencia en el campo de la seguridad cibernética. Trabajó en el famoso grupo de seguridad "The Paranoids" de Yahoo y trabajó durante 6 años en Meta antes de unirse a Anthropic. Además, Rohlf también participa en investigación en el Centro de Seguridad y Tecnología Emergente de la Universidad de Georgetown.
Según Rohlf, la IA podría abrir grandes oportunidades para mejorar la seguridad cibernética global y Anthropic es uno de los lugares más adecuados para perseguir este objetivo.