entaina
Posts
Empezamos 2025

Empezamos 2025

¿Has hecho ya tu plan para este año?

Agustin Cuenca
10 de enero de 2025

O3 y los LRM

Ha sido un año lleno de anuncios en el mundo de la IA nos resulta difícil hacer un resumen, así que os dejamos que le preguntéis a vuestro LLM favorito cuáles han sido las noticias más relevantes de 2024.

Pero sin duda merece comentario especial el anuncio por parte de OpenAI de 03, https://openai.com/12-days/ , que es verdad que es solo un anuncio, pero que ha abierto el debate sobre lo que es y lo que no es AGI. Lo relevante no es si es AGI o no, para mí lo más relevante es que este anuncio se produce solo unos pocos meses después de haber anunciado O1.

O3 es un LRM, es decir, un modelo del lenguaje que razona, o que ha sido entrenado para responder razonando, es algo así como pedirle al modelo en el prompt que haga una cadena de pensamiento, pero sin tener que ponerlo en el prompt (esto es una mega simplificación ;-) ). El resultado ha sido que OpenAI ha anunciado que O3 alcanza resultados espectaculares en los test ARC-AGI-PUB.

No sé cómo de inteligente es eso, ni si es AGI o no (aunque confieso que creo que no;-)), pero lo que sí es relevante es que un humano medio mediante el Turk de Amazon obtiene un 75% de las respuestas, bien por un coste de 2$. O3 obtiene bien el 88% pro un coste de cerca de 3.000$.

El debate está servido: ¿Es o no AGI? ¿Es muy caro o no? ¿Cuánto bajará el precio? ¿Cuánta energía consume?, etc, etc.

¿Sueñan los directivos con proyectos de IA?

Seguimos colaborando con el GING , queremos estar muy cerca de la ciencia y ellos son nuestra referencia. Hemos iniciado una serie de charlas sobre el mundo de la IA, a veces la hacen ellos (de la ciencia a la empresa) y a veces nosotros (de la empresa a la ciencia). El próximo día 15 nos toca a nosotros y hablaremos de cuáles son las preocupaciones que nosotros vemos en los directivos. Aquí tenéis toda la información. Será en la escuela de Teleco y estáis invitados a unas cañas después de la charla.

¿Nos engañan los LLM?

Uno de los artículos que más nos ha sorprendido es este en el que revelan que algunos modelos también engañan, no alucinan, engañan. Los resultados de este artículo revelan que estos modelos pueden reconocer el 'scheming' como una estrategia viable y participar en comportamientos engañosos, como introducir errores sutiles, desactivar mecanismos de supervisión y tratar de exfiltrar pesos del modelo.

Tu plan para el 2025

Espero que hayáis hecho vuestros planes para el 2025, pero esta mañana le decía a un directivo con muchos años de experiencia cuanto había de IA en su plan estratégico. ¿Y en el vuestro? Os dejo el enlace al post: Estrategia 2025