- entaina
- Posts
- Sin datos, también puedes usar la IA
Sin datos, también puedes usar la IA
Que no te frene la falta de datos
Cuando se habla de inteligencia artificial, casi siempre aparece la frase: “los datos son el nuevo petróleo”. Y es verdad que los datos son valiosos, que permiten entrenar modelos propios y que muchas empresas han invertido millones en recolectarlos, limpiarlos y organizarlos.
Pero creo que se ha instalado un error de concepto: pensar que si no tienes datos, no puedes usar inteligencia artificial.
El mito de “hacerse tu propia IA”
Se ha hecho muy famoso el estudio de MIT State_of_AI_in_Business_2025_Report que señala que solo el 5% de los proyectos de IA en empresas han tenido éxito. Un dato llamativo… hasta que miramos bien:
Ese 5% se refiere a proyectos en los que las compañías intentaron desarrollar su propio modelo.
Y el estudio se basa en apenas 53 empresas, la muestra no es muy significativa y tiene otros sesgos (este artículo de Forbes) .
Es decir, hablamos de un contexto muy específico y que además tiene un problema central: entrenar un modelo propio es carísimo y complejo. No solo hace falta infraestructura y talento, también una cantidad enorme de datos relevantes y de calidad.
Por eso, cuando escuchamos a alguien decir: “me han construido una IA generativa”, la respuesta suele ser sencilla: si no te has gastado unos cuantos millones, lo que tienes no es un modelo propio, sino una adaptación de un modelo genérico (quizá con un poco de fine-tuning, algunos guardarraíles, o incluso un RAG bien montado). Y eso está muy bien, porque lo importante no es la etiqueta de “propia”, sino el valor que aporta la aplicación.
La diferencia de la IA generativa
Aquí está lo relevante: los modelos generativos han cambiado las reglas del juego.
Hoy no necesitas entrenar desde cero un modelo para poder aprovechar la IA. Los LLM ya están entrenados con billones de datos que no son los tuyos. Lo que necesitas no es “más datos”, sino:
Organizar bien tus contextos.
Saber qué información propia conectar a la IA.
Definir bien el caso de uso y la integración en tu negocio.
Esto abre la puerta a qué empresas medianas (que no tienen departamentos enteros de data science ni chief data officers) puedan usar IA sin tener que montar un data lake multimillonario.
Para añadir más posibilidades además ahora podemos entrenar o ajustar pequeños modelos (SLM: Small Language Models) con costes muy inferiores a los de los LLMs.
¿Modelos grandes o modelos pequeños?
El debate sigue abierto:
¿Ganarán los LLM gigantes, que hacen “casi todo bastante bien”?
¿O veremos el auge de los SLM , más baratos, especializados y eficientes?
Así que ahora si que empieza a ser posible que tengas tu propio modelo ajustado para tu problema concreto, y sin necesidad de grandes cantidades de datos.
Ahora te toca decidir si un SLM (en principio menos “listo” que un LLM) sirve para tu problema o si te irá mejor con un LLM mas “listo” pero menso especializado en tu problema.
El error de quedarse fuera por los datos
Muchas empresas medianas dicen: “nosotros no tenemos datos, así que la IA no es para nosotros”. Y eso es una excusa peligrosa.
Claro que los datos son importantes.
Claro que sin ellos no puedes entrenar tu propio modelo.
Pero eso no significa que no puedas usar IA.
Hoy el reto no está en recolectar toneladas de datos, sino en definir dónde aporta valor la IA a tu negocio y qué datos (pocos, pero relevantes) puedes poner a su servicio. Y eso es lo que nosotros llamamos contexto.
Conclusión
No dejes que la falta de un histórico de datos, una política de data governance o un departamento de data science te detenga. La IA generativa ha democratizado el acceso: ya no necesitas petróleo para tener motor.
La pregunta no es si tienes datos suficientes, sino: 👉 ¿Qué problema quieres resolver con IA y qué valor puedes generar con ella, aquí y ahora?