La guerra invisible por los datos: cómo el auge de la inteligencia artificial está reconfigurando la industria del dato

Actualidad09/07/2025
Data-industry-Dall·E

Durante años, la inteligencia artificial se ha entendido como una disciplina impulsada por el desarrollo de algoritmos: cuanto más complejos e innovadores, mejores los resultados. Sin embargo, esa narrativa omite un componente esencial sin el cual ningún modelo funciona: los datos. En este momento, mientras los focos iluminan a los gigantes que desarrollan modelos fundacionales, se libra otra batalla menos visible, pero igual o más estratégica: la del control sobre los datos que alimentan esas inteligencias artificiales. Y es precisamente ahí donde asistimos a un proceso acelerado de consolidación.

¿Qué es la industria del dato y por qué importa ahora más que nunca? La industria del dato está compuesta por empresas que recolectan, procesan, estructuran, almacenan y venden datos. Algunas, como Thomson Reuters o Moody’s, lo hacen desde hace décadas con modelos de negocio asentados. Otras, como Clearview AI o Harbr, han emergido con propuestas específicas en nichos como el reconocimiento facial o los marketplaces de datos. También están las firmas intermedias de infraestructura como Fivetran, que conectan múltiples fuentes para facilitar el flujo de información entre sistemas. Y otras, como Reddit y muchas más, se reconfiguran para convertirse en compañías de datos e incrementar su atractivo en el mercado.

Este ecosistema fragmentado ha crecido exponencialmente en los últimos diez años, alimentado por capital riesgo y soluciones hiperespecializadas. Según PitchBook, entre 2020 y 2024 se invirtieron más de 300,000 millones de dólares en startups de datos en más de 24,000 operaciones. Muchas de estas compañías ofrecían productos que resolvían problemas muy específicos dentro del ciclo de vida del dato, a menudo construidos en torno a una sola funcionalidad. Pero ese enfoque, que funcionó durante un tiempo, se convierte cada vez más en un obstáculo para las aspiraciones de la inteligencia artificial.

En ese sentido, la consolidación que estamos viendo es un síntoma de una nueva etapa: las recientes adquisiciones de Databricks (comprando Neon por 1,000 millones) o de Salesforce (absorbiendo Informatica por 8,000 millones) no son casuales. Todas estas operaciones comparten un mismo objetivo: adquirir tecnología que permita a las grandes corporaciones dar el salto a una inteligencia artificial verdaderamente útil. Como explicaba Gaurav Dhillon, fundador de Informatica y ahora en SnapLogic, «quien quiera aprovechar el imperativo de la inteligencia artificial debe rehacer sus plataformas de datos desde cero».

En esa línea, el caso de Fivetran comprando Census ilustra cómo incluso empresas maduras deben buscar piezas que les faltan para ofrecer soluciones integradas. Hasta ese momento, Fivetran solo permitía mover datos hacia los almacenes en la nube; Census, por su parte, ofrecía justo lo contrario: extraerlos. Juntas, proporcionan una solución de ida y vuelta imprescindible para alimentar modelos de inteligencia artificial.

De hecho, podría ocurrir que la inteligencia artificial no fuese sólo cuestión de algoritmos, sino de quién posee los datos. Desde OpenAI negociando con Reddit y Stack Overflow para acceder a sus corpus de conversaciones, hasta Clearview AI vendiendo bases de datos faciales extraídas de internet, lo que vemos es una guerra por los datos como tales. Como decía Dhillon, ignorando el enorme caudal de investigación anterior a la inteligencia artificial generativa, «nadie nació con inteligencia artificial: esto tiene apenas tres años». Pero quien posea o controle los datos más relevantes tiene una ventaja competitiva inigualable. De ahí la creciente presión para que los grandes jugadores de inteligencia artificial y los gestores de datos se fusionen o colaboren.

La propia estructura de la industria del dato, construida sobre capas tecnológicas incompatibles, es parte del problema. Los clientes están cansados de usar soluciones que no hablan entre sí, que capturan metadatos de forma redundante y que exigen una integración constante. En ese caldo de cultivo, la consolidación no solo es lógica: es casi inevitable.

¿Qué podemos esperar del futuro inmediato? Por un lado, esta ola de adquisiciones da una salida razonable a muchas startups que no encontraban financiación ni condiciones para salir a bolsa. Para los compradores, adquirir estas firmas supone no solo incorporar tecnología, sino talento, clientes y posicionamiento. Como dice Derek Hernandez, analista de PitchBook, «si Salesforce o Google no compran a estas empresas, sus competidores lo harán». Pero por otro lado, hay una pregunta crucial: ¿tiene sentido que las compañías que gestionan los datos sigan existiendo por separado de las que desarrollan modelos de inteligencia artificial? Si el valor está en la fusión, ¿no estaremos asistiendo al preludio de una industria totalmente integrada, donde los límites entre proveedor de datos y constructor de inteligencia artificial se difuminan?

El verdadero campo de batalla parece estar en la infraestructura invisible del conocimiento. Si algo está claro, es que el futuro de la inteligencia artificial ya no se juega únicamente en los laboratorios de investigación, sino en los despachos donde se deciden adquisiciones, licencias y fusiones. En un mundo donde los datos son el nuevo petróleo, la forma en que se recolectan, procesan y consolidan determinará no solo qué modelos triunfan, sino también qué sesgos arrastran, qué verdades aprenden y qué valores refuerzan.

Entender la consolidación de la industria del dato no es solo una cuestión técnica o empresarial. Es comprender el nuevo mapa del poder digital. Y ese mapa se está redibujando ahora mismo, en tiempo real.

Nota: https://www.enriquedans.com/

Te puede interesar
Lo más visto

Suscríbete al newsletter para recibir periódicamente las novedades en tu email