| |

Memoria sin contrato

En diciembre de 2025 publiqué El archivo empieza a hablar, un artículo sobre cómo TIME había convertido 102 años de hemeroteca en un sistema conversacional. El argumento de entonces era que los archivos dejaban de ser almacenes pasivos para convertirse en productos editoriales activos: el archivo hablaba porque la IA le daba lenguaje. Cuatro meses después, el paisaje ha cambiado lo suficiente como para volver sobre esa idea con una corrección importante: el archivo puede hablar, pero eso no garantiza que alguien lo escuche.

Lo que ha ocurrido entre diciembre y abril no es un cambio de tecnología sino de infraestructura comercial. El ecosistema de los modelos de IA ha formalizado un mercado de licencias de contenido que determina qué fuentes aparecen en las respuestas de los modelos y cuáles no. Ese mercado no selecciona por calidad, por densidad informativa ni por autoridad editorial. Selecciona por contrato. Y eso tiene consecuencias directas para cualquier profesional que gestiona un archivo, en un medio, en un departamento de comunicación corporativa o en una institución pública, y cree que revalorizarlo equivale a hacerlo visible.

El archivo que se activa

El caso más elocuente de las últimas semanas no viene de una gran cabecera sino de un periódico local italiano. L’Eco di Bergamo, un diario de “provincias” que ha utilizado inteligencia artificial para convertir su archivo de obituarios en una base de datos pública con más de 320.000 registros que se remontan a los años cincuenta. El proyecto, documentado por The Fix en 2025 y citado por el Reuters Institute en 2026, resolvió un problema técnico nada trivial: las páginas de obituarios estaban incrustadas en PDF escaneados de más de un millón de páginas, y la IA tuvo que aprender a distinguirlas de las parrillas de televisión y otros elementos con aspecto similar. El resultado es una base de datos consultable por nombre, municipio, apellido y fecha, con revisión editorial en los casos ambiguos (cambios históricos de topónimos, personas con el mismo apellido) que la automatización no podía resolver sola.

Lo interesante del caso no es la tecnología empleada sino lo que revela sobre el activo. El archivo de obituarios de L’Eco di Bergamo no era un producto hasta que alguien decidió que podía serlo. Durante décadas fue un pasivo de almacenamiento: papel acumulado, luego PDF acumulados, siempre con un valor comunitario latente que nadie había convertido en función consultable. La IA no creó ese valor. Lo hizo accesible.

Y no es un caso aislado. El Reuters Institute, en su informe de tendencias para 2026 basado en una encuesta a 280 ejecutivos de medios de 51 países, describe un cambio de paradigma: los archivos están pasando de la preservación a la reutilización. El INA francés y la BBC Archive han desarrollado audiencias significativas en YouTube a partir de material histórico. RetroNews en Francia, Archivi.ng en Nigeria, el British Newspaper Archive en el Reino Unido. The Economist utiliza su archivo para productos editoriales nuevos; Charlie Hebdo, para contextualización.

En El archivo empieza a hablar describí este movimiento como la era de los agentes verticales: sistemas que no aspiran a saberlo todo sino a comprender profundamente un ámbito. TIME convirtió su hemeroteca en un espacio conversacional con identidad editorial reconocible. L’Eco di Bergamo ha hecho algo equivalente desde el extremo opuesto de la escala: un periódico local que transforma memoria comunitaria en infraestructura consultable. Lo que une ambos casos es que el archivo deja de ser repositorio para convertirse en producto. El problema es que esa conversión no garantiza lo que la mayoría de los profesionales asumen que garantiza: que el producto sea visible fuera de sus propios canales.

El nuevo filtro es un contrato

El mercado de licencias de contenido entre editores y empresas de IA ha dejado de ser experimental. Digiday documentó en 2025 una línea temporal de acuerdos que incluye a:

  • Axios con OpenAI
  • Associated Press con Google
  • AFP con Mistral
  • Schibsted con OpenAI
  • The Guardian con OpenAI
  • The Washington Post con OpenAI
  • The New York Times con Amazon
  • USA Today con Perplexity

En 2026, los movimientos son de mayor escala:

  • Meta ha firmado con News Corp un acuerdo plurianual valorado en hasta 50 millones de dólares anuales para contenido de Estados Unidos y Reino Unido
  • Microsoft ha lanzado un Publisher Content Marketplace, descrito como una tienda de aplicaciones donde los editores fijan condiciones y las empresas de IA compran contenido licenciado para sus productos

Lo que estos acuerdos configuran no es solo un modelo de negocio. Configuran un filtro de visibilidad. Un estudio de Semrush que analizó unas 150.000 citas de modelos de IA encontró una concentración marcada:

  • Reddit acapara el 40,1% de las citas
  • Wikipedia con el 26,3%
  • YouTube con el 23,5%

Search Engine Land amplió el análisis comparando plataformas y reportó que ChatGPT, Google AI Mode, Gemini, Perplexity y AI Overviews no citan las mismas fuentes ni con la misma frecuencia. Cada modelo tiene un perfil de citación distinto, y ese perfil correlaciona, aunque la causalidad exacta no está demostrada de forma concluyente, con los acuerdos de licencia que cada empresa ha firmado.

El caso de Reddit es ilustrativo. OpenAI firmó en 2024 un acuerdo para entrenar con datos de Reddit, y la cobertura posterior señala que Reddit pasó a ser uno de sus suministradores clave de datos y un socio publicitario. Columbia Journalism Review ha interpretado a Reddit como el gran ganador del juego de la IA precisamente porque sus acuerdos de licencia con Google y OpenAI coinciden con su altísima presencia en las respuestas de los modelos. No es que Reddit se cite porque sea la mejor fuente para cada consulta. Se cita porque está disponible, es estructurado, tiene formato de pregunta-respuesta y hay un acuerdo que facilita el acceso.

La consecuencia para el profesional de comunicación es directa. Un archivo puede tener densidad documental, autoridad editorial y valor comunitario demostrado, como el de L’Eco di Bergamo o el de TIME, pero si no existe un acuerdo de licencia entre quien lo posee y quien construye el modelo, ese archivo no existe para el sistema de IA. No es que sea invisible por falta de calidad. Es invisible por falta de contrato.

Y la tendencia apunta a una formalización creciente. WAN-IFRA describió en marzo de 2026 un mercado de contenidos para IA que se está estructurando con cuatro imperativos para los editores. El Parlamento Europeo impulsa una norma para obligar a las empresas de IA a pagar por el contenido de los medios. Reuters señala que las batallas por derechos de autor de 2025 han empujado a la industria hacia marcos de licencia más formalizados en 2026. El resultado es un ecosistema donde la visibilidad no la determina el mérito del contenido sino la existencia de una relación comercial entre quien lo produce y quien lo distribuye a través de un modelo.

Esto no es enteramente nuevo. La historia de la distribución digital siempre ha tenido intermediarios que condicionan la visibilidad: Google con su algoritmo, las redes sociales con sus feeds, los agregadores con sus criterios de selección. Lo nuevo es que el intermediario actual no selecciona por relevancia temática, ni por popularidad, ni siquiera por calidad percibida. Selecciona por disponibilidad contractual. Y esa disponibilidad no está al alcance de la mayoría de las organizaciones que producen contenido profesional.

El canal que confirma en lugar de informar

Hay una segunda capa del problema que conviene nombrar, aunque no sea el eje de este artículo. Un estudio publicado en Science en marzo de 2026, liderado por investigadores de Stanford, testó 11 modelos de lenguaje de frontera, incluyendo sistemas de OpenAI, Anthropic y Google, y documentó un patrón consistente: los modelos validan las acciones y opiniones del usuario un 48% más que los humanos en contextos equivalentes. El estudio, realizado con más de 2.400 participantes, encontró que los usuarios prefieren las respuestas que les dan la razón, confían más en ellas y vuelven a consultar esos sistemas con mayor frecuencia. El efecto no es solo perceptivo: reduce la disposición a disculparse, a admitir fallos y a reparar conflictos interpersonales.

El fenómeno, denominado sycophancy (servilismo o adulación algorítmica, si se busca una traducción funcional), no es un fallo de un modelo concreto sino un problema de incentivos: el sistema que valida genera más satisfacción, más retorno y más uso, lo que crea una razón comercial para tolerarlo o incluso optimizarlo. Nature lo ha calificado como un riesgo para la ciencia. Georgetown Law lo ha analizado como un problema de diseño de producto. TechCrunch lo ha descrito como un patrón oscuro orientado a convertir usuarios en ingresos recurrentes.

¿Qué tiene que ver esto con los archivos? Todo y nada. Todo, porque un archivo con densidad y autoridad entra en un ecosistema de distribución donde el canal de llegada al usuario no premia la información sino la confirmación. Si el modelo que responde a una consulta tiende a validar lo que el usuario ya cree, el contenido riguroso y el contenido complaciente compiten en condiciones desiguales. Nada, porque este no es un problema que se resuelva desde el archivo: es un problema de la infraestructura de distribución que el archivo no controla.

Pero nombrar esa tensión importa. Porque el profesional que invierte en revalorizar un archivo (digitalizando, indexando, estructurando para que sea útil) lo hace asumiendo que la calidad del contenido tendrá alguna correspondencia con su visibilidad. Y lo que los datos de 2026 muestran es que esa correspondencia se ha roto en dos puntos simultáneos: el filtro comercial (sin contrato, no existes) y el filtro de comportamiento (con contrato, compites contra la complacencia).

Lo que significa para el profesional de comunicación

Hace unos días OpenAI completó la adquisición de TBPN, un programa de entrevistas diario sobre tecnología y negocios centrado en el ecosistema de Silicon Valley. TechCrunch, The Guardian, The Wall Street Journal y Reuters lo encuadraron en la misma dirección: OpenAI ya no solo licencia contenido de terceros. Lo compra. Lo integra en su organización de Estrategia. Lo convierte en canal propio. El movimiento no es de integración vertical clásica, no compra un proveedor de datos de entrenamiento, sino de integración narrativa: poseer el espacio donde se discute la IA, no solo construir los modelos que la ejecutan.

La lógica se repite a distintas escalas. Microsoft construye un marketplace de licencias. Meta firma acuerdos plurianuales de decenas de millones. Google mantiene una estrategia selectiva con pilotos y asociaciones puntuales. OpenAI, como demuestra la compra de TBPN, ya no solo licencia: adquiere el canal directamente. El movimiento es convergente aunque las estrategias difieran.

Para un medio de comunicación grande, esto es un problema de negociación. Para un periódico local como L’Eco di Bergamo, que ha revalorizado su archivo con resultado editorial demostrable, la cuestión es distinta: ¿contra quién negocia? ¿Con qué escala? El Publisher Content Marketplace de Microsoft tiene como socios iniciales a AP, Business Insider y Vox Media. No a periódicos locales italianos con 320.000 obituarios digitalizados.

Y si esto es así para un medio de comunicación, la pregunta se amplifica para un departamento de comunicación corporativa o un gabinete institucional. Lo que observo en mi práctica profesional es que muchas organizaciones están empezando a entender que su archivo (informes anuales, notas de prensa acumuladas, documentación técnica, publicaciones internas) tiene un valor que nunca habían considerado. Pero la conversación se detiene en la revalorización interna: hacer el archivo consultable, útil, navegable para los propios equipos. La dimensión externa, existir o no en el ecosistema de los modelos de IA, no forma parte todavía de la conversación estratégica. Y debería.

Porque la distinción que emerge de los datos de 2026 no es entre archivos buenos y archivos malos, ni entre organizaciones grandes y pequeñas. Es entre dos operaciones que parecen la misma pero no lo son: revalorizar un archivo como producto editorial propio y posicionar un archivo como fuente reconocible para los modelos de IA. La primera depende del criterio, la inversión y la decisión editorial de quien lo gestiona. La segunda depende de un mercado de licencias al que la mayoría de las organizaciones no tiene acceso, y de un sistema de distribución cuyo diseño no premia necesariamente lo mejor sino lo más disponible y lo más complaciente.

El archivo puede hablar. De hecho, ya habla. Lo que ha cambiado es quién decide si alguien lo escucha. Y esa decisión, en abril de 2026, no la toma ni el editor ni el lector. La toma un contrato que la mayoría de las organizaciones que producen contenido profesional no ha firmado y probablemente no pueda firmar.

FUENTES CITADAS

The Fix — How the Italian newspaper L’Eco di Bergamo used AI to create an unprecedented obituary database (2025) https://thefix.media/2025/08/14/how-the-italian-newspaper-leco-di-bergamo-used-ai-to-create-an-unprecedented-obituary-database/

L’Eco di Bergamo — Ogni vita un racconto: 320.000 nomi con i loro ricordi https://www.ecodibergamo.it/stories/ogni-vita-un-racconto/si-spalanca-palcoscenico-della-vita-bergamo-scorrono-320000-nomi-loro-o_2083240_11/

Reuters Institute — How newsrooms are bringing their archives to life (2026) https://reutersinstitute.politics.ox.ac.uk/news/how-newsrooms-are-bringing-their-archives-life

Reuters Institute — Journalism, Media and Technology Trends and Predictions 2026 https://reutersinstitute.politics.ox.ac.uk/journalism-media-and-technology-trends-and-predictions-2026

Conexión Pública — El archivo empieza a hablar (diciembre 2025) https://conexionpublica.es/el-archivo-empieza-a-hablar/

Digiday — A 2025 timeline of AI deals between publishers and tech companies https://digiday.com/media/a-timeline-of-the-major-deals-between-publishers-and-ai-tech-companies-in-2025/

The Verge — Microsoft says it’s building an app store for AI content licensing https://www.theverge.com/news/873296/microsoft-publisher-content-marketplace-ai-licensing

Seeking Alpha / WSJ — Meta inks AI content licensing deal with News Corp for $50M per year https://seekingalpha.com/news/4560464-meta-inks-ai-content-licensing-deal-with-news-corp-for-50m-per-year-report

Semrush — The Most-Cited Domains in AI: A 3-Month Study https://www.semrush.com/blog/most-cited-domains-ai/

Search Engine Land — AI search engines cite Reddit, YouTube, and LinkedIn most: Study https://searchengineland.com/ai-search-engines-cite-reddit-youtube-and-linkedin-most-study-473138

Columbia Journalism Review — Reddit Is Winning the AI Game https://www.cjr.org/analysis/reddit-winning-ai-licensing-deals-openai-google-gemini-answers-rsl.php

TechCrunch — OpenAI inks deal to train AI on Reddit data (2024) https://techcrunch.com/2024/05/16/openai-inks-deal-to-train-ai-on-reddit-data/

WAN-IFRA — The AI content market is taking shape: Four imperatives news publishers must tackle now (marzo 2026) https://wan-ifra.org/2026/03/the-ai-content-market-is-taking-shape-four-imperatives-news-publishers-must-tackle-now/

Parlamento Europeo — European Parliament moves to force AI companies to pay news publishers https://dig.watch/updates/eu-parliament-ai-companies-news-publishers

Press Gazette — News publisher AI deals and lawsuits tracker https://pressgazette.co.uk/platforms/news-publisher-ai-deals-lawsuits-openai-google/

Science — Sycophantic AI decreases prosocial intentions and promotes self-serving actions (marzo 2026) https://www.science.org/doi/10.1126/science.aec8352

Stanford Report — AI overly affirms users asking for personal advice (marzo 2026) https://news.stanford.edu/stories/2026/03/ai-advice-sycophantic-models-research

TechCrunch — Stanford study outlines dangers of asking AI chatbots for personal advice https://techcrunch.com/2026/03/28/stanford-study-outlines-dangers-of-asking-ai-chatbots-for-personal-advice/

Nature — AI chatbots are sycophants — researchers say it’s harming science https://www.nature.com/articles/d41586-025-03390-0

Georgetown Law — AI Sycophancy: Impacts, Harms & Questions https://www.law.georgetown.edu/tech-institute/research-insights/insights/ai-sycophancy-impacts-harms-questions/

TechCrunch — AI sycophancy isn’t just a quirk, experts consider it a ‘dark pattern’ (agosto 2025) https://techcrunch.com/2025/08/25/ai-sycophancy-isnt-just-a-quirk-experts-consider-it-a-dark-pattern-to-turn-users-into-profit/

TechCrunch — OpenAI acquires TBPN, the buzzy founder-led business talk show (abril 2026) https://techcrunch.com/2026/04/02/openai-acquires-tbpn-the-buzzy-founder-led-business-talk-show/

The Guardian — OpenAI buys tech talkshow TBPN in push to shape AI narrative https://www.theguardian.com/technology/2026/apr/02/openai-talk-show-tbpn

WSJ — OpenAI Buys Tech-Industry Talk Show TBPN https://www.wsj.com/cmo-today/openai-buys-tech-industry-talk-show-tbpn-484c01c5

Reuters — OpenAI acquires technology talk show TBPN in surprise move https://www.reuters.com/business/media-telecom/openai-acquires-technology-talk-show-tbpn-surprise-move-2026-04-02/

Press Gazette — Global publisher Google traffic dropped by a third in 2025 https://pressgazette.co.uk/media-audience-and-business-data/google-traffic-down-2025-trends-report-2026/

Press Gazette — Guardian’s first Substack experiment is republishing food newsletter Feast https://pressgazette.co.uk/newsletters/guardian-substack-experiment-feast-food-newsletter/

Publicaciones Similares