Le fonti dell’intelligenza artificiale. Ecco la mappa del sapere digitale

Condividi

I modelli di intelligenza artificiale attingono informazioni da un ecosistema di fonti digitali che sta ridefinendo l’accesso alla conoscenza. Secondo i dati Semrush di agosto 2025, basati su 150.000 citazioni da 5.000 parole chiave selezionate casualmente, Reddit raccoglie il 40,1% delle citazioni nei contenuti generati dall’AI, superando Wikipedia, YouTube e persino la ricerca tradizionale di Google.

La predominanza di Reddit riflette una trasformazione nel modo in cui la conoscenza viene costruita e trasmessa. La piattaforma, con i suoi contenuti generati dagli utenti, spazia dalle discussioni tecniche specialistiche alle opinioni di esperti settoriali. Un ruolo rafforzato dall’accordo da 60 milioni di dollari tra Google e Reddit, che ha garantito al colosso di Mountain View l’accesso diretto ai dati del forum per il training degli algoritmi.

Wikipedia resta al secondo posto con il 26,3% delle citazioni, rappresentando la fonte prediletta dai modelli che privilegiano dati strutturati e verificabili. L’enciclopedia collaborativa ha espresso più volte preoccupazioni per i riassunti generati dall’intelligenza artificiale senza citare le fonti, che rischiano di ridurre la navigazione e quindi la collaborazione degli utenti. È il paradosso contemporaneo: l’AI utilizza massicciamente Wikipedia, ma al tempo stesso ne può indebolire il modello aperto e partecipativo.

YouTube segue con il 23,5%, apprezzato per la ricchezza di contenuti multimediali. La piattaforma video fornisce tutorial, lezioni e approfondimenti che arricchiscono le risposte delle intelligenze artificiali con elementi dinamici e immediati. Subito dopo si colloca la ricerca tradizionale di Google (23,3%), che però sta perdendo centralità a favore dei nuovi strumenti AI integrati.

Il quadro si completa con altre piattaforme che, pur meno rilevanti, mantengono un ruolo complementare: Yelp (21%), Facebook (20%), Amazon (18,7%), TripAdvisor (12,5%), oltre a sistemi di mappatura come Mapbox e OpenStreetMap (11,3%).

I diversi modelli AI mostrano preferenze distinte. Secondo Semrush, Reddit emerge come fonte dominante in ChatGPT, Perplexity AI e Google AI Mode, mentre YouTube si afferma come risorsa chiave per le piattaforme che valorizzano la componente multimodale.

La trasformazione più radicale riguarda proprio Google. Nel maggio 2025 l’azienda ha introdotto Google AI Mode, superando il tradizionale modello dei “dieci link blu” con risposte sintetizzate dall’IA, arricchite da link e interfacce conversazionali. È un cambiamento che modifica la distribuzione del traffico web e, di conseguenza, i modelli economici che hanno retto finora l’ecosistema digitale.

La crescente dipendenza da fonti di user-generated content come Reddit solleva interrogativi sulla qualità e sull’affidabilità dell’informazione. Mentre Wikipedia dispone di meccanismi di revisione e controllo, i contenuti di Reddit variano enormemente per accuratezza e autorevolezza. La sfida per l’industria digitale è duplice: da un lato garantire sintesi rapide e pertinenti, dall’altro preservare la sostenibilità economica e la diversità delle piattaforme che alimentano l’intelligenza artificiale.

In definitiva, il futuro dell’accesso alla conoscenza dipenderà dalla capacità di bilanciare efficienza e pluralità delle fonti. L’intelligenza artificiale non può esistere senza l’ecosistema che la nutre: proteggerne la qualità e la vitalità sarà la vera posta in gioco nei prossimi anni.