Affidabilità dell’intelligenza artificiale su clima ed energia

CATEGORIE:

Quanto è affidabile l’AI su tematiche come mutamenti climatici ed energia? Audit indipendenti trovano risposte errate fino al 40% e forti differenze tra modelli. Come formulare domande e verifiche per non farsi ingannare.

ADV
image_pdfimage_print

I dati disponibili tra il 2023 e il 2025 indicano che l’affidabilità delle risposte fornite dai principali modelli di intelligenza artificiale (AI) su clima ed energia è variabile, disomogenea e fortemente dipendente dal tipo di domanda.

Secondo audit indipendenti e test comparativi, una quota rilevante delle risposte generate su narrazioni climatiche controverse contiene informazioni false, parziali o presentate in modo fuorviante, soprattutto quando il modello viene sollecitato a commentare affermazioni già circolanti nello spazio pubblico.

Il monitor mensile condotto da NewsGuard sui principali chatbot generalisti (ChatGPT, Copilot, Gemini, Grok, Meta AI, Claude e altri) mostra che, nelle domande collegate a narrazioni false già identificate, i sistemi analizzati hanno ripetuto affermazioni infondate nel 40,33% dei casi, mentre nel 21,67% non sono stati in grado di fornire una risposta verificabile.

Sommando falsità e non-risposte, il cosiddetto “tasso di fallimento” arriva al 62%. Le smentite esplicite, il cosidetto “debunking“, di domande di per sé basate su assunti falsi si fermano invece al 38%.

Questi risultati forniscono un’indicazione di quanto i modelli fatichino quando entrano in contatto con disinformazione già strutturata, inclusi temi energetici e climatici fortemente polarizzati.

I test tematici

Un riscontro ancora più netto emerge dai test tematici. Nel 2023, il Center for Countering Digital Hate (CCDH) ha valutato le risposte di Bard, allora chatbot di Google, su un set di 100 narrazioni false in nove ambiti.

Sul sottoinsieme climatico, tutte le dieci narrazioni selezionate sono state riprodotte senza avvisi o confutazioni. In termini pratici, su quel campione Bard non ha mai bloccato o corretto una falsa affermazione climatica, ma l’ha riformulata come informazione plausibile.

Nel rapporto, il CCDH sottolinea che “in tutti i prompt climatici testati, Bard non è riuscito a fornire una correzione o un avvertimento, riproducendo invece l’affermazione falsa come plausibile”, precisando che l’obiettivo del test era verificare la reazione del modello a falsità già documentate, non misurarne l’accuratezza generale.

Anche le analisi qualitative più recenti mostrano differenze marcate tra modelli. Test condotti da Global Witness indicano che alcuni sistemi, in particolare quelli progettati per massimizzare il coinvolgimento dell’utente, tendono a fornire risposte più permissive verso narrazioni negazioniste o complottiste quando il contesto lo suggerisce. Altri modelli appaiono più cauti, ma comunque inclini a introdurre elementi di “falso equilibrio”, presentando come dibattito aperto ciò che nella letteratura scientifica ed economica è ampiamente consolidato.

Nel complesso, le evidenze convergono su un punto: l’AI non fornisce un livello di affidabilità uniforme su clima ed energia. Alcuni modelli sono più prudenti, altri più compiacenti; tutti mostrano vulnerabilità ricorrenti quando vengono chiamati a sintetizzare contenuti controversi o già politicizzati.

Domande, fonti e personalizzazione

I riscontri pratici indicano che l’errore non sia casuale, ma strutturale. Uno dei risultati principali che emerge dalle analisi più solide non riguarda, infatti, il singolo modello, ma la relazione fra il modo in cui una domanda è posta e la probabilità che la risposta sia errata o distorta.

Nei monitor quantitativi e nei test controllati, l’errore cresce quando la richiesta incorpora presupposti controversi, chiede implicitamente conferma di una tesi circolante o sollecita una sintesi “equilibrata” su temi dove le evidenze non lo sono.

TechPolicy.press osserva come l’AI applicata alla ricerca e alla sintesi informativa tenda a trattare la domanda come una cornice da rispettare, più che come un’ipotesi da verificare. Quando una richiesta presuppone, ad esempio, un nesso diretto fra politiche climatiche e blackout, o chiede “le due posizioni” di un dibattito fortemente asimmetrico, il modello tende a costruire la risposta dentro quella cornice, invece di metterla in discussione.

In questi casi “le affermazioni controverse incorporate nel prompt hanno maggiori probabilità di essere riprodotte che contestate”, osserva TechPolicy.press.

Secondo l’organizzazione, un problema ugualmente o anche più insidioso dell’inventare “frottole”, cioè le cosiddette “allucinazioni” dei chatbot, potrebbe essere un altro.

“Il problema più pericoloso dei chatbot con intelligenza artificiale nella ricerca sul web potrebbe non essere che sono bravissimi a inventare cose, ma che sono pessimi anche nelle competenze di base relative ai media e all’informazione e non sono in grado di valutare le fonti”, scrive Jutta Haider, docente presso la Scuola svedese di biblioteconomia e scienze dell’informazione dell’Università di Borås e membro del programma Mistra Environmental Communication.

Quando l’AI attinge al web, infatti, la visibilità delle fonti tende a contare più della loro attendibilità. Documenti di think tank di parte, comunicazione aziendale o contenuti pseudoscientifici ben indicizzati rischiano di essere riassunti e presentati come “una prospettiva” affidabile, senza che venga chiarito il loro peso rispetto alla letteratura scientifica o ai dati ufficiali.

In questi casi l’AI non agisce come filtro, ma come amplificatore: la richiesta “richiama” una storia, e il modello la restituisce in forma fluida e apparentemente equilibrata.

Personalizzazione e compiacenza

Un ulteriore moltiplicatore di rischio è la personalizzazione. In un’indagine di quest’anno, Global Witness ha testato ChatGPT, Meta AI e Grok con profili utente diversi: uno fiducioso nella scienza e nelle istituzioni, uno incline alle teorie complottiste, senza dichiarare posizioni sul clima, come mostra il prompt in inglese nell’illustrazione di Global Witness.

Il risultato è che, in particolare nel caso di Grok, il modello AI di X (ex Twitter) le risposte cambiano sensibilmente: con l’utente incline al “complottismo”, il modello passa da spiegazioni relativamente caute a formulazioni tipiche della disinformazione climatica.

Nel rapporto, Global Witness osserva che Grok “non si limita a riecheggiare narrazioni complottiste, ma suggerisce attivamente di rendere i contenuti più provocatori per aumentarne la portata”.

ChatGPT, nello stesso test, appare più prudente nel linguaggio e tende a inserire avvertenze quando cita voci controverse o quando una richiesta dell’utente rischia di spingere verso fonti problematiche. Global Witness riporta che ChatGPT accompagna le eventuali menzioni con un invito alla cautela e alla verifica, chiarendo che la risposta non rappresenta un avvallo della tesi esposta e che occorre appurare solidità delle prove ed eventuali distorsioni.

In questo ambito, la distorsione non nasce da un dato inventato, ma da una logica di ottimizzazione del coinvolgimento degli utenti applicata a temi scientifici e di politica energetica. Quando l’AI cerca di incontrare le convinzioni dell’utente, il rischio è che trasformi un errore potenziale resistente alla verifica in una narrazione coerente e calzante rispetto a convinzioni infondate.

Dal negazionismo al dubbio sulle soluzioni

Nel periodo 2023-2025, diverse analisi mostrano che la disinformazione climatica ha cambiato forma.

Studi pubblicati su riviste scientifiche come Global Sustainability (Università di Cambridge) descrivono uno spostamento progressivo dalla negazione della fisica del clima alla delegittimazione delle soluzioni: rinnovabili raccontate come inaffidabili, transizione dipinta come economicamente insostenibile, politiche climatiche presentate come imposizioni ideologiche più che come risposte a un problema reale.

Un quadro analogo emerge dai rapporti di organizzazioni che analizzano le campagne di influenza sul clima. InfluenceMap, centro di ricerca che monitora lobbying e comunicazione legata ai combustibili fossili, individua tra le narrazioni più ricorrenti quelle che mettono in dubbio l’“accessibilità” e la “sicurezza” della transizione energetica, usando un linguaggio che si presenta come pragmatismo economico ma che, nei fatti, tende a rallentare o disorientare il dibattito pubblico.

Anche il Centre for Climate Action Against Disinformation (CAAD) segnala come, nei contenuti online più diffusi, l’accento si sposti sempre più su presunti limiti pratici delle rinnovabili e sulle conseguenze negative delle politiche climatiche.

In questo contesto, il falso equilibrio prodotto dall’AI diventa particolarmente insidioso. Le analisi di Global Witness mostrano che, quando i modelli sintetizzano questi temi, possono finire per mettere sullo stesso piano il consenso scientifico, analisi marginali e opinioni di parte, cancellando le differenze di qualità e di solidità delle prove.

Non si tratta di bugie dirette, ma di distorsioni sistemiche del quadro informativo: una rappresentazione “bilanciata” che, proprio perché sembra ragionevole, rende più difficile distinguere tra ciò che è supportato da evidenze robuste e ciò che non lo è.

Elezioni e opinione pubblica

Le evidenze disponibili non consentono oggi di stabilire una correlazione robusta e diretta tra la diffusione di risposte disinformative dell’AI su clima ed energia e risultati elettorali specifici.

Mancano set di dati pubblici sufficientemente granulari per collegare in modo causale l’uso dell’AI, i contenuti climatici e l’esito delle consultazioni elettorali, soprattutto su scala nazionale o comparata.

Al tempo stesso, alcune evidenze sperimentali più circoscritte indicano che la persuasione conversazionale funziona. Studi pubblicati tra il 2023 e il 2025 su riviste scientifiche come Nature Human Behaviour e Science Advances, condotti da gruppi di ricerca universitari negli Stati Uniti e in Europa, mostrano che brevi interazioni con sistemi di AI possono produrre cambiamenti misurabili nelle opinioni politiche e nelle percezioni delle politiche pubbliche.

In questi esperimenti controllati, l’effetto non riguarda l’esito di un’elezione reale, ma variazioni statisticamente significative delle risposte degli utenti prima e dopo l’interazione con un modello AI, soprattutto quando le risposte appaiono personalizzate e formulate in linguaggio fattuale.

Gli autori degli studi sottolineano che non esistono evidenze scientifiche per affermare che l’AI “decida le elezioni”. Esiste però un rischio plausibile: se risposte personalizzate e apparentemente neutre diventano una fonte primaria di informazione su temi climatici ed energetici, cioè, ambiti già fortemente polarizzati, l’AI può contribuire a orientare atteggiamenti e preferenze politiche, amplificando convinzioni pregresse più che fornire un quadro informativo equilibrato.

Come ottenere risposte più affidabili?

Le stesse ricerche indicano anche possibili soluzioni ai rischi di disinformazione legati all’AI.

L’affidabilità dei chatbot e delle loro risposte aumenta quando le domande degli utenti impongono dei vincoli chiari:

  • richiesta esplicita di dati quantitativi con fonte qualificata
  • periodo di riferimento
  • distinzione esplicita fra fatti e interpretazioni
  • separazione chiara fra consenso scientifico, posizioni minoritarie e opinioni
  • esplicitazione dei limiti e delle incertezze delle risposte.

Al contrario, domande che chiedono conferme, che sollecitano simmetrie narrative, che spingono l’AI a costruire argomentazioni persuasive anziché verifiche o che premiano l’effetto retorico aumentano la probabilità di errore, cioè di disinformazione da parte dell’AI.

La linea di confine fra informazione e disinformazione è insomma più culturale che tecnologica. Il problema è, cioè, come gli utenti maneggiamo lo strumento AI, non lo strumento in sé, a prescindere da come le società dell’AI impostano la logica dei loro modelli, sapendo che le aziende in genere non necessariamente hanno a cuore il benessere della collettività come loro prima priorità.

Sul lato della domanda, i modelli di AI possono essere utili bussole per orientarsi, ma per funzionare bene devono essere usati lontano dai “magnetismi” di posizioni molto polarizzate che interferiscono con la capacità dei modelli di dare una “direzione” accurata. In altre parole, la qualità delle risposte dipende in larga misura dalla qualità delle domande, e dalla capacità di chi legge di riconoscere quando una risposta elegante o calzante non è anche una risposta fondata.

Sul lato dell’offerta, c’è una questione regolatoria e di mercato che va oltre l’idea che sia l’utente a dover “fare le domande giuste” (Green Energy Day: porte aperte agli impianti, muri alzati da burocrazia e disinformazione). In Europa, ma non solo, si discute di obbligare i fornitori di AI a rendere i loro modelli più robusti, cioè capaci di produrre risposte ragionevolmente accurate, prudenti e non fuorvianti anche quando sono sottoposti a prompt scadenti, tendenziosi, ambigui o costruiti male, favorendo trasparenza e mitigando la disinformazione.

L’obiettivo non è rendere l’AI infallibile, ma ridurre in modo sistematico la probabilità che diventi un amplificatore automatico di narrazioni false o distorte, anche su temi scientifici e di policy come clima ed energia.

ADV
×
Privacy Policy Cookie Policy