Se non ci si addestra molto attentamente a essere vigili contro gli errori delle attuali intelligenze artificiali, quegli errori passeranno inosservati e finiranno per contaminare tutto, con conseguenze potenzialmente disastrose.
Leggo su The Verge che l’IA di Google dedicata alla medicina, Med-Gemini (non una IA generica, ma un prodotto destinato specificamente all’uso medico), ha “inventato” una parte anatomica che non esiste, i “gangli basilari”. Secondo Google si è trattato semplicemente di un refuso al posto di “gangli basali”, ma il problema è che il refuso non è stato notato dai revisori e quindi rischia di propagarsi inosservato, alterando la terminologia medica. E qui sta il problema di fondo di questi software: spesso generano risultati che a prima vista possono suonare giusti ma sono in realtà sottilmente sbagliati, e noi non siamo mentalmente predisposti per notare errori così sottili, nascosti in una sequenza di parole plausibili. Ci adagiamo facilmente, abbassiamo la guardia.
Me ne sono accorto personalmente stamattina. Sono alle prese con una traduzione medica dall’italiano all’inglese che a un certo punto parla di estrogeni, al plurale. DeepL, che ho usato nella sua versione professionale per la pre-traduzione di bozza (perché è abbastanza efficace come assistente ma ogni tanto prende granchi clamorosi), mi ha tradotto quel plurale volgendolo al singolare: estrogen.
La cosa mi ha insospettito. Nel rivedere attentamente a mano il testo, ritraducendo mentalmente per poi vedere come se l’è cavata DeepL, come faccio sempre, ho verificato che in inglese estrogen viene usato sia come countable, ossia sostantivo che ha un plurale (estrogens), sia come uncountable, ossia che rimane invariato al plurale (come furniture o information). E solitamente si usa come uncountable, quindi al singolare. DeepL ha lavorato bene.
Ma quando ho immesso in Google “estrogen plural”, come faccio sempre quando voglio verificare il plurale dei termini (soprattutto medici, visto che molti in inglese hanno plurali alla latina o alla greca), l’IA di Google mi ha risposto con perentoria certezza in modo molto differente.
The plural of estrogen is estrogens. This is because “estrogen” refers to a group of related hormones, not a single substance. The term “estrogens” is more accurate when referring to these multiple hormones.
In altre parole, l’IA di Google mi ha dato una risposta che è in sé corretta ma omette una parte importantissima, ossia il fatto che anche la forma estrogen per il plurale è valida. Questi errori di omissione sono i più subdoli in assoluto.
Faccio ancora un esempio, in cui stavolta è stato DeepL a sbagliare in maniera sottilmente ingannevole. Lo stesso testo parla, nell’originale, di DNA che viene tagmentato. Nella sua pre-traduzione, DeepL ha tradotto fragmented, ossia “frammentato”, come se avesse interpretato tagmentato come un errore di battitura al posto appunto di frammentato. Ma in realtà il testo originale è corretto, perché la tagmentazione è un procedimento che esiste e ha un significato tecnico molto preciso.
Quanti traduttori avrebbero pensato a un semplice refuso e avrebbero detto “ecco guarda quanto è bravo DeepL, corregge persino gli errori di battitura”, commettendo invece un errore importante di traduzione?
Per usare efficacemente questi software di traduzione assistita, e più in generale per usare efficacemente le intelligenze artificiali, bisogna insomma riaddestrarsi, cambiare metodo di lavoro, cercare di anticipare gli errori tipici di questi prodotti e diventare loro supervisori inflessibili e perennemente sul chi vive. Pensare che possano sostituire gli esseri umani è pura incoscienza.