“Africa Next Voices” raccoglie dati per istruire i modelli di’intelligenza artificiale per quanti in Africa non parlano inglese.
In Africa si dice siano parlate oltre un quarto delle lingue del mondo per una stima totale di circa 2000 idiomi.
Buona parte di questi però sono usati solo oralmente e quindi mancano completamente di tutti quei testi con cui le aziende tecnologiche stanno addestrando i loro modelli di AI.
Mancano anche adeguati investimenti.
Rischio esclusione
La maggior parte degli strumenti di IA attualmente in uso, come ChatGPT, sono addestrati principalmente in inglese, in altre lingue europee e in cinese.
Se un chatbot non sa rispondere in modo utile a milioni di persone che vivono in Africa, questo si traduce nella loro esclusione.
“Stiamo vivendo questa rivoluzione dell’IA, immaginando tutto ciò che si può fare con essa. Ora immaginate una parte della popolazione che non vi ha accesso, perché tutte le informazioni sono in inglese”, spiega il professor Vukosi Marivate, professore di informatica presso l’Università di Pretoria.
“Pensiamo nelle nostre lingue, sogniamo in esse e interpretiamo il mondo attraverso di esse. Se la tecnologia non lo riflette, un intero gruppo rischia di essere lasciato indietro” aggiunge Marivate.
Il progetto “Africa Next Voices”
Il progetto “Africa Next Voices”, finanziato dalla Gates Foundation con una sovvenzione di 2,2 milioni di dollari, ha permesso a linguisti e informatici di creare dataset adatti all’IA in 18 lingue africane.
Si tratta di una parte molto piccola delle lingue parlate nel continente, ma i partecipanti al progetto sperano di ampliarlo in futuro.
In due anni, il team ha registrato 9.000 ore di parlato in Kenya, Nigeria e Sudafrica, catturando situazioni quotidiane legate ad agricoltura, salute ed educazione.
Le lingue documentate includevano Kikuyu e Dholuo in Kenya, Hausa e Yoruba in Nigeria, isiZulu e Tshivenda in Sudafrica.
Alcune di queste lingue sono parlate da milioni di persone.
“Serve una base di partenza, ed è proprio questo che rappresenta Africa Next Voices. Poi le persone potranno costruire sopra e aggiungere le proprie innovazioni”, dice il professor Marivate, che ha guidato la ricerca in Sudafrica.
La linguista computazionale Lilian Wanzare, che collabora al progetto dal Kenya, afferma che registrare il parlato direttamente sul territorio ha permesso di creare dati che riflettono realmente come le persone vivono e parlano.
“Abbiamo raccolto voci da diverse regioni, età e contesti sociali per essere il più inclusivi possibile. Le grandi aziende tecnologiche spesso non colgono queste sfumature”, afferma.
I dati registrati sono accessibili liberamente per mettere gli sviluppatori in condizioni di creare strumenti capaci di tradurre, trascrivere e rispondere in lingue africane.
Un aiuto pratico alla popolazione
I professionisti che lavorano al progetto hanno già raccolto vari esempi di come le lingue indigene implementate nell’IA possano aiutare gli utenti a risolvere problemi reali della popolazione africana.
“Per chi, come me, sta ancora imparando a fare l’agricoltore, ci sono molte difficoltà”, ha spiegato alla BBC Kelegobile Mosime, agricoltrice di 45 anni, che gestisce un terreno di 21 ettari a Rustenburg, nella regione del platino in Sudafrica.
La signora dice di aiutarsi con un’app chiamata AI-Framer, che riconosce diverse lingue sudafricane, tra cui Sesotho, isiZulu e Afrikaans.
“Sono una persona di campagna, non ho molta familiarità con la tecnologia, ma con questa app posso chiedere come controllare gli insetti, oppure aiuto per diagnosticare piante malate” racconta Mosime.
Un’altra testimonianza arriva da Lelapa AI, una azienda fondata nel 2022 a Johannesburg che sviluppa strumenti di IA in lingue africane per banche e società di telecomunicazioni.
“L’inglese è la lingua delle opportunità. Per molti sudafricani che non lo parlano, non è solo scomodo: significa perdere l’accesso a servizi essenziali come sanità, banca o aiuti governativi” spiega la ceo Pelonomi Moiloa.
“Se perdiamo le lingue africane, perdiamo anche il nostro immaginario”
Marivate perà sottolinea che non è solo una questione di affari o comodità, ma di perdere qualcosa di ben più profondo e prezioso.
“La lingua è accesso all’immaginazione. Non si tratta solo di parole – ma di storia, cultura, conoscenza. Se le lingue indigene non vengono incluse, perdiamo più che dati: perdiamo modi di vedere e comprendere il mondo.”
Foto (YouTube): Vukosi Marivate