Italia
CNR PISA: ITALIANO E ALTRE LINGUE EUROPEE A RISCHIO ESTINZIONE DIGITALE
L’italiano, come la maggioranza delle lingue europee, rischia di scomparire da Internet, anche se la sua presenza in rete è tutt’altro che marginale. A dirlo è il rapporto “La lingua italiana nell’era digitale” dell’Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti. La percentuale di pagine web in italiano a livello mondiale è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005, spiega Nicoletta Calzolari dell’Ilc-Cnr. È stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell’Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni è però rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicché la proporzione di coloro che parlano la nostra lingua subirà una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all’inglese. Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7%, con 30 milioni di internauti (circa il 6,3% di quelli dell’Ue) su 58 milioni di cittadini: la loro crescita è stata del 127,5% tra il 2000 e il 2010.
Se questo è il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore. Il dato è preoccupante, prosegue Claudia Soria dell’Ilc-Cnr, perché dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua.
Lo studio condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net (disponibile a stampa da Springer e online all’indirizzo www.meta-net.eu/whitepapers): 21 lingue su 30 analizzate si collocano al livello più basso, con un supporto digitale debole o assente’ in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.), spiega Soria. L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con supporto frammentario’, si collocano tra le lingue ad alto rischio. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con supporto modesto’. Nessuna lingua, però, ottiene supporto eccellente’.
Sono risultati allarmanti, conclude Hans Uszkoreit, coordinatore di Meta-Net. La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro.