Tecnica matematica per rendere 'quasi' perfette traduzioni Google

(AGI) - Washington, 30 set. - Una nuova tecnica matematicapotrebbe migliorare notevolmente le traduzioni automatiche diGoogle. Chiunque abbia provato BabelFish o Google Translate sache forniscono servizi di traduzione utili, ma ben lungidall'essere perfetti. L'idea di base di questi sistemi e'quella di confrontare un corpus di parole di una lingua con lostesso corpus di parole tradotte in un altro idioma: parole efrasi che condividono proprieta' statistiche simili sonoconsiderati equivalenti. Il problema, naturalmente, e' che letraduzioni iniziali si basano su dizionari che devono esserecompilati da esperti umani e questo richiede tempo e fatica.Ora pero', Tomas Mikolov e colleghi di Google a Mountain View,come si legge su arXiv, hanno sviluppato una tecnica che generaautomaticamente dizionari e tabelle di frasi che convertono unalingua in un'altra. Il nuovo metodo non si fonda su versioni indiverse lingue di uno stesso documento ma utilizza tecniche di'data mining' per creare un modello della struttura di unalingua che poi viene paragonato alla struttura di un'altralingua. Il nuovo approccio e' relativamente semplice: si basasul fatto che ogni lingua descrive un insieme simile di idee ele parole che vi appartengono devono necessariamente esseresimili. Per esempio, la maggior parte dei linguaggi avra'parole per animali comuni come cane, gatto, mucca e cosi' via.E queste parole saranno usate nello stesso modo in frasi come'il gatto e' un animale piu' piccolo del cane'. Il nuovotrucco e' rappresentare un'intera lingua usano le relazioni frale parole. L'insieme di tutte le relazioni, il cosiddetto'spazio del linguaggio', puo' essere pensato come un insieme divettori che vanno da una parola all'altra. Negli ultimi anni, ilinguisti hanno scoperto che e' possibile gestire questivettori matematicamente. Per esempio, l'operazione 're'-'uomo'+ 'donna' risulta in un vettore che e' simile a 'regina'. Si e'scoperto che diversi linguaggi condividono similitudini inquesto spazio vettoriale: il processo di conversione da unalingua all'altra si riduce allora a trovare la trasformazionematematica che trasforma uno spazio vettoriale nell'altro. Unproblema linguistico diventa quindi di tipo matematico e glistudiosi di Google hanno trovato una opportuna applicazione checolleghi i due spazi vettoriali. "Il nostro metodo e'estremamente efficace: abbiamo raggiunto finora una precisionedel 90 per cento nelle traduzioni fra inglese e spagnolo", hacommentato Mikolov. (AGI).