Segnalo due notizie sulla strategia di Google per catturare le informazioni dai video e sul lancio di un nuovo motore per le traduzioni. La strategia è caratterizzata da un uso comune di metodi statistici, cosa che a Google riesce bene grazie all’enorme mole di dati di cui può disporre
La prima notizia è riportata in un’intervista di InfoWorld a Marissa Mayer, vice presidente Search Products & User Experience: Google sta lavorando ad un nuovo motore di speech-to-text che si basa sulla statistica raccolta durante le chiamate al numero telefonico di assistenza tecnica:
The speech recognition experts that we have say: If you want us to build a really robust speech model, we need a lot of phonemes, which is a syllable as spoken by a particular voice with a particular intonation. So we need a lot of people talking, saying things so that we can ultimately train off of that. … So 1-800-GOOG-411 is about that: Getting a bunch of different speech samples so that when you call up or we’re trying to get the voice out of video, we can do it with high accuracy.
Il risultato dovrà servire per implementare la ricerca all’interno dei video, che ora avviene tramite metadati.