TCS – DeepSpeech & Common Voice

Iniziamo il 2019 con la nostra prima TCS dell’anno interamente dedicata a  Common Voice e DeepSpeech, due progetti di Mozilla di raccolta dati e riconoscimento vocale. Sono open-source e aperti a tutti, e chiunque può “donare” la propria voce o giocare con gli algoritmi.

Common Voice è un progetto di crowdfunding, non quello classico pensato per raccogliere soldi, bensì per raccogliere dati testuali e vocali basati su lingue specifiche, nato con il progetto Open Source di riconoscimento vocale DeepSpeech basato su algoritmi di Machine Learning e reti neurali.

Per poter quindi permettere a Common Voice e DeepSpeech di progredire, c’è bisogno di quel nutrimento composto dalla partecipazione di volontari che contribuiscono con nuove frasi, leggono del testo o che revisionano le registrazioni effettuate in una specifica lingua. Con un dataset di centinaia di letture della stessa frase i modelli di Machine Learning e Deep Learning, basati sul paper di ricerca di Baidu, saranno allenati grazie alle caratteristiche nelle frasi registrate da più persone con accenti diversi, tono, velocità e pronuncia. Common Voice e DeepSpeech fanno quindi leva su come parlano le persone nella vita reale!

Speaker

Stefania Delprete

Data scientist e insegnante di Python presso TOP-IX, co-creator dei Mozilla Meetup a Berlino e Torino. Appassionata di fisica, filantropia, jazz, frutta e coscienza.