Quantcast
Channel: Rss Tecno News » Sintesi vocale
Viewing all articles
Browse latest Browse all 8

Il motore di sintesi vocale di Google si aggiorna, e noi andiamo ad analizzare tutti gli altri.

0
0

Cogliamo l’occasione dell’aggiornamento del motore di sintesi vocale di Google per analizzare tutte le alternative presenti sul mercato degli smartphone. sintesi_vocale

Nella giornata di oggi Google ha rilasciato l’aggiornamento per il suo motore di sintesi vocale, ma plachiamo subito le aspettative infatti, a differenza della versione americana e di quella inglese che pesano intorno a 200 mega, l’aggiornamento italiano è solo di 5 mega. Quindi molto probabilmente non riscontreremo alcuna differenza.  Noi di androidtech però abbiamo deciso di cogliere l’occasione per parlare dei diversi programmi di sintesi vocale. In particolare parleremo dei rispettivi programmi di Microsoft, Apple e Google e introdurremo anche alcuni programmi presenti nel Play Store.

Sintesi Vocale di Google Siri la sintesi vocale di Apple

  • Quando uscii per i telefoni era a dir poco imbarazzante. Google si era limitata a trasportare  il codice che utilizzava per Translate: di per se il programma non era mal riuscito, solo che gli utenti se ne sono subito accorti. Infatti il programma di sintesi vocale era nato per la compitazione di alcune parole cercate su Google Translate e non per formulare frasi lunghe. Con il passare degli anni (e l’uscita di Siri) a Mountain Wiew hanno capito che non potevano continuare a concentrare i loro sforzi solo per la versione anglofona, cosi fecero uscire un corposo aggiornamento (l’attuale) le cose cambiarono. Però non sono riusciti ad ottenere la perfezione, infatti pur ottenendo una certa intonazione si capisce chiaramente che i margini di miglioramento sono ampi, ad esempio la sintesi vocale ha il difetto di terminare le parole marcando l’accento sull’ultima sillaba cosa che i rivali non fanno. Sembrerebbe che Google stia cascando nello stesso problema di pochi anni fa, ovvero sta concentrando gli sforzi solo sul settore anglofono lasciando  il resto del mondo in attesa di un aggiornamento.

Siri la sintesi vocale di Apple

  • Molti ingenuamente pensano che la sintesi vocale di apple sia vicina alla perfezione, ma non è assolutamente vero. Infatti bisogna riconoscere agli ingegneri Apple la completa superiorità rispetto a quelli Google (che dovrebbero avere molta più esperienza), ma per prima cosa bisogna fare delle considerazioni. Inanzi tutto Apple ha cercato di fare di Siri il suo cavallo di battaglia e quindi ci si aspetta l’assoluta perfezione. Infatti pur avendo una dizione migliore rispetto ai rivali ha una voce metallica e lascia passare troppo tempo tra una parola e l’altra. Per non parlare dei lunghissimi tempi che ci impiega a formulare le frasi (sembra quasi che abbia una sorta di handicap mentale). La differenza sostanziale è che la sintesi vocale è simile su per tutti gli idiomi  e quindi non sono previsti a breve grandi margini di miglioramento.

Cortana la sintesi vocale di Microsoft

  • Come al solito Microsoft arriva in ritardo. Infatti solo pochi giorni fa Microsoft ha fatto trapelare Cortana attraverso un video, peccato che nel video si possa giudicare tutto eccetto la sintesi vocale infatti essendo Microsoft nuovamente in ritardo non ha ancora nemmeno presentato un’opzione almeno confrontabile a quella dei rivali. E questo è un vero peccato perchè come dimostrato dal successo di Siri gli utenti dedicano un sacco di importanza a questo genere di cose. E dire che Microsoft fu pioniera in questo settore, infatti nei primi anni 2000 aveva messo a punto un sistema di riconoscimento vocale mai andato in porto.

Quindi sembrerebbe  non esistere una sintesi vocale all’altezza dei vostri smartphones….ma è qui che vi sbagliate infatti vi parlerò di Ivona Text.

Ivona Text la sintesi vocale gratuita per Android

  • Ebbene si…esiste un ottimo programma di sintesi vocale, naturalmente è un esclusiva Android ed è pure Gratuito. Il suo nome è Ivona Text ed avrete la possibilità di parlare con Giorgio oppure con Clara. La cosa strabiliante è la quantità infinita di voci disponibili sul sito: inoltre è compatibile con diverse lingue. A essere sinceri la differenza con una persona reale la noterete comunque ma molto meno…. Inoltre esiste anche una versione online di prova, dove potrete far dire ciò che volete al vostro PC, quindi che aspettate andate subito a far dire stupidaggini a Giorgio e a Clara tanto chi è che non lo vorrebbe fare. Fra le diverse qualità di questo programma c’è di sicuro la possibilità di impostarlo come voce predefinita sul vostro telefono. Infatti basterà scaricare l’app, scaricare il pacchetto dati relativi all’idioma e al sesso della voce e da qul momento il vostro telefono avrà una voce più umana. Personalmente l’accoppiata che adoro fare è quella con Jarvis un assistente personale in grado persino di raccontare barzellette. Infatti questa combinazione mi fa sentire un po Tony Stark e chi non vorrebbe sentirsi come lui.  

Molti di voi leggendo questa comparazione avranno pensato che l’autore si sia fumato qualcosa, perché  non esiste un assistente vocale migliore di quello di Apple, peccato che si stia andando ad analizzare la sintesi vocale e non l’intelligenza artificiale. Andiamo vedere a grandi linee su cosa si basa la sintesi vocale.A grandi linee un programma di sintesi vocale può essere suddiviso in due parti. Una Front-end e una Back-end:

  • Front-end: In questa fase il programma “normalizza” il testo, ovvero , viene eseguita un’analisi del testo scritto per convertire tutti i numeri, le sigle e le abbreviazioni in parole per esteso (es. il testo ’2′ viene convertito in ‘due’). Fatto questo si occupa della conversione in simboli fonetici del testo, cioè suddivide il testo in frasi, proposizioni e periodi. Questa fase è la più importante in assoluto perchè è quella che si occupa dell’analisi del testo, di dare la giusta intonazione e enfasi alle frasi, dando quindi al programma di sintesi vocale una corretta impostazione.
  • Back-end: La fase finale consiste nella conversione dei simboli fonetici in suoni veri e propri. Questo può avvenire grazie al procedimento dei  vari sistemi di sintesi vocale che si differenziano a seconda delle dimensioni dei campioni vocali memorizzati: un sistema che memorizza singoli fonemi o fonemi doppi consente di ottenere il numero massimo di combinazioni a discapito della chiarezza complessiva mentre in altri sistemi concepiti per un impiego specifico si ricorre alla registrazione di parole intere o di intere frasi per ottenere un risultato di qualità elevata.

Possiamo ottenere un chiarimento dall’immagine sottostante presa a titolo esemplificativo da Wikipedia.

Sintesi_vocale

 

Nonostante questa tecnologia sia studiata da diverso tempo tutti i programmatori che si accingono a sviluppare un programma applicativo di sintesi vocale (in questo caso per i nostri assistenti) si devono imbattere nella risoluzione di alcune problematiche per ottenere un prodotto di qualità. Tra queste problematiche le principali sono la normalizzazione, l’aspetto qualitativo, l’emotività del lettore e la resa fonemica del testo. Ma la fregatura più grande è dovuta al fatto che questo tipo di problematiche bisogna andare ad analizzarle nello specifico per ogni idioma che si vuole digitalizzare. Infatti a differenza della maggior parte delle applicazioni che non hanno problematiche di traduzione la sintesi vocale ne è vittima.

L'articolo Il motore di sintesi vocale di Google si aggiorna, e noi andiamo ad analizzare tutti gli altri. sembra essere il primo su .


Viewing all articles
Browse latest Browse all 8

Latest Images

Trending Articles





Latest Images