Πρόγραμμα εκδηλώσεων της Ημαθίας
[ditty id=231425 category="h-thesh-tou-laou"]

Σύστημα σύνθεσης ομιλίας της Google μιμείται τέλεια την ανθρώπινη φωνή χάρις στην τεχνητή νοημοσύνη

Πλέον, και επίσημα ο άνθρωπος εκχώρησε τη φωνή του στις μηχανές. Ένα επιστημονικό άρθρο που δημοσίευσε η Google, το οποίο πάντως δεν έχει αξιολογηθεί από άλλους επιστήμονες, περιγράφει ένα σύστημα εκφώνησης κειμένου που διεκδικεί σχεδόν απόλυτη ομοιότητα με την ανθρώπινη φωνή.


Το σύστημα ονομάζεται Tacotron 2 και αποτελεί τη δεύτερη επίσημη “γενιά” της συγκεκριμένης τεχνολογίας, η οποία βασίζεται σε δύο νευρωνικά δίκτυα. Το πρώτο δίκτυο “μεταφράζει” το κείμενο σε φασματογράφημα, οπτικοποιώντας έτσι την εξέλιξη των ακουστικών συχνοτήτων συναρτήσει του χρόνου.

 

Στη συνέχεια, το φασματογράφημα “φορτώνεται” στο WaveNet, ένα σύστημα από το ερευνητικό εργαστήριο DeepMind της Alphabet, το οποίο “διαβάζει” το γράφημα και αναπαράγει τα αντίστοιχα ηχητικά στοιχεία.

 

Το σύστημα τα καταφέρνει επίσης εξίσου καλά με ονόματα και λέξεις που προφέρονται, όπως επίσης και να προσαρμόζει τη χροιά του ανάλογα με τα σημεία στίξης. Μάλιστα, είναι άμεσα αξιοποιήσιμο από την Google, αφού το Google Assistant “χρωστά” τη φωνή του στο WaveNet, το οποίο πρωτοανακοινώθηκε το 2016. Επομένως, όταν είναι εντελώς έτοιμο για χρήση, το Tacotron 2 θα βελτιώσει κατακόρυφα τις δυνατότητες της υπηρεσίας.

Κοινοποίηση της ανάρτησης:

Σχετικές αναρτήσεις

ΑΠΟ ΤΕΧΝΙΚΗ ΕΤΑΙΡΕΙΑ ΜΕ ΕΔΡΑ ΤΗ ΒΕΡΟΙΑ ΖΗΤΕΙΤΑΙ ΧΕΙΡΙΣΤΗΣ ΜΗΧΑΝΗΜΑΤΩΝ ΕΡΓΩΝ / ΟΔΗΓΟΣ ΦΟΡΤΗΓΟΥ

ΑΠΟ ΤΕΧΝΙΚΗ ΕΤΑΙΡΕΙΑ ΜΕ ΕΔΡΑ ΤΗ ΒΕΡΟΙΑ ΖΗΤΕΙΤΑΙ ΧΕΙΡΙΣΤΗΣ ΜΗΧΑΝΗΜΑΤΩΝ ΕΡΓΩΝ / ΟΔΗΓΟΣ ΦΟΡΤΗΓΟΥ, ΓΙΑ ΕΡΓΑΣΙΑ ΤΗΛ. ΕΠΙΚΟΙΝΩΝΙΑΣ 23310 23400

Διαβάστε περισσότερα »

Ιστορικό

[pmpro_login redirect="/account/"]