Εspeak: Κάντε το Linux να σας μιλάει ελληνικά [βίντεο]

dimitris | Κυρ, 07/22/2018 - 16:55 | 5' | 14

Οσοι "έζησαν" την εποχή των home computers (Amiga, Atari ST, κλπ), θα θυμούνται το δέος που νιώθαμε με τη σύνθεση φωνής, τη δυνατότητα να ακούς λέξεις ή φράσεις από υπολογιστές με ελάχιστη επεξεργαστική ισχύ*. Κάτι αντίστοιχο κάνει το Espeak στο Linux και με ιδιαίτερη επιτυχία καθώς μιλάει ακόμα και Ελληνικά.

Το Espeak είναι ένα synthesizer φωνής ανοικτού κώδικα που προέρχεται από ένα παλιότερο synthesizer που είχε γράψει ο δημιουργός του για τα συστήματα Archimedes τη δεκαετία του 1990, γι' αυτό η φειδωλή χρήση της μνήμης δεν αποτελεί έκπληξη. Χρησιμοποιεί διαφορετική μέθοδο σύνθεσης από άλλα text-to-speech συστήματα (όπως το Festival) και γι' αυτό οι φωνές ακούγονται πιο "κομπιουτερίστικες". Αυτό σε κάποιους δεν θα αρέσει γιατί η φωνή δεν έχει ανθρώπινη ομαλότητα, αν και υπάρχουν άλλοι που το προτιμούν ακριβώς γι' αυτό! Στο κάτω κάτω "μιλάει ο υπολογιστής", τι περιμένεις να ακούσεις;

Υπάρχουν όμως και πλεονεκτήματα. Αντίθετα με το πιο διαδεδομένο Festival, που απαιτεί μια βάση δεδομένων για κάθε φωνή που περιλαμβάνει και "τρώει" πολλά ΜΒ χώρου στο δίσκο, η όλη η εγκατάσταση του ESpeak δεν ξεπερνάει τα 950ΚΒ και υποστηρίζει πολλές φωνές και γλώσσες. Ανάμεσά τους και τα ελληνικά, ενώ υπάρχει μέχρι και πειραματική υποστήριξη για τα αρχαία ελληνικά!

Το Espeak μπορεί να χρησιμοποιηθεί από τη γραμμή εντολών, αλλά μπορείτε να το ενσωματώσετε και στις εφαρμογές σας. Το πρόγραμμα θα διαβάσει ό,τι κείμενο του δώσετε ως παράμετρο, ακόμα και ένα ολόκληρο αρχείο. Καταλαβαίνει HTML, όπως επίσης και τη γλώσσα SSML (Speech Synthesis Markup Language) που είναι πρόταση του W3C σε XML για τις εφαρμογές σύνθεσης φωνής. Προαιρετικά, το ESpeak μπορεί να διαβάσει το κείμενο που του δίνετε ως φωνήματα. 

Για να το δοκιμάστε στην πράξη, αρκεί να το εγκαταστήσετε από το Κέντρο Λογισμικού της διανομής σας (υπάρχει πακέτο στις περισσότερες διανομές).

Μετά κάντε το πρώτο τεστ:

espeak -v el "Γεια σου"

Φυσικά θα ακούσετε το PC να σας λέει "γειά σου" με αντρική φωνή.

Εναλλακτικά μπορείτε να γράψετε μόνο

espeak -v el

και το πρόγραμμα θα περιμένει από εσάς να του γράψετε εκείνη τη στιγμή τι να πει. Η' αν έχετε έτοιμο ένα text αρχείο (π.χ. keimeno.txt) του δίνετε:

espeak -v el < keimeno.txt

Αν θέλετε γυναικεία φωνή, τότε χρησιμοποιείτε τον διακόπτη +f4:

espeak -v el+f4 "γειά σας"

Το ωραίο με το Espeak είναι ότι σέβεται τον τονισμό των ελληνικών λέξεων, δηλαδή θα ακούσετε να προφέρει διαφορετικά το "πότε" από "ποτέ"! Το κακό με το Espeak είναι ότι δεν καταλαβαίνει τα "διαλυτικά" π.χ. τη λέξη "ταΐζω" δεν θα την πει αλλά θα την συλλαβίσει.

Εχει πλάκα πάντως να βάλεις το Espeak να σου απαγγείλει ελληνικούς στίχους, ποιήματα ή τραγούδια. Με την "μπαλάντα του κυρ Μέντιου" τα πήγε μια χαρά...

Δείτε και ένα βίντεο, με το espeak να απαγγέλει μέρος του άρθρου:

*Για όσους δε γνωρίζουν, οι πρώτες εκδόσεις του AmigaOS υποστήριζαν σύνθεση φωνής και ανάγνωση κειμένου με απλό drag 'n drop του αρχείου! Δεν ήταν βέβαια ο HAL 9000, αλλά ήταν αρκετά εντυπωσιακό αν σκεφτεί κανείς ότι έτρεχε σε ένα επεξεργαστή των 7MHz με λιγότερο από 512ΚΒ μνήμης.

Δώσε αστέρια!

MO: 4.3 (ψήφοι: 7)

Σχόλια

Μια μικρή διόρθωση για την ιστορία, επειδή τυγχάνω συλλέκτης και λάτρης των ρετρό υπολογιστών. Οι υπολογιστές που ανέφερες είναι 16bit και όχι 8bit. 8bit υπολογιστές, ήταν για παράδειγμα οι: Commodore 64/128/vic20/plus4, Acorn BBC 32/64/128/Master, ZX spectrum 48/128/+2/+3, Apple II/IIc/IIe, Dragon 32/64, Atari 400/800/XL/65XE, Ti99/4a. 16bit υπολογιστές ήταν οι: Amiga 500/600/1000/2000 Atari ST/STE, Sinclair QL, Apple IIGS, Macintosh 128/512/plus/SE/XL και δεν συμμαζεύεται. Πολύ γρήγορα, κυκλοφόρησαν και οι 32bit, που θα έλεγα ότι πρακτικά δεν ήταν 32bit αλλά 24bit!!! Τέτοιοι ήταν οι Acorn Archimedes A305/310/410/420/520/3000/3010/3020/4000/5000/7000/RISCPC, Amiga 1200/3000/4000, Atari TT/Falcon, Macintosh LC/LCII/LCIII/II/IIcx/IIx/IIfx. Ελπίζω να μην κούρασα. Μια μικρή αποκατάσταση θέλησα να κάνω.

bakoulis]

Μια μικρή διόρθωση για την ιστορία, επειδή τυγχάνω συλλέκτης και λάτρης των ρετρό υπολογιστών. Οι υπολογιστές που ανέφερες είναι 16bit και όχι 8bit. 8bit υπολογιστές, ήταν για παράδειγμα οι: Commodore 64/128/vic20/plus4, Acorn BBC 32/64/128/Master, ZX spectrum 48/128/+2/+3, Apple II/IIc/IIe, Dragon 32/64, Atari 400/800/XL/65XE, Ti99/4a. 16bit υπολογιστές ήταν οι: Amiga 500/600/1000/2000 Atari ST/STE, Sinclair QL, Apple IIGS, Macintosh 128/512/plus/SE/XL και δεν συμμαζεύεται. Πολύ γρήγορα, κυκλοφόρησαν και οι 32bit, που θα έλεγα ότι πρακτικά δεν ήταν 32bit αλλά 24bit!!! Τέτοιοι ήταν οι Acorn Archimedes A305/310/410/420/520/3000/3010/3020/4000/5000/7000/RISCPC, Amiga 1200/3000/4000, Atari TT/Falcon, Macintosh LC/LCII/LCIII/II/IIcx/IIx/IIfx. Ελπίζω να μην κούρασα. Μια μικρή αποκατάσταση θέλησα να κάνω.

Πολύ καλά έκανες και με διόρθωσες! Εχουν περάσει τόσα χρόνια από τότε που ξέχασα κι εγώ τι ήταν το κάθετί. Οντως 16μπιτη ήταν η Amiga 500, και ο Atari ST. 8μπιτος ήταν ο 6128 μου. Ομως με τη φράση "8μπιτοι υπολογιστές" ήθελα να αποδώσω όλο εκείνο το είδος των υπολογιστών. Νομίζω ότι αποδίδεται πιο σωστά ως "home computers", συμφωνούμε;

Μια χαρά μου δουλεύει το espeak, αυτό που δεν κατάφερα ποτέ μα ποτέ να κάνω να δουλέψει είναι το festival

dimitris]

Πολύ καλά έκανες και με διόρθωσες! Εχουν περάσει τόσα χρόνια από τότε που ξέχασα κι εγώ τι ήταν το κάθετί. Οντως 16μπιτη ήταν η Amiga 500, και ο Atari ST. 8μπιτος ήταν ο 6128 μου. Ομως με τη φράση "8μπιτοι υπολογιστές" ήθελα να αποδώσω όλο εκείνο το είδος των υπολογιστών. Νομίζω ότι αποδίδεται πιο σωστά ως "home computers", συμφωνούμε;

Φυσικά και συμφωνούμε και ας ξέχασα τον θρυλικό Amstrad 6128 που είχες και έχω και εγώ φυσικά!!! Η παρέμβαση μου άλλωστε δεν ήταν για να σε βγάλω λάθος, ήταν για να ρίξω λίγο φως στην μακρινή, αλλά πολυαγαπημένη μου εποχή των home micros. Και με την ευκαιρία, να δώσω και μερικές πληροφορίες σχετικές με το θέμα. Από όσο γνωρίζω, 8bit home micros με ειδικό chip φωνής ήταν μόνο ο Texas Instruments Ti99/4a και ο Acorn BBC micro. Το speech chip ήταν απαραίτητο για την αναπαραγωγή φωνής, καθώς οι 8bit CPUs ήταν πολύ αδύναμες για να αναπαράγουν φωνή από μόνες τους. Αυτό άλλαξε με τους "πανύσχηρους" 16bit επεξεργαστές, που με την "ωμή" δύναμη τους, μπορούσαν να αναπαράγουν ομιλία χωρίς speech chip (Amiga, AtariST, Mac). Ένα παράδειγμα 8bit speech που θα θυμούνται οι παλιότεροι, είναι η εκπαιδευτική εκπομπή των 80's "ΚΟΚΚΙΝΟΙ ΓΙΓΑΝΤΕΣ, ΑΣΠΡΟΙ ΝΑΝΟΙ". Εκεί μιλούσε ένας Ti99/4a με speech expansion. Από την άλλη, στην Αγγλική τηλόραση σε μια εκπαιδευτική σειρά του BBC, μιλούσε ένας Acorn BBC (που αρχικά ονομάζονταν PROTON και μετονομάστηκε σε BBC λόγο του ομόνυμου καναλιού) με την βοήθεια ενός speech chip στο εσωτερικό του, με την φωνή του διάσημου Άγγλού τηλεπαρουσιαστή Kenneth Kendall. Αξίζει να σημειωθεί, ότι και αυτό το chip (TMS5220) ήταν κατασκευασμένο από την Texas Instruments.

dimitris]

Το Espeak μπορεί να χρησιμοποιηθεί από τη γραμμή εντολών, αλλά μπορείτε να το ενσωματώσετε και στις εφαρμογές σας. Το πρόγραμμα θα διαβάσει ό,τι κείμενο του δώσετε ως παράμετρο, ακόμα και ένα ολόκληρο αρχείο. Καταλαβαίνει HTML, όπως επίσης και τη γλώσσα SSML (Speech Synthesis Markup Language) που είναι πρόταση του W3C σε XML για τις εφαρμογές σύνθεσης φωνής. Προαιρετικά, το ESpeak μπορεί να διαβάσει το κείμενο που του δίνετε ως φωνήματα. 

 

 

 

Πως μπορούμε να το βάλουμε στις εφαρμογές μας;

Τι ακριβώς εννοείς "να το βάλουμε στις εφαρμογές μας"; 

Για παράδειγμα, στις εφαρμογές του KDE μπορείς να το χρησιμοποιήσεις μέσω του Jovie, που υπάρχει στα αποθετήρια των περισσότερων διανομών.

BTW, έχει πλάκα ο διακόπτης +whisper:

espeak -v el+whisper "γειά σας"

Τα λέει ψιθυριστά χαχα :)

Εννοώ αν μπορώ να το βάλω στo vlc παράδειγμα για να μου διαβάζει το μενού

Χαζό παράδειγμα αλλά αυτό μου ήρθε.  cool

Ή εννοείς ότι μπορούμε να το βάλουμε σε αφαρμογές που έχουμε φτιάξει εμείς.
 

Πολυ ενδιαφερον. Η υποστηριξη ελληνικων λεξεων με εκανε να βαλω το espeak σε Arch και να παιξω  με διαφορα κειμενα. Ευχαριστω.

neos]

Ή εννοείς ότι μπορούμε να το βάλουμε σε αφαρμογές που έχουμε φτιάξει εμείς.

Βασικά, ακριβώς αυτό εννοούσα. :)

Για τις υπολοιπες υπάρχουσες εφαρμογές, είναι θέμα της καθεμίας αν υποστηρίζει accessibility λειτουργίες όπως η εκφώνηση κειμένου.

Καλά κατάλαβα.

Μου φάνηκε περίεργο να το βάζουμε σε υπάρχουσες εφαρμογές.

Α Π Ι Σ Τ Ε Υ Τ Ο !!! Όποιος το έχει φτιάξει, ειναι θεός. Και καταλαβαίνει και ελληνικα! Του βάζω να μου απαγγέλει ποιήματα, και τα πάει αρκετά καλά. Δεν το περίμενα...