pesto TTS + Raspberry Pi = pesto Pi

pesto Pi: Ένα σύστημα σύνθεσης Ελληνικής ομιλίας για τον Raspberry Pi, τον υπολογιστή μεγέθους πιστωτικής κάρτας !

Το pesto Pi είναι ένα σύστημα μετατροπής κειμένου σε ομιλία για την Ελληνική γλώσσα που τρέχει στον υπολογιστή των 25 δολλαρίων Raspberry Pi 700 MHz με επεξεργαστή ARM. Βασίζεται στο pesto TTS και η τρέχουσα έκδοση περιλαμβάνει τη Ελληνική φωνή χαμηλού ίχνους "Σίμος_1081".

Επιδόσεις

Το pesto Pi τρέχει άνετα στο Raspberry, επιτυγχάνοντας απόδοση καλύτερη από 60 x Realtime (Πραγματικός Χρόνος *) σε ένα πρώτυπο βασισμένο στο Model B. Οι απαιτήσεις μνήμης κυμαίνονται ανάλογα με τη συμπίεση και τη βάση των φωνημάτων που χρησιμοποιείται (η φωνή "Σίμος_1018" καταλαμβάνει 4.3MB και μπορεί να συμπιεστεί περισσότερο αν απαιτείται) αρχίζοντας από μόλις 1MB μνήμης στην κάρτα SD, ενώ χρησιμοποιεί περίπου 100KB μνήμης RAM κατά την εκτέλεση.

(*) "60 x Realtime" σημαίνει ότι το TTS χρειάζεται χρόνο ίσο με το 1/60 της διάρκειας της παραγόμενης ομιλίας για να τη συνθέσει. Δηλαδή, για να συνθέσει μία φράση διάρκειας 10 δευτερολέπτων, ο χρόνος επεξεργασίας είναι 167 χιλιοστά του δευτερολέπτου. Αρκετά γρήγορα για ένα επεξεργαστή 700MHz, δεν είναι;

Συμβατότητα

Το pesto Pi μπορεί να τρέξει και στα δύο μοντέλα Model A και B του Raspberry Pi.

Προγραμματισμός

Το pesto Pi περιέχει βιβλιοθήκες σε C και Python για να το ενσωματώσετε στα έργα σας.

 

Φωνή

Η φωνή "Σίμος_1081" βασίζεται σε ηχογραφημένα δίφωνα ομιλίας. Η προσωδία έχει μοντελοποιηθεί χρησιμοποιώντας τεχνικές μηχανικής μάθησης σε φυσική ομιλία. Η χαμηλού-ίχνους (small-footprint) φύση αυτής της φωνής παράγει μία μηχανική χροιά, η οποία ταιριάζει σε εφαρμογές παιχνιδιών, ρομπότ, ειδοποιήσεων κλπ.

Γλώσσες

Η φωνή "Σίμος_1081" υποστηρίζει την Ελληνική γλώσσα και μπορεί επίσης να μιλήσει και Αγγλικά με Ελληνική προφορά.

Χαρακτηριστικά επεξεργαστή Ελληνικών:

  • Μετατροπέας γραμμάτων σε φωνήματα για τα Ελληνικά: μπορεί να εκφωνήσει σωστά οποιαδήποτε Ελληνική λέξη, ακόμα και ανορθόγραφη ή περίεργους συνδυασμούς γραμμάτων χωρίς νόημα (μοναδικό χαρακτηριστικό), χωρίς περιορισμούς λεξικού.
  • Light έκδοση του PhonAesthesia Language Suite context-based text normalizer για αριθμητικές μορφές (αριθμοί, αριθμοί τηλεφώνων, διευθύνσεις, ημερομηνίες, ώρα κλπ), συντμήσεις και ακρωνύμια.

Χαρακτηριστικά επεξεργαστή Αγγλικών:

  • Μετατροπέας γραμμάτων σε φωνήματα για τα Αγγλικά: οποιαδήποτε λέξη δύναται φωνολογικά να εκφωνηθεί, διαβάζεται ως έχει, αλλιώς προφέρεται γράμμα-γράμμα (χαρακτηριστικό δανεισμένο από το flite). Σε κάθε περίπτωση χρησιμοποιούνται Ελληνικά φωνήματα.
  • Τα αριθμητικά διαβάζονται πάντα στα Ελληνικά.

 

Διαθεσιμότητα

Το pesto Pi είναι προς το παρόν διαθέσιμο κατόπιν αίτησης. Μπορείτε να επικοινωνήσετε με την e-rhetor για να μάθετε περισσότερα.

Ζητήστε πληροφορίες για το pesto Pi

raspberry pi