Γυναίκα ακούει εντυπωσιασμένη με ακουστικά από έναν υπολογιστή

Φυσικό; Εκφραστικό; Τέλειο!

Το domainTTS είναι μία γλωσσική υπηρεσία προστιθέμενης αξίας της e-rhetor που παρέχει μία ολοκληρωμένη λύση για την αυτόματη μετατροπή κειμένων σε άρτιας ποιότητας ομιλία για εφαρμογές με σαφώς ορισμένο το λεκτικό και συντακτικό τους πεδίο. Το domainTTS βασίζεται στο σύστημα μετατροπής κειμένου σε ομιλία pesto TTS και προσθέτει προσαρμοσμένες φυσικές και εκφραστικές φωνές domain voices που αναπτύσσονται κατά παραγγελία. Ενδεικτικά παραδείγματα περιλαμβάνουν:

  • Εξυπηρέτηση πελατών (π.χ. υπόλοιπο λογαριασμού, ενέργειες, …)
  • Δελτία καιρού
  • Αποτελέσματα αγώνων
  • Αφίξεις/Αναχωρήσεις δρομολογίων
  • Αναζήτηση βενζινάδικων/φαρμακείων/ ή άλλων επιχειρήσεων
  • Αναγγελίες
  • Ειδοποιήσεις

Σύγκριση με άλλα TTS

Ένας κοινό σύστημα TTS σπανίως επιτυγχάνει τα επιθυμητά εκφραστικά χαρακτηριστικά. Ακολουθεί ένας συγκριτικός πίνακας του domainTTS με άλλες εμπορικές λύσεις σύνθεσης ομιλίας τύπου "φυσικής φωνής".

ΧαρακτηριστικόΆλλα TTSdomainTTS
Εκφραστικότητα Όχι Ναι
Ερωτήσεις Όχι Ναι
Μοναδική/αποκλειστική φωνή Όχι Ναι
Ποιότητα ήχου Πολύ καλή Άριστη
Απεριόριστο λεξικό Ναι Όχι
Χρόνος κατασκευής 0 από λίγες ώρες
Αν πρόκειται για υπάρχουσα φωνή

Σύγκριση με συρραφή ηχογραφήσεων

Η τυπική και οικονομική εναλλακτική του domainTTS είναι η σύνθεση μικρών προ-ηχογραφημένων φράσεων, τεχνική που χρησιμοποιείται ευρέως, ιδίως σε εφαρμογές IVR. Όμως, το γνωστό φαινόμενο της «σπαστής» ομιλίας στα αυτόματα τηλεφωνικά κέντρα, καθιστά ενοχλητική για τον χρήστη την επικοινωνία του με το κέντρο. Τα συγκριτικά πλεονεκτήματα του domainTTS είναι:

  • η απουσία παύσεων και συγκολλήσεων ανάμεσα στις συρραφές
  • η διατήρηση της φυσικότητας της προσωδίας
  • η ποιότητα της συρραφής των κυματομορφών
  • η ευελιξία που παρέχει το domainTTS στη σύνθεση νέων εκφωνημάτων

Παράδειγμα: εφαρμογή εκφώνησης της ώρας σε υπηρεσία IVR

Η ώρα είναι 8 και 25.

Πρότυπο φράσεων: Η ώρα είναι [1-2]?[0-9] (και [0-9][0-9]?)?