background image

ματοποιώντας γλωσσολογική ανάλυση εις βάθος για την εξαγωγή αποτελέσματος

ομιλίας.

Στόχος αυτών των συστημάτων είναι η ποιότητα του αποτελέσματος να καλύ-

πτει την φυσικότητα του προφορικού λογού και η μηχανή να εκφωνεί οποιαδήποτε

σειρά λέξεων και φωνημάτων ζητηθεί χωρίς να αλλοιώνεται το νόημα της πρότασης

και η σημασία των λέξεων.

2.5.1

Τρόπος Λειτουργίας

Το γενικό μοντέλο ενός TTS συστήματος απαρτίζεται από το front-end και το

back-end τα οποία εκτελούν την γλωσσική ανάλυση του κειμένου και την επεξερ-

γασία του σήματος αντίστοιχα [49].

Πιο συγκεκριμένα, το front-end, αφού έχει εισέλθει το κείμενο στο σύστημα

εκτελεί τις πρώτες βασικές αναλύσεις της γλώσσας με σκοπό να απλοποιηθεί η

μετέπειτα φωνητική μετατροπή. Σε πρώτη φάση, το κείμενο της εισόδου γράφεται

αναλυτικά και ολογράφως συμπεριλαμβάνοντας αριθμούς και σημεία στίξης. Στην

συνέχεια κάθε γράμμα αντιστοιχίζεται σε ένα αρχείο ήχου που το αντιπροσωπεύει

για την παραγωγή της ηχητικής πληροφορίας.

Το back-end, γνωστό και ως συνθέτης, αναλαμβάνει την ακρόαση του κειμένου

αφού πρώτα έχει αναπαραστήσει με το εκάστοτε μοντέλο χρήσης της μηχανής τα

φωνήματα σε ήχους. Επιπλέον λειτουργία του back-end, είναι να αποδώσει στον

ήχο προσωδία, δηλαδή να αποφασίσει για τον τόνο της φωνής που θα ακουστεί το

ύφος και την διάρκεια των γραμμάτων.

Οι βασικές κατηγορίες των τεχνολογιών που επικρατούν για τους συνθέτες των

TTS συστημάτων διαφοροποιούνται στον τρόπο που επιλεγεί το σύστημα να θέσει

σε σειρά τα φωνήματα δημιουργώντας έτσι το αρχείο ήχου που θα εκφωνηθεί.

75