C# Text-to-speech & Voice Recognition (videos)
Την Τετάρτη 17 Μαρτίου 2010 πραγματοποίησα παρουσίαση στο Οικονομικό Πανεπιστήμιο Αθηνών σχετικά με τη χρήση του Windows Speech API μέσα από managed περιβάλλον. Για τα demos χρησιμοποιήθηκε η γλώσσα C#, ενώ το γραφικό περιβάλλον έγινε σε WPF. Ευχαριστώ θερμά το Venus Forum (την online κοινότητα των φοιτητών Πληροφορικής του ΟΠΑ) για την υψηλή και ενθουσιώδη ανταπόκριση!
Η παρουσίαση ήταν χωρισμένη σε δύο μέρη: Speech Synthesis και Voice Recognition. Στο πρώτο μέρος είδαμε μετατροπή κειμένου σε ομιλία και στο δεύτερο ασχοληθήκαμε με μεθόδους αναγνώρισης φωνής. Σε αυτό το post θα βρείτε:
- Τα slides της παρουσίασης
- Όλα τα demos με αναλυτικό σχολιασμό
- Videos για να δημιουργήσετε τις δικές σας εφαρμογές
- Δείγματα κώδικα
Speech Synthesis (text-to-speech)
Στην ενότητα text-to-speech παρουσιάστηκαν τρόποι μετατροπής κειμένου σε ομιλία. Χρησιμοποιήθηκε PromptBuilder προκειμένου να εκμεταλλευτούμε τις δυνατότητες αλλαγής προφοράς, επιλογής spelling, καθώς επίσης και χρήσης δικών μας audio files:
Voice Recognition
Στην ενότητα αναγνώρισης φωνής δημιουργήσαμε ένα απλό WPF παιχνίδι: Ο χρήστης μιλάει στον υπολογιστή και, ανάλογα με τις εντολές που εκφωνεί, μετακινείται στην αντίστοιχη θέση η εικόνα του Ισοβίτη! Οι μέθοδοι για την κίνηση (MoveLeft, MoveRight, MoveTop, MoveDown) δημιουργούν το κατάλληλο WPF animation που δίνει την αίσθηση της κίνησης. Παρακάτω φαίνεται η δημιουργία της μηχανής αναγνώρισης φωνής με την προσθήκη του επιθυμητού εύρους λέξεων:
Η επιλογή της κατάλληλης κίνησης γίνεται στον event handler:
Για οποιοδήποτε σχόλιο, μπορείτε πάντοτε να επικοινωνείτε μαζί μου είτε στο pinelies[at]gmail[dot]com είτε αφήνοντας comment στο παρόν blog. Enjoy!

