Σε μια εποχή όπου η τεχνητή νοημοσύνη εξελίσσεται με καταιγιστικούς ρυθμούς, η φωνητική τεχνολογία παραμένει ένα από τα πιο απαιτητικά και κρίσιμα πεδία εφαρμογής. Κι ενώ τα διεθνή μοντέλα δείχνουν να κυριαρχούν, συχνά αδυνατούν να ανταποκριθούν στις πραγματικές ανάγκες μικρών γλωσσικών κοινοτήτων, όπως η ελληνική και —ακόμη περισσότερο— η κυπριακή διάλεκτος. Σε αυτό ακριβώς το κενό έρχεται να δώσει λύση η Aseto AI, μια κυπριακή εταιρεία που μέσα από στοχευμένη έρευνα, προσαρμοσμένα datasets και τεχνολογική επιμονή κατάφερε να προσφέρει ακρίβεια μεταγραφής ομιλίας που ξεπερνά το 95%, εκεί όπου τα διεθνή συστήματα συχνά αποτυγχάνουν.
Ο Γιώργος Κουμανταρής, Διευθύνων Σύμβουλος και Ιδρυτής της Aseto AI και συνιδρυτής της HFM, μιλά αποκλειστικά στο SigmaLive για την τεχνολογία φωνής που αναπτύσσει η εταιρεία και η οποία καταφέρνει να αναγνωρίζει με ακρίβεια την ελληνική και την κυπριακή διάλεκτο εκεί όπου τα διεθνή συστήματα αποτυγχάνουν. Περιγράφει πώς μια αρχική απογοήτευση εξελίχθηκε σε καινοτομία, αναλύει τις τεχνικές προκλήσεις και εξηγεί πώς η φωνητική τεχνητή νοημοσύνη μπορεί να μεταμορφώσει την εξυπηρέτηση πολιτών και επιχειρήσεων σε Κύπρο και Ελλάδα.
- Πώς προέκυψε η ιδέα για την ανάπτυξη τεχνολογίας αναγνώρισης ομιλίας ειδικά για την ελληνική και την κυπριακή διάλεκτο;
Η ιδέα ουσιαστικά ξεκίνησε από μια απογοήτευση, αφού στην προσπάθεια μας να εφαρμόσουμε στην κοινή ελληνική αλλά και στην κυπριακή διάλεκτο τα επιτυχημένα αγγλικά σενάρια των τεχνολογιών φωνής που είχαμε αναπτύξει διαπιστώσαμε ότι υπήρχαν βασικές και ουσιαστικές ελλείψεις. Για παράδειγμα, τα υπάρχοντα μοντέλα αποτύγχαναν σε βασικά σημεία, όπως αριθμούς, διευθύνσεις και τοπικές προφορές. Εύκολα αντιλαμβάνεται κανείς τις ιδιαιτερότητες της κυπριακής διαλέκτου όπου για παράδειγμα το «κοσίθκιο» αντί «είκοσι δύο», μπέρδευε πλήρως τα διεθνή μοντέλα. Χωρίς αξιόπιστη αναγνώριση ομιλίας, τα workflows δεν μπορούν να λειτουργήσουν σωστά. Ισχύει απόλυτα το “junk in, junk out”. Αν η μεταγραφή δεν είναι σωστή, δεν μπορεί να ληφθεί σωστή απόφαση ούτε να εκτελεστεί σωστή ενέργεια, ούτε καν για βασικές λειτουργίες. Άρα ουσιαστικά από αυτή μας την απογοήτευση οδηγηθήκαμε να αναζητούμε και στο τέλος να αναπτύξουμε με επιτυχία το δικό μας fine-tuning ανοιχτού κώδικα μοντέλων, ώστε να κατανοούν φυσικά τόσο την ελληνική γλώσσα, όπως αυτή εκφράζεται στην Κοινή Νεοελληνική, όσο και τις γλωσσικές της ποικιλίες, όπως η κυπριακή διάλεκτος
- Ποιο ήταν το μεγαλύτερο τεχνικό εμπόδιο που χρειάστηκε να ξεπεραστεί για να επιτευχθεί η σημερινή ακρίβεια στη μετατροπή ομιλίας σε κείμενο;
Η μεγαλύτερη πρόκληση ήταν η δημιουργία του κατάλληλου dataset. Δεν αρκεί η συλλογή φωνών· χρειάζεται εντοπισμός των αδυναμιών, όπως αριθμοί, εκφράσεις και προφορές, και παραγωγή δεδομένων που διορθώνουν συγκεκριμένα αυτά τα κενά. Παράλληλα, έπρεπε να βρούμε την ισορροπία στο fine-tuning, ώστε το μοντέλο να βελτιωθεί στην κοινή ελληνική αλλά και στην κυπριακή διάλεκτο, χωρίς να χάσει την απόδοσή του σε άλλες γλώσσες. Με πολλές δοκιμές καταφέραμε να αυξήσουμε σημαντικά την ακρίβεια, χωρίς να επηρεαστεί η συνολική ποιότητα.
- Τι διαφοροποιεί τη λύση της Aseto AI από τα διεθνή συστήματα αναγνώρισης ομιλίας που χρησιμοποιούνται ευρέως;
Η απάντηση σε αυτό είναι απλή, αλλά ταυτόχρονα και ουσιαστική. Η Aseto AI, ξεκινώντας να εφαρμόζει όσα χρησιμοποιούνται διεθνώς, εντόπισε κενά και δυσκολίες στην πράξη. Έτσι οδηγήθηκε στο να προσφέρει μια λύση που δεν είναι γενική ή «έτοιμη», αλλά πλήρως προσαρμοσμένη στις ανάγκες των πελατών. Και γιατί συμβαίνει αυτό; Διότι βασιζόμαστε σε εξειδικευμένα δεδομένα, τα οποία με τη σειρά τους στηρίζονται στην τοπική γνώση και τις ιδιαιτερότητες της κάθε χώρας. Θα δώσω το παράδειγμα της Κύπρου, όπου ο τρόπος ομιλίας διαφοροποιείται σημαντικά λόγω της κυπριακής διαλέκτου. Δεν θα ήταν υπερβολή να πει κανείς ότι κανένα διεθνές σύστημα αναγνώρισης ομιλίας που χρησιμοποιείται σήμερα δεν μπορεί να αναγνωρίσει με ακρίβεια την κυπριακή διάλεκτο. Και αυτό διότι, πέρα από το ότι οι διεθνείς πάροχοι δεν επενδύουν αρκετά στα ελληνικά, παρουσιάζουν ακόμη μεγαλύτερα κενά στην κυπριακή διάλεκτο. Έτσι δυσκολεύονται με αριθμούς, διευθύνσεις, εκφράσεις και ειδική ορολογία.
Η Aseto AI, με στοχευμένο fine-tuning, επιτυγχάνει ακρίβεια άνω του 95%, όταν τα διεθνή μοντέλα συχνά πέφτουν κάτω από 80% σε πραγματικές συνθήκες.
- Με ποιον τρόπο προσαρμόζεται η τεχνολογία της εταιρείας στις ιδιαιτερότητες της κυπριακής διαλέκτου αλλά και της κοινής ελληνικής;
Τα μοντέλα εκπαιδεύονται με πραγματικά τοπικά δεδομένα, ώστε να αναγνωρίζουν φυσικά κυπριακές προφορές (π.χ. εικόσι θκιο ‘είκοσι δύο’ ή Πέφτη ‘Πέμπτη’), εκφράσεις και καθημερινά γλωσσικά μοτίβα. Έχουμε ενσωματώσει επίσης πλήρη βάση κυπριακών διευθύνσεων και τοπωνυμίων, ώστε το σύστημα να κατανοεί τα αιτήματα ακριβώς όπως εκφέρονται.
- Υπάρχουν ήδη παραδείγματα εφαρμογής της νέας τεχνολογίας σε επιχειρήσεις ή οργανισμούς, και ποια είναι τα μέχρι τώρα αποτελέσματα;
Ναι. Η πιο πρόσφατη υλοποίηση διαχειρίζεται περίπου 120 κλήσεις την ημέρα, αυτοματοποιώντας διαδικασίες που μέχρι τώρα απαιτούσαν προσωπικό. Τα πρώτα αποτελέσματα δείχνουν μείωση κόστους, ταχύτερη εξυπηρέτηση και μικρότερο φόρτο στο τμήμα εξυπηρέτησης πελατών.
- Πώς μπορεί αυτή η καινοτομία να συμβάλει στην ενίσχυση της παραγωγικότητας και στη βελτίωση της εμπειρίας πελατών σε τοπικό επίπεδο;
Η λύση μας εξαλείφει τις αναπάντητες κλήσεις και απαντά σε όλες τις συχνές ερωτήσεις. Μέσω σύνδεσης με CRM/ERP μπορεί να δίνει πληροφορίες σε πραγματικό χρόνο ή να καταχωρεί αιτήματα. Έτσι, απελευθερώνει χρόνο από τις ομάδες υποστήριξης και βελτιώνει σημαντικά την εμπειρία του πελάτη. Για να σας το κάνω πιο κατανοητό με ένα παράδειγμα, και μάλιστα ένα καθημερινό πρόβλημα για τον μέσο Κύπριο πολίτη, φανταστείτε μια δημόσια υπηρεσία να εφαρμόζει τεχνολογίες φωνής όπως αυτή που προτείνει η Aseto AI. Η σχέση των πολιτών με το κράτος θα ήταν άμεση και πολύ πιο αποτελεσματική.
- Σε ποιον βαθμό η ακριβής αναγνώριση ελληνικής και κυπριακής ομιλίας μπορεί να επιταχύνει τον ψηφιακό μετασχηματισμό της Κύπρου και της Ελλάδας;
Η ακρίβεια στη μεταγραφή είναι θεμελιώδης. Εάν τα δεδομένα που παράγει ένα voice σύστημα είναι λανθασμένα, καμία αυτοματοποίηση δεν μπορεί να λειτουργήσει σωστά. Με αξιόπιστη αναγνώριση, οι οργανισμοί μπορούν να αυτοματοποιήσουν κρίσιμες λειτουργίες και να δημιουργήσουν νέες ψηφιακές υπηρεσίες με σιγουριά.
- Ποιο είναι το επόμενο βήμα για την Aseto AI μετά από αυτή την τεχνολογική πρόοδο; Υπάρχουν σχέδια επέκτασης σε άλλες γλώσσες ή αγορές;
Εστιάζουμε στην περαιτέρω ωρίμανση των ελληνικών λύσεων και στην ανάπτυξη ενός νέου, υψηλής ποιότητας ελληνικού TTS, πριν επεκταθούμε σε άλλες γλώσσες και αγορές.
- Πώς μπορεί η τεχνολογία φωνής να αλλάξει τον τρόπο με τον οποίο λειτουργούν οι επιχειρήσεις και οι δημόσιοι οργανισμοί στην περιοχή;
Η φωνή είναι ο φυσικότερος τρόπος επικοινωνίας. Ένας φωνητικός πράκτορας μπορεί να απαντά κλήσεις, να ενημερώνει, να καταγράφει αιτήματα και να προσφέρει συνεπή εξυπηρέτηση. Έτσι, οργανισμοί που παραδοσιακά «δεν απαντούν» μπορούν πλέον να παρέχουν άμεση και επαγγελματική ανταπόκριση.
- Ποιες είναι οι προϋποθέσεις ώστε η Κύπρος και η Ελλάδα να βρεθούν στην πρωτοπορία της τεχνητής νοημοσύνης και να μην περιορίζονται σε ρόλο απλών χρηστών
Ενίσχυση της τοπικής τεχνολογίας, εμπιστοσύνη σε εγχώριους παρόχους, θεσμική στήριξη και συστηματική εκπαίδευση. Μόνο έτσι η περιοχή θα παράγει, και δεν θα καταναλώνει μόνο, τεχνολογία AI.
- Ποιο είναι το μήνυμα που θα θέλατε να στείλετε στους νέους επιστήμονες και επιχειρηματίες που θέλουν να ασχοληθούν με την τεχνητή νοημοσύνη και την καινοτομία στην περιοχή μας;
Τώρα είναι η κατάλληλη στιγμή για να δημιουργήσουν και να καινοτομήσουν. Η τεχνητή νοημοσύνη αποτελεί τεράστια ευκαιρία και το μέλλον θα διαμορφωθεί από αυτούς που επιλέγουν να γίνουν δημιουργοί και όχι απλοί παρατηρητές.
Sigma Live
Aseto AI : Aναγνώριση ομιλίας για την ελληνική γλώσσα & την κυπριακή διάλεκτο!
Published November 21, 2025
Η Aseto AI, μια κυπριακή εταιρεία, έχει αναπτύξει τεχνολογία αναγνώρισης ομιλίας με εξαιρετική ακρίβεια (άνω του 95%) για την ελληνική και την κυπριακή διάλεκτο. Η εταιρεία αντιμετώπισε τις προκλήσεις που παρουσιάζουν τα διεθνή μοντέλα στην αναγνώριση των ιδιαιτεροτήτων της ελληνικής γλώσσας και της κυπριακής διαλέκτου, δημιουργώντας ένα προσαρμοσμένο dataset και αξιοποιώντας τεχνητή νοημοσύνη και υπολογιστική προσομοίωση. Η τεχνολογία αυτή έχει τη δυνατότητα να μεταμορφώσει την εξυπηρέτηση πολιτών και επιχειρήσεων στην Κύπρο και την Ελλάδα, προσφέροντας ανοικτά εργαλεία και τεχνογνωσία στη βιομηχανία.
You Might Also Like
Sigma Live
Η ιστορία της κυπριακής Ναυτιλίας: Από το παρελθόν στο μέλλον
Nov 17
Sigma Live
Νέοι σε έναν κόσμο που αλλάζει: Προκλήσεις και επικινδυνότητα του σήμερα
Nov 21