Η Apple δηλώνει ότι εργάζεται για την επιδιόρθωση του εργαλείου μετατροπής ομιλίας σε κείμενο, έπειτα από αναφορές χρηστών στα μέσα κοινωνικής δικτύωσης, που διαπίστωσαν πως όταν πρόφεραν τη λέξη “racist” (“ρατσιστής”) στα iPhone τους, αυτή μετατρεπόταν σε “Trump”.
Βίντεο που κυκλοφόρησαν στο διαδίκτυο δείχνουν άτομα να προφέρουν τη λέξη “racist” στην εφαρμογή της Υπαγόρευσης. Σε ορισμένες περιπτώσεις η λέξη μεταγράφεται σωστά, ενώ σε άλλες εμφανίζεται ως “Trump” προτού διορθωθεί αυτόματα. Το BBC δεν κατάφερε να αναπαράγει το σφάλμα, γεγονός που υποδηλώνει ότι η επιδιόρθωση της Apple έχει ήδη αρχίσει να αποδίδει.
Η είδηση προκάλεσε ποικίλα σχόλια και αντιδράσεις, όπως και η εξήγηση που έδωσε ο αμερικανικός κολοσσός για το σφάλμα.
«Είμαστε ενήμεροι για ένα ζήτημα στο μοντέλο αναγνώρισης ομιλίας που τροφοδοτεί την Υπαγόρευση και κυκλοφορούμε σήμερα μια επιδιόρθωση», δήλωσε εκπρόσωπος της Apple και υποστήριξε πως το πρόβλημα στην υπηρεσία Υπαγόρευσης (Dictation) οφείλεται σε «δυσκολία διάκρισης λέξεων που περιέχουν το γράμμα “r”».
Γιατί δεν ευσταθεί η εξήγηση της Apple
Ειδικός στην αναγνώριση ομιλίας, που κλήθηκε να σχολιάσει την απάντηση της Apple, δήλωσε στο BBC ότι αυτή η εξήγηση είναι «απλώς αβάσιμη». Ο Πίτερ Μπελ, καθηγητής τεχνολογίας ομιλίας στο Πανεπιστήμιο του Εδιμβούργου, εκτίμησε ότι είναι πιο πιθανό κάποιος να έχει «παρέμβει» στο λογισμικό στο οποίο βασίζεται το εργαλείο.
Όπως επεσήμανε τα περί φωνητικής επικάλυψης δεν ευσταθούν, καθώς οι δύο λέξεις δεν έχουν καμία ομοιότητα μεταξύ τους, ώστε να μπερδέψουν ένα σύστημα τεχνητής νοημοσύνης (AI). Τα μοντέλα αναγνώρισης ομιλίας εκπαιδεύονται με ηχητικά αποσπάσματα πραγματικών ανθρώπων συνοδευόμενα από ακριβείς απομαγνητοφωνήσεις. Εκπαιδεύονται επίσης να κατανοούν τις λέξεις στο πλαίσιο τους — για παράδειγμα, μπορούν να διακρίνουν τη λέξη “cup” από τη λέξει “cut” όταν περιλαμβάνεται στη φράση “a cup of tea”.
Τα μοντέλα αναγνώρισης ομιλίας εκπαιδεύονται με ηχητικά αποσπάσματα πραγματικών ανθρώπων συνοδευόμενα από ακριβείς απομαγνητοφωνήσεις. Εκπαιδεύονται επίσης να κατανοούν τις λέξεις στο πλαίσιο τους — για παράδειγμα, μπορούν να διακρίνουν τη λέξη “cup” από τη “cut” όταν περιλαμβάνεται στη φράση “a cup of tea”.
Μοιάζει περισσότερο με φάρσα
Πρώην υπάλληλος της Apple, που εργαζόταν στον φωνητικό βοηθό Siri, δήλωσε στους New York Times πως «αυτό μοιάζει περισσότερο με φάρσα».
Η Apple αναγκάστηκε να αποσύρει άλλη μια λειτουργία που βασίζεται στην τεχνητή νοημοσύνη τον περασμένο μήνα, έπειτα από διαμαρτυρίες του BBC και άλλων ειδησεογραφικών οργανισμών. Είχε αναστείλει τις AI περιλήψεις ειδήσεων, αφού εμφάνιζαν ψευδείς ειδοποιήσεις σε άρθρα — μεταξύ αυτών και μία που ανέφερε λανθασμένα ότι ο τενίστας Ραφαέλ Ναδάλ είχε κάνει coming out ως ομοφυλόφιλος.
Η εταιρεία ανακοίνωσε χθες ότι θα επενδύσει 500 δισ. δολάρια (395 δισ. λίρες) στις ΗΠΑ τα επόμενα τέσσερα χρόνια, συμπεριλαμβανομένης της κατασκευής ενός μεγάλου κέντρου δεδομένων στο Τέξας για την υποστήριξη της Apple Intelligence.
Ο διευθύνων σύμβουλος της Apple, Τιμ Κουκ, δήλωσε επίσης ότι η εταιρεία ενδέχεται να χρειαστεί να αλλάξει τις πολιτικές της για τη διαφορετικότητα, την ισότητα και την ένταξη (DEI), καθώς ο πρώην πρόεδρος Ντόναλντ Τραμπ έχει ζητήσει τον τερματισμό τέτοιων προγραμμάτων.