Η κινεζική εταιρεία ηλεκτρονικού εμπορίου Alibaba παρουσίασε την Τετάρτη μια νέα εκδοχή του μοντέλου της τεχνητής νοημοσύνης, το οποίο, όπως υποστήριξε, υπερτερεί του μοντέλου AI της DeepSeek σε διάφορα σημεία.
Συγκεκριμένα, η μονάδα cloud της Alibaba παρουσίασε τη νέα εκδοχή του μοντέλου τεχνητής νοημοσύνης της Qwen, Qwen2.5 Max.
Η εταιρεία δήλωσε ότι το Quen2.5 Max «επιτυγχάνει ανταγωνιστικές επιδόσεις έναντι των κορυφαίων μοντέλων» του είδους,παραπέμποντας σε εκείνα των OpenAI, DeepSeek και Meta, βάσει δοκιμών αναφοράς που πραγματοποίησε. «Το Qwen 2.5-Max ξεπερνάει … σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», υποστηρίζει η μονάδα cloud της Alibaba, αναφερόμενη στα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης ανοικτού κώδικα.
Η ανακοίνωση της Alibaba ήρθε λίγες μέρες αφότου η κινεζική startup τεχνητής νοημοσύνης DeepSeek πυροδότησε φρενίτιδα στις αγορές με την κυκλοφορία του τελευταίου της μοντέλου τεχνητής νοημοσύνης.
Η παρουσίαση στις 10 Ιανουαρίου του βοηθού τεχνητής νοημοσύνης της DeepSeek, με βάση το μοντέλο DeepSeek-V3, καθώς και η παρουσίαση στις 20 Ιανουαρίου του μοντέλου της R1, προκάλεσε σοκ στην Σίλικον Βάλεϊ και έριξε τις μετοχές των τεχνολογικών εταιρειών, καθώς τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τεράστιες δαπάνες από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης στις ΗΠΑ.
Ως απάντηση στα επιτεύγματα του DeepSeek, οι ανταγωνιστές αναβαθμίζουν τα μοντέλα τεχνητής νοημοσύνης τους. Δύο ημέρες μετά την κυκλοφορία του DeepSeek-R1, η ByteDance ανακοίνωσε μια επικαιροποίηση του δικού της βασικού μοντέλου τεχνητής νοημοσύνης, για το οποίο ισχυρίστηκε πως έχει καλύτερες επιδόσεις από το υποστηριζόμενο από τη Microsoft o1 της OpenAI στο AIME, ένα τεστ που μετράει πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν περίπλοκες οδηγίες και ανταποκρίνονται σ’ αυτές.
Αυτό απηχεί τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 υπερτερεί σε αρκετά κριτήρια απόδοσης του o1 της OpenAI.
Η επιτυχία της DeepSeek φαίνεται ότι έκανε και τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης. Αυτό υποδεικνύει ο ασυνήθιστος χρόνος της κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι έχουν αργία και βρίσκονται με τις οικογένειές τους.
Διαβάστε ακόμα:
→ Η Κίνα και η «φούσκα» της αμερικανικής «τεχνητής νοημοσύνης»