ΧΟΝΓΚ ΚΟΝΓΚ — Για να παραφράσουμε τον αείμνηστο John F. Kennedy, αποφασίσαμε να ορίσουμε την τεχνητή νοημοσύνη ανοιχτού κώδικα όχι επειδή είναι εύκολο, αλλά επειδή είναι δύσκολο. γιατί αυτός ο στόχος θα βοηθήσει να οργανώσουμε και να μετρήσουμε τα καλύτερα μέρη της ενέργειας και των δεξιοτήτων μας.
Ο Stefano Maffulli, εκτελεστικός διευθυντής του Open Source Initiative (OSI), μου είπε ότι το λογισμικό και τα δεδομένα που συνδυάζουν την τεχνητή νοημοσύνη (AI) με τις υπάρχουσες άδειες ανοιχτού κώδικα δεν ταιριάζουν καλά. «Έτσι», είπε ο Maffulli, «πρέπει να δημιουργήσουμε έναν νέο ορισμό για την τεχνητή νοημοσύνη ανοιχτού κώδικα».
Επίσης: Πώς ο ανοιχτός κώδικας βοηθά την τεχνητή νοημοσύνη να προχωρήσει
Ο μητρικός οργανισμός του Firefox, το Mozilla Foundation, συμφωνεί.
Ένας εκπρόσωπος της Mozilla εξήγησε ότι οι μεγάλοι τεχνολογικοί γίγαντες «δεν έχουν δεσμευτεί απαραίτητα σε όλες τις αρχές ανοιχτού κώδικα όσον αφορά τα μοντέλα τεχνητής νοημοσύνης τους». Επιπλέον, ο νέος ορισμός θα «βοηθήσει τους νομοθέτες που εργάζονται για την ανάπτυξη κανόνων και κανονισμών για την προστασία των καταναλωτών από κινδύνους τεχνητής νοημοσύνης».
Το OSI εργάζεται σκληρά για να δημιουργήσει έναν ολοκληρωμένο ορισμό για AI ανοιχτού κώδικα, παρόμοιο με τον ορισμό ανοιχτού κώδικα για λογισμικό. Αυτή η σημαντική εργασία αντιμετωπίζει την αυξανόμενη ανάγκη για σαφήνεια στον ορισμό του συστήματος τεχνητής νοημοσύνης ανοιχτού κώδικα, σε μια εποχή που πολλές εταιρείες ισχυρίζονται ότι τα μοντέλα τεχνητής νοημοσύνης τους είναι ανοιχτού κώδικα χωρίς να είναι στην πραγματικότητα ανοιχτού κώδικα, για παράδειγμα, το Llama 3.1 από τη Meta.
Το τελευταίο προσχέδιο του ορισμού τεχνητής νοημοσύνης ανοιχτού κώδικα OSI, 0.0.9, έχει αρκετές σημαντικές αλλαγές. Εδώ είναι:
- Διευκρινισμένοι ορισμοί: Ο ορισμός ορίζει πλέον σαφώς μοντέλα και βάρη/παραμέτρους ως μέρος ενός «συστήματος» AI, τονίζοντας ότι όλα τα στοιχεία πρέπει να συμμορφώνονται με ένα πρότυπο ανοιχτού κώδικα. Αυτή η σαφήνεια διασφαλίζει ότι ολόκληρο το σύστημα τεχνητής νοημοσύνης, όχι μόνο μέρη του, συμμορφώνεται με τις αρχές ανοιχτού κώδικα.
- Ρόλος των δεδομένων εκπαίδευσης: Τα δεδομένα εκπαίδευσης είναι χρήσιμα αλλά όχι απαραίτητα για την τροποποίηση συστημάτων τεχνητής νοημοσύνης. Αυτή η απόφαση αντικατοπτρίζει την πολυπλοκότητα της κοινής χρήσης δεδομένων, συμπεριλαμβανομένων νομικών ζητημάτων και ζητημάτων απορρήτου. Το έργο ταξινομεί τα δεδομένα εκπαίδευσης σε ανοιχτά, δημόσια και μη δημόσια δεδομένα που δεν μπορούν να διαχωριστούν και το καθένα έχει συγκεκριμένες συστάσεις για τη βελτίωση της διαφάνειας και την κατανόηση της προκατάληψης στα συστήματα τεχνητής νοημοσύνης.
- Διαίρεση λίστας ελέγχου: Η λίστα ελέγχου αξιολόγησης άδειας έχει διαχωριστεί από το κύριο έγγραφο ορισμού, σύμφωνα με το Μοντέλο Ανοικτό Πλαίσιο (MOF). Αυτή η διαίρεση επιτρέπει μια εστιασμένη συζήτηση σχετικά με την αναγνώριση της τεχνητής νοημοσύνης ανοιχτού κώδικα, διατηρώντας παράλληλα τις γενικές αρχές του ορισμού.
Όπως εξήγησε ο εκτελεστικός διευθυντής του Ιδρύματος Linux Jim Zemlin στο Open Source Summit στην Κίνα, το MOF «είναι ένας τρόπος να βοηθήσει να αξιολογηθεί εάν ένα μοντέλο είναι ανοιχτό ή όχι. Επιτρέπει στους ανθρώπους να αξιολογούν μοντέλα».
Ο Zemlin πρόσθεσε ότι το MOF έχει τρία επίπεδα διαφάνειας. «Το υψηλότερο επίπεδο, το πρώτο επίπεδο, είναι ο ορισμός της ανοιχτής επιστήμης, όπου τα δεδομένα, κάθε συστατικό που χρησιμοποιείται και όλες οι οδηγίες πρέπει να πάνε στην πραγματικότητα και να δημιουργήσουν το δικό σας μοντέλο με τον ίδιο ακριβώς τρόπο. Το επίπεδο δύο είναι το υποσύνολο όπου στην πραγματικότητα δεν είναι όλα ανοιχτά, αλλά το μεγαλύτερο μέρος είναι ανοιχτό. Στη συνέχεια, στο επίπεδο τρία, έχετε περιοχές όπου τα δεδομένα μπορεί να μην είναι διαθέσιμα, αλλά δεδομένα που περιγράφουν τα σύνολα δεδομένων θα είναι διαθέσιμα. Και μπορείτε να συνειδητοποιήσετε ότι –ακόμα κι αν το μοντέλο είναι ανοιχτό– δεν είναι διαθέσιμα όλα τα δεδομένα».
Επίσης: Αυτό το μοντέλο AI σάς επιτρέπει να δημιουργείτε βίντεο χρησιμοποιώντας μόνο τις φωτογραφίες σας.
Αυτά τα τρία επίπεδα, μια έννοια που εμφανίζεται επίσης στα δεδομένα εκπαίδευσης, θα είναι δύσκολο να τα αποδεχτούν ορισμένοι υποστηρικτές ανοιχτού κώδικα. Η διαμάχη τόσο για τα μοντέλα όσο και για τα δεδομένα εκπαίδευσης θα συνεχίσει να δημιουργείται καθώς συνεχίζεται η συζήτηση σχετικά με το ποια συστήματα AI και μηχανικής μάθησης (ML) είναι πραγματικά ανοιχτά και ποια όχι.
Η δημιουργία του ορισμού τεχνητής νοημοσύνης ανοιχτού κώδικα έγινε σε συνεργασία με διάφορους ενδιαφερόμενους σε όλο τον κόσμο. Αυτά περιλαμβάνουν, ενδεικτικά, τον κώδικα για την Αμερική, το Ίδρυμα Wikimedia, το Creative Commons, το Linux Foundation, τη Microsoft, το Google, το Amazon, το Meta, το Hugging Face, το Ίδρυμα λογισμικού Apache και τη Διεθνή Ένωση Τηλεπικοινωνιών του ΟΗΕ.
Το OSI έχει πραγματοποιήσει πολλές συναντήσεις και εργαστήρια στην πόλη για να συγκεντρώσει πληροφορίες, διασφαλίζοντας ότι ο ορισμός είναι περιεκτικός και αντιπροσωπεύει μια ποικιλία απόψεων. Η διαδικασία είναι ακόμη σε εξέλιξη.
Επίσης: Το Sonos αποτυγχάνει και εκατομμύρια συσκευές θα μπορούσαν να καταρρεύσουν μαζί του—γιατί ο ήχος ανοιχτού κώδικα είναι η μόνη μας ελπίδα
Ο ορισμός θα συνεχίσει να βελτιώνεται και να τελειοποιείται μέσω των roadshow σε όλο τον κόσμο, καθώς και με τη συγκέντρωση σχολίων και έγκρισης από διάφορες κοινότητες.
Ο Maffulli του OSI γνωρίζει ότι δεν θα είναι όλοι ευχαριστημένοι με αυτό το προσχέδιο ορισμού. Πράγματι, πριν από αυτήν την κυκλοφορία, ο επικεφαλής τεχνικός στρατηγικής του AWS Open Source Tom Callaway έγραψε στο LinkedIn: «Είναι ακράδαντα πεποίθησή μου (και πολλών, πολλών άλλων στον χώρο ανοιχτού κώδικα) ότι ο τρέχων ορισμός ανοιχτού κώδικα της AI δεν ισχύει παρέχουν μια σαφή εγγύηση ότι τα συστήματα τεχνητής νοημοσύνης θα διατηρήσουν απεριόριστα δικαιώματα χρήστη για εκτέλεση, αντιγραφή, διανομή, μελέτη, τροποποίηση και βελτίωση τους.»
Τώρα που το έργο είδε το φως της δημοσιότητας, είμαι σίγουρος ότι και άλλοι θα εκφράσουν τις απόψεις τους. Η OSI ελπίζει να παρουσιάσει μια σταθερή έκδοση του ορισμού στη διάσκεψη All Things Open τον Οκτώβριο του 2024. Αν όλα πάνε καλά, το αποτέλεσμα θα είναι ένας ορισμός που οι περισσότεροι —αν όχι όλοι— συμφωνούν να προωθήσουν τη διαφάνεια, τη συνεργασία και την καινοτομία σε συστήματα τεχνητής νοημοσύνης ανοιχτού κώδικα.