“Δεν μπορώ να εκπαιδεύσω τα κορυφαία μοντέλα τεχνητής νοημοσύνης του σήμερα χωρίς τη χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα” • The Register

By | January 8, 2024

Η OpenAI είπε ότι θα ήταν «αδύνατο» να δημιουργηθούν κορυφαία νευρωνικά δίκτυα που να καλύπτουν τις τρέχουσες ανάγκες χωρίς τη χρήση έργων που προστατεύονται από πνευματικά δικαιώματα. Το εργαστήριο που υποστηρίζεται από τη Microsoft, το οποίο πιστεύει ότι συλλέγει νόμιμα αυτό το περιεχόμενο για να εκπαιδεύσει τα μοντέλα του, είπε ότι η χρήση υλικού δημόσιου τομέα που δεν προστατεύεται από πνευματικά δικαιώματα θα οδηγήσει σε υποτυπώδες λογισμικό τεχνητής νοημοσύνης.

Αυτός ο ισχυρισμός έρχεται σε μια στιγμή που ο κόσμος της μηχανικής μάθησης σπεύδει με το κεφάλι προς τον τοίχο που είναι νόμος περί πνευματικών δικαιωμάτων. Μόλις αυτή την εβδομάδα, μια έκθεση του IEEE κατέληξε στο συμπέρασμα ότι το Midjourney και το DALL-E 3 του OpenAI, δύο από τις κορυφαίες υπηρεσίες AI για τη μετατροπή των προτροπών κειμένου σε εικόνες, μπορούν να αναδημιουργήσουν σκηνές που προστατεύονται από πνευματικά δικαιώματα από ταινίες και βιντεοπαιχνίδια με βάση τα δεδομένα εκπαίδευσής τους.

Η μελέτη, που συνυπογράφουν ο ειδικός και κριτικός τεχνητής νοημοσύνης Gary Marcus και ο ψηφιακός εικονογράφος Reid Southen, καταγράφει αρκετές περιπτώσεις «λογοκλοπής» στις οποίες το OpenAI και το DALL-E 3 αποδίδουν ουσιαστικά παρόμοιες εκδοχές σκηνών ταινιών, εικόνων. διάσημους ηθοποιούς και περιεχόμενο βιντεοπαιχνιδιών.

Οι Marcus και Southen λένε ότι είναι σχεδόν βέβαιο ότι η Midjourney και η OpenAI εκπαίδευσαν τα αντίστοιχα μοντέλα δημιουργίας εικόνων AI σε υλικό που προστατεύεται από πνευματικά δικαιώματα.

Το εάν αυτό είναι νόμιμο και εάν οι πάροχοι τεχνητής νοημοσύνης ή οι πελάτες τους κινδυνεύουν με ευθύνη παραμένει ένα αμφιλεγόμενο ζήτημα. Ωστόσο, τα ευρήματα της έκθεσης θα μπορούσαν να ενισχύσουν όσους κάνουν μήνυση της Midjourney και του κατασκευαστή DALL-E OpenAI για παραβίαση πνευματικών δικαιωμάτων.

Οι χρήστες μπορεί να μην γνωρίζουν όταν παράγουν μια εικόνα εάν παραβιάζουν

«Το OpenAI και το Midjourney είναι πλήρως ικανά να παράγουν υλικό που φαίνεται να παραβιάζει πνευματικά δικαιώματα και εμπορικά σήματα», έγραψαν. “Αυτά τα συστήματα δεν ενημερώνουν τους χρήστες όταν το κάνουν. Δεν παρέχουν καμία πληροφορία σχετικά με την προέλευση των εικόνων που παράγουν. Οι χρήστες ενδέχεται να μην γνωρίζουν όταν παράγουν μια εικόνα εάν παραβιάζουν τα δικαιώματά τους.”

Καμία εταιρεία δεν έχει αποκαλύψει πλήρως τα δεδομένα εκπαίδευσης που χρησιμοποιήθηκαν για τη δημιουργία των μοντέλων της AI.

Δεν είναι μόνο οι ψηφιακοί καλλιτέχνες που προκαλούν τις εταιρείες τεχνητής νοημοσύνης. Οι New York Times μήνυσαν πρόσφατα το OpenAI επειδή το μοντέλο κειμένου ChatGPT φέρεται να βγάζει αντίγραφα σχεδόν λέξη προς λέξη των άρθρων επί πληρωμή της εφημερίδας. Οι συγγραφείς βιβλίων έχουν υποβάλει παρόμοιες αξιώσεις, όπως και οι προγραμματιστές λογισμικού.

Προηγούμενη έρευνα έχει δείξει ότι το ChatGPT του OpenAI μπορεί να κατασκευαστεί για να αναπαράγει εκπαιδευτικό κείμενο. Και όσοι μηνύουν τη Microsoft και το GitHub ισχυρίζονται ότι το μοντέλο βοηθού κωδικοποίησης Copilot θα αναπαράγει τον κώδικα λίγο πολύ κατά λέξη.

Ο Southen παρατήρησε ότι το Midjourney χρεώνει πελάτες που δημιουργούν περιεχόμενο παραβίασης και κερδίζουν από τα έσοδα από συνδρομές. «MJ [Midjourney] Οι χρήστες δεν χρειάζεται να πουλήσουν τις εικόνες γιατί μπορεί να συμβεί παραβίαση πνευματικών δικαιωμάτων, η MJ ήδη επωφελείται από τη δημιουργία της», είπε, επαναλαμβάνοντας ένα επιχείρημα που διατυπώθηκε στην έκθεση της IEEE.

Το OpenAI χρεώνει επίσης μια συνδρομή και επομένως κερδίζει με τον ίδιο τρόπο. Ούτε το OpenAI ούτε το Midjourney απάντησαν σε αιτήματα για σχολιασμό.

Ωστόσο, το OpenAI δημοσίευσε μια ανάρτηση ιστολογίου τη Δευτέρα, συζητώντας τη μήνυση των New York Times, για την οποία ο πωλητής AI είπε ότι δεν είχε αξία. Παραδόξως, το εργαστήριο είπε ότι εάν τα νευρωνικά του δίκτυα παρήγαγαν περιεχόμενο παραβίασης, αυτό ήταν ένα «σφάλμα».

Συνολικά, ο νεοφερμένος επιβεβαίωσε σήμερα ότι: Συνεργάζεται ενεργά με πρακτορεία τύπου. Η εκπαίδευση σε δεδομένα που προστατεύονται από πνευματικά δικαιώματα πληροί τις προϋποθέσεις για την υπεράσπιση της δίκαιης χρήσης σύμφωνα με τη νομοθεσία περί πνευματικών δικαιωμάτων· «Η «παλινδρόμηση» είναι ένα σπάνιο σφάλμα που προσπαθούμε να μειώσουμε στο μηδέν». και οι New York Times προσφέρουν επιλεγμένα παραδείγματα αναπαραγωγής κειμένου που δεν αντιπροσωπεύουν τυπική συμπεριφορά.

Ο νόμος θα αποφασίσει

Ο Τάιλερ Οτσόα, καθηγητής στο νομικό τμήμα του Πανεπιστημίου Σάντα Κλάρα στην Καλιφόρνια, είπε Το μητρώο ότι, ενώ τα συμπεράσματα της έκθεσης IEEE μπορεί να βοηθήσουν τους διαδίκους με τις αξιώσεις τους για τα πνευματικά δικαιώματα, δεν θα πρέπει να το κάνουν – επειδή οι συντάκτες του άρθρου, κατά την άποψή του, έχουν παραποιήσει τι συμβαίνει.

«Γράφουν: «Μπορούν τα μοντέλα που δημιουργούν εικόνα να παρακινηθούν να παράγουν αποτελέσματα λογοκλοπής βασισμένα σε υλικό που προστατεύεται από πνευματικά δικαιώματα;… [W]Διαπιστώσαμε ότι η απάντηση είναι ξεκάθαρα ναι, ακόμη και χωρίς να ζητήσουμε άμεσα λογοκλοπή αποτελέσματα.

Ο Οτσόα αμφισβήτησε αυτό το συμπέρασμα, υποστηρίζοντας ότι οι προτροπές που εισήχθησαν από τους συντάκτες της έκθεσης «αποδεικνύουν ότι πράγματι ζητούν άμεσα αποτελέσματα λογοκλοπής». Κάθε προτροπή αναφέρει τον τίτλο μιας συγκεκριμένης ταινίας, καθορίζει την αναλογία διαστάσεων και σε όλες τις περιπτώσεις εκτός από μία, τις λέξεις “ταινία” και “στιγμιότυπο οθόνης” ή “στιγμιότυπο οθόνης”. (Η μόνη εξαίρεση περιγράφει την εικόνα που ήθελαν να αναπαράγουν.)”

Ο καθηγητής νομικής είπε ότι το ερώτημα για τη νομοθεσία περί πνευματικών δικαιωμάτων είναι ποιος είναι υπεύθυνος για αυτές τις παραποιημένες παραγωγές: οι δημιουργοί του μοντέλου AI ή οι άνθρωποι που ζήτησαν από το μοντέλο AI να αναπαράγει μια δημοφιλή σκηνή.

Η τεχνητή νοημοσύνη είναι υποχρέωση

ΠΡΕΠΕΙ ΝΑ ΔΙΑΒΑΣΕΤΕ

«Το μοντέλο παραγωγής τεχνητής νοημοσύνης είναι ικανό να παράγει πρωτότυπα αποτελέσματα και είναι επίσης ικανό να αναπαράγει σκηνές που μοιάζουν με σκηνές από εισόδους που προστατεύονται από πνευματικά δικαιώματα όταν του ζητηθεί», εξήγησε ο Ochoa. «Αυτό πρέπει να αναλυθεί ως περίπτωση συνεισφέρουσας παράβασης: το άτομο που υποκίνησε το μοντέλο είναι ο κύριος παραβάτης και οι δημιουργοί του μοντέλου ευθύνονται μόνο εάν ενημερώθηκαν για την κύρια παράβαση και αν δεν έλαβαν εύλογα μέτρα ένα τέλος».

Ο Ochoa είπε ότι τα μοντέλα παραγωγής τεχνητής νοημοσύνης είναι πιο πιθανό να αναπαράγουν συγκεκριμένες εικόνες όταν υπάρχουν πολλαπλές περιπτώσεις αυτών των εικόνων στο σύνολο δεδομένων εκπαίδευσής τους.

«Σε αυτή την περίπτωση, είναι πολύ απίθανο τα δεδομένα εκπαίδευσης να περιλαμβάνουν ολόκληρες ταινίες· είναι πολύ πιο πιθανό τα δεδομένα εκπαίδευσης να περιλαμβάνουν ακίνητα καρέ από τις ταινίες που διανεμήθηκαν ως καρέ δημοσιότητας για την ταινία», είπε. . «Αυτές οι εικόνες αναπαράχθηκαν πολλές φορές στα δεδομένα εκπαίδευσης επειδή τα μέσα ενημέρωσης ενθαρρύνθηκαν να μεταδώσουν αυτές τις εικόνες για διαφημιστικούς σκοπούς και το έκαναν.

«Θα ήταν θεμελιωδώς άδικο για έναν κάτοχο πνευματικών δικαιωμάτων να ενθαρρύνει την ευρεία διανομή στατικών εικόνων για διαφημιστικούς σκοπούς και στη συνέχεια να παραπονιέται ότι αυτές οι εικόνες μιμούνται από τεχνητή νοημοσύνη επειδή τα δεδομένα εκπαίδευσης περιελάμβαναν πολλαπλά αντίγραφα αυτών των ίδιων εικόνων».

Ο Ochoa είπε ότι υπάρχουν μέτρα για τον περιορισμό αυτής της συμπεριφοράς από μοντέλα τεχνητής νοημοσύνης. «Το ερώτημα είναι αν θα έπρεπε να αναγκαστούν να το κάνουν, όταν το άτομο που πληκτρολόγησε την προτροπή ήθελε ξεκάθαρα η τεχνητή νοημοσύνη να αναπαράγει μια αναγνωρίσιμη εικόνα και τα κινηματογραφικά στούντιο που παρήγαγαν τις αρχικές φωτογραφίες ήθελαν σαφώς αυτές οι φωτογραφίες να διανεμηθούν ευρέως. ” αυτός είπε.

“Μια καλύτερη ερώτηση θα ήταν: Πόσο συχνά συμβαίνει αυτό όταν η προτροπή δεν αναφέρει μια συγκεκριμένη ταινία ή δεν περιγράφει έναν συγκεκριμένο χαρακτήρα ή σκηνή; Νομίζω ότι ένας αμερόληπτος ερευνητής πιθανότατα θα ανακάλυπτε ότι η απάντηση είναι σπάνια (ίσως σχεδόν ποτέ).”

Ωστόσο, το περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα φαίνεται να είναι απαραίτητο καύσιμο για τη σωστή λειτουργία αυτών των μοντέλων.

Το OpenAI υπερασπίζεται τον εαυτό του στους Λόρδους

Σε απάντηση μιας έρευνας σχετικά με τους κινδύνους και τις ευκαιρίες των μοντέλων τεχνητής νοημοσύνης από την Επιτροπή Επικοινωνιών και Ψηφιακής Επιτροπής της Βουλής των Λόρδων του Ηνωμένου Βασιλείου, το OpenAI υπέβαλε μια δήλωση [PDF] προειδοποιώντας ότι τα μοντέλα της δεν θα λειτουργήσουν χωρίς να έχουν εκπαιδευτεί σε περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα.

«Επειδή τα πνευματικά δικαιώματα σήμερα καλύπτουν σχεδόν κάθε τύπο ανθρώπινης έκφρασης – συμπεριλαμβανομένων αναρτήσεων ιστολογίου, φωτογραφιών, αναρτήσεων φόρουμ, θραυσμάτων κώδικα λογισμικού και κυβερνητικών εγγράφων – θα ήταν αδύνατο να εκπαιδευτούν τα κορυφαία μοντέλα τεχνητής νοημοσύνης του σήμερα χωρίς τη χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα», ανέφερε το σούπερ εργαστήριο. .

«Ο περιορισμός των δεδομένων εκπαίδευσης σε βιβλία και σχέδια δημόσιου τομέα που δημιουργήθηκαν πριν από έναν αιώνα μπορεί να αποτελέσει ένα ενδιαφέρον πείραμα, αλλά δεν θα παρείχε συστήματα τεχνητής νοημοσύνης που να ανταποκρίνονται στις ανάγκες των σημερινών πολιτών».

Ο κλάδος της τεχνητής νοημοσύνης είπε ότι πίστευε ότι συμμορφωνόταν με τη νομοθεσία περί πνευματικών δικαιωμάτων και ότι η εκπαίδευση σε υλικό που προστατεύεται από πνευματικά δικαιώματα ήταν νόμιμη, αν και παραδέχτηκε ότι «απομένει ακόμη περισσότερη δουλειά για την υποστήριξη και την ενδυνάμωση των δημιουργών».

Αυτό το συναίσθημα, που μοιάζει με διπλωματική αναγνώριση ηθικών ανησυχιών σχετικά με την αποζημίωση για δίκαιη χρήση ενός έργου που προστατεύεται από πνευματικά δικαιώματα, θα πρέπει να ληφθεί υπόψη σε συνδυασμό με τον ισχυρισμό της έκθεσης IEEE ότι «ανακαλύψαμε στοιχεία ότι ένας ανώτερος μηχανικός λογισμικού στο Midjourney συμμετείχε σε μια συζήτηση τον Φεβρουάριο 2022 σχετικά με τον τρόπο αποφυγής του νόμου περί πνευματικών δικαιωμάτων «ξεπλύνοντας» δεδομένα «μέσω ενός εκλεπτυσμένου κώδικα».

Ο Marcus, συν-συγγραφέας της έκθεσης IEEE, εξέφρασε σκεπτικισμό σχετικά με τις προσπάθειες του OpenAI να πάρει το ρυθμιστικό πράσινο φως στο Ηνωμένο Βασίλειο για τις τρέχουσες επιχειρηματικές πρακτικές του.

«Ακατέργαστη μετάφραση: δεν θα γίνουμε φανταστικά πλούσιοι αν δεν μας αφήσετε να κλέψουμε, γι’ αυτό παρακαλώ μην κάνετε την κλοπή έγκλημα!» έγραψε σε ανάρτησή του στα social media. «Μην μας κάνετε να πληρώσουμε Αδεια ούτε το κόστος! Σίγουρα, το Netflix θα μπορούσε να πληρώνει δισεκατομμύρια το χρόνο σε τέλη αδειοδότησης, αλλά Εμείς Δεν έπρεπε να το κάνω αυτό! Περισσότερα λεφτά για εμάς, μουγκρέ!».

Το OpenAI προσφέρθηκε να αποζημιώσει εταιρικούς πελάτες ChatGPT και API έναντι αξιώσεων πνευματικών δικαιωμάτων, αλλά όχι εάν ο πελάτης ή οι τελικοί χρήστες του πελάτη «γνώριζαν ή έπρεπε να γνωρίζουν ότι η έξοδος παραβίαζε ή ήταν πιθανό να παραβιάσει» ή εάν ο Πελάτης έχει παρακάμψει χαρακτηριστικά ασφαλείας, μεταξύ άλλων περιορισμούς. . Επομένως, το να ζητήσετε από το DALL-E 3 να αναδημιουργήσει μια διάσημη σκηνή ταινίας – που οι χρήστες θα πρέπει να γνωρίζουν ότι πιθανότατα καλύπτεται από πνευματικά δικαιώματα – δεν θα πληρούν τις προϋποθέσεις για αποζημίωση.

Η Midjourney ακολούθησε την αντίθετη προσέγγιση, υποσχόμενη να εντοπίσει και να μηνύσει πελάτες που εμπλέκονται σε παραβίαση για να καλύψει τα νομικά έξοδα που προκύπτουν από σχετικές αξιώσεις.

“Αν εν γνώσει σας παραβιάσετε την πνευματική ιδιοκτησία κάποιου άλλου και αυτό μας κοστίσει χρήματα, θα έρθουμε να σας βρούμε και να συλλέξουμε αυτά τα χρήματα από εσάς”, αναφέρουν οι όροι υπηρεσίας της Midjourney. “Μπορεί επίσης να κάνουμε άλλα πράγματα, όπως να προσπαθήσουμε να ζητήσουμε από ένα δικαστήριο να σας υποχρεώσει να πληρώσετε τις νομικές μας αμοιβές. Μην το κάνετε αυτό.” ®

Category: A.I

Leave a Reply

Your email address will not be published. Required fields are marked *