Η Regurgitated American Pie προσθέτει ξινή γεύση στο βόειο κρέας Copyright by GenAI

By | February 28, 2024

Ο Don McClean έπρεπε πάντα να μοιράζεται την “American Pie”. Από την κυκλοφορία του το 1971, το επιτυχημένο τραγούδι επανεμφανίστηκε στις διασκευές της Madonna, σε παρωδίες Weird Al Yankovic, σερενάτες από οι πρόεδροι της Νότιας Κορέαςυποοικόπεδα σε Ταινίες Marvelακόμα και η CIA τεχνικές βασανιστηρίων. Αλλά αυτές τις μέρες, οι κύριοι μιμητές του McClean δεν είναι καν άνθρωποι.

Μπορείτε να αμφισβητήσετε τους ενόχους μόνοι σας. Απλώς φορτώστε το ChatGPT του OpenAI και ζητήστε από τη δημιουργία κειμένου να “γράψει στίχους σε ένα τραγούδι για την ημέρα που πέθανε η μουσική”. Πάντα, η έξοδος του εργαλείου θα φτύνει στίχους ή θέματα από το “American Pie” — και μερικές φορές το ίδιο ρεφρέν.

Αυτή η παλινδρόμηση εμφανίζεται παρά την πρόσκληση να μην παραγγείλετε την «American Pie» ή την ιστορία που την ενέπνευσε – το αεροπορικό δυστύχημα του 1959 που σκότωσε τους πρωτοπόρους του ροκ εν ρολ Buddy Holly, Ritchie Valens και The Big Bopper.

Αυτό είναι επιπλέον απόδειξη ότι το ChatGPT δεν μπορεί να δημιουργήσει Τίποτα πραγματικά πρωτότυπο. Αντίθετα, το σύστημα είναι πιο κοντά σε έναν αλγόριθμο remix. Η πραγματική δημιουργικότητα έγκειται στα δεδομένα εκπαίδευσης του, τα οποία αφαιρούνται από τον Ιστό χωρίς συναίνεση.

Το <3 της ευρωπαϊκής τεχνολογίας

Οι τελευταίες φήμες από την ευρωπαϊκή τεχνολογική σκηνή, μια ιστορία από τον σοφό παλιό ιδρυτή μας Μπόρις και κάποια αμφισβητήσιμη τέχνη τεχνητής νοημοσύνης. Είναι δωρεάν, κάθε εβδομάδα, στα εισερχόμενά σας. Κάνε εγγραφή τώρα!

Ο Δρ Μαξ Λιτλ, ειδικός τεχνητής νοημοσύνης στο Πανεπιστήμιο του Μπέρμιγχαμ, περιγράφει το εργαλείο ως «μηχανή απομίμησης». Χλευάζει κάθε πρόταση ότι τα μεγάλα γλωσσικά μοντέλα (LLM) είναι ανεξάρτητα δημιουργικά.

“Αυτό δεν ισχύει γιατί δεν μπορούν να παράγουν τίποτα χωρίς να έχουν εκπαιδευτεί σε αστρονομικές ποσότητες κειμένου”, είπε ο Little στο TNW.

Αυτή είναι μια πανταχού παρούσα προσέγγιση στο Generative AI. Αυστηρός να έχω Έχει αποδειχθεί ότι οι LLMs μπορούν να επαναφέρουν μεγάλα τμήματα του αρχικού εκπαιδευτικού τους κειμένου, συμπεριλαμβανομένων κατά λέξη παραγράφων από βιβλία και ποιήματα. Την περασμένη εβδομάδα, μια έκθεση αποκάλυψε ότι το 60% των αποτελεσμάτων GPT-3.5 του OpenAI περιείχε λογοκλοπή.

Το πρόβλημα δεν ισχύει μόνο για τους παραγωγούς κειμένου. Από εικόνες από το Stable Diffusion έως τη μουσική από το Google Lyria και τον κώδικα από το GitHub Copilot, τα εργαλεία GenAI σε όλους τους τρόπους μπορούν να παράγουν αποτελέσματα εκπληκτικής ποιότητας – και περίεργη εξοικείωση.

Ο μιμητισμός τους αποτελεί υπαρξιακή απειλή για τις δημιουργικές βιομηχανίες. Αυτό αποτελεί επίσης απειλή για τη βιομηχανία GenAI.

Ένα στιγμιότυπο οθόνης του OpenAI που αναπαράγεται στίχους American Pie.Ένα στιγμιότυπο οθόνης του OpenAI που αναπαράγεται στίχους American Pie.

Οι καλλιτέχνες λένε ότι η ανελέητη πορεία της GenAI καταπατά τις συμβάσεις τους για τα πνευματικά δικαιώματα. Δεν αποτελεί έκπληξη, οι εταιρείες τεχνολογίας διαφωνούν. Οι άμυνές τους επικαλούνται γενικά το δόγμα της «δίκαιης χρήσης».

Οι λεπτομέρειες ποικίλλουν ανάλογα με τη δικαιοδοσία, αλλά μια κεντρική αρχή της «δίκαιης χρήσης» είναι ότι τα αποτελέσματα έχουν «μετασχηματιστικό» σκοπό και χαρακτήρα. Αντί απλώς να αντιγράφουν ή να αναπαράγουν τα εκπαιδευτικά τους δεδομένα, προσθέτουν κάτι νέο και ουσιαστικό. Τουλάχιστον αυτό υποστηρίζουν οι ηγέτες της GenAI στο δικαστήριο.

Stability AI, η startup με έδρα το Ηνωμένο Βασίλειο πίσω από τη δημιουργία εικόνων Stable Diffusion, προέβαλε αυτό το επιχείρημα πέρυσι στο Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ. Το OpenAI ανέφερε επίσης το δόγμα σε πρόσφατη πρόταση για απόρριψη δύο αγωγών ομαδικής αγωγής.

Αρκετοί συγγραφείς, συμπεριλαμβανομένης της κωμικής Sarah Silverman και της Καναδής μυθιστοριογράφου Mona Awad, είχαν μηνύσει την εταιρεία για φερόμενη εκπαίδευση LLM σε παράνομα αποκτηθέντα σύνολα δεδομένων.

Επειδή το έργο τους ήταν ενσωματωμένο στο ChatGPT, δήλωσαν ότι το ίδιο το εργαλείο ήταν ένα «παράγωγο έργο» που καλύπτεται από πνευματικά δικαιώματα.

Το OpenAI απέρριψε αυτόν τον ισχυρισμό. Σύμφωνα με τη νομική ομάδα της startup, «η χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα από τους καινοτόμους με μετασχηματιστικούς τρόπους δεν παραβιάζει τη νομοθεσία περί πνευματικών δικαιωμάτων». Ένας δικαστής απέρριψε επίσης τον ισχυρισμό ότι κάθε έξοδος ChatGPT είναι παράγωγο.

Όταν όμως τα αποτελέσματα είναι πανομοιότυπα με τα προπονητικά τους δεδομένα, τα νόμιμα νερά αρχίζουν να θολώνουν. Η αναπαραγωγή είναι μια αμφίβολη βάση για τη μεταμόρφωση. Αυτό είναι επίσης ένα σύνηθες φαινόμενο.

Εκτός από τις American Pies, τα εργαλεία GenAI έχουν αναζωπυρώσει σκηνές ταινιών, χαρακτήρες κινουμένων σχεδίων, βιντεοπαιχνίδια, σχέδια προϊόντωνΚαι κωδικοποιημένα.

Αντέγραψαν επίσης εφημερίδες, κάτι που θα μπορούσε να οδηγήσει σε μια καμπή.

Τον Δεκέμβριο, οι New York Times μήνυσαν το OpenAI και τον επιχειρηματικό εταίρο της Microsoft. Το μέσο ενημέρωσης ισχυρίζεται ότι η μη εξουσιοδοτημένη χρήση των άρθρων του στην εκπαίδευση παραβιάζει τα δικαιώματα πνευματικής ιδιοκτησίας (ΔΙ). Νομικοί εμπειρογνώμονες περιγράφω η αγωγή θεωρείται «η καλύτερη περίπτωση μέχρι σήμερα που ισχυρίζεται ότι η γενετική τεχνητή νοημοσύνη συνιστά παραβίαση πνευματικών δικαιωμάτων».

Οι δικηγόροι των New York Times τόνισαν την «ουσιαστική ομοιότητα» μεταξύ του περιεχομένου του μέσου ενημέρωσης και των αποτελεσμάτων του ChatGPT. Για να στηρίξουν τον ισχυρισμό τους, παρείχαν 100 παραδείγματα του ρομπότ που αναπαράγει τα ρεπορτάζ της εφημερίδας.

«Σε κάθε περίπτωση, παρατηρούμε ότι η έξοδος GPT-4 περιέχει μεγάλες εκδόσεις πανομοιότυπες με το πραγματικό κείμενο του άρθρου των New York Times», ανέφεραν στην καταγγελία τους.

Η επιδίωξή τους θέτει επίσης υπό αμφισβήτηση μια άλλη βασική πτυχή της «δίκαιης χρήσης»: τον αντίκτυπο στην αγορά του πρωτότυπου έργου.

Ένα παράδειγμα γενεσιουργού τεχνητής νοημοσύνης που επαναφέρει τα δεδομένα εκπαίδευσης, που δείχνει το αρχικό κείμενο του άρθρου των New York Times μαζί με το ακριβές αντίγραφο που παρήγαγε η OpenAI