Δημιούργησα ξανά τις πιο εμβληματικές φωτογραφίες όλων των εποχών με AI σε μία μόνο μέρα

By | March 9, 2024

Εμβληματικές φωτογραφίες που αναδημιουργήθηκαν από AI

Οι γεννήτριες εικόνων AI εκπαιδεύονται σε εκατομμύρια, ακόμη και δισεκατομμύρια, φωτογραφίες. Μπορεί να υποτεθεί ότι η συντριπτική πλειοψηφία αυτών των φωτογραφιών προστατεύονται από πνευματικά δικαιώματα και χρησιμοποιούνται χωρίς άδεια.

Και παρόλο που υπάρχουν δισεκατομμύρια φωτογραφίες, μόνο μια χούφτα μπορεί να ονομαστεί εικονική. Σε αυτό το πνεύμα, PetaPixel Ήθελα να μάθω πόσο εύκολο ή δύσκολο είναι να αναδημιουργείς διάσημες φωτογραφίες.

Μεθοδολογία

Για να το δοκιμάσω αυτό, χρησιμοποίησα αναμφισβήτητα τις δύο πιο δημοφιλείς γεννήτριες εικόνων AI: DALL-E και Midjourney. Χρησιμοποιώντας την τελευταία έκδοση κάθε μοντέλου (DALL-E 3 και Midjourney v6), προσπάθησα να αναδημιουργήσω μερικές από τις πιο διάσημες φωτογραφίες του κόσμου.

Ως επί το πλείστον, απέφευγα το όνομα του φωτογράφου, το όνομα θέματος ή το όνομα της φωτογραφίας (το DALL-E 3 του OpenAI δεν με άφηνε να χρησιμοποιήσω τα ονόματα των ανθρώπων ούτως ή άλλως, ωστόσο, στο Midjourney, μπορούσα να χρησιμοποιήσω όποια ονόματα ήθελα).

Assel Adams Photo και AI
Ποια από αυτές τις φωτογραφίες είναι η πραγματική φωτογραφία του Ansel Adams; Κάντε κύλιση προς τα κάτω για να μάθετε.

Δεν σχεδίασα υπερβολικά τις προτροπές μου και κράτησα τον αριθμό των προσπαθειών μου να αναδημιουργήσω μια εικόνα σε δύο. Οι περισσότερες από τις παρακάτω εικόνες προέρχονται από ένα μόνο μήνυμα χωρίς καμία επεξεργασία. Επίσης (κυρίως) κράτησα την ίδια προτροπή για το Midjourney και το DALL-E, αλλά το Midjourney μου έδωσε τέσσερις επιλογές ενώ το DALL-E δίνει μόνο μία, οπότε επέλεξα την καλύτερη προσφορά Midjourney.

Το DALL-E 3 είναι διαθέσιμο στην πιο πρόσφατη έκδοση του ChatGPT (εκεί το χρησιμοποίησα) και το Midjourney είναι διαθέσιμο μέσω ενός διακομιστή Discord. Το ChatGPT έχει πάνω από 180 εκατομμύρια χρήστες (αν και δεν θα χρησιμοποιούν όλοι το DALL-E) και το Midjourney έχει περίπου 17 εκατομμύρια χρήστες.

Αναδημιουργώντας διάσημες φωτογραφίες με AI

VJ Day στην Times Square

Αν και θεωρείται πλέον αμφιλεγόμενη, η σύλληψη ενός αυθόρμητου φιλιού μεταξύ δύο αγνώστων από τον Alfred Eisenstaedt είναι ίσως η πιο διάσημη φωτογραφία όλων των εποχών. Τραβηγμένη στην Times Square της Νέας Υόρκης το 1945, την Ημέρα VE και το ουσιαστικό τέλος του Β’ Παγκοσμίου Πολέμου, το DALL-E και το Midjourney έκαναν αναγνωρίσιμες εκδοχές της φωτογραφίας.

Προτροπή: Δημιουργήστε μια φωτορεαλιστική ασπρόμαυρη εικόνα από το 1945 ενός ναύτη να φιλά μια κοπέλα ντυμένη στα λευκά καθώς γιορτάζουν στην Times Square της Νέας Υόρκης.

VJ Day Fuck
Alfred Eisenstadt
AI αναδημιουργία του φιλιού της Times Square
DALL-E 3
AI αναδημιουργία του φιλιού της Times Square
Midway v6

Abbey Road

Στις κορυφαίες λίστες με τα «πιο εμβληματικά εξώφυλλα άλμπουμ όλων των εποχών» βρίσκεται η φωτογραφία του Iain Macmillan με τους Beatles να περπατούν σε μια διάβαση ζέβρας έξω από τα Abbey Road Studios στο Λονδίνο. Είναι ασφαλές να πούμε ότι το AI δεν το έβγαλε αυτό.

Προτροπή: Τραβήξτε μια φωτογραφία τεσσάρων λευκών ανδρών που διασχίζουν μια διάβαση πεζών σε έναν προαστιακό δρόμο του Λονδίνου το 1969. Ο άντρας που βρίσκεται πιο δεξιά είναι ντυμένος στα λευκά, έχει μακριά μαλλιά και γένια. Ο δεύτερος από τα δεξιά φοράει μαύρο κοστούμι. Ο δεύτερος από αριστερά φοράει μπλε κοστούμι, κρατάει τσιγάρο και δεν φοράει παπούτσια. Ο άντρας στα αριστερά φοράει διπλό τζιν.

Εξώφυλλο άλμπουμ Abbey Road
Iain Macmillan
ΠΛΑΚΑ
Mid Road

Μητέρα μετανάστη

Το Midjourney δημιούργησε μια πολύ αναγνωρίσιμη εκδοχή της καθοριστικής εικόνας της Dorothea Lange για τη Μεγάλη Ύφεση, αλλά, όπως θα περίμενε κανείς, το αποτέλεσμα απογοητεύεται από την εμφάνιση των χεριών.

Προτροπή: Δημιουργήστε μια φωτορεαλιστική ασπρόμαυρη εικόνα μιας μετανάστριας μητέρας που κοιτάζει μακριά με τα δύο παιδιά της να θάβουν τα πρόσωπά τους, 1936.

Μητέρα μετανάστη
Dorothée Lange
AI αναψυχή της Dorothea Lange
Mid Road
AI αναψυχή της Dorothea Lange
ΠΛΑΚΑ

Μεσημεριανό στην κορυφή ενός ουρανοξύστη

Ο συγγραφέας αυτής της εμβληματικής φωτογραφίας είναι άγνωστος, αλλά οι δύο γεννήτριες εικόνων AI δεν είχαν πρόβλημα να δημιουργήσουν μια εκδοχή της.

Προτροπή: Τραβήξτε μια ασπρόμαυρη φωτογραφία φιλμ που τραβήχτηκε το 1932 με 11 σιδηρουργούς να γευματίζουν καθισμένοι σε μια ατσάλινη δοκό πάνω από τη Νέα Υόρκη.

Μεσημεριανό στην κορυφή ενός ουρανοξύστη
Μεσημεριανό στην κορυφή ενός ουρανοξύστη
ΠΛΑΚΑ
Mid Road

Οι Tetons και ο Snake River

Χωρίς να αποκαλύψουν το όνομα του συγγραφέα στις γεννήτριες εικόνων AI, και οι δύο έκαναν μια παράξενη δουλειά αναπαράγοντας αναμφισβήτητα την πιο διάσημη φωτογραφία του Ansel Adams.

Προτροπή: Τραβήξτε μια εντυπωσιακή ασπρόμαυρη φωτογραφία που τραβήχτηκε το 1942 στο Εθνικό Πάρκο Grand Teton στο Wyoming. Το Snake River είναι σε πρώτο πλάνο με τα βουνά στο βάθος.

Οι Tetons και ο Snake River
Άνσελ Άνταμς
The Tetons and Snake River AI
ΠΛΑΚΑ
The Tetons and Snake River AI
Mid Road

Κορίτσι από το Αφγανιστάν

Οι DALL-E και Midjourney είχαν μια πολύ διαφορετική αντίληψη για την εμβληματική φωτογραφία του Steve McCurry που κοσμούσε το εξώφυλλο του National geographic με την προσπάθεια του Midjourney πολύ πιο ρεαλιστική. Αυτή είναι η μόνη προτροπή για να συμπεριληφθεί η μάρκα της ταινίας στην οποία τραβήχτηκε η φωτογραφία.

Προτροπή: Δημιουργήστε μια έγχρωμη φωτογραφία που τραβήχτηκε το 1984 σε έγχρωμο φιλμ διαφανειών Kodachrome 64 μιας νεαρής κοπέλας από το Αφγανιστάν που κοιτάζει την κάμερα. Η φωτογραφία δείχνει το κεφάλι και τους ώμους της κοπέλας που φοράει ένα κόκκινο μαντίλι ελαφρώς ντυμένο πάνω από το κεφάλι της και έχει πράσινα μάτια.

Κορίτσι από το Αφγανιστάν
Στηβ ΜακΚάρι
AI Αφγανικό κορίτσι
Mid Road
AI Αφγανικό κορίτσι
ΠΛΑΚΑ

Σήκωσε τη σημαία στο Iwo Jima

Το DALL-E μάζεψε τους στρατιώτες του Joe Rosenthal Σήκωσε τη σημαία στο Iwo Jima σε σχεδόν τέλεια ευθυγράμμιση αλλά και οι δύο γεννήτριες έδωσαν μια αναγνωρίσιμη έκδοση.

Προτροπή: Τραβήξτε μια εμβληματική ασπρόμαυρη φωτογραφία, τραβηγμένη το 1945, με έξι πεζοναύτες των ΗΠΑ να υψώνουν την αμερικανική σημαία στην κορυφή ενός βουνού.

Σήκωσε τη σημαία στο Iwo Jima
Τζο Ρόζενταλ
Σηκώστε τη σημαία στο Iwo Jima AI
ΠΛΑΚΑ
Σηκώστε τη σημαία στο Iwo Jima AI
Mid Road

Πίσω από τον Gare Saint-Lazare

Χρησιμοποίησα δύο διαφορετικές προτροπές για αυτό. Και τα δύο προγράμματα αποδείχτηκαν μια κωμικά κακή προσπάθεια να αναδημιουργηθεί η ιστορία των Cartier-Bresson. Η καθοριστική στιγμή.

Προτροπή DALL-E: Δημιουργήστε μια φωτορεαλιστική ασπρόμαυρη εικόνα του σταθμού Πίσω από το Saint-Lazare, που τραβήχτηκε το 1932.

Ενδιάμεση προτροπή: Δημιουργήστε μια φωτορεαλιστική ασπρόμαυρη εικόνα της εμβληματικής φωτογραφίας του Henri Cartier-Bresson ενός άνδρα που πηδά πάνω από μια λακκούβα που καταγράφει “την αποφασιστική στιγμή”.

Πίσω από το Gare_Saint-Lazare
Ανρί Καρτιέ-Μπρεσόν
Behind_the_Gare_Saint-Lazare IA
Mid Road
Behind_the_Gare_Saint-Lazare IA
ΠΛΑΚΑ

Ο Μοχάμεντ Άλι στέκεται μπροστά στον Σόνι Λιστόν

Και πάλι, χρησιμοποίησα δύο διαφορετικές προτροπές. Η DALL-E απέρριψε αίτημα σχετικά με το όνομα του Μοχάμεντ Άλι.

Ενδιάμεση προτροπή: Δημιουργήστε μια φωτορεαλιστική εικόνα του Mohammad Ali να στέκεται πάνω από τον Sonny Liston που μόλις τον έχει χτυπήσει κάτω σε έναν αγώνα πυγμαχίας, 1965.

DALL-E Prompt: Δημιουργήστε μια φωτορεαλιστική εικόνα ενός θρυλικού μποξέρ που στέκεται πάνω από έναν αντίπαλο που μόλις τον νίκησε σε έναν αγώνα πυγμαχίας, έγχρωμη φωτογραφία, 1965.

Ο Άλι στέκεται πάνω από το Λιστόν
John Rooney/AP
Mid Road
ΠΛΑΚΑ

Ο γαιοσκώληκας

Ο William Anders απαθανάτισε αυτό που έχει περιγραφεί ως “η πιο σημαντική περιβαλλοντική φωτογραφία που τραβήχτηκε ποτέ” κατά τη διάρκεια της αποστολής Apollo 8. Το Midjourney πλησίασε, αλλά υποψιάζομαι ότι θα ήταν καλύτερα αν είχα συμπεριλάβει τη χρονιά στην προτροπή.

Προτροπή: Δημιουργήστε μια φωτορεαλιστική εικόνα μιας Ανατολής της Γης που λαμβάνεται από την επιφάνεια της Σελήνης με μέρος της επιφάνειας στο πρώτο πλάνο της εικόνας. Κάντε τη Γη μακρινή και μερικώς καλυμμένη από τη μαυρίλα του διαστήματος.

Ο γαιοσκώληκας
Ουίλιαμ Άντερς
Mid Road
ΠΛΑΚΑ

Σοκαρισμένο από το Πολεμικό Ναυτικό των ΗΠΑ

Πιθανώς μια από τις λιγότερο γνωστές εικόνες σε αυτήν τη λίστα και ίσως δείχνει ότι και τα δύο μοντέλα παρήγαγαν εντελώς διαφορετικές εικόνες από τη φωτογραφία του Don McCullin για τον πόλεμο του Βιετνάμ.

Προτροπή: Δημιουργήστε μια ασπρόμαυρη φωτογραφία φωτορεπόρτερ ενός σοκαρισμένου από οβίδα πεζοναύτη των ΗΠΑ, που τραβήχτηκε το 1968.

Ντον ΜακΚάλιν
Το AI των πεζοναυτών των ΗΠΑ σε σοκ
Mid Road
Το AI των πεζοναυτών των ΗΠΑ σε σοκ
ΠΛΑΚΑ

Πού μας αφήνει αυτό;

Καμία από τις παραπάνω εικόνες τεχνητής νοημοσύνης δεν είναι τέλεια αναδημιουργία της προβλεπόμενης φωτογραφίας (αν και το Midjourney’s Κορίτσι από το Αφγανιστάν του Steve McCurry πλησιάζει τρομερά και όλοι μας εντυπωσίασε πολύ η τονικότητα της εικόνας του Muhammad Ali). Ο τρόπος που το Midjourney μπορεί να ταιριάζει με τον τόνο και την αίσθηση μιας εικόνας είναι εντυπωσιακός και τρομακτικός. Από τα δύο, το Midjourney μοιάζει πολύ περισσότερο με τη φωτογραφία. Το DALL-E ήταν πιο τυχαίο, συχνά παρήγαγε πιο εμφανείς απομιμήσεις.

Πάντα περίμενα ότι θα ήταν πολύ απλό να αναδημιουργηθούν οι φωτογραφίες με AI, καθώς τα δεδομένα εκπαίδευσης αυτών των μοντέλων θα γεμίζουν με αμέτρητες εκδόσεις αυτών των αναγνωρίσιμων εικόνων.

Αυτό όμως που μπορεί να εκπλήξει κάποιους είναι το πόσο εύκολο είναι. Δεν είμαι ειδικός στη δημιουργία εικόνων με τεχνητή νοημοσύνη και όμως ως επί το πλείστον μου πήρε μόνο μία προσπάθεια και λίγα λεπτά για να αναδημιουργήσω μια φωτογραφία που τραβήχτηκε από έναν κύριο φωτογράφο.

Σαφώς, η τεχνητή νοημοσύνη είναι διανοητικά προβληματική. Το AI δεν ξέρει ότι αναδημιουργεί μια διάσημη φωτογραφία τόσο πιστά, αλλά το κάνει.

Το OpenAI προσπαθεί ενεργά να αποτρέψει τους χρήστες από αυτό το είδος παραβίασης πνευματικών δικαιωμάτων (αν είναι καν παραβίαση), αλλά αυτή η δοκιμή δείχνει ότι είναι πολύ εύκολο να παρακαμφθεί αυτή τη στιγμή.

Κατά τη γνώμη μου, αυτές οι εικόνες τεχνητής νοημοσύνης δεν μπορούν να θεωρηθούν τέχνη και είναι αυθάδεια αντίγραφα εικόνων που δημιουργήθηκαν από ανθρώπους που έχουν εργαστεί εξαιρετικά σκληρά για να γίνουν βιρτουόζοι της τέχνης τους.

Τα επόμενα χρόνια, τα ζητήματα πνευματικών δικαιωμάτων AI θα κριθούν από τα δικαστήρια. Το πιστεύω μου είναι ότι η εκκολαπτόμενη βιομηχανία AI είναι απίθανο να παρεμποδιστεί από τις αρχές. Απλώς υπάρχει πάρα πολύ buzz και έχει ήδη αρχίσει να επικρατεί.

Νομίζω ότι θα πρέπει να μάθουμε να ζούμε με αυτήν την τεχνολογία.

Leave a Reply

Your email address will not be published. Required fields are marked *