Niezły GauGAN. AI tworzy pejzaże

W latach 30. ubiegłego wieku Walter Benjamin zastanawiał się, w jaki sposób możliwość reprodukcji technicznej wpływa na sztukę (esej Dzieło sztuki w dobie reprodukcji technicznej). W wydanej niedawno książce Po piśmie Jacek Dukaj zastanawia się, co się stanie z kulturą pod wpływem rozwoju szeroko pojętej AI. Twierdzi przy tym, że nie jest to kwestia przyszłości, ale już naszej teraźniejszości. Ja natomiast podrzucam ciekawy kontekst, o którym się ostatnio dowiedziałem – GauGAN, technologię opracowywaną przez firmę NVIDIA.

Na początek umówmy się, że pod pojęciem „szeroko rozumianej sztucznej inteligencji” przyjmujemy tu wszelkie technologie, które usprawniają nasze myślenie i działanie oraz są zdolne do samodzielnych korekt lub przekształceń różnego rodzaju dzieł i działań człowieka. Nie jest przy tym istotne, czy są to programy, algorytmy, jakieś mechanizmy bazujące na uczeniu maszynowym czy sztuczne sieci neuronowe. Tym bardziej nie interesuje nas, czy mają one samoświadomość, czy nie. W tym sensie zarówno popularny korektor gramatyki angielskiej Grammarly, apki do robienia zdjęć z efektami AR, jak i Alexa czy Asystent Google są już jakimiś przejawami działania sztucznej inteligencji w kulturze.

Jak zauważa Dukaj (i jak również mi często nasuwa się na myśl), mamy skłonność do bronienia kolejnych bastionów ludzkiej aktywności przed ingerencją AI. Zarazem nie jesteśmy w tej obronie szczególnie gorliwi, gdyż szybko okazuje się, że owa ingerencja jest dla nas najzwyczajniej w świecie wygodna. Można oczywiście wzbraniać się przed używaniem GPS-a, jednak któż z nas nie woli zawierzyć Mapom Google, podczas przejazdu przez obce miasto w godzinie szczytu? Możemy wertować słownik ortograficzny, wątpiąc w pisownię jakiegoś słowa, jednak możemy też zaufać autokorekcie w edytorach tekstowych. Niech każdy sam sobie odpowie, które rozwiązanie wybierze.

Jednak tego rodzaju rozszerzenia naszej wiedzy czy kompetencji to jeszcze nie kreatywność; to raczej techniczne usprawnienie naszych codziennych działań – myślimy sobie. Owszem, technologia nam pomaga, jednak tak naprawdę nie robi niczego sama z siebie. Prawda?

Twórcza technologia

Jednak pisze Dukaj:

Przekonanie, że „maszyny nie mogą być twórcze”, należy do reliktów filozofii umysłu epoki Turinga […]. Programy piszą poezję, która w swym efekcie emocjonalnym, intelektualnym jest nieodróżnialna od poezji pisanej przez ludzi. Programy komponują muzykę, która wzrusza, porywa, rezonuje w rejestrach sublime. Programy tworzą obrazy, zarazem takie, że od pierwszego na nie spojrzenia nie może być wątpliwości, iż nie wyszły one spod mózgu i ręki człowieka, i zarazem szczerze poruszające.

Jacek Dukaj, Po piśmie, „Sztuka w czasach sztucznej inteligencji”


Dlaczego tak się dzieje? Cóż, może nie jesteśmy aż tak skomplikowani, jak lubimy o sobie myśleć. A może poziom naszej komplikacji tak naprawdę nie jest istotny, gdyż w ujęciu statystycznym, porównując każdego z nas do milionów innych osób na globie (co w epoce Big Data jest już zupełnie możliwe), technologia nie musi rozumieć konkretnego człowieka; wystarczy, że wcześniej zetknęła się i zebrała dane o tysiącach innych, niemal identycznych przypadków. Skoro tamtym podobało się to-a-to, to temu zapewne też się to spodoba. I okazuje się, że to działa. Gdyby nie działało, nie opłacałoby się kręcić kina w Hollywood, prawda?

NVIDIA GAUGAN

Właśnie na takiej analizie olbrzymiej ilości danych wizualnych bazuje eksperymentalny model uczenia głębokiego, opracowywany przez firmę NVIDIA, który z byle bohomazu potrafi zrobić fotorealistyczny pejzaż. Program, nauczony na tysiącach realnych fotografii, jak wygląda prawdziwy krajobraz, zastępuje schematyczną kompozycję całkowicie realnie wyglądającymi elementami. Wygenerowany obraz prezentuje się przy tym na tyle dobrze i prawdziwie, że po udoskonaleniu technologii – jestem o tym przekonany – będzie go można z powodzeniem wykorzystać w roli rzeczywistej fotografii pejzażowej. W niedawnym wpisie rozważałem wpływ, jaki rozwój AI może wywrzeć na rynek pracy w branży kreatywnej (Multiklasowość i nowe horyzonty, czyli grafik wobec wyzwań przyszłości). Czy naprawdę nie da się pomyśleć np. pejzaży stockowych generowanych programowo? Przecież już dziś wiele z nich jest tak mocno obrobionych w Photoshopie, że wyglądają raczej jak stworzone komputerowo.

Obejrzyjcie ten krótki filmik prezentujący możliwości GauGAN-a. A potem sięgnijcie po swoje zdjęcia z wakacji i zastanówcie się, czy da się wskazać między nimi, a kreacjami programu jakąś kluczową, jakościową różnicę. ( Może się da. Może nawet na to liczę…)

GauGAN tworzy fotopejzaże. Niejeden fotograf nie poznałby, że te obrazy są sztuczne.