Ikona strony Nauka To Lubię

Jak sztuczna inteligencja tworzy obrazy?

Czy sztuczna inteligencja naprawdę tworzy obrazy? Jest kreatywna i twórcza? Ostatnio sztuczna inteligencja wygrała prestiżowy konkurs plastyczny, przez co inni artyści – ci żywi – są podobno wściekli. W tym materiale opowiem Ci, jak wygląda proces twórczy sztucznej inteligencji.  

Sztuczna inteligencja i jej twórczość

Przynajmniej w mojej bańce co chwila ktoś wrzuca obrazy wygenerowane przez sztuczną inteligencję. Na moim Instagramie możecie zobaczyć galerię z kilkoma z nich. Niektóre są niepokojące, inne są intrygujące. Jak to działa?  

Komputery już od dawna są lepsze od ludzi w wielu dziedzinach. Mam tutaj na myśli matematykę, przewidywanie pogody (czyli matematykę) i granie w różne gry (czyli w sumie matematykę). Jest jeszcze granie na giełdzie, ale to też jest w zasadzie matematyka.  Komputery są także lepsze w prowadzeniu samochodów czy pilotowaniu samolotów – bo to wszystko matematyka. Wciąż jednak nie widzimy w nich kreatywnych bytów, które mogłyby konkurować z nami w konkursach muzycznych czy malarskich. A może nasza kreatywność to też matematyka? 

Czy sztuczna inteligencja jest bardziej kreatywna niż człowiek?

Weźmy dwa obrazy jako przykład.

Obraz „Warszawa” stworzony przez Canaletta. Źródło: www.zamek-krolewski.pl/strona/historia/620-canaletto.
Obraz komputerowy wygenerowany przez Jeremy’ego Kraybilla. Źródło: www.medium.com/hackernoon/i-cant-paint-but-meet-my-robot-f167a60b2635.

Ten pierwszy to Warszawa namalowana przez Canaletta, a drugi to obraz wygenerowany przez artystę i programistę Jeremy’ego Kraybilla.

O którym powiedzielibyśmy, że jest sztuką? O obu czy o którymś z nich? Canaletta (tego od realistycznych obrazów starej Warszawy) uważa się powszechnie za artystę. A ten drugi obraz? To portret wykonany przez komputer. Programista najpierw wyuczył model na wybranych obrazach, aby uzyskał własny styl, a później przeniósł projekt na płótno dzięki robotycznemu ramieniu. Komputer nauczył się, że powinien wykonywać mocne pociągnięcia pędzlem, aby odwzorowywać najważniejsze elementy twarzy bohatera.

Wyścig trenerów algorytmów 

Czy dzieło komputerowych algorytmów jest bardziej kreatywne niż namalowanie Zamku Królewskiego w Warszawie? Dzisiaj algorytmy uczenia maszynowego tworzą obrazy na podstawie zaledwie kilku słów. 

Można powiedzieć, że obecnie toczy się wyścig pomiędzy twórcami i trenerami takich algorytmów. Wyścig o to, który algorytm będzie lepszy, bardziej kreatywny, czy który będzie tworzył bardziej oryginalne grafiki czy animacje. Czasami jest to też wyścig o to, który algorytm będzie tworzył zupełnie nierealne postaci, przedmioty czy całe rzeczywistości. 

Na przykład Markos Kay w swoim projekcie „Biocomputer” używał algorytmów i na ich podstawie tworzył animowane postaci. Jak to jest możliwe?

W jaki sposób sztuczna inteligencja tworzy?

Przykładów wygenerowanych przez algorytmy obrazów jest bardzo dużo, ale jak to w zasadzie działa? Jak to jest właściwie możliwe, że algorytm tworzy coś, co nie jest kopią czegoś, co już istnieje? 

Otóż jest to możliwe dzięki nałożeniu się trzech rzeczy. 

Szybki komputer, umiejętność łatwej komunikacji i umiejętność rozpoznawania obrazów nałożyły się na siebie. A skoro algorytm potrafi rozpoznawać obrazy, potrafi je też tworzyć. Program nie ma jednak fizycznych doświadczeń, na przykład głaskania kota czy drapania psa za uchem. Dla niego kot czy pies to zbiór pikseli. Gdy więc algorytm ma namalować kota, nie namaluje swojego ulubionego pupila z dzieciństwa, tylko jakąś mieszankę tych, które widział. Nigdy tego samego, zawsze innego. 

Z kotem sytuacja jest prosta. A co z miastem przyszłości? Algorytm wie, jak wyglądają miasta dzisiaj. Wie też, o ile został do tego wytrenowany, jakie cechy kojarzą się nam z przyszłością. Miasto przyszłości będzie więc miksem skojarzeń miasta i przyszłości. A każdy z tych elementów będzie nałożeniem wszystkich obrazów miast, na jakich sztuczna inteligencja była trenowana, i wszystkiego, co podczas treningu zostało jej przedstawione jako nowoczesność albo obrazy nowoczesności. 

Od czego zależy wygląd obrazu stworzonego przez komputer?

Efekty pracy algorytmu zależą wprost od danych treningowych. Im więcej słów czy określeń podamy, tym bardziej odjechane obrazy zobaczymy. I to odjechane na swój nieludzki sposób. Dlatego właśnie te obrazy tak intrygują, bo pochodzą jak gdyby z innej rzeczywistości, bo powstały nie w ludzkim mózgu, tylko w czarnej skrzynce sztucznej inteligencji. 

To też Cię zainteresuje: Czy komputer może odczytać nasze myśli? Pionierskie badania naukowców ze Stanford University

Na to wszystko możemy nałożyć jeszcze jedną warstwę – styl. Każdy z obrazów stworzonych przez sztuczną inteligencję może naśladować styl malarzy tworzących w różnych epokach – impresjonistów, ekspresjonistów, modernistów czy tych, którzy malowali w stylu klasycystycznym czy kubistycznym. Jak możemy tego algorytm nauczyć? Tak samo jak rozróżniania kota od psa, czyli pokazując mu obrazy. 

Można też pójść o krok dalej i wyuczyć algorytm, by malował w stylu konkretnego twórcy. Jeżeli algorytm będzie odpowiednio wytrenowany, historyk sztuki, patrząc na takie dzieło, rozpozna w nim charakterystyczny styl konkretnego artysty. 

Problem autorstwa obrazów stworzonych przez sztuczną inteligencję

I tutaj zaczyna się pewien w zasadzie nierozwiązywalny problem – kto jest autorem stworzonych przez sztuczną inteligencję obrazów? Autor algorytmu, trener, autor tekstowego zapytania, a może sam algorytm? Niektórzy mogą powiedzieć, że problem jest rozdmuchany, bo algorytm tylko kopiuje to, co kiedyś widział. Nie jest to jednak takie proste.  

Po pierwsze obrazy, a czasami całe skomplikowane animacje, które z siebie wypluwa algorytm, nie są kopią tego, czego doświadczył. Po drugie można zadać sobie pytanie – jak jest z twórczością u ludzi? Ile w utworze muzycznym jest inspiracji – uświadomionej bądź nie – głosami miasta, rzeki, lasu czy ptaków, a ile jest inwencji autora? Czy Vincent van Gogh kopiował może wazon ze słonecznikami? A Leonardo da Vinci modelkę Giocondę, czyli Mona Lisę? 

To też Cię zainteresuje: W objęciach robota – czy roboty humanoidalne zastąpią człowieka?

Spójrz na obraz, który pokazałem na początku – Warszawę namalowaną przez Canaletta. Co tu jest oryginalnego, a co skopiowanego? Czy gdyby w czasach, w których żył i malował Canaletto, ludzie mieli smartfony i robili nimi zdjęcia, nie dostawaliby takich samych, a może nawet identycznych obrazów?  

Ludzki mózg od początku trenuje się w jak najlepszym zrozumieniu świata. W każdej sekundzie odbiera multum sygnałów ze świata, które mogą wzmacniać lub osłabiać jego reakcje. 

Steve Jobs powiedział, że „kreatywność polega na łączeniu elementów, których nikt jeszcze nie połączył”. Ludzkość robi to od zarania dziejów, budując cywilizację na barkach wcześniejszych pokoleń. W podobnym kierunku rozwijamy również uczenie maszynowe. Tu jednak tempo uczenia się i łączenia elementów, których nikt wcześniej nie połączył, jest zdecydowanie szybsze niż u nas. Czym w takim razie różnimy się od algorytmów? To jest temat na inny materiał.