Czy w Midjourney można stworzyć utwór?
Mało jest prawniczych sporów, które mnie irytują w równym stopniu, co dyskusja wokół prawnoautorskiej ochrony wytworów generatywnej sztucznej inteligencji. Spróbuję więc wyjść poza schemat i napisać coś więcej, niż to, że „problem jest złożony” i w ogóle „to zależy” oraz okraszeniem tego kilkoma mądrymi słowami. Zajmę się jednym bardzo konkretnym przypadkiem: fotorealistycznymi obrazami generowanymi za pomocą Midjourney. Dla uproszczenia ograniczę się do pytania, czy możliwe jest stworzenie utworu plastycznego WYŁĄCZNIE przez wpisanie w Midjourney odpowiedniego promptu, bez późniejszej edycji w programie graficznym.
Jak ocenić twórczość?
Żeby sensownie na nie odpowiedzieć, muszę zacząć od małej dawki teorii. Ochrona w ramach prawa autorskiego przyznawana jest automatycznie, z mocy prawa, jeżeli spełnione są przesłanki ochrony. Przesłanki te określają jakimi cechami powinien odznaczać się utwór, a więc taki wytwór, który jest chroniony prawem autorskim. Przesłanki te są bardzo różnie interpretowane. Ograniczę się do podejścia wypracowanego w orzecznictwie Trybunału Sprawiedliwości UE. Nie dlatego, że jest jakoś szeroko akceptowane – jego podstawy prawne są dyskusyjne, część sądów (np. niemiecki BGH) je kontestuje. Ale ma dla nas dwie zalety. Po pierwsze jest dość proste do wytłumaczenia. Po drugie jest dostosowane do oceny wytworów utylitarnych, o niskim natężeniu pierwiastków osobistych, takich jak proste fotografie, programy komputerowe, bazy danych, wzory użytkowe itp.
Jego cechą charakterystyczną jest postrzeganie ocenianego wytworu jako sumy wyborów dokonanych przez twórcę. Ja, pisząc ten tekst, wybieram słowa, zestawiam je ze sobą, układam w zdania, z nich zestawiam akapity, a całość w artykuł. Bardzo ładnie wybory dokonywane przez fotografa TSUE opisał w wyroku w sprawie C‑145/10 Eva-Maria Painer. Stwierdził tam, że: „W fazie przygotowawczej autor może dokonać wyboru inscenizacji, pozy osoby fotografowanej lub oświetlenia. Podczas wykonywania fotografii portretowej może dokonać wyboru kadrowania, kąta ujęcia, a także wytworzonej atmosfery. Wreszcie przy wykonywaniu odbitek z kliszy autor może dokonać wyboru spośród różnych istniejących technik wywoływania tej, którą zechce zastosować, a nawet użyć w razie potrzeby oprogramowania informatycznego.”
Swobodne i twórcze wybory
Wybory dokonywane przez autora powinny być „swobodne i twórcze”. Czyli nie mogą być narzucane przez czynniki zewnętrzne, takie jak wymagania zamawiającego, ograniczenia technologiczne, przeznaczenie wytworu. Ponadto muszą być własnymi wyborami autora (muszą stanowić jego własną twórczość intelektualną). Oznacza to, że nie mogą być skopiowane. Ale też nie mogą być dokonane w inny sposób niż przez samego twórcę – człowieka. „Swobodnymi i twórczymi” wyborami mogą być wiec potencjalnie manualne ustawienia czułości ISO, czasu naświetlania, przesłony, a także dobór obiektywu czy długości ogniskowej. Jeżeli fotograf zdał się na automatykę, ustawienia dobrane przez procesor aparatu nie są jego „swobodnymi i twórczymi” wyborami.
Jeżeli tych „swobodnych i twórczych” wyborów jest dostatecznie dużo, aby autor był w stanie odcisnąć na tworzonym dziele swój „osobisty charakter”, dany wytwór będzie uznany za utwór.
Jest jeszcze jedna zasada. Brane są pod uwagę tylko te wybory, które kształtują formę wyrażenia dzieła. Nie są brane pod uwagę te wybory, które są całkowicie nieistotne (jak to, czy fotograf był w czapce, czy bez czapki), jak i te, które dotyczą elementów pozostających poza zakresem prawa autorskiego – idei, koncepcji, procedur. O zaliczeniu danego elementu do sfery niechronionych idei TSUE wypowiada się bardzo ostrożnie. Zalicza do nich jednak wyraźnie „funkcje techniczne” wytworu. Rozumienie tego terminu jest nieco pokrętne, bo np. w sprawie C-469/17 Funke Medien za „funkcje techniczne” uznał zawartość informacyjną raportów o sytuacji wojskowej w Afganistanie. Dla potrzeb dalszych rozważać posłużę się uproszczeniem i założę, że do takich niechronionych idei należy sam temat utworu i zasadniczo jego treść. W naszym fotograficznym przykładzie sam wybór tematu zdjęcia, decyzja o tym, co ma ono przedstawiać (koleżankę z pracy, krzywą wieżę w Pizie, bałagan na biurku), nie będzie decydował o ochronie dzieła. Nie wystarczy dla uznania fotografii za utwór.
Jakich wyborów można dokonać w Midjourney?
Pora wrócić do Midjourney. Możemy użyć tego narzędzia w różny sposób. Po pierwsze możemy zrobić tak, jak to robi 99% użytkowników, czyli po prostu wpisać do prompta to, co obrazek ma przedstawiać. Np. tak, jak w grafice ilustrującej ten artykuł zażądać obrazka przedstawiającego „astronautę, jadącego na oklep na tyranozaurze po powierzchni Marsa”. Czy w ten sposób stworzyliśmy utwór? Nie.1 Określiliśmy tylko, co nasz obrazek ma przedstawiać. Nasze wybory, nawet jeżeli były oryginalne, odnosiły się do tematu obrazka, a więc tej sfery, która pozostaje poza zakresem ochrony. Nie zdeterminowały natomiast formy wyrażenia. Najprościej można się o tym przekonać wpisując ten prompt wiele razy i za każdym razem otrzymując inny obrazek. Tyranozaur może być zwrócony w lewo, tłem może być grupka astronautów albo lądujący statek kosmiczny, Mars może być bardziej czerwony itp. itd.

Czy to zamyka dyskusję? A skądże. Midjourney potrafi o wiele więcej. Nasz prompt może określać atmosferę obrazka (np., że ma ona być „epicka” albo „romantyczna”), możemy wybrać stylistykę (fotorealistyczną, komiksową czy nawet imitującą malarstwo olejne) i cały szereg innych parametrów odnoszących się do tego, jak obrazek ma WYGLĄDAĆ. Midjourney będzie nadal generował różne obrazki, ale będą one już do siebie bardziej podobne. Możemy iść jeszcze dalej i zacząć szczegółowo opisywać kompozycję. Np. gdzie – względem centrum obrazka – ma być umieszczony dany obiekt, ilu astronautów ma być w tle, jaki kolor ma dominować. Czy to już utwór? Zdecydowanie cieplej, ale załóżmy, że trafimy na AI-sceptycznego sędziego i nadal nie będzie przekonany.
Musimy się więc bardziej postarać. Pomoże w tym nieoficjalna dokumentacja do Midjourney, którą łatwo można znaleźć na Githubie.2 Opisuje ona parametry, jakie można wpisać do prompta przy generowaniu fotorealistycznych grafik, aby zachować kontrolę nad ostatecznym rezultatem. Są one typowo „fotograficzne”: szerokość otwarcia wirtualnej „przysłony” (co wpływa na głębię ostrości i operowanie światłem), marka i czułość filmu (decydujące o charakterystyce barwnej czy ziarnistości), marka i parametry optyczne obiektywu (determinujące zniekształcenia i proporcje obiektów), jego jasność (znów światło), długość ogniskowej (przybliżenie), korpus „aparatu” (istotne dla realizmu i stylizacji obrazka) czy czas otwarcia migawki. Innymi słowy prompt w Midjourney daje takie same możliwości, jak manualne ustawienia aparatu fotograficznego, a nawet pozwala wybrać sam „aparat” i „obiektyw”, którym wykonamy „zdjęcie”.
Czyli co? Da się?
Śmiem więc twierdzić, że przestrzeń dla dokonywania „swobodnych i twórczych” wyborów przy generowaniu grafik w Midjourney, i to takich, które wpływają na formę wytworu, jest co najmniej na podobnym poziomie, jak przy tworzeniu prostej fotografii portretowej, jak w sprawie w sprawie C‑145/10 Painer. Jeżeli więc utworem może być wykonane przez panią Painer zdjęcie dziecka w przedszkolu, w przypadku którego wybory pani Painer polegały na określeniu tła, określeniu pozycji i wyrazu twarzy, obsłudze aparatu fotograficznego oraz procesu wywołania, to utworem może być również obrazek wygenerowany przez Midjourney w oparciu o rozbudowany prompt, zawierający opisane wyżej parametry. To, że rezultaty osiągnięte na podstawie danego promptu nie będą w pełni powtarzalne, nie powinno mieć dla prawa autorskiego znaczenia. Inaczej wyeliminowalibyśmy ochronę choćby tych wszystkich utworów, które zawierają w sobie elementy przypadku.
Czy to oznacza, że KAŻDY obrazek z Midjourney może być chroniony prawem autorskim? Oczywiście, że nie. Odsetek użytkowników używających tego narzędzia w sposób świadomy, do osiągnięcia z góry założonego efektu, jest znikomy. Reszta z nas zadowoli się prostym rezultatem, który i tak będzie good enough, a którego ochronę w ramach prawa autorskiego naprawdę trudno poważnie rozważać. Tyko czy nie przypomina to sytuacji z tymi tysiącami zdjęć, które każdy z nas ma w swoim smartfonie?
- Uwagę, że można dyskutować o ochronie oryginalnej treści, np. odwołując się do klasycznego ujęcia J. Kohlera, odrzucamy jako niezorganizowaną. ↩︎
- https://github.com/ymgenesis/Midjourney-Photography ↩︎
ilustracja generowana przez AI
Doktor nauk prawnych i radca prawny specjalizujący się w prawie własności intelektualnej i nowych technologii. Łączę praktykę prawniczą z działalnością naukową, dzieląc się wiedzą i doświadczeniem na blogu. Dowiedz się więcej…