Wyrok w sprawie Getty Images vs Stability AI

4 listopada 2025 r. High Court of Justice (Business and Property Courts, Intellectual Property List) wydał wyrok w sprawie Getty Images v. Stability AI ([2025] EWHC 2863 (Ch)). Orzeczenie, liczące ponad 200 stron, dotyczy jednego z pierwszych sporów sądowych o wykorzystanie materiałów chronionych prawem autorskim do trenowania generatywnych modeli AI. Sędzia Joanna Smith DBE oddaliła roszczenia Getty w zakresie naruszenia prawa autorskiego. Wyrok częściowo uwzględnił jedynie zarzuty dotyczące znaków towarowych.

Tło sprawy

Getty Images, operator jednej z największych bibliotek stockowych na świecie (w tym marki iStock), pozwał Stability AI w styczniu 2023 r. Zarzuty obejmowały: naruszenie praw autorskich do 7,3 mln utworów w wersji 1 modelu i 4,4 mln w wersji 2, naruszenie prawa do bazy danych, naruszenie znaków towarowych oraz passing off. Getty twierdziło, że Stability AI bezprawnie pobrało („zeskrobało") miliony fotografii z serwisu Getty w celu wytrenowania modelu Stable Diffusion. Spór opisywałem już na blogu i można o nim poczytać w tym artykule.

Zarzuty wycofane w toku postępowania

Przed wydaniem wyroku Getty stopniowo ograniczało zakres roszczeń. Zarzut naruszenia praw autorskich przez proces trenowania modelu został wycofany po ustaleniu, że trening odbywał się poza terytorium Wielkiej Brytanii, co wykluczało jurysdykcję sądu angielskiego. Roszczenie dotyczące generowania outputów powielających zdjęcia Getty zredukowano z milionów do 13 utworów, a następnie całkowicie porzucono wobec niemożności wykazania istotnego podobieństwa („substantial similarity"). Getty zrezygnowało również z zarzutu naruszenia prawa sui generis do bazy danych.

Prawo autorskie – model jako „infringing copy"

Po wycofaniu pozostałych roszczeń w zakresie copyright pozostało pytanie, czy wytrenowany model Stable Diffusion stanowi „infringing copy" (kopię naruszającą) w rozumieniu prawa angielskiego jako rezultat przetworzenia materiałów chronionych. Sędzia Smith uznała, że model nie jest taką kopią. W uzasadnieniu wskazała, że aby dany przedmiot (article) mógł zostać uznany za infringing copy, musi „at some point in time have consisted of, contained, or stored a copy of a copyright work". Model Stable Diffusion nie przechowuje kopii danych treningowych. W procesie uczenia maszynowego rozpoznaje wzorce i koduje je numerycznie w parametrach (wagach) sieci neuronowej.

Sąd zwrócił uwagę na skalę kompresji: dane treningowe o objętości 220 TB zostały przekształcone w plik modelu o wielkości 3,44 GB. Ta dysproporcja wskazuje, że wagi modelu stanowią wynik ekstrakcji wzorców statystycznych, nie zaś kopie poszczególnych utworów. Na tej podstawie sąd orzekł, że model Stable Diffusion nie może zostać uznany za „infringing copy" w rozumieniu przepisów o wtórnym naruszeniu prawa autorskiego (secondary infringement). Ale jest tu istotne zastrzeżenie. Z wyroku nie wynika, że modele AI nie mogą memoryzować. Z wyroku wynika tak naprawdę tylko tyle, że nie wszystkie dane są memoryzowane, a Getty nie udało się wykazać memoryzacji w tym akurat konkretnym przypadku.

Wyrok nie przesądza natomiast kwestii legalności masowego pobierania utworów chronionych w celu trenowania modeli AI na terytorium Wielkiej Brytanii – ta kwestia nie została rozstrzygnięta z uwagi na ograniczenia jurysdykcyjne.

Znaki towarowe

W zakresie naruszenia znaków towarowych sąd stwierdził naruszenie w „extremely limited" zakresie. Dotyczyło ono wyłącznie wczesnych wersji modelu (Stable Diffusion 1 i 2), które w niektórych przypadkach generowały obrazy zawierające elementy wizualnie podobne do znaków wodnych iStock (należących do grupy Getty). Sąd zidentyfikował trzy przykłady takiego naruszenia na podstawie art. 10(1) i 10(2) Trade Marks Act 1994.

Roszczenia dotyczące nowszych wersji modelu (Stable Diffusion XL i 1.6) zostały oddalone w całości. Sąd oddalił również zarzuty z art. 10(3) TMA (naruszenie renomy znaku) z powodu braku wystarczających dowodów na powstanie szkody. Sędzia Smith zwróciła uwagę, że Getty w ramach postępowania dowodowego prowadziło własne eksperymenty – wprowadzało do modelu dosłowne opisy (captions) pochodzące z serwisu Getty oraz ich parafrazy wygenerowane przez ChatGPT. Te testy rzeczywiście generowały obrazy ze znakami wodnymi. Sąd ustalił jednak, że „no evidence that a single user in the UK had copied and pasted a verbatim Getty caption" w warunkach rzeczywistego użytkowania modelu. Brak dowodów na występowanie naruszeń „in the wild" skutkował oddaleniem roszczenia o dodatkowe odszkodowanie.

Znaczenie wyroku

Wyrok stanowi precedens w zakresie kwalifikacji modeli AI jako potencjalnych „infringing copies". Rozstrzygnięcie jest korzystne dla firm technologicznych rozwijających generatywną sztuczną inteligencję. Należy jednak uwzględnić ograniczenia tego orzeczenia: model Stable Diffusion w wersjach objętych sporem różni się od współczesnych modeli komercyjnych (np. aktualnych wersji Midjourney), które mogą wykazywać inną charakterystykę memoryzacji danych treningowych. Ponadto pojedyncze zdjęcia stockowe mają odmienną pozycję w zbiorze treningowym niż ikoniczne, wielokrotnie powielane obrazy. Już wtedy zresztą model zdawał się doskonale wiedzieć, jak wygląda Mona Lisa.

Getty Images kontynuuje równoległe postępowanie przeciwko Stability AI w Stanach Zjednoczonych, gdzie zlokalizowany był proces trenowania modelu i gdzie roszczenia dotyczące bezpośredniego naruszenia praw autorskich (direct infringement) mogą zostać rozpatrzone merytorycznie.