Like vs Google: pierwsza sprawa AI przed Trybunałem Sprawiedliwości UE

Pierwsza sprawa AI przed TSUE już jest. Węgierski wydawca prasowy pozwał Google’a, bo chatbot streścił artykuł o delfinach w Balatonie. Brzmi absurdalnie? W sprawie C-250/25 Like Company przeciwko Google Ireland (bo to o niej mowa), budapesztański Környéki Törvényszék (odpowiednik naszego sądu okręgowego) sformułował jednak pytania w taki sposób, że obejmują one najgorętsze obecnie problemy na styku AI i prawa autorskiego. Mam jednak wątpliwości, czy TSUE na wszystkie pytania odpowie i czy te odpowiedzi na pewno będą dotyczyć sztucznej inteligencji. Nie wiem też, czy spodobają się wydawcom.

Jakie pytania zadał sąd krajowy?

Tłem sporu było wyświetlenie przez chatbota powiązanego z wyszukiwarką Google (obecnie Google Gemini) streszczenia artykułu, do którego prawa pokrewne do publikacji prasowej przysługują powodowi (wydawcy portalu internetowego). Pytania zmierzają do ustalenia:

  1. Czy wyświetlanie przez chatbota opartego na dużym modelu językowym (LLM) tekstu częściowo identycznego z treścią stron internetowych wydawców prasowych stanowi publiczne udostępnianie?
  2. Czy proces trenowania chatbota stanowi zwielokrotnianie?
  3. Czy takie zwielokrotnianie podpada pod wyjątek dotyczący eksploracji tekstów i danych (TDM) z art. 4 dyrektywy 2019/790 o prawie autorskim na jednolitym rynku cyfrowym (DSM)?
  4. Czy jeżeli użytkownik wydaje polecenie, które odpowiada tekstowi zawartemu w publikacji prasowej lub które odnosi się do tego tekstu, a chatbot następnie generuje swoją odpowiedź na podstawie polecenia wydanego przez użytkownika to taka sytuacja stanowi zwielokrotnianie tej publikacji przez dostawcę usługi?

Żeby być precyzyjnym, należy zauważyć, że wszystkie pytania dotyczą praw pokrewnych wydawców przewidzianych w art. 15 dyrektywy DSM, a nie prawa autorskiego sensu stricto. Przepis ten przyznaje wydawcom prawa wynikające z art. 2 i art. 3 ust. 2 dyrektywy 2001/29/WE (InfoSoc) w zakresie korzystania online z ich publikacji prasowych przez dostawców usług społeczeństwa informacyjnego, tj. szeroko rozumiane prawo zwielokrotniania i tzw. making avaiable right (udostępnianie w sposób umożliwiający publiczności dostęp w miejscu i czasie przez nią wybranym). Sama treść tych praw jest identyczna tak w przypadku prawa autorskiego, jak i praw pokrewnych. Ale to, że przedmiot prawa jest tu inny, nie jest jednak bez znaczenia prawnego.

Ponadto pytania odnoszą się do realnych problemów jakie AI ma z prawem autorskim (a może prawo autorskie z AI). Dyskutujemy przecież, czy „na wejściu” (podczas procesu uczenia maszynowego) dochodzi do zwielokrotniania, a jeżeli tak, to czy to czy takie zwielokrotnianie znajduje podstawę w wyjątku dotyczącym TDM, a więc pytania 2 i 3 nie dotyczą problemu, który nie istnieje. Tak samo wątpliwości wywołuje ocena przypadków, w których „na wyjściu” (w wynikach generowanych przez model) pojawia się coś, co powtarza dane treningowe. Wówczas – tak jak w pytaniu 1 i (częściowo) 4 możemy się zastanawiać, czy to jest publiczne udostępnianie lub zwielokrotnianie, a także czy znaczenie ma to, w jaką interakcję z modelem wchodził wcześniej użytkownik.

Pytania nie są więc głupie. Nie wiem tylko, czy TSUE może i powinien na nie odpowiadać akurat w tej sprawie. Żeby zrozumieć dlaczego, trzeba się uważniej przyjrzeć faktom.

Skąd się wzięła sprawa Like vs Google?

Fakty są mniej więcej takie: powód zadał Google Gemini (dawniej Bard) pytanie Czy możesz przedstawić streszczenie w języku węgierskim internetowej publikacji prasowej, która ukazała się na stronie balatonkornyeke.hu, dotyczącej planu Kozsó wprowadzenia delfinów do jeziora? Google Gemini udzielił „szczegółowej odpowiedzi”, która zawierała streszczenie informacji pojawiających się w mediach informacyjnych należących do powoda (pkt 8 podsumowania wniosku). Pozwany podkreśla przy jednak, że treść odpowiedzi udzielonej przez chatbota nie jest identyczna z treścią odpowiednich artykułów prasowych powoda i odnosiła się jedynie do niektórych faktów pojawiających się w chronionych treściach (pkt 22 podsumowania).

Tu kryje się zasadnicza wątpliwość: co znaczy wspomniana w pytaniu pierwszym „częściowa identyczność”? Problem jest rzeczywiście ważny, ale dotyczy nie tyle sztucznej inteligencji, co prawa pokrewnego wydawców prasowych. Można go sformułować następująco: czy umieszczenie w sieci streszczenia artykułu (załóżmy, że zrobionego przez człowieka), powielającego wszystkie przedstawione w artykule fakty, ingeruje w prawo wydawcy prasowego? Gdyby chodziło o utwór, powiedzielibyśmy, że zapewne nie, bo prawo autorskie nie chroni faktów[1].

Po sieci krąży już link do artykułu o marzeniach i problemach piosenkarza Kozsó, którego streszczenie przez Google Gemini doprowadziło do sporu. Możemy więc zapoznać się z nim bliżej i – dzięki dobrodziejstwu tłumaczenia maszynowego – przekonać, że jest to krótka zbitka faktów (i „faktów) z różnych źródeł, sprawiająca wrażenie dość przypadkowo połączonych, niemal jakby była generowana maszynowo2. Znów gdyby chodziło o prawo autorskie, powiedzielibyśmy, że ta zbitka jest zbyt prosta, żeby była chroniona. Nieco mądrzej: zastosowalibyśmy koncepcję merger i powiedzieli, że w sytuacji, w której forma wyrażenia jest na tyle prosta, że zlewa się z wyrażoną ideą, całość nie jest chroniona, bo przyznanie w takim przypadku ochrony równałoby się objęciu ochroną idei.

Całej tej aparatury pojęciowej nie mamy w przypadku prawa pokrewnego wydawców prasowych. A dotykamy istotnej kwestii. Bo takie określenie zakresu przedmiotowego ochrony prawa pokrewnego wydawców wchodzi na kurs kolizyjny z art. 11 Karty Praw Podstawowych, czyli prawem do wolności wypowiedzi i informacji. I tu jest rzeczywiście istotne zagadnienie prawne, którym powinien zająć się TSUE. Ale to jest raczej pytanie o przedmiotowe granice prawa pokrewnego wydawców prasowych, niż o to, czy obecność pewnych treści w wynikach chatbota jest publicznym udostępnianiem.

Logika prawa unijnego jest przy tym taka, że trudno sobie wyobrazić, aby TSUE uznał, że prawo pokrewne wydawców umożliwia monopolizowanie faktów.

„Nie no, nabita była, panie sędzio!”

Ten okrzyk jednego z kibiców, jaki możemy usłyszeć po przyznaniu karego dla drużyny niemieckiej w meczu piłki nożnej, podczas którego Kwinto spotkał się z Duńczykiem w pierwszej części Vabanku, dobrze oddaje pewien drobny szczegół, który ujawnia się w pytaniu czwartym.

Mianowicie z opisu wynika, że Gemini (Bard) nie wygenerował streszczenia tak sam z siebie, tylko użytkownik we wcześniejszych interakcjach tę treść do Gemini wprowadził (pkt 23 wniosku). Znajduje to odbicie w treści pytania. Nie chodzi o to, czy jak bot zwielokrotnia dane wejściowe, to dochodzi do zwielokrotnienia. Chodzi o to, czy w sytuacji, w której użytkownik wcześniej wprowadza określony tekst, a bot fragmenty tego tekstu zwraca w odpowiedzi, czynności zwielokrotnienia dokonuje dostawca usługi.

Wyobraźmy sobie, że zacznę interakcję np. z ChatGPT i zażądam od niego, aby powtarzał za mną „To nie karnawał, ale tańczyć chcę / I będę tańczył z nią po dzień / To nie zabawa, ale bawię się / Bezsenne noce, senne dnie”. Oczywiscie ChatGPT w odpowiedzi powtórzy ten tekst i zapewne dojdzie w ten sposób do zwielokrotnienia fragmentu utworu Grzegorza Ciechowskiego. Ale istotne jest tu jest jeszcze to, kto zwielokrotnienia dokonał. Czyli czy zrobiłem to ja, wydając odpowiednie polecenia maszynie, czy dostawca usługi, który mi maszynę zdolną do wykonania takiego polecenia udostępnił.

Problem jest dla prawa autorskiego nienowy i przewija się przez kilka wyroków TSUE. Najogólniej ujmując ocena takich przypadków powinna uwzględniać, czy rola dostawcy usługi jest aktywna, czy pasywna. Przykładowo ze sprawy C-433/20 Austro-Mechana wynika, że samo „pasywne” dostarczenie dysku w chmurze, na który użytkownik może wrzucać pliki, nie prowadzi do zwielokrotnienia tych plików przez dostawcę usługi[3]. Z kolei w wyroku w połączonych sprawach C-682/18 i C-683/18 YouTube i Cyando Trybunał podkreślił, że jeżeli dostawca umożliwia jedynie przechowywanie informacji i nie odgrywa aktywnej roli, nie można mu przypisać „publicznego udostępniania” utworów w rozumieniu art. 3 dyrektywy 2001/29/WE[4].

Znów – logika orzecznictwa TSUE sugeruje, że w sprawie Like vs Google podmiotem zwielokrotniającym publikację prasową wprowadzoną wcześniej przez użytkownika nie był Google ponieważ akurat w zakresie tej treści jego rola była pasywna. A więc nie ponosi za nie odpowiedzialności. I nie trzeba tego uzasadniać tak jak to (chyba) próbuje robić Google, czyli przez art. 5 ust. 1 dyrektywy InfoSoc i art. 4 dyrektywy DSM[5].

A co z TDM-ami?

Zgodnie z utrwalonym orzecznictwem TSUE, zadaniem Trybunału w ramach procedury odesłania prejudycjalnego, jest udzielenie sądowi krajowemu użytecznej odpowiedzi, umożliwiającej rozstrzygnięcie sporu zawisłego przed tym sądem[6]. Z tego powodu Trybunał – gdy zachodzi taka potrzeba – może przeformułować przedstawione mu pytania lub ograniczyć zakres odpowiedzi wyłącznie do tych kwestii, które mają znaczenie dla rozstrzygnięcia sprawy, a pominąć te aspekty, które mają charakter hipotetyczny, teoretyczny lub nie odnoszą się do faktycznych okoliczności sprawy[7].

TSUE przeformułuje więc pytanie, jeżeli uzna, że w ten sposób lepiej pomoże sądowi krajowemu rozstrzygnąć spór. Moim zdaniem takie podejście jest przedopobne zwłaszcza w przypadku pytania 1. A co z pytaniem 2 i 3? Z tego, co na razie wiemy faktyczne okoliczności sprawy nie wskazują, aby odpowiedź na te pytania była sądowi krajowemu rzeczywiście potrzebna. Oczywiście podsumowanie wniosku może nie dawać pełnego obrazu, ale – chociaż sam bym chętnie przeczytał co TSUE ma do powiedzenia na temat stosowania art. 4 dyrektywy DSM do trenowania AI – nie sądzę, żeby odpowiedzi padły akurat w tej sprawie.

Mimo wszystko mamy jednak problem

Przy wszystkich przywołanych wyżej ocenach prawnych sprawa Like vs Google odzwierciedla jednak realny konflikt, jaki narasta pomiędzy dostawami usług wyszukiwania i dostawcami treści. Dotychczasowy relacja ich relacja przypominała raczej symbiozę. Wyszukiwarki tworzyły swoją ofertę wykorzystując cudze treści, ale jednocześnie generowały ruch do stron dostawców tych treści. Przy wszystkich wątpliwościach prawnych, jakie związane są z działaniem usług wyszukiwania (to osobny problem, też z ciekawym wątkiem węgierskim), jakoś to działało.

Czas przeszły nie został użyty przeze mnie przypadkowo. Usługi takie jak Google Gemini zintegrowany z wyszukiwarką, Perplexity, nowe interfejsy wyszukiwania w ChatGPT czy Claude, wywracają bowiem stolik. Nadal usługa budowana jest na cudzych treściach. Ale nie kieruje już ruchu na strony tych, którzy treści tworzą. Poza trudnymi do przewidzenia konsekwencjami dla ekosystemu informacyjnego oczywiste jest, że spraw podobnych do Like vs Google będzie więcej. Znacznie więcej.


[1] To dość złożony problem, ale odsyłam do sprawy C-469/17 Funke Medien. W skrócie, zawartość informacyjna raportów wojskowych o sytuacji Budeswehry w Afganistanie została uznana za funkcję techniczną utworu (ideę), w każdym przypadku wyłączoną spod ochrony.

[2] ChatGPT podsumował dla mnie ten tekst w taki sposób: Kozso, znany węgierski muzyk i malarz, mimo licznych życiowych zawirowań nie porzucił swojego wieloletniego marzenia o sprowadzeniu słodkowodnych delfinów do akwarium nad Balatonem, nad czym intensywnie pracuje. Ostatnio był hospitalizowany, lecz szybko wrócił do aktywności artystycznej, odnosząc duże sukcesy jako malarz, a jego życie prywatne i zawodowe było naznaczone zarówno spektakularnymi osiągnięciami, jak i kontrowersjami, w tym pobytem w więzieniu i wyrokiem za kradzież prądu. Prawdę powiedziawszy interwencja LLM-a nadała tu pierwotnemu tekstowi sporo polotu i sensu.

[3] Wyrok Trybunału Sprawiedliwości Unii Europejskiej z dnia 24 marca 2022 r. w sprawie C-433/20 (Austro-Mechana przeciwko Strato AG) dotyczył kwestii przechowywania plików użytkownika, w tym plików muzycznych, w chmurze obliczeniowej w kontekście prawa autorskiego. Trybunał orzekł, że przechowywanie przez użytkownika kopii utworu chronionego prawem autorskim w chmurze obliczeniowej stanowi zwielokrotnienie na dowolnym nośniku w rozumieniu art. 5 ust. 2 lit. b) dyrektywy 2001/29/WE. Oznacza to, że wyjątek dotyczący kopii na użytek prywatny ma zastosowanie również do przechowywania utworów w chmurze, pod warunkiem że kopiowanie odbywa się wyłącznie do celów prywatnych i niekomercyjnych. A to implikuje fakt, że zwielokrotnienia takiego dokonywał użytkownik (który na użytek prywatny się powołać może), a nie dostawca usługi, którego wskazany przepis nie dotyczy.

[4] „Gdy operator platformy internetowej nie odgrywa aktywnej roli, pozwalającej mu uzyskać wiedzę lub kontrolę nad zamieszczanymi na niej treściami, nie można uznać, że sam dokonał czynu publicznego udostępniania (…)”. Wyrok z 22 czerwca 2021 r. w połączonych sprawach YouTube i Cyando (C-682/18 i C-683/18).

[5] W pkt 21 podsumowania wniosku znajdziemy taką argumentację pozwanego: [Nawet] gdyby fakt wyświetlenia przez pozwanego odpowiedzi stanowił przypadek zwielokrotnienia lub publicznego udostępnienia, takie zwielokrotnienie byłoby nadal objęte wyjątkiem przewidzianym w przypadku tymczasowych czynności zwielokrotniania (art. 5 ust. 1 dyrektywy 2001/29) oraz eksploracji tekstów i danych (art. 4 dyrektywy 2019/790). W związku z tym fragmenty, które pojawiają się w odpowiedzi, nie przekraczają limitów dotyczących treści i zakresu, ani nie [wykraczają poza] wyjątki od ochrony prawnej.

[6] Por. wyroki: z dnia 28 czerwca 2018 r., Crespo Rey, C‑2/17, EU:C:2018:511, pkt 40; z dnia 26 września 2019 r., UTEP 2006, C‑600/18, EU:C:2019:784, pkt 17

[7] Por. wyrok w sprawie C‑666/18, ECLI:EU:C:2019:1099, IT Development SAS przeciwko Free Mobile SAS, pkt 26