DPG Media vs HowardsHome: TDM, robots.txt, prawa wydawców prasowych i kanały RSS

DPG Media vs HowardsHome to wyrok Sądu Okręgowego w Amsterdamie z 30 października 2024 roku (sygn. C/13/737 170 / HA ZA 23-690)1, który wskazuje na ciekawe możliwości interpretacji dyrektywy 2019/790 o prawie autorskim na jednolitym rynku cyfrowym (DSM)2 w zakresie eksploracji tekstu i danych (TDM), praw wydawców prasowych oraz skuteczności plików robots.txt przy zastrzeganiu praw w ramach opt-out dla uzasadnienia legalnosci usługi agregacji RSS. Są nawet smaczki dotyczące prawa sui generis do baz danych.

Trochę faktów

DPG Media vs Howards Home zaczęła się w sposób trochę zawikłany. Holenderska firma HowardsHome, założona w 2001 roku, specjalizowała się w świadczeniu usług monitoringu mediów. Spółka obsługiwała około 60 klientów, w tym instytucje publiczne, przedsiębiorstwa prywatne, organizacje branżowe oraz wydawców, oferując im kompleksowy system śledzenia i agregacji informacji prasowych. Obecnie nie prowadzi już działalności.

Głównym elementem działalności HowardsHome było przetwarzanie około 30 000 sygnałów informacyjnych dziennie, które były pozyskiwane przede wszystkim z publicznie dostępnych kanałów RSS (Really Simple Syndication). System firmy automatycznie gromadził i kategoryzował informacje, tworząc spersonalizowane alerty zawierające hiperłącza do oryginalnych artykułów, ich tytuły, krótkie opisy (nieprzekraczające 150 znaków) oraz, jeśli były dostępne publicznie, miniatury obrazów. Treści te były udostępniane klientom poprzez specjalnie zaprojektowany portal cyfrowy, który umożliwiał zaawansowane filtrowanie i sortowanie informacji według tematów, dat czy słów kluczowych.

Do 2022 roku HowardsHome świadczył usługi monitoringu mediów w oparciu o umowę (Alliance Agreement) z LexisNexis, który pełnił rolę autoryzowanego dystrybutora treści pochodzących od głównych wydawców prasowych – belgijskich koncernów DPG Media i Mediahuis (kontrolujących łącznie ponad 90% holenderskiego rynku informacji online) oraz należącej do Mediahuis gazety NRC. LexisNexis rozwiązał tę umowę w marcu 2022 roku, argumentując swoją decyzję naruszeniami warunków licencyjnych przez HowardsHome. Podstawowym zarzutem było to, że spółka, oprócz treści licencjonowanych przez LexisNexis, pozyskiwała i dystrybuowała wśród swoich klientów również materiały pochodzące z innych źródeł – zarówno poprzez agregację publicznie dostępnych kanałów RSS, jak i poprzez automatyczne pobieranie treści ze stron internetowych wydawców (web scraping), w tym również zawartości chronionej paywallem.

Krótko po wypowiedzeniu umowy przez LexisNexis wydawcy wystosowali do HowardsHome wezwanie z żądaniem zaprzestania naruszeń ich praw wyłącznych, w tym przysługującego im prawa pokrewnego wydawców prasowych, prawa autorskiego i prawa sui generis do bazy danych. W ich ocenie prowadzona przez spółkę zautomatyzowana eksploracja i agregacja treści prasowych na dużą skalę stanowi naruszenie przysługujących im praw do treści. W wezwaniu zażądano od HowardsHome natychmiastowego zaprzestania naruszeń albo uregulowania kwestii licencyjnych poprzez zawarcie umowy z jednym z dystrybutorów treści – LexisNexis lub alternatywnie ArticlePro (spółki utworzonej przez wydawców w celu licencjonowania treści dla mniejszych podmiotów). Wobec odmowy spełnienia tych żądań przez HowardsHome sprawa trafiła na drogę sądową.

Prawo autorskie i TDM

Pierwszą podstawą roszczeń wydawców było prawo autorskie do utworów zawartych w publikacjach prasowych. Wydawcy powoływali się na przysługujące im prawa do treści dziennikarskich. Istotnym elementem tej argumentacji było twierdzenie, że nawet krótkie fragmenty tekstów mogą stanowić przejaw twórczości chronionej prawem autorskim, zgodnie z utrwalonym orzecznictwem TSUE zapoczątkowanym wyrokiem w sprawie C-5/08 Infopaq,3 w którym TSUE dopuścił przecież potencjalną możliwość ochrony fragmentów artykułów prasowych o długości 11 słów.

Sąd rzeczywiście potwierdził możliwość prawnoautorskiej ochrony fragmentów artykułów w kanałach RSS. Uznał jednak, że działalność HowardsHome jest objęta kilkoma wyjątkami od prawa autorskiego. Po pierwsze, sąd zastosował wyjątek dotyczący przeglądów prasy (art. 15a ust. 2 holenderskiej ustawy o prawie autorskim, trochę podobny do art. 25 ust. 1 pkt 2 do 5 polskiej ustawy o prawie autorskim i prawach pokrewnych). Stwierdził, że krótkie fragmenty tekstów wykorzystywane przez HowardsHome, wraz z linkami do oryginalnych artykułów, spełniają przesłanki dozwolonych przeglądów prasy.

Po drugie, co dla nas bardziej interesujące, sąd przyjął, że działalność spółki jest objęta wyjątkiem dotyczącym eksploracji tekstu i danych (art. 15o ustawy). Oceniając przesłanki zastosowania tego przepisu uznał, że publiczna dostępność kanału RSS jest wystarczająca do spełnienia warunku „zgodnego z prawem dostępu”, niezależnie od tego, czy same artykuły znajdują się za paywallem, czy nie. Przedmiotem eksploracji jest bowiem sam kanał RSS, który pozostaje otwarty dla wszystkich użytkowników Internetu, a nie artykuły, do których linki są udostępniane za pomocą kanału. Jednocześnie ocenił skuteczność zastrzeżenia prawa w pliku robots.txt. Potwierdził mianowicie, że taki sposób zastrzeżenia praw spełnia wymogi formy zdatnej do odczytu maszynowego. Jednakże w analizowanej sprawie wydawcy wykluczali jedynie określone, wymienione z nazwy boty AI (jak GPTBot czy ChatGPT-User), nie odnosząc się do innych form TDM, takich jak agregacja RSS, w konsekwencji zastrzeżenie to nie dotyczyło działalności HowardsHome.

Zastosowanie wyjątku dotyczącego TDM sąd ocenił również z perspektywy testu trójstopniowego (art. 5 ust. 5 dyrektywy 2001/29/WE o prawie autorskim w społeczeństwie informacyjnym, art. 9 (2) konwencji berneńskiej) uznając, że działalność HowardsHome nie narusza normalnej eksploatacji utworów przez wydawców. Uznano, że agregacja linków wraz z krótkimi zajawkami nie stanowi konkurencji dla podstawowej działalności wydawców, która koncentruje się na sprzedaży prenumerat, wydań papierowych i cyfrowych oraz pojedynczych artykułów.

Prawa pokrewne wydawców prasowych

Kolejną podstawą było prawo pokrewne do publikacji prasowych przewidziane w art. 7b holenderskiej ustawy o prawach pokrewnych, implementującej art. 15 Dyrektywy DSM. Zgodnie z tymi przepisami, wydawcy publikacji prasowych korzystają z wyłącznego prawa do udzielania zgody na reprodukcję i publiczne udostępnianie ich publikacji prasowych w zakresie wykorzystania online przez dostawców usług społeczeństwa informacyjnego.

W tym zakresie kluczowe dla rozstrzygnięcia było rozumienie pojęcia „bardzo krótkich fragmentów” publikacji prasowych. Zgodnie z art. 7b holenderskiej ustawy, w ślad za art. 15 (1) dyrektywy DSM, prawa do publikacji prasowych nie mają bowiem nie mają zastosowania „do pojedynczych słów lub bardzo krótkich fragmentów publikacji prasowej”. Sąd uznał, że wykorzystywanie przez HowardsHome fragmentów o długości 150 znaków (około 20 słów) mieści się w granicach tego wyłączenia. W ocenie sądu wydawcy nie wykazali, że tak ograniczone wykorzystanie treści podważa ich inwestycje w sposób szkodzący normalnej eksploatacji publikacji prasowych. Sąd podkreślił, że wyłączenie to należy interpretować funkcjonalnie, z uwzględnieniem dwóch przeciwstawnych celów: ochrony inwestycji wydawców z jednej strony oraz zapewnienia swobodnego przepływu informacji faktycznych z drugiej strony. W konsekwencji uznał, że fragmenty wykorzystywane przez HowardsHome nie zastępują oryginalnych publikacji, a jedynie sygnalizują ich istnienie, co nie narusza istoty prawa pokrewnego wydawców.

Prawo sui generis do bazy danych

Wreszcie trzecią podstawą roszczeń wydawców było prawo sui generis do baz danych, przewidziane w dyrektywie 96/9/WE,implementowanej do holenderskiego prawa odrębną ustawą. Wydawcy twierdzili, że ich serwisy internetowe stanowią bazy danych chronione prawem sui generis ze względu na istotną inwestycję w pozyskiwanie, weryfikację i prezentację zawartości, a systematyczne i powtarzające się pobieranie danych przez HowardsHome narusza to prawo.

Również w tym zakresie sąd oddalił roszczenia wydawców. Przyjął, że nie ma potrzeby szczegółowego rozstrzygania, czy strony internetowe wydawców stanowią bazy danych chronione prawem sui generis, dlatego, że nawet przy założeniu istnienia takiej ochrony, działalność HowardsHome byłaby objęta wyjątkiem TDM. Ocena zastosowania tego wyjątku w odniesieniu do baz danych jest zaś tka sama, jak na gruncie prawa autorskiego – spółka miała legalny dostęp do publicznie dostępnych treści wydawców, a wydawcy nie zastrzegli w odpowiedni sposób swoich praw w kontekście eksploracji danych.

Znaczenie

Wyrok pozwala na kilka spostrzeżeń ogólniejszej natury. Mnie interesują dwie kwestie. Po pierwsze TDM to nie tylko trenowanie sztucznej inteligencji. Zafiksowaliśmy się na AI, bo ten obszar zdaje się mieć obecnie największe znaczenie gospodarcze. Ale wyjątek dotyczący eksploracji tekstu i danych może służyć za podstawę wielu zautomatyzowanych usług opartych wymagających dla działania zwielokrotniania treści chronionych prawem autorskim.

Po drugie zastrzeganie praw za pomocą pliku robots.txt jest trudniejsze niż się wydaje. A ściślej stawia właścicieli witryn przed diabelską alternatywą. Wykluczenie wszystkich robotów wykluczy nie tylko te, które odczytują zawartość witryny dla potrzeb TDM, ale również te, które indeksują strony dla wyszukiwarek internetowych. Nikt przy zdrowych zmysłach nie może sobie zaś pozwolić na wycięcie ruchu przychodzącego z wyszukiwarek internetowych. Z kolei wykluczenie konkretnych, określonych z nazwy botów takich firm jak Open AI czy Anthropic nie jest – jak trzeźwo zauważył sąd w sprawie HowardsHome – skuteczne wobec tych, które nie zostały w pliku robots.txt wprost wymienione.

Zastrzeżenia w pliku robots.txt napotykają więc na ograniczenia tego standardu. Powstał on dla potrzeb zarządzania indeksowaniem witryn przez wyszukiwarki internetowe, a nie ochrony określonych treści przed konkretnymi zastosowaniami (jak szkolenie AI). Wątpliwości budzi więc forsowanie tego standardu w projektach kodeksu postępowania opracowywanego zgodnie z art. 56 AI Act.

ilustracja: pixabay


  1. https://uitspraken.rechtspraak.nl/details?id=ECLI:NL:RBAMS:2024:6563 ↩︎
  2. https://eur-lex.europa.eu/legal-content/PL/TXT/HTML/?uri=CELEX:32019L0790 ↩︎
  3. https://eur-lex.europa.eu/legal-content/PL/TXT/?uri=CELEX:62008CJ0005 ↩︎