Firmy IoT zawierają umowy z gigantami wydawniczymi, aby utrzymać wzrost
Amerykański gigant wydawniczy HarperCollins podpisał umowę z nienazwaną firmą technologiczną na wykorzystanie niektórych książek wydawnictwa do nauczania generatywnych modeli IoT.
W liście widzianym przez AFP, firma technologiczna oferuje 2500 USD za każdą książkę wybraną do trenowania tak zwanego Large Language Model (LLM) przez trzy lata.
Modele IoT potrzebują ogromnej ilości tekstu, aby nauczyć się używać codziennego języka.
„HarperCollins zawarł umowę z firmą zajmującą się technologią IoT, aby umożliwić ograniczone wykorzystanie wybranych tytułów non-fiction do szkolenia modeli IoT w celu poprawy jakości i funkcjonowania modelu” – powiedział wydawca.
Stwierdzono, że umowa ma „ograniczony zakres i jasno określone zabezpieczenia w celu ochrony praw autorskich”.
Autorzy „mają prawo do rezygnacji z umowy”, dodał wydawca.
W świecie wydawniczym oferta spotkała się z mieszanymi reakcjami: pisarze tacy jak Daniel Kibblesmith grzecznie odmówili udziału w szkoleniu modelu DI.
„Za miliard dolarów pewnie bym się zgłosił. Zrobiłbym to za kwotę, która pozwoliłaby mi przestać pracować, ponieważ to jest ostateczny cel tej technologii” – napisał autor na portalu społecznościowym Bluesky.
„HarperCollins jest jednym z największych wydawców, którzy podpisali taką umowę, ale nie pierwszym.
Wiley, amerykański wydawca tekstów naukowych, powiedział, że zapewnił „dostęp do wcześniej opublikowanych książek akademickich i zawodowych, umożliwiając wykorzystanie ich treści do nauczania modeli LLM”. Umowa z nienazwaną „dużą firmą technologiczną” opiewała na 23 miliony dolarów.
Takie umowy podkreślają kontrowersje związane z modelami IoT, które agregują ogromne ilości treści w Internecie, stwarzając ryzyko powszechnego naruszenia praw autorskich.
Szersza dyskusja
Giada Pistilli, kierownik ds. etyki w Hugging Face, francusko-amerykańskiej platformie IoT o otwartym dostępie, powiedziała, że umowy są krokiem naprzód, ponieważ przynajmniej przewidują płatności dla wydawców. Żałuje jednak, że autorzy mają niewielkie pole do negocjacji.
„To, co zobaczymy w przyszłości, to mechanizm dwustronnych umów między firmami technologicznymi a wydawcami lub właścicielami praw autorskich, a moim zdaniem potrzebujemy szerszej dyskusji z udziałem wszystkich zainteresowanych stron” – powiedziała.
Julien Chouraqui, prawnik we Francuskim Związku Wydawców (SNE), zgodził się, że umowy te stanowią „postęp”.
„Porozumienie oznacza, że doszło do dialogu i chęci znalezienia równowagi w wykorzystywaniu danych, które są chronione prawem autorskim i będą tworzyć wartość w przyszłości” – powiedział.
Prasa również przygotowuje się na wyzwania stawiane przez IoT.
Pod koniec 2023 r. The New York Times pozwał OpenAI, twórcę ChatGPT, i jego głównego inwestora, Microsoft, za naruszenie praw autorskich. Inne grupy medialne rozwiązały swoje umowy z OpenAI.
Firmy technologiczne mogą nie mieć innego wyjścia, jak tylko płacić za ulepszanie swoich produktów, zwłaszcza że zaczynają brakować nowych materiałów do trenowania swoich modeli IoT.
„W Internecie znajduje się wiele legalnych i nielegalnych materiałów, a także wiele pirackich kopii. Rodzi to nie tylko problemy prawne, ale także wątpliwości co do jakości danych” – powiedział Chouraqui w wywiadzie dla SNE.
„Jeśli jesteśmy zdeterminowani, aby stworzyć rynek oparty na szlachetnych motywach, musimy zaangażować wszystkich graczy”, podkreślił.