Generatory SI łamią prawa autorskie. Tworzą nawet zdjęcia prawdziwych osób
Generatory obrazów napędzane sztuczną inteligencją potrafią dokładnie odwzorować zdjęcia chronione prawami autorskimi. Naukowcy, którzy przyjrzeli się bliżej temu problemowi, odkryli, że narzędzia takie jak Stable Diffusion tworzą nawet zdjęcia przedstawiające prawdziwe osoby.
Wraz z uruchomieniem generatorów obrazów takich jak DALL·E czy Stable Diffusion pojawiły się również obawy o naruszenie praw autorskich. W końcu wspomniane narzędzia do efektywnego działaniu muszą wcześniej zostać "nakarmione" masą obrazów stworzonych przez człowieka. Problem jest na tyle widoczny, że przeciwko Stable Diffusion wytaczane są procesy sądowe.
Dalsza część artykułu pod materiałem wideo
Prawa autorskie a sztuczna inteligencja
Z tego względu naruszaniu praw autorskich przez generatory obrazów postanowili przyjrzeć się badacze z Google, DeepMind, Uniwersytetu Kalifornijskiego w Berkeley, Politechniki Federalnej w Zurychu i Uniwersytetu Princeton. Wspólnymi siłami w swojej pracy badawczej Extracting Training Data from Diffusion Models wykazali, że modele dyfuzyjne potrafią zapamiętać konkretne obrazy, a następnie niemal wiernie je odtworzyć.
"Badamy, czy modele dyfuzyjne 'zapamiętują' przykłady treningowe, co definiujemy jako generowanie niemal identycznej kopii dowolnego obrazu. Proponujemy wydobycie zapamiętanych obrazów poprzez wielokrotne generowanie z tą samą podpowiedzią i oznaczanie przypadków, w których wiele wygenerowanych obrazów jest takich samych" – wyjaśnia Eric Wallace, doktorant z Laboratorium Badań nad Sztuczną Inteligencją w Berkeley, który pracował nad raportem.
Generator obrazów tworzy zdjęcia prawdziwych osób
Badacze podczas eksperymentu skupili się przede wszystkim na narzędziach Stable Diffusion i Google Imagen. Wielokrotnie zlecili generatorom stworzenie obrazu na podstawie imion i nazwisk konkretnych osób. Następnie analizowali, czy któryś z wygenerowanych przez nie obrazów pasuje do oryginalnych zdjęć w bazie danych modelu. Grupie udało się wyodrębnić ponad 100 replik obrazów z zestawu treningowego SI.
"Stosując naszą metodę do Stable Diffusion i Google Imagen, wyodrębniamy setki obrazów, i robimy to z dużą precyzją. Wiele z tych obrazów jest chronionych prawami autorskimi lub licencjami, a niektóre to zdjęcia osób fizycznych" – dodaje Eric Wallace.
Zespół odtworzył m.in. portret Ann Graham Lotz przy użyciu Stable Diffusion. Bezpośrednie porównanie prawdziwego zdjęcia z tym wygenerowanym ujawnia wady takie jak zniekształcenia i szumy na obrazie SI, ale nie ma wątpliwości, że jest to ten sam obraz i ta sama osoba.
Konrad Siwik, dziennikarz Fotoblogii