Engedély nélkül használhatott fel fizetős könyveket az OpenAI a ChatGPT fejlesztéséhez?

Újabb vádak merültek fel az OpenAI ellen: egy nonprofit szervezet szerint a cég jogosulatlanul használhatott fel fizetős, nem nyilvánosan hozzáférhető könyveket a legújabb, GPT-4o mesterséges intelligencia modelljének betanításához. Ez tovább mélyíti azokat az aggodalmakat, amelyek szerint a vállalat szerzői jogilag védett anyagokat használ fel technológiája fejlesztéséhez.

Nem ez az első eset, hogy az OpenAI-t szerzői jogok megsértésével vádolják. Korábban már több kiadó és szerző is jogi lépéseket tett a cég ellen hasonló okokból. Az OpenAI korábbi védekezése a méltányos felhasználás elvére épült, hangsúlyozva, hogy a modern mesterséges intelligencia modellek létrehozásához elengedhetetlen a nagy mennyiségű adat feldolgozása, még ha az védett is.

A legfrissebb vizsgálatot az AI Disclosures Project nevű, 2024-ben Tim O’Reilly médiamogul (aki egyben az O’Reilly Media könyvkiadó vezérigazgatója) és Ilan Strauss közgazdász által alapított nonprofit szervezet végezte. Céljuk a mesterséges intelligencia működésének és adatfelhasználásának átláthatóbbá tétele.

Elemzésük során a DE-COP nevű módszert alkalmazták 34 O’Reilly-könyv 13 962 bekezdésrészletén. Ez a teszt azt méri, hogy az MI modell képes-e megkülönböztetni az eredeti, ember által írt szöveget annak átfogalmazott, MI által generált változatától. Ha igen, az arra utalhat, hogy a modell már „találkozott” a szöveggel a tanítási adatai között. Az eredmények alapján a jelenleg alapértelmezett GPT-4o modell valószínűsíthetően ismerte a fizetőfal mögötti tartalmakat, szemben a korábbi GPT-3.5 Turbo modellel, amely inkább a nyilvánosan elérhető tudásbázisra támaszkodott.

A jelentés készítői azt is megjegyzik, hogy az MI elméletileg abból is tanulhatott, ha a felhasználók másoltak be részleteket a kérdéses könyvekből a ChatGPT csevegőfelületére. Az OpenAI egyelőre nem reagált az AI Disclosures Project által közzétett eredményekre és vádakra.

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük