
Декількома словами
Суд відхилив прохання OpenAI про припинення справи щодо порушення авторських прав, ініційованої The New York Times. Газета звинувачує техногіганта у незаконному використанні її контенту для навчання ChatGPT. Це рішення дозволяє продовжити судовий процес, який може мати значні наслідки для індустрії ШІ та новинних медіа, зокрема щодо доктрини «добросовісного використання» та майбутнього моделей монетизації контенту.
Федеральний суддя в середу відхилив клопотання OpenAI про відхилення позову про порушення авторських прав, поданого газетою The New York Times. У позові стверджується, що технологічна компанія використовувала контент видання без дозволу чи оплати.
У своєму рішенні, що дозволяє продовжити розгляд справи, суддя Сідні Стайн з Південного округу Нью-Йорка звузив рамки позову, але дозволив розглядати основні вимоги щодо порушення авторських прав. Суддя Стайн не оприлюднив повного висновку одразу, але пообіцяв зробити це «якнайшвидше».
Це рішення є перемогою для газети, яка об'єднала зусилля з іншими видавцями, щоб оскаржити спосіб, у який OpenAI збирала величезні обсяги даних з Інтернету для навчання свого популярного сервісу штучного інтелекту ChatGPT.
Юристи The Times вважають, що статті газети є одним з найбільших джерел захищеного авторським правом тексту, який OpenAI використала для створення ChatGPT, провідного чат-бота зі штучним інтелектом. Вони стверджують, що OpenAI порушила закони про авторське право, незаконно використовуючи журналістські матеріали газети.
Представники The Times та OpenAI не надали коментарів одразу.
Керівники OpenAI стверджували, що масовий збір даних компанією, включаючи статті The Times, захищений юридичною доктриною «добросовісного використання» («fair use»). Вона дозволяє повторно використовувати матеріали без дозволу в певних випадках, зокрема для досліджень, навчання та коментування.
Рішення судді означає, що справа тепер може перейти до судового розгляду, але дата слухань ще не призначена. Очікується, що збір доказів, включаючи допити керівників обох сторін, відбуватиметься конфіденційно, поряд із публічними досудовими слуханнями для врегулювання суперечок щодо доказів та інших питань.
Правова боротьба між одним із найвпливовіших світових новинних видань та провідною компанією Кремнієвої долини у сфері ШІ ставить багато на карту як для новинної індустрії, так і для майбутнього інструментів штучного інтелекту.
Для видавців існує побоювання, що потужні чат-боти, які можуть швидко узагальнювати новинні статті за запитом, призведуть до того, що читачі рідше відвідуватимуть новинні веб-сайти. Це може спричинити падіння доходів від реклами, що негативно вплине на фінансовий стан галузі.
Хоча позов стосується лише OpenAI та її фінансового партнера Microsoft, інші компанії, що займаються штучним інтелектом, також збирають контент з Інтернету для навчання своїх моделей. Здебільшого індустрія ШІ наслідувала приклад OpenAI у навчанні чат-ботів та інших сервісів ШІ, діючи за принципом, що обробка даних, знайдених у відкритому Інтернеті, для створення відповідей чат-ботів юридично захищена законом про авторське право.
Однак законодавство з цього питання залишається невизначеним.
Суди зазначали, що добросовісне використання твору, захищеного авторським правом, повинно створювати щось нове, що є «трансформативним», або коментує чи посилається на оригінальний твір. The Times стверджує, що це не стосується того, як OpenAI відтворює оригінальні репортажі газети.
Інша частина правового аналізу стосуватиметься ідеї «заміщення ринку» – чи є відповіді чат-бота заміною, наприклад, читанню веб-сайту The Times, чи чат-боти та газети діють на різних ринках.
На слуханнях у Нью-Йорку в січні юристи видавців стверджували, що коли ChatGPT ставили запитання на теми, висвітлені The Times, чат-бот дослівно відтворював статті.
Проте юридична команда OpenAI заперечила, що новинні видання, схоже, спеціально маніпулювали запитами, щоб змусити чат-бота видавати великі фрагменти, взяті з веб-сайту газети. За словами Джозефа Гратца, юриста OpenAI, більшість людей не так взаємодіють із сервісом, і чат-бот не призначений для такої роботи.
«Це не система пошуку документів. Це велика мовна модель», – сказав Гратц.