Блокування ботів зі штучним інтелектом від Microsoft та інших було «болем у ку**»: генеральний директор Reddit

Генеральний директор Reddit Стів Хаффман підтримує рішення Reddit заборонити компаніям сканувати сайт без угоди про штучний інтелект.

Минулого тижня 404 Media помітили, що пошукові системи, які не є Google, більше не показують у результатах останні публікації Reddit. Це сталося через те, що Reddit оновив свій протокол виключення роботів (текстовий файл), щоб заблокувати роботам сканування сайту. У файлі написано: «Reddit вірить у відкритий Інтернет, але не в зловживання загальнодоступним контентом». Після появи новин OpenAI анонсував SearchGPT, який може показувати останні результати Reddit.

Зміни відбулися через рік після того, як Reddit почав намагатися припинити безкоштовне копіювання, яке Хаффман спочатку назвав спробою перешкодити компаніям штучного інтелекту безкоштовно заробляти гроші на вмісті Reddit. Ця спроба також призвела до того, що Reddit почав стягувати плату за доступ до API (високі ціни призвели до закриття багатьох сторонніх програм Reddit).

У сьогоднішньому інтерв’ю The Verge Хаффман підтримав зміни, які призвели до того, що Google тимчасово залишився єдиною пошуковою системою, здатною показувати нещодавні дискусії з Reddit. У лютому Reddit і Google підписали угоду про навчання штучному інтелекту вартістю 60 мільйонів доларів на рік. Незрозуміло, скільки коштує угода Reddit OpenAI. Хаффман сказав:

Без цих угод ми не можемо говорити чи знати про те, як відображаються наші дані та для чого вони використовуються, що поставило нас у положення блокувати людей, які не бажали погоджуватися з тим, як ми хочу, щоб наші дані використовувалися або не використовувалися.

Передав The Verge, Хаффман стверджував, що Microsoft, Anthropic і Perplexity не вели переговорів. Три компанії не прокоментували інтерв’ю Хаффмана.

«[Це було] справжньою мукою в дупі блокувати ці компанії», — сказав Хаффман The Verge.

Читайте ще: Bricked iPhone 16 оснащений бездротовим режимом відновлення для реанімації з телефону на телефон

Особа, знайома з цим питанням, раніше повідомила Ars, що Microsoft відмовилася укладати угоду, яка дотримується правил конфіденційності даних Reddit. Розмовляючи з The Verge, Хаффман стверджував, що Microsoft раніше використовувала дані з Reddit для навчання ШІ та підсумкових результатів Bing, але не повідомив Reddit. Він також стверджував, що дані з Reddit були «продані через Bing API іншим пошуковим системам», за The Verge.

AI дебати

Минулого тижня представник Microsoft сказав мені, що «Microsoft поважає стандарт robots.txt і ми дотримуємося вказівок, наданих веб-сайтами, які не хочуть, щоб контент на їхніх сторінках використовувався з нашими генеративними моделями штучного інтелекту». Але, як зазначив The Verge, Джорді Рібас, корпоративний віце-президент із пошуку та штучного інтелекту в Microsoft, звернувся до X 29 липня, щоб підкреслити, що зміни в Reddit сприяють Google, «впливаючи на конкуренцію з боку Bing і двигунів на базі Bing».

Повідомляється, що Хаффман також посилався на червневе інтерв’ю CNBC, де Мустафа Сулейман, генеральний директор Microsoft AI, сказав: «Я вважаю, що щодо контенту, який уже є у відкритому Інтернеті, суспільний договір щодо цього контенту з 90-х років такий: це добросовісне використання. Будь-хто може скопіювати його, відтворити з ним, відтворити з ним. Це була безкоштовна програма, якщо хочете. Це було розуміння». Сулейман додав, що його коментар не стосується певних типів веб-контенту, наприклад новинних організацій.

«Microsoft, Anthropic і Perplexity діяли так, ніби весь вміст в Інтернеті для них є безкоштовним. Це їх справжня позиція», – сказав Хаффман.

Reddit не розкриває, скільки грошей потрібно для угод, які б дозволили отримати копію від Microsoft, Perplexity, Anthropic або менших компаній. Минулого тижня речник Reddit Тім Ратшмідт сказав Ars, що Reddit спілкувався «з кількома пошуковими системами» і що Reddit «відкритий для співпраці з великими та малими партнерами».

Читайте ще: Apple досягла рекордно високої частки ринку смартфонів і посідає перше місце у 2023 році

Імовірно, Reddit націлений на великі угоди зі штучним інтелектом, які він вважає важливою частиною свого бізнесу. Колін Хейхерст, генеральний директор пошукової системи Mojeek, сказав Ars минулого тижня, що Reddit не відповів на його електронні листи про блокування Mojeek, доки не з’явився звіт 404 Media.

Зусилля Reddit знайти нові джерела доходу, коли він намагається вперше стати прибутковим, були пронизані проблемами, включаючи масовий протест користувачів у відповідь на зміни правил API Reddit. Компанія прагне укладати угоди в той час, коли видавці, музична індустрія та багато іншого борються з легальністю ботів зі штучним інтелектом і прагнуть встановити перевагу. Залежність Reddit від безкоштовного контенту, створеного користувачами, ще більше ускладнює дискусію.

Advance Publications, якій належить материнська компанія Ars Technica Condé Nast, є найбільшим акціонером Reddit.