Издание New York Times приняло превентивные меры, чтобы предотвратить использование своего контента для обучения систем искусственного интеллекта. Запрет распространяется на текст, фотографии, изображения, аудио- и видеоклипы, «внешний вид», метаданные или компиляции.
В обновленных условиях также указано, что автоматизированные инструменты, такие как веб-краулеры, предназначенные для использования, доступа или сбора такого контента, не могут быть использованы без письменного разрешения издания.
В NYT заявляют, что отказ от соблюдения этих ограничений может повлечь за собой штрафы и судебные разбирательства. Несмотря на введение новых правил в свою политику, издание, похоже, не внесло никаких изменений в robots.txt – файл, информирующий поисковые системы о том, к каким URL-адресам можно получить доступ.
Этот шаг связан с недавним обновлением политики конфиденциальности Google. Поисковый гигант провозгласил, что может собирать открытые данные из Интернета для обучения Bard или Cloud AI.
Отмечается, что многие крупные языковые модели, используемые в популярных ИИ-сервисах, таких как ChatGPT от OpenAI, обучаются на обширных массивах данных, которые могут содержать материалы, защищенные авторским правом или иными способами.
В феврале NYT подписала с Google соглашение на сумму $100 млн, которое позволит поисковому гиганту в течение трех лет размещать контент издания на некоторых своих платформах.