Компания OpenAI признала необходимость использования материалов, защищенных авторским правом, при разработке таких инструментов искусственного интеллекта, как ChatGPT.
Текстовые и графические ИИ-модели, получают свои способности в ходе тренировок, в которых задействуется контент, взятый из интернета без разрешения правообладателей. Подобное вольное использование является частью давней традиции академических исследований в области машинного обучения, но поскольку модели ИИ-модели недавно стали коммерческими, эта практика оказалась под пристальным вниманием.
– Поскольку авторское право сегодня распространяется практически на все виды человеческих проявлений, включая блоги, фотографии, сообщения на форумах, фрагменты программного кода и правительственные документы, – было бы невозможно обучать современные ведущие модели ИИ без использования материалов, защищенных авторским правом, – написали представители OpenAI.
В компании заявляют, что ограничение обучающих данных книгами и рисунками, являющимися общественным достоянием, созданными более века назад, не позволит подготовить системы ИИ, которые отвечают потребностям современных пользователей.
Это заявление последовало за иском, поданным в прошлом месяце газетой The New York Times против OpenAI и Microsoft за якобы незаконное использование контента газеты в своих продуктах.
Защита OpenAI в основном опирается на правовой принцип «добросовестного использования». Он допускает ограниченное использование защищенного авторским правом контента без разрешения владельца при определенных обстоятельствах. Компания утверждает, что закон об авторском праве не запрещает обучение моделей ИИ с помощью таких материалов.