Поисковый бот от OpenAI атаковал сайт компании Triplegangers, пытаясь скопировать все его данные. По словам владельцев ресурса, бот использовал сотни IP-адресов, чтобы собрать информацию о 65 тысячах размещенных товаров. Об этом сообщает издание techcrunch.com.
Компания Triplegangers потратила 10 лет, чтобы собрать гигантскую базу данных «цифровых двойников людей» в Интернете. Эти файлы представляют собой 3D-изображений, отсканированные с реальных моделей людей. Компания продает файлы 3D-объектов, а также фотографии волос, кожи и всего тела 3D-художникам, создателям видеоигр и всем, кому нужно воссоздать в цифровом виде аутентичные человеческие черты.
В минувшие выходные генеральный директор Александр Томчук получил сообщение о том, что сайт его компании не работает. Вскоре он обнаружил, что виновником стал поисковой бот (краулер) от OpenAI, который пытался скопировать всю информацию с Triplegangers.
– У нас более 65 000 товаров. На каждой странице есть как минимум три фотографии. OpenAI отправлял тысячи запросов на сервер, пытаясь загрузить сотни тысяч фотографий вместе с их подробными описаниями. OpenAI использовал 600 IP-адресов для сбора данных, и мы все еще анализируем журналы за прошлую неделю, возможно, их гораздо больше, – говорит Александр Томчук.
Интересно, что Triplegangers разместила на своем сайте страницу с условиями предоставления услуг, запрещающую ботам брать ее изображения без разрешения. Более того, у компании был настроен файл robot.txt с тегами, специально указывающими роботам не трогать информацию на сайте. Однако, это не остановило бота OpenAI от вторжения. В Triplegangers не знают, какую информацию он успел скопировать.
По словам экспертов, проблема недобросовестного вторжения ботов ИИ-разработчиков сегодня стала очень острой. Согласно исследованию DoubleVerify, в 2024 году краулеры увеличат общий недействительный трафик на 86%.