Зачем OpenAI нужен поисковый робот
GPTBot — новый поисковый робот компании OpenAI, который будет просматривать и анализировать веб-страницы в поисках контента для обучения ИИ-моделей. При этом он умеет отфильтровывать ресурсы, которые требуют платного доступа, содержат персональную информацию пользователей или нарушают внутренние правила компании. По мнению экспертов, его запуск связан с разработкой и обучением ChatGPT-5.
Если вы не хотите, чтобы данные вашего сайта или блога использовались бесплатно для обучения ИИ-моделей, то вы можете заблокировать доступ GPTBot. Информация об этом появилась в документации к API Open AI.
Как ограничить GPTBot для своего сайта
Для запрета доступа GPTBot к сайту в файл robots.txt добавьте текст:
Теперь поисковый робот не сможет использовать информацию с вашего сайта. Если вы хотите запретить доступ только к определённым разделам сайта и папкам, то их можно явно указать в тексте:
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!