Образование
#новости

Стало известно, как «Антиплагиат» определяет сгенерированный нейросетью текст

Исполнительный директор компании описал, как работает инструмент, и поделился лайфхаком для обнаружения написанных ИИ текстов.

В интервью сайту Российского союза ректоров исполнительный директор компании «Антиплагиат» Юрий Чехович рассказал о том, как работает детектор текстов, написанных нейросетью. По его словам, в основе алгоритма — тоже система искусственного интеллекта (ИИ). Она выполняет задачу классификации текстов на искусственные и естественные.

Компания представила новый инструмент в мае 2023 года. Его включили в стандартную лицензию проверки текстов на обнаружение заимствований. Тогда в «Антиплагиате» сообщили, что быстро внедрить такую функцию помог многолетний опыт исследований по обработке естественного языка (Natural language processing, или NLP).

В интервью Юрий Чехович объяснил, что алгоритм автоматически выявляет части текста, в которых есть признаки искусственной генерации, и сообщает об этом пользователю. Делается это на основе анализа большого набора признаков, но конкретный их набор директор «Антиплагиата» не раскрыл. Подробную информацию об обнаруженных фрагментах можно увидеть в полном отчёте о проверке текста.

Но руководитель «Антиплагиата» подчеркнул, что «система выступает лишь инструментом, подсвечивающим подозрительные фрагменты работы, а дальше дело за человеком», поэтому сделать финальный вывод о том, что этот текст был написан нейросетью, пока нельзя. «Мы советуем всегда проверять работы через систему, а затем внимательно прочитывать подозрительные фрагменты», — резюмирует Юрий.

Кроме того, Юрий Чехович назвал признак, который может говорить о том, что текст написан машиной. Стоит насторожиться, если в тексте есть частые повторы одного и того же смысла или противоречащие друг другу выводы, как будто автор неожиданно поменял точку зрения. В «Антиплагиате» называют это «эффектом рыбки Дори» — по имени персонажа мультфильма «В поисках Немо» (эта рыбка всё мгновенно забывала).

Журналист и преподаватель курса по писательскому мастерству Западного университета штата Коннектикут Эрик Офганг тоже недавно делился признаками, которые помогают ему без проверки в специальных инструментах понять, что студенческий текст, скорее всего, сгенерирован нейросетью. Иногда такой текст существенно длиннее, чем предполагало задание, или написан в стиле, который ранее не был свойственен конкретному студенту.

Ранее сообщалось, что в конце января 2023 года «Антиплагиат» и Московский городской педагогический университет подписали соглашение о совместной работе по борьбе с неэтичным использованием генераторов текста в научных и академических работах. Сообщалось о планах по разработке новых технологий, направленных на предотвращение академического мошенничества.

Больше интересного про образование ― в нашем телеграм-канале. Подписывайтесь!

Научитесь: Профессия Методист с нуля до PRO Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована