Інструменти виявлення штучного інтелекту стають все більш поширеними, оскільки згенерований штучним інтелектом текст поширюється в Інтернеті, в освіті та на робочому місці. Однак ці інструменти не працюють як перевірка плагіату; вони не шукають копії існуючого тексту. Натомість вони покладаються на ймовірності та лінгвістичні шаблони, щоб визначити, чи був текст створений ШІ чи людиною. Розуміння як вони працюють виявляє їхні обмеження та чому високий «продуктивність ШІ» не обов’язково означає низьку якість або неетичний вміст.
Зміст
Основний принцип: передбачення проти розуміння
Більшість детекторів штучного інтелекту використовують машинне навчання, навчене на величезних наборах даних, що містять текст, написаний людиною та згенерований штучним інтелектом. Вони аналізують такі характеристики, як структура речення, вибір слів і загальна передбачуваність, шукаючи ознаки, які корелюють з авторством ШІ. Це не передбачає «читання», щоб зрозуміти значення; мова йде про ідентифікацію шаблонів.
Два ключові показники лежать в основі цих виявлень: здивування та однорідність.
- Perplexy вимірює, наскільки текст є передбачуваним для мовної моделі. Текст, створений штучним інтелектом, як правило, має нижче здивування, оскільки штучний інтелект зазвичай вибирає найбільш вірогідне наступне слово.
- Нерівномірність стосується варіацій у довжині та стилі речень. Людське письмо природно поєднує короткі та довгі речення для створення ритму; Текст, створений штучним інтелектом, часто позбавлений цієї варіативності та виглядає більш однорідним.
Обмеження виявлення: помилкові позитивні та помилкові негативні результати
Сучасні детектори — це класифікатори з машинним навчанням, які постійно перенавчаються на нових виходах штучного інтелекту (наприклад, GPT-4 і новіших), щоб бути актуальними. Незважаючи на це, вони надають лише ймовірності, а не впевненості.
Це означає, що хибні спрацьовування (помилкове визначення людського тексту як штучного інтелекту) і хибні негативні результати (нездатність виявити створений ШІ текст) є поширеними. Незвичайні людські стилі письма, такі як хитрі фрази чи ексцентричні голоси, можуть бути ідентифіковані помилково, тоді як добре замаскований контент, створений ШІ, може залишитися непоміченим.
Виявлення ШІ проти плагіату: різні проблеми
Важливо розрізняти виявлення ШІ та перевірку на плагіат. Перевірка на плагіат порівнює текст із базою даних існуючих джерел, тоді як AI-детектор аналізує, як був написаний текст. Це означає, що створений штучним інтелектом текст може бути повністю оригінальним (не знайденим більше ніде) і все ще бути позначеним, тоді як людський плагіат може повністю уникнути виявлення ШІ.
Роль людського судження: необхідний тест
Досвідчені редактори та вчителі часто покладаються на перевірку вручну, шукаючи такі ознаки, як надто загальний, емоційно безглуздий тон. Деякі навіть переглядають історію змін або журнали натискань клавіш, щоб підтвердити процес написання людиною.
Компанії, які створили ці інструменти, наголошують, що результати штучного інтелекту є лише сигналами, а не остаточним доказом. Знання стилю автора та використання особистої перевірки є важливими, особливо якщо результати суперечливі.
Поза текстом: зображення, відео та майбутнє відкриттів
Ті самі принципи застосовуються до виявлення ШІ на зображеннях і відео шляхом аналізу артефактів або шаблонів, створених генеративними моделями. Але ці візуальні системи також обмежені, вимагаючи обширних навчальних даних і виробляючи хибні спрацьовування/заперечення, коли з’являються нові методи.
Суть: якість над походженням
Великі платформи, як-от Google, надають перевагу якості та корисності контенту, а не тому, чи був він написаний людиною чи штучним інтелектом. Мета полягає в тому, щоб відфільтрувати низькоякісний спам, а не заборонити весь контент, створений ШІ. Відповідальне використання включає прозорість, ретельне редагування та людський досвід.
Високий «результат, створений штучним інтелектом» не обов’язково означає, що вміст поганий або неетичний; Вміст AI може бути прийнятним, якщо він має високу якість і перевірений людьми.
Зрештою, виявлення штучного інтелекту – це сфера, що розвивається, з властивими обмеженнями. Це не безпомилкова система, і людське судження залишається важливим для забезпечення точності та етичного використання.
