Ми побудували власний AI-детектор — і ось що дізналися
Коли тексти від ШІ заполонили видачу, нам доводилося перевіряти контент клієнтів вручну. Платні сервіси (Copyleaks, Originality.ai) допомагали, але не пояснювали «чому». Розібравшись у їхній логіці, ми зрозуміли: в основі — аналіз тексту тим самим ШІ. І зібрали власний безкоштовний AI-детектор, який не просто дає вердикт, а показує, де і чим ШІ «наслідив».
Ця стаття — вижимка того, чого ми навчилися на тисячах перевірених текстів. За нашими спостереженнями за проєктами клієнтів:
Офіційна позиція Google — у гайдлайні щодо AI-контенту: важлива якість, а не спосіб виробництва. Але сирий машинний текст розпізнається — і алгоритмами, і читачами. Нижче — як саме.
Мовні маркери GPT: фрази, що видають машину
GPT будує текст зі статистично частих зворотів. Звучить по-людськи, але на дистанції абзацу зʼявляються впізнавані кліше. Найчастіші «вступні»:
Друга група — «канцелярит-обвʼязка», якою ШІ починає речення: з огляду на, в межах, в умовах, виходячи з, у контексті, відповідно до. Третя — узагальнення-пустушки, якими GPT заповнює абзац, коли фактів немає:
Якщо в тексті поспіль трапляються такі конструкції і при цьому немає конкретних фактів, цифр і прикладів — перед вами майже напевно сирий ШІ. Як додавати факти правильно — ми розбирали в гайді «ТЗ для копірайтера».
GPT проти людини: зведена таблиця
| Ознака | GPT | Людина |
|---|---|---|
| Структура | Ідеально логічна: теза → обґрунтування → висновок | Може бути збитою, імпровізованою |
| Тон | Ввічливий, академічний, без оцінок | Емоційний, особистісний, із гумором |
| Переходи | Явні звʼязки: «тим не менш», «таким чином» | Часто інтуїтивні, без маркерів |
| Помилки | Відсутні | Трапляються — іноді навмисні |
| Абзаци | Однакової довжини, симетричні | Нерівні: від одного рядка до полотна |
| Аргументи | Завжди «за підручником», без відступів | Бувають нелогічними, але переконливими |
Машинна логіка: правило трьох та ідеальна симетрія
Навіть якщо заборонити GPT «слівця», логіку не обдурити. Людина лажає: ставить дивні конструкції, забуває коми (мій редактор підтвердить). GPT — ні. Звідси три стійкі патерни:
- Правило трьох. «Корисним, структурованим і заснованим на фактах» — GPT обожнює ділити ідеї на три елементи: три прикметники, три пункти, три блоки під кожним заголовком (вступ → пояснення → висновок).
- Структурна симетрія. Абзаци однієї довжини; кожен починається зі вступної та закінчується звʼязкою до наступного. Ми запитали в самого GPT, чому так, — він відповів: «будую текст як добре структуровану статтю, за підручником».
- Надмірна ввічливість. Замість «це не працює» — «деякі користувачі можуть вважати цей підхід недостатньо ефективним за певних умов». Категоричність, гумор і сумнів — людське; нейтральна дипломатія в кожному реченні — машинне.
Підозрюєте, що ШІ-контент уже тягне сайт донизу?
Перевіримо безкоштовним аудитом: знайдемо проблемні сторінки та точки відновлення трафіку.
Спецсимволи-докази: що не видно оку, але видно в коді
Найнадійніша частина нашої системи. Людина фізично не вводить ці символи з клавіатури — а GPT вставляє їх постійно. Відкрийте текст у HTML-режимі та шукайте:
— (—)Довге тире. У людини — 1–2 на текст. GPT ставить до 19 на сторінку.
“ ” (“ ”)«Типографські» лапки. У живих текстах на сайтах майже не трапляються — людина ставить прості "лапки".
→ (→)Стрілки-символи. Людина малює стрілку «колгоспно»: дефіс + знак більше (->).
(0xa0)Нерозривний пробіл. Автори ставлять звичайні пробіли й не паряться.
’ (’)«Правильний» апостроф замість людського '. Машинна типографіка.
… (…)Символ трикрапки. Людина ставить три крапки поспіль...
 Тонкий пробіл. Більшість авторів про його існування навіть не знає.
© ® (© ®)Людина напише (с) або (R) — цих символів немає на клавіатурі.
Докази у верстці
- Ідеально закриті теги. Кожен
<p>,<li>,<div>закритий за стандартом — без жодного огріху, який завжди є в людей. - Механічні списки.
<ul><li><p>Текст</p></li></ul>замість простого<li>Текст</li>. <hr />із закривним слешем і горизонтальні лінії-розділювачі між секціями — фірмовий почерк GPT, «камінг-аут перед Google».- Атрибути data-start / data-end у заголовках і списках — технічна розмітка, яку людина не ставить ніколи.
Інструменти перевірки: з чого почати
Ручний аналіз за маркерами — найточніший, але довгий. Для потоку працює звʼязка «детектор + вибіркова ручна перевірка»:
Unmiss AI Detectorбезкоштовно
Наш інструмент: вставляєте текст → отримуєте не лише вердикт, а й розбір, де і чим ШІ «наслідив». Створений на досвіді цієї статті. Спробувати →
Copyleaks
Один із найточніших комерційних детекторів, підтримує українську. Гарний для потокової перевірки підрядників.
Originality.ai
Стандарт західного ринку: детекція ШІ + плагіат в одному звіті. Платний, заточений під англійську.
GPTZero
Популярний академічний детектор: оцінює «перплексію» та «сплески» тексту. Є безкоштовний ліміт.
До речі, створити власний інструмент сьогодні простіше, ніж здається, — ми розповідаємо про це в послузі розробки AI-інструментів. А про те, як використовувати ШІ в SEO з розумом, — у гайді з ChatGPT для SEO та добірці 50 мега-промптів.
Чекліст ручної перевірки: 7 кроків
- Пошук фраз-маркерів. Ctrl+F по тексту: «у сучасному світі», «варто зазначити», «таким чином». 3+ збіги — жовтий прапорець.
- Перевірка фактів. Чи є конкретні цифри, імена, приклади? Узагальнення без фактів — головна ознака «води» від ШІ.
- Ритм абзаців. Відступіть від екрана: якщо всі абзаци візуально однакові — це симетрія машини.
- Правило трьох. Порахуйте трійки: три прикметники, три пункти, три блоки на секцію.
- Код-аудит. Відкрийте HTML: — більше трьох разів, типографські лапки, data-атрибути, <hr />.
- Прогін через детектор. Unmiss / Copyleaks / GPTZero — для підтвердження, не замість голови.
- Тест на користь. Головне питання Google: чи дізнається читач щось, чого немає в перших трьох результатах видачі? Якщо ні — неважливо, хто писав.
Той самий підхід працює і у зворотний бік — коли треба «олюднити» ШІ-чернетку: прибрати маркери, додати факти та особистий досвід, зламати симетрію. Як писати комерційні тексти, що продають, — у статті про комерційний контент.
Навіщо це все: ШІ-текст і видимість у Google та AI-пошуку
Парадокс 2026 року: ШІ-пошуковики (AI Overviews, ChatGPT, Perplexity) самі не люблять цитувати сирий ШІ-контент. Вони спираються на джерела з експертизою, фактами й авторитетом — докладно ми розбирали це у статтях про GEO-оптимізацію під GPT та джерела зовнішніх посилань.
- Сирий ШІ-текст → шаблони, нуль фактів → не цитується, ризикує потрапити під «scaled content abuse» зі спам-політик Google.
- ШІ-чернетка + редактор + факти + досвід → повноцінний контент, який ранжується та цитується. Спосіб виробництва Google не хвилює.
Тому перевірка тексту на ШІ — це насправді перевірка контент-процесу. Детектор ловить не «ШІ», а відсутність людської роботи над текстом.
Коротко: система з трьох рівнів
- Мова: фрази-маркери, канцелярит-обвʼязка, узагальнення без фактів.
- Синтаксис: правило трьох, симетричні абзаци, надмірна ввічливість, ідеальна граматика.
- Код: спецсимволи (—, “ ”, →, ) і машинна верстка (data-атрибути, <hr />).
- Інструменти пришвидшують, але не замінюють: вердикт детектора завжди перевіряйте за доказами вище.
- Мета — не «впіймати ШІ», а не публікувати марний контент: саме за нього карає Google та ігнорує AI-пошук.
Джерела даних
- Google — офіційна позиція щодо AI-контенту: Search and AI content; спам-політики (scaled content abuse): spam policies.
- Unmiss — наш безкоштовний AI-детектор із розбором доказів: ai-content-detector.
- Copyleaks — AI content detector; Originality.ai — originality.ai; GPTZero — gptzero.me.
Відсотки на початку статті (85% шаблонних фраз, 90% ідеальної граматики, ~25% сайтів із просіданням після ШІ-спаму) — внутрішні спостереження SEOquick на перевірених текстах і проєктах клієнтів; це орієнтири з практики, а не академічне дослідження. Списки маркерів і спецсимволів — із нашої роботи над детектором Unmiss.