Як перевірити текст на ШІ: маркери, докази в коді та інструменти детекції

Чому ми на цьому знаємося

Ми побудували власний AI-детектор — і ось що дізналися

Коли тексти від ШІ заполонили видачу, нам доводилося перевіряти контент клієнтів вручну. Платні сервіси (Copyleaks, Originality.ai) допомагали, але не пояснювали «чому». Розібравшись у їхній логіці, ми зрозуміли: в основі — аналіз тексту тим самим ШІ. І зібрали власний безкоштовний AI-детектор, який не просто дає вердикт, а показує, де і чим ШІ «наслідив».

Ця стаття — вижимка того, чого ми навчилися на тисячах перевірених текстів. За нашими спостереженнями за проєктами клієнтів:

85%ШІ-текстів містять шаблонні фрази-маркери зі списків нижчеспостереження SEOquick

90%ШІ-текстів мають ідеально рівну граматику та пунктуацію — людина так не пишеспостереження SEOquick

~25%сайтів, що приходили до нас із просіданням, втрачали трафік після масової публікації сирого ШІ-контентустатистика проєктів SEOquick

Важливо: Google не карає за ШІ як такий — він карає за марний контент, створений для маніпуляції видачею. Перевірка тексту на ШІ — це перевірка на «сирість», а не полювання на відьом.

Офіційна позиція Google — у гайдлайні щодо AI-контенту: важлива якість, а не спосіб виробництва. Але сирий машинний текст розпізнається — і алгоритмами, і читачами. Нижче — як саме.

Рівень 1 · мова

Мовні маркери GPT: фрази, що видають машину

GPT будує текст зі статистично частих зворотів. Звучить по-людськи, але на дистанції абзацу зʼявляються впізнавані кліше. Найчастіші «вступні»:

У сучасному світіНе секрет, щоВарто зазначити, щоВажливо розумітиОдним із ключових аспектів єСлід враховуватиТаким чиномУ цій статті розглядається

Друга група — «канцелярит-обвʼязка», якою ШІ починає речення: з огляду на, в межах, в умовах, виходячи з, у контексті, відповідно до. Третя — узагальнення-пустушки, якими GPT заповнює абзац, коли фактів немає:

Існує безліч способівКожен випадок потребує індивідуального підходуОднозначної відповіді не існуєВажливо враховувати низку факторівЦе особливо актуально в умовах

Якщо в тексті поспіль трапляються такі конструкції і при цьому немає конкретних фактів, цифр і прикладів — перед вами майже напевно сирий ШІ. Як додавати факти правильно — ми розбирали в гайді «ТЗ для копірайтера».

GPT проти людини: зведена таблиця

Ознака	GPT	Людина
Структура	Ідеально логічна: теза → обґрунтування → висновок	Може бути збитою, імпровізованою
Тон	Ввічливий, академічний, без оцінок	Емоційний, особистісний, із гумором
Переходи	Явні звʼязки: «тим не менш», «таким чином»	Часто інтуїтивні, без маркерів
Помилки	Відсутні	Трапляються — іноді навмисні
Абзаци	Однакової довжини, симетричні	Нерівні: від одного рядка до полотна
Аргументи	Завжди «за підручником», без відступів	Бувають нелогічними, але переконливими

Рівень 2 · синтаксис

Машинна логіка: правило трьох та ідеальна симетрія

Навіть якщо заборонити GPT «слівця», логіку не обдурити. Людина лажає: ставить дивні конструкції, забуває коми (мій редактор підтвердить). GPT — ні. Звідси три стійкі патерни:

Правило трьох. «Корисним, структурованим і заснованим на фактах» — GPT обожнює ділити ідеї на три елементи: три прикметники, три пункти, три блоки під кожним заголовком (вступ → пояснення → висновок).
Структурна симетрія. Абзаци однієї довжини; кожен починається зі вступної та закінчується звʼязкою до наступного. Ми запитали в самого GPT, чому так, — він відповів: «будую текст як добре структуровану статтю, за підручником».
Надмірна ввічливість. Замість «це не працює» — «деякі користувачі можуть вважати цей підхід недостатньо ефективним за певних умов». Категоричність, гумор і сумнів — людське; нейтральна дипломатія в кожному реченні — машинне.

Візуальний «ритм» тексту: у GPT блоки однакової довжини з однаковими звʼязками, у людини — рваний, живий малюнок абзаців.

Підозрюєте, що ШІ-контент уже тягне сайт донизу?

Перевіримо безкоштовним аудитом: знайдемо проблемні сторінки та точки відновлення трафіку.

Перевірити сайт →

Рівень 3 · код

Спецсимволи-докази: що не видно оку, але видно в коді

Найнадійніша частина нашої системи. Людина фізично не вводить ці символи з клавіатури — а GPT вставляє їх постійно. Відкрийте текст у HTML-режимі та шукайте:

— (—)

Довге тире. У людини — 1–2 на текст. GPT ставить до 19 на сторінку.

“ ” (“ ”)

«Типографські» лапки. У живих текстах на сайтах майже не трапляються — людина ставить прості "лапки".

→ (→)

Стрілки-символи. Людина малює стрілку «колгоспно»: дефіс + знак більше (->).

  (0xa0)

Нерозривний пробіл. Автори ставлять звичайні пробіли й не паряться.

’ (’)

«Правильний» апостроф замість людського '. Машинна типографіка.

… (…)

Символ трикрапки. Людина ставить три крапки поспіль...

 

Тонкий пробіл. Більшість авторів про його існування навіть не знає.

© ® (© ®)

Людина напише (с) або (R) — цих символів немає на клавіатурі.

Докази у верстці

Ідеально закриті теги. Кожен <p>, <li>, <div> закритий за стандартом — без жодного огріху, який завжди є в людей.
Механічні списки. <ul><li><p>Текст</p></li></ul> замість простого <li>Текст</li>.
<hr /> із закривним слешем і горизонтальні лінії-розділювачі між секціями — фірмовий почерк GPT, «камінг-аут перед Google».
Атрибути data-start / data-end у заголовках і списках — технічна розмітка, яку людина не ставить ніколи.

Автоматизація

Інструменти перевірки: з чого почати

Ручний аналіз за маркерами — найточніший, але довгий. Для потоку працює звʼязка «детектор + вибіркова ручна перевірка»:

Unmiss AI Detectorбезкоштовно

Наш інструмент: вставляєте текст → отримуєте не лише вердикт, а й розбір, де і чим ШІ «наслідив». Створений на досвіді цієї статті. Спробувати →

Copyleaks

Один із найточніших комерційних детекторів, підтримує українську. Гарний для потокової перевірки підрядників.

Originality.ai

Стандарт західного ринку: детекція ШІ + плагіат в одному звіті. Платний, заточений під англійську.

GPTZero

Популярний академічний детектор: оцінює «перплексію» та «сплески» тексту. Є безкоштовний ліміт.

Чесне попередження: будь-який детектор помиляється. Добре відредагований ШІ-текст проходить перевірку, а сухий людський канцелярит — «палиться». Вердикт детектора — привід для ручної перевірки, а не вирок.

До речі, створити власний інструмент сьогодні простіше, ніж здається, — ми розповідаємо про це в послузі розробки AI-інструментів. А про те, як використовувати ШІ в SEO з розумом, — у гайді з ChatGPT для SEO та добірці 50 мега-промптів.

Практика

Чекліст ручної перевірки: 7 кроків

Пошук фраз-маркерів. Ctrl+F по тексту: «у сучасному світі», «варто зазначити», «таким чином». 3+ збіги — жовтий прапорець.
Перевірка фактів. Чи є конкретні цифри, імена, приклади? Узагальнення без фактів — головна ознака «води» від ШІ.
Ритм абзаців. Відступіть від екрана: якщо всі абзаци візуально однакові — це симетрія машини.
Правило трьох. Порахуйте трійки: три прикметники, три пункти, три блоки на секцію.
Код-аудит. Відкрийте HTML: — більше трьох разів, типографські лапки, data-атрибути, <hr />.
Прогін через детектор. Unmiss / Copyleaks / GPTZero — для підтвердження, не замість голови.
Тест на користь. Головне питання Google: чи дізнається читач щось, чого немає в перших трьох результатах видачі? Якщо ні — неважливо, хто писав.

Той самий підхід працює і у зворотний бік — коли треба «олюднити» ШІ-чернетку: прибрати маркери, додати факти та особистий досвід, зламати симетрію. Як писати комерційні тексти, що продають, — у статті про комерційний контент.

Контекст 2026

Навіщо це все: ШІ-текст і видимість у Google та AI-пошуку

Парадокс 2026 року: ШІ-пошуковики (AI Overviews, ChatGPT, Perplexity) самі не люблять цитувати сирий ШІ-контент. Вони спираються на джерела з експертизою, фактами й авторитетом — докладно ми розбирали це у статтях про GEO-оптимізацію під GPT та джерела зовнішніх посилань.

Сирий ШІ-текст → шаблони, нуль фактів → не цитується, ризикує потрапити під «scaled content abuse» зі спам-політик Google.
ШІ-чернетка + редактор + факти + досвід → повноцінний контент, який ранжується та цитується. Спосіб виробництва Google не хвилює.

Тому перевірка тексту на ШІ — це насправді перевірка контент-процесу. Детектор ловить не «ШІ», а відсутність людської роботи над текстом.

Висновки

Коротко: система з трьох рівнів

Мова: фрази-маркери, канцелярит-обвʼязка, узагальнення без фактів.
Синтаксис: правило трьох, симетричні абзаци, надмірна ввічливість, ідеальна граматика.
Код: спецсимволи (—, “ ”, →,  ) і машинна верстка (data-атрибути, <hr />).
Інструменти пришвидшують, але не замінюють: вердикт детектора завжди перевіряйте за доказами вище.
Мета — не «впіймати ШІ», а не публікувати марний контент: саме за нього карає Google та ігнорує AI-пошук.

Джерела даних

Google — офіційна позиція щодо AI-контенту: Search and AI content; спам-політики (scaled content abuse): spam policies.
Unmiss — наш безкоштовний AI-детектор із розбором доказів: ai-content-detector.
Copyleaks — AI content detector; Originality.ai — originality.ai; GPTZero — gptzero.me.

Відсотки на початку статті (85% шаблонних фраз, 90% ідеальної граматики, ~25% сайтів із просіданням після ШІ-спаму) — внутрішні спостереження SEOquick на перевірених текстах і проєктах клієнтів; це орієнтири з практики, а не академічне дослідження. Списки маркерів і спецсимволів — із нашої роботи над детектором Unmiss.

Як перевірити текст на ШІ: маркери, докази в коді та інструменти детекції

Ми побудували власний AI-детектор — і ось що дізналися

Мовні маркери GPT: фрази, що видають машину

GPT проти людини: зведена таблиця

Машинна логіка: правило трьох та ідеальна симетрія

Підозрюєте, що ШІ-контент уже тягне сайт донизу?

Спецсимволи-докази: що не видно оку, але видно в коді

Докази у верстці

Інструменти перевірки: з чого почати

Unmiss AI Detectorбезкоштовно

Copyleaks

Originality.ai

GPTZero

Чекліст ручної перевірки: 7 кроків

Навіщо це все: ШІ-текст і видимість у Google та AI-пошуку

Коротко: система з трьох рівнів

Джерела даних

Читайте далі

ChatGPT для SEO: повний гайд

GEO: оптимізація сайту під GPT

50 мега-промптів для SEO

ТЗ для копірайтера

Комерційний контент

Де брати зовнішні посилання

Контент, який цитує навіть ШІ