![]() |
Алгоритм определения сгенерированного текста
Предлагаю обсудить, как поисковые системы определяют, что на сайте не человеческий а сгенерированный програмой текст.
Обычно дорвейщики используют генераторы контента на основе цепей маркова. Я так понимаю, что этот текст и яндекс и гугл отличает от человечкского. Палю тему - поисковики смотрят ещё на последовательности слов, у них есть схемы, какие слова идут за какими, и если в тексте очень мало таких совпадений, то текст генерируеммый. Пример Я живу в (большом/красивом/новом) доме. И после слова живу не может быть например слово скисшем. |
Часовой пояс GMT +3, время: 03:48. |
Powered by vBulletin® Version 3.8.6
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. Перевод: zCarot