9 февраля 2012 | Категория:

Непалимые цепи Маркова

Как известно, тексты, сгенерированные на основе цепей Маркова, даже не содержащие грамматических косяков, очень легко и непренужденно палятся поисковиками. Самый простой метод спалить такие тексты (и, наверняка, именно он и используется поисковиками) – проверить, выполняет ли текст закон Ципфа (Зипфа). Если кратко, закон Ципфа – это закон, описывающий график распределение частотности слов в ЛЮБОМ естественном языке. За подробностями дуйте в Википедию.

А самое приятное в этой истории то, что дописать к цепям Маркова выполнение закона Ципфа довольно просто. И у вас в руках будет пусть и бредогенератор (тексты от закона Ципфа осмысленнее не станут), но зато этот бред поисковикам будет уже не так просто спалить. И можно будт больше не париться, где брать контент для своих доров.

Написать комментарий