Анализ текста по закону ципфа

Джордж Ципф

Основным источником информации в интернете являются тексты. Естественно, что и продвижение сайтов в поисковые ТОПы по большей части связано с правильным написанием подобного контента. Но написать текст мало – надо еще и оформить его согласно разнообразным SEO правилам и рекомендациям. Из них можно выделить наиболее популярные и всеми используемые:

  • Минимум тошноты, воды и спама.
  • Правильная структура размещаемого материала (заголовки, списки).
  • Вписывание ключей.

Это все азы, поэтому их использует большая часть оптимизаторов. Но сайтов на просторах интернета становится все больше, поэтому некоторые из их владельцев ищут другие варианты для успешности продвижения своего продукта.

И здесь часть из них вспоминают про некий закон Ципфа.

Но мало того, что они начинают затачивать собственные сочинения под сервис, работающий на основе утверждений английского ученого, жившего хрен знает сколько лет назад, так они еще и заставляют наемных копирайтеров ломать себе голову над ним!

Но доктор Айтупит бдит, поэтому, аки Черный Плащ, спешит на помощь интернет писакам, чтобы разобраться с эффективностью данного метода по продвижению сайтов в Топы самых известных поисковиков.

Содержание

Проверка по закону Ципфа

Ясен пень, что я не буду давать ссылку на ресурс, где расположен данный сервис – кто ищет, тот всегда найдет. Тем не менее, что показывает данная интернет программка:

Анализ текста по закону Ципфа

По сути, только две важнейших характеристики:

  • Тошноту проверяемого контента.
  • Естественность.

Первый минус этого продукта заключается именно в показателях тошноты: разработчики явно не учли, что существует классическая и академическая вариация этой SEO характеристики.

А большинству людей, работающих в этой сфере, известно, что для снижения показателей каждого из вариантов используются совершенно разные способы (об этом доктор Айтупит постарается рассказать в одной из следующих своих статей).

Но «Ципфо-сервис» не сообщает об этом своим пользователям, что иногда может привести к некоторым затруднениям. Не буду долго мучить и скажу, что в данном случае подразумевается только классическая тошнота.

Переходим к «Естественности». Что оно такое? Я долго искал адекватную информацию по этому вопросу. Но нашел только постоянное переписывание каких-то заумных слов, понять смысл которых невозможно без пары бутылок пива. Нет, конечно, может быть я и тупой, но каждый из вас способен понять это:

«..

эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее..»

Эмпирическая, блин, закономерность… Это же надо было такое написать! Ну да ладно – Сатана ему не простит.

Не это самое интересное! Интересно то, что автором сего изречения является американский лингвист, который жил в середине прошлого века, когда об интернете знал только Джордж Лукас и Леонид Ильич Брежнев.

То есть, существуют люди, которые считают, что современные поисковики просто обязаны выполнять анализ по закону Ципфа? Пардонте, Мусье, но с хрена ли?..

Наверное, некоторые читатели после вышенаписанных слов решат, что автор сего опуса является типичным балаболом? Я постараюсь привести достойные аргументы, чтобы переубедить вас!

Прежде всего, обратимся к авторитетным источникам. Например, к представителю администрации известной на просторах Рунета биржи копирайта «Адвего». Вот, собственно, само мнение:

– Требование соответствия параметров текста закону Ципфа или, если быть точным, всяческим “сервисам”, якобы проверяющим тексты на такое соответствие – профанация чистейшей воды. Такое условие является бессмысленным как с точки зрения качества текста, так и с точки зрения его оптимизации для поисковых систем.

– Проверка по Ципфу – это сродни SEO-амулетам и фен-шую – слышал звон, да не знаю, где он.

А так как в SEO вообще много псевдонаучной мистификации из-за изначальной закрытости алгоритмов поисковых систем, то проверка по Ципфу очень гармонично присоседилась к более релевантным показателям качества – плотности ключей и уникальности, результаты которых в свою очередь тоже нужно принимать постольку-поскольку.

Никаких домыслов с моей стороны – честно скоммунизженные слова, написанные по поводу данного закона!

И я готов подписаться под каждым словом Жеки с Адвего. Давайте пофантазируем. Представьте, что перед вами стоит некий автомат. Вам требуется подойти и набрать на его табло произвольную комбинацию цифр.

Правильного числа никто не знает, поэтому каждый раз размер выигрыша разнится.

Некоторые люди просто вводят значения и уходят, другие начинают изобретать какие-то системы: танцуют румбу, три раза плюют строго под углом в пятнадцать градусов, съедают козюльку, засохшую три дня назад и так далее.

И тут одну из последних везет – он срывает куш! Почему ему повезло – хрен знает. Может просто угадал комбинацию, а может козюлька волшебная была. Но на следующий день этот человек приходит к автомату и устанавливает рядом столик, за которым предлагает всем желающим обязательно попробовать перед набором цифры его методику…

Все равно не убедил? Тогда воспользуюсь тяжелой артиллерией – проведу эксперимент.

Наглядная проверка текста по закону Ципфа

Для предстоящей работы я решил взять несколько разных ключевых фраз и проверить тексты на соответствие закону Ципфа, расположенные в разных местах ТОПа нашей отечественной поисковой системы Yandex. Приступим.

Первый ключ – «Строительство домой из бруса».

Выбираю сайт, который расположен вверху поискового рейтинга, делаю анализ:

дом из бруса. Первые места в ТОПе

Что имеем: естественность – 80, тошнота – 5.9.

Перехожу на страницу ниже в поисковике, выбираю сайт из третьего десятка, провожу анализ:

Дом из бруса. Во втором десятке ТОПа

Результат: естественность – 82, тошнота – 6.16.

Опускаюсь на десяток позиций ниже и повторяю процедуру:

Дом из бруса. где-то далеко-далеко

Итог: Е – 86, Т – 8.6.

Американский автор этого закона подошел бы, наверное, к автору последнего материала, и сказал бы ему – Вообще, красавчик!

Но в ТОПе то другое стоит! Мало? Повторяем проверку. Берем следующий ключ. Допустим – лечение геморроя.

Первое место в рейтинге:

Лечение геморроя. Первое место в ТОПе

Результат: Е – 70, Т – 11.23.

Ниже на два десятка позиций:

Лечение геморроя. Во втором десятке Топа.

Итог: Е – 91, Т – 4.90.

Еще на страницу ниже:

Лечение Геморроя. Примерно там, где находится сама болезнь.

Результат: Е – 91, Т – 4.12.

Заключение

Как видно из проведенного анализа, лучшие показатели естественности текстовых материалов по закону Ципфа совершенно не дают гарантию на успешность конкуренции с текстами, расположенными на других интернет-ресурсах. Впрочем, решать все равно вам…

Источник: https://helpmyos.ru/seo-kopirajt/zakon-tsipfa-sleduet-li-pisat-pod-nego-teksty/

Закон Ципфа. Естественность SEO-текстов

Мир SEO непрерывно развивается, и оптимизация не стоит на месте. Появляются новые методы написания текстов, их подготовка для лучшего индексирования. Одним из параметров, на который оптимизаторы обратили пристальное внимание, является естественность текста по закону Ципфа. В чем же заключается закон Ципфа и его роль в SEO-продвижении?

Согласно формулировке, закон Ципфа представляет собой установленную опытным путем закономерность расположения частоты слов в тексте.

Согласно закону, частота слова в тексте почти обратно пропорциональна его месту в списке.

То есть, если отталкиваться от закона, второе по частоте упоминания в тексте слово должно использоваться в два раза реже, чем первое, а третье — в три раза реже, и так далее.

Для простоты понимания данной закономерности стоит обратить внимание на расположение букв на компьютерной клавиатуре. Оно не случайно: наиболее часто употребляемые буквы любого языка располагаются удобнее, чем употребляемые реже. Ситуация со словами идентичная: существуют часто употребляемые слова и редко употребляемые, более значимые слова, определяющие тематику текста.

Разделение по значимости слов используется и при ранжировании сайтов в алгоритмах поисковых систем. С этим учетом различие слов по смысловой нагрузке и частоте употребления помогает разделить слова при написании SEO-текстов на 3 группы:

  • Вспомогательные. К этой группе относятся слова, не несущие самостоятельной смысловой нагрузки, например союзы, предлоги, местоимения, частицы. Все вспомогательные слова воспринимаются поисковыми системами как информационный шум и игнорируются при ранжировании.
  • Важные. Такие слова реже встречаются в текстах и несут существенную смысловую нагрузку. Поисковые системы воспринимают слова этой группы как ключевые.
  • Случайные. Слова этой группы нечасто используются для текстов конкретной тематики и практически не влияют на поисковое ранжирование.

По мнению SEO-специалистов, американский лингвист Джордж Ципф определил законы, которые начали использоваться поисковиками для определения естественности и уникальности текстов по частоте используемых слов.

Оптимизаторы часто сталкиваются с проблемами продвижения текста при высоких показателях уникальности и релевантности. То есть текст может быть уникальным на 100%, оптимизированным под ключевой запрос с высокой релевантностью, и при этом не выйти в топ или, что хуже, остаться вне поля зрения программ для анализа позиций.

Непросто установить, насколько закон Ципфа в отдельности влияет на результаты поисковой выдачи. Вероятнее всего, поисковики учитывают совокупность многих факторов, среди которых есть и проверка на естественность по Ципфу.

На сегодняшний день, в поисковом продвижении контент играет одну из важнейших ролей, поэтому при создании SEO-текстов рекомендуется тщательно следить за показателями уникальности и естественности. Существует множество сервисов для проверки текстов.

Остановимся на двух наиболее популярных и зарекомендовавших себя сайтах — 1y.ru и pr-cy.ru.

Сервис 1y.ru

Сайт позволяет проверить на естественность контента отдельные веб-страницы, сайты целиком или тексты объемом от 100 до 5000 слов. Ограничение для анонимных пользователей позволяет проверять до 2000 текстов в день.

Недостаток сайта заключается в том, что невозможно проверить веб-страницу без искажения результатов, так как сервис сканирует всю найденную текстовую информацию, включая рубрикатор, виджеты, меню и другие виды вспомогательного текста.

После проверки текста 1y.ru выдает статистику по содержанию с рекомендациями по уменьшению повторяющихся слов и предоставляет график с тремя кривыми: кривая значений проверяемого текста, кривая рекомендуемых значений и кривая идеальных значений.

Сервис pr-cy.ru

Этот ресурс также предоставляет возможность оценить естественность текстов и веб-страниц. Сервис отфильтровывает стоп-слова, рассчитывает процент тошноты текста, а также предоставляет рекомендации по уменьшению или увеличению количества вхождений согласно закону Ципфа.

Заключение

Разница результатов при проверке одного текста в различных сервисах может быть значительной. Так, первые три абзаца текста, который вы читаете, показали 59% по 1y.ru и 88% по pr-cy.ru.

Вывод напрашивается только один: при написании текстов не стоит уделять излишнее внимание вписыванию в тело статьи ключевых вхождений.

Писать нужно интересно и доступно, а если все же будет необходимо внедрить в текст ключевые слова, то стоит проверить текст по методу Ципфа.

Источник: https://blog.webformula.pro/article/zakon-tsipfa-estestvennost-seo-tekstov/

Увеличиваем естественность текста по закону Ципфа

Всем привет! В последнее время все чаще от коллег слышу о требовании в ТЗ оценивать качество текста по закону Ципфа. И далеко не все понимают, как нужно редактировать текст под этот закон. В сегодняшней статье попробую рассказать, как наиболее простым способом улучшить параметр, а также уточню почему хорошим авторам на самом деле это не нужно.

Определить качество текста по закону Ципфа можно по нескольким сервисам. Но, наиболее адекватным я считаю PR-CY, тут сочетается правильная формула с простым и понятным интерфейсом. Именно его я и использовал при подготовке этого материала.

Что такое закон Ципфа

Для начала стоит разобраться, что это такое. Если верить Википедии, сформулировал эту закономерность в 1908 году Жан-Батист Эсту, первоначально относился этот закон к стенографии. Первое известное широкой общественности применение закономерности относится к демографии, а точнее к распределению численности населения в городах, использовал ее Феликс Ауэрбах.

Современное название закономерность получила в 1949 году благодаря лингвисту Джорджу Ципфу. Он показал с ее помощью градацию распределения богатства среди населения. И только потом закон стали применять для определения читабельности текстов.

Как рассчитывается

Чтобы правильно использовать этот закон нужно понимать, как он работает. Разберем формулу для расчета.

FR=C

Где:

  • F – частота использования слова;
  • R – порядковый номер;
  • C – постоянная величина (число обозначающее самое большое по количеству повторов слово).

На практике более удобной оказывается другая формула, она выглядит понятнее.

F=C/R

Удобнее такой подход так как у нас есть данные по числу повтора максимально распространенного слова. Именно от этого количества и отталкиваются.

Если упростить, то в нашем тексте второе по повторяемости слово должно встречаться в два раза реже, чем первое. Идущее на третьем месте, в три раза и так далее.

Пример подгонки текста

С теорией немного разобрались. Осталось разобраться с практикой. В качестве подопытного текста взял статью из Т-Ж. Почему именно оттуда? Все просто. На текущий момент это один из лучших образчиков любимого многими инфостиля. Ну, и было интересно, что покажет текст, написанный под руководством Максима Ильяхова.

Скажу сразу, тексты по этому показателю на уровне, хотя, перелопатив более 40 сайтов вообще не нашел ни одной статьи с плохой естественностью.

Также, сразу забегу вперед и скажу, что подопытный текст после подгонки стал намного хуже, несмотря на улучшенный показатель по Ципфа, не стоит сильно заморачиваться по чрезмерному повышению естественности.

Вот что нам показал анализатор после проверки.

Разберем, что там указано. Как видим есть столбец со словами, а также непонятные цифры. В столбце «вхождения» (1) указано сколько раз встречаются словоформы в тексте.

В столбце «по Ципфу» (2) рекомендованное количество вхождений. Маркерами 3 и 4 помечены идеальные показатели для второй и третьей позиции.

Также стоит обратить внимание на рекомендации, здесь указано сколько слов нужно убрать для достижения идеального сочетания.

Для большего понимания разберем, что насчитал анализатор. За основу возьмем цифру 39 (C), также нам понадобится порядковый номер, обратим внимание на 2 (F) позицию. Берем формулу.

F=C/R

Подставляем.

F=39/2=19,5

Округляем в большую сторону и получаем 20, это и будет необходимым количеством вхождений. Что подтверждает и анализатор. У нас же второе по популярности слово употребляется 28 раз, соответственно 8 повторов нужно будет удалить или заменить.

Разобравшись с принципом работы закона начинаем редактировать. Для этого удаляем или заменяем на синонимы слова, у которых больше вхождений, чем это требуется по Ципфа. В результате получаем вот такую картину.

Как видите, мне удалось увеличить показатель с 83% до 88%. Но, при этом значительно пострадало качество текста. Не стоит стремиться к увеличению этого показателя до 100%. По факту, если у вас уже есть 75%, это отлично и дальше извращаться не стоит.

Ципфа и SEO

Теперь перейдем к тому, зачем требуется знание этой закономерности копирайтеру. Сеошники заказывая тексты стремятся сделать их наиболее удобными для поисковых систем.

Считается (правда, непонятно кем), что закон Ципфа активно используется поисковыми алгоритмами. Доказать или опровергнуть это утверждение сложно.

Никаких вменяемых исследований и экспериментов на эту тему мне найти не удалось.

Решил проверить самостоятельно. Для этого взял выдачу по такому конкурентному запросу «пластиковые окна», в Яндексе бралась московская выдача, в Гугле пришлось поколдовать, и он меня вроде тоже определил, как жителя столицы (по крайней мере рекламу мне показал с московской геолокацией). Брал первую страницу выдачи, плюс 49 место. Получилась вот такая табличка.

Если посмотреть внимательнее, можно обратить внимание, в Яндексе выдача более ровная, если смотреть на исследуемую нами закономерность. Но, при этом более высокий показатель не гарантирует победы в борьбе за первое место в топе.

На основании этого можно сказать, если поисковики и применяют данный закон, является он только одним из факторов. И не основным.

Выводы

Ну, вот и все. Теперь вы знаете, что такое качество текста по закону Ципфа, а также можете корректировать этот показатель. На самом деле тут нет ничего сложного, все достаточно просто. Достаточно один раз понять принцип работы этой закономерности.

Источник: https://copywriting-tarasov.ru/?p=552

Закон Ципфа: как и зачем производить новомодный анализ текста?

Солнце поднимается, рисуя в небе траекторию, так похожую на закон Ципфа… С Вами Ирина Иваськив. Сегодня поисковой маркетинг набирает внушительные обороты, в результате чего появляется множество сервисов для текстового анализа. Помимо проверки грамматики, уникальности, заспамленности и прочего, тексты начали анализировать и на естественность.

Поисковые системы без труда распознают искусственно сформированные тексты, автоматически выводя их из первых страниц результатов поиска. Вот почему для успешного продвижения продукта или услуги важно проверять тексты на естественность. Анализ текста по такому критерию осуществляется по закону Ципфа.

Что такое «закон Ципфа»? Как практически производится анализ текста по закону Ципфа? Обо всём этом поговорим в статье.

Значимость слов в тексте

Суть закона можно понять, взяв для примера компьютерную клавиатуру. Буквы на ней располагаются не в алфавитном порядке, а учитывая частоту встречаемости в словах.

Это означает, что буквы, которые используются в словах русского языка чаще других, располагаются на русской клавиатуре ближе к центру (так удобнее для глаз и пальцев), а буквы, которые используются реже (например, буквы ё, ъ, э, й), располагаются на клавиатуре дальше от центра.

 Так же и поисковые системы распределяют сайты по позициям (в топе или подальше от него) в зависимости от значимости слов в тексте, условно разделяя их на 3 группы:

  • Важные слова: значимые ключевые тематические слова, несущие в себе основной смысл, в тексте встречаются не часто, в тексте их примерно 20% (но именно они и «вытягивают» тексты на высокие оценки – практическое действие закона Парето)
  • Случайные: такие слова к основному смыслу текста прямого отношения не имеют, встречаются не часто (в этом их плюс), влияния на распределение сайтов в поисковых результатах не оказывают
  • Вспомогательные: такие слова используются в предложениях, в основном, как связующие, к смыслу текста напрямую не относятся и, как и случайные слова, на результаты поисковой выдачи не влияют

Появление закона Ципфа

Джордж Ципф

Один из ключевых законов, используемых в инфометрии. Назван закон в честь лингвиста из США Джорджа Ципфа. Именно он популяризировал интересные закономерности, выявленные стенографистом из Франции Жаном-Батистом-Эсту в 1908 году.

Выявленные закономерности применялись в разных сферах: в классификации городов по их размерам, в распределении экономических ресурсов, в распределении социальных статусов и т.п. Джордж Ципф привлёк внимание к этим закономерностям, и вскоре родилась теория естественности текста.

Использоваться применительно к текстам она стала примерно с середины ХХ столетия.

Условная схема “1-2-3”

Согласно закону Ципфа, естественный текст будет выглядеть примерно так. Допустим, самым часто употребляемым словом в тексте является слово «программист». Следующее за ним по частоте употребления – слово «сайт», а после него – слово «продвижение».

Если слово «программист» используется в тексте 12 раз, то для естественности слово «сайт» должно быть использовано в тексте 6 раз, а слово «продвижение» – 3 раза. Текст, составленный таким образом, пройдёт проверку на естественность и будет включён в верхние позиции поисковых запросов.

 Другими словами, суть закона Ципфа можно выразить так:

  • второе слово должно использоваться в 2 раза реже, чем первое (12:2=6 раз)
  • третье слово должно использоваться в 3 раза реже, чем первое (12:3=4 раза)
  • и так далее

Давайте назовём эту закономерность условным названием «1-2-3», где 1 – первое слово, 2 – второе слово, 3 – третье слово. Цифры 2 и 3 напомнят также, что второе слово надо использовать в 2 раза реже, а третье – в 3.

Анализ текста по закону Ципфа

Для точного определения соответствия закону Ципфа используется формула:

FR=C

где F обозначает, как часто используется то или иное слово, R – номер слова по порядку, C – величина постоянная, обозначающая общее количество раз использования наиболее часто встречающегося слова в тексте

Есть более простая и удобная формула:

Кратко резюмируем сказанное:

  • основываясь на этом методе, абсолютно любой текст можно проанализировать на предмет естественности
  • текст, который соответствует описанной выше схеме не меньше, чем на 30-50%, считается естественным
  • текст, получивший оценку от 50% и выше, считается очень хорошим (чем выше процент, тем текст идеальнее)
  • текст, который получил оценку меньше, чем 30% по закону Ципфа, лучше ещё раз тщательно вычитать

Важные предостережения

Сегодня уже доказано, что набор несвязных случайных слов тоже будет подчиняться теории Ципфа. Другими словами, анализ текста по закону Ципфа – это самый обычный математический анализ, статистический феномен, искусственно созданный инструмент. Закон Ципфа не имеет отношения:

  • к содержательности текста, ведь если проверить литературные произведения великих классиков, то окажется, что многие из них не соответствуют данному закону
  • к профессионализму автора, ведь любую бессмысленную кучку слов можно «заточить» таким образом, что закон Ципфа определит текст как «профессиональный»
  • к оригинальности текста, ведь 100%-ную уникальность могут иметь как тексты с высокими оценками по Ципфу, так и тексты с низкими оценками по Ципфу
  • к продвижению сайтов, ведь на первой странице выдачи часто оказываются тексты с низкими оценками по Ципфу, а на 99-й – тексты с высокими оценками по Ципфу

Часто смотрю на задания на биржах фриланса, в которых заказчики изощряются в перечислении всех мыслимых и не мыслимых искусственных критериев, и улыбаюсь… Те, кто заинтересован в качественных, читабельных, профессиональных текстах, указывают совершенно другие требования: например, раскрыть тему, свести «воду» до минимума, дать людям пользу от чтения и т.д.

Кому необходим закон Ципфа

Но, безусловно, есть и практическая польза от проверки текстов по Ципфу. Анализ текста по закону Ципфа регулярно проводят:

  • писатели
  • копирайтеры
  • SEO-специалисты
  • маркетологи
  • веб-программисты

Все эти специалисты понимают: какой бы полезной ни была SEO-оптимизация текстов, писать в любом случае надо для людей, а не для поисковых роботов. Текст не должен напоминать свалку ключей в угоду SEO-тенденциям. Людям должно быть интересно читать тексты. Поэтому писателям и копирайтерам важно проверять свои тексты перед сдачей заказа. Объясню это на 3-х примерах:

1. Закон Ципфа и ключевые запросы

Для высоких показателей естественности текста необходимо грамотное вхождение в него ключей. Ключевые слова должны использоваться с большими разрывами между ними.

 Зачастую заказчики в технических заданиях для копирайтеров указывают точное количество вхождений ключевых слов в текст, запрещая вставлять в ключевых фразах предлоги и другие слова. Если соблюдать эти условия, добиться высокого показателя согласно закону Ципфа маловероятно.

А вот текст, основанный на свободном вхождении естественного количества ключевых слов, будет оценён намного выше.

Строго соблюдая ТЗ, всё равно необходимо помнить о том, что основным должно быть ТОЛЬКО ОДНО ключевое слово. Именно оно и должно встречаться в тексте НАИБОЛЬШЕЕ КОЛИЧЕСТВО РАЗ. Остальные слова будут употребляться в меньшем количестве – в соответствии со схемой 1-2-3.

Техническое задание можно считать правильным, если заказчик предоставил только ключи, без требований употребить их строго столько-то раз.

В этом случае надо будет просто определить главное слово, которое и будет использоваться чаще других, а другие слова надо будет использовать меньшее количество раз в зависимости от их значимости.

Анализ текста по Ципфу как раз покажет, удалось ли главное слово сделать главным (или его обскакали по частоте какие-то незначимые слова). По результатам можно увидеть, где доработать вхождение ключей (какие из них увеличить по частоте употребления, а какие – сократить).

2. Закон Ципфа и стоп-слова

Анализ текста по Ципфу покажет и частоту стоп-слов, и Вы будете видеть, количество каких не значимых слов уменьшить, чтобы не получилось так, что заурядный предлог или союз окажется вдруг по частоте употребления на первом месте. Вычитывая текст, заметить это нереально, а вот анализ текста покажет эту проблему в 2 клика.

3. Анализ Ципфа и продвижение сайтов

Анализ текста по Ципфу необходим всем, кто занимается продвижением сайтов. Потому что анализ показывает и уровень естественности всего сайта в целом. Этот показатель также измеряется в процентах. Чем выше показатель, тем скорее поисковики полюбят ваш сайт.

Высокий показатель для них будет означать одно: на вашем сайте нет спама. Хорошими будут оценки от 50% и выше, но стремиться надо к максимуму – к 100%. К примеру, анализ сайта показал, что самыми частыми словами, которые блоггер машинально использует, оказались «дети, детей, детям».

Но если его блог не о детях, а о семейной психологии, то лучше было бы, чтобы в верхушке самых частых слов оказались вариации слов «психология» и «семья».

То есть ему при написании текстов надо будет помнить об этом и использовать варианты слова «дети» реже, а варианты слов «психология» и «семья» чаще.

Закон Хипса в копирайтинге

Очень похож на закон Ципфа, являясь его следствием. Если не влезать в дебри формул, то закон Хипса показывает количество уникальных слов в тексте в зависимости от его длины.

Классический график по закону Хипса строится примерно так: по горизонтали – объём текста, по вертикали – количество уникальных слов в тексте. Чем длиннее текст, тем количество уникальных слов должно быть выше. Если этот показатель не повышается, автор начинает лить воду.

По графику будет заметно, с какого момента оригинальность текста остановится в развитии.

Сервисы для анализа по Ципфу

Сегодня множество сервисов и ресурсов способны анализировать тексты по закону Ципфа. Наберите в поисковой строке “Проверить текст по закону Ципфа”, и высветится несколько ресурсов, где можно будет произвести такой анализ текста бесплатно.

Хотите зарабатывать написанием текстов? В Школе Копирайтинга Вы можете освоить профессию копирайтера, SEO-копирайтера, контент-менеджера

Источник: http://lifeacademy.pearl.pp.ua/zakon-cipfa-kak-i-zachem-proizvodit-novomodnyj-analiz-teksta.html

Сервисы комплексного анализа текстов и хрелион факторов

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

на рассылку и получи книгу в подарок!

Итак ваш текст на сайте прочитали несколько человек:

Филолог сказал, что у него глаза вытекли, журналист написал сотню поправок, ваш SEO специалист сообщил, что трафика не будет даже в 2030 году, маркетологи огорчили, что цели можно даже не настраивать, конверсии ждать не придется. Ваши друзья сказали “норм”, вы сами думаете, что все вообще идеально.

В такие моменты хочется получить нейтральную оценку, независимую от субъективизма оценщика, но это невозможно в природе, у всех анализирующих будут свои пристрастия, так что единственный вариант — сравнение с текстами конкурентов по каким-то количественным характеристикам.

В статье речь не о том, какие факторы нужны, а какие нужнее и нет цифр какие нужно достигнуть. Скорее это некий список факторов, которые можно измерить и посчитать так или иначе с помощью сервисов или рук.

Зачем вообще проверять тексты для сайта?

Если пользователь желает конкретики и мяса в статье, а вместо этого получает воду и листочек салата, то это явно его расстроит. Он закроет такую статью и, скорее всего, больше не вернется к вам на сайт.

Поисковые роботы тоже весьма подробно разбирают текст на странице, чтобы оценить степень его полезности для пользователя. Только лучшие тексты попадут в ТОП поисковой выдачи.1. Если в текстах слишком много ключевиков — робот сочтет, что страницы была создана исключительно в SEO-целях и не покажет её в ТОПе.2.

Если ваш текст, как и огурец, на 80% состоит из воды или степень тошноты на том уровне, когда и правда тошнит от одних и тех же слов — пользователь не увидит ваш текст.

3.

Если ради прямых вхождений вы пожертвовали смысловой согласованнстью предложений — будьте уверены, страницу сочтут переоптимизированной, а значит не несущей пользу для посетителя.

Какие показатели важны?

  • Количество орфографических ошибок
  • Количество слов.
  • Количество уникальных слов.
  • Вода.
  • Тошнота.
  • Плотность.

Сервис анализа текстов: разберем все, что нашли

Istio

Сервис анализа SEO текстов. Он проверит:

  • орфографию;
  • длину текста (количество слов и символов);
  • тошноту (насколько часто одно и то же слово встречается в тексте);
  • плотность ключевых слов;
  • количество воды в тексте.

Очень крутая функция — можно посмотреть карту и визуально понять, какое слово вы любите больше всего:)

Выделяет слова, которые по мнению программы, являются водой.

Text.ru

Вообще, Текст.ру — это биржа статей со встроенным сервисом комплексного анализа текстов. Чем он может быть полезен:

  • проверить статью на уникальность;
  • сделает SEO анализ;
  • выявит орфографические ошибки;
  • посчитает символы, слова, водность статьи.

Забавно получилось. Когда я делала скриншот, обнаружилось, что кто-то спер нашу статью.

Главред

С помощью этого сервиса можно проверить текст слова-паразиты, стоп-слова, сомнительные формулировки и другого словесного мусора, который размазывает всю суть текста (как и цель).

Сразу скажу, Главред не подходит для проверки художественных текстов или статей из нашего блога, например. Дело в том, что сервис считает шлаком любой художественный оборот.

Но если необходимо донести до читателя какую-либо конкретику, то этот сервис как раз то, что вам нужно.

Анализ текста по закону Ципфа

С помощью этого  сервиса анализа текста можно проверить статью по закону Ципфа. Как рассказывал мне руководитель нашего контент-отдела, раньше этот закон считали открытием и разгадкой великой тайны Яндекса.

Суть вот в чем: закон Ципфа говорит, что если упорядочить все слова определенного текста по уменьшению частоты их использования, то частота n-го слова будет около обратно-пропорциональной его рангу (порядковому номеру n). Например, второе слово используется в два раза реже, чем первое, т. д.

По поводу великой разгадки все, конечно же, ошиблись, но анализ текста никогда не бывает лишним.

С помощью этого сервиса можно оценить естественность текста. Чем выше процент результата, тем идеальней страница. Как пишут разработчики: хороший показатель естественности начинается от 50% и выше.

Seozor analyzer

Вес слов очень важен как в тексте для сайта, так и при формировании анкор-листа. С помощью данного сервиса вы можете проанализировать тексты  сайты из ТОП- 10 и определить среднее количество ключевиков, длину текста и все вхождения.

Основываясь на частотном SEO анализе, сервис сам определит ключи, а также вес каждого слова.

TextAnalyzer

Проводит комплексный анализ: с помощью этого сервиса можно узнать не только стандартные характеристики текста (символы, водность и т.д.), но и часто встречаемые последовательности слов. Забавная фишка — частотный словарь.

Анализ помогает понять насколько ваш текст естественен (потому что тексты нужно писать для людей, а не для поисковиков). Измеряет следующие характеристики:

  • тошнота;
  • плотность текста;
  • уникальные слова;
  • символы;
  • водность;
  • количество предложений, а также их длину;
  • кол-во запятых.

Анализ позволит вам разобраться, где нужно усовершенствовать ключевые слова, то есть увеличить или уменьшить.

Seolib

Сервис анализа релевантности текстов. Сравнивает плотность ключевых фраз, объем текстов и иных показателей сайтов из Топ-10 по 5 запросам или страниц, которые вы указали вручную. 

Очень полезная штука для комплексного анализа статьи при тематическом трафике.

Тopwriter

Применяя неизвестные нам, простым смертным, алгоритмы этот сервис анализа текстов поможет вам выявить качество рерайта. Очень полезен для копирайтеров и рерайтров.

SeoTXT

Простой интерфейс для комплексного анализа текстов с возможностью не учитывать слова размером до пяти символов.

Чем полезен:

  1. Определяет плотность ключевиков.
  2. Отсекает слова по длине (указывается в символах) и «шумовые» слова, которые не нужны при анализе текста (управляемые опции).
  3. Умеет учитывать или не учитывать (опционально) числа в анализируемом тексте в качестве слов
  4. Генерирует ключевые слова на основе заданных вручную списков.
  5. Ищет фразы, состоящие не более чем из 1,2,3,4 слов

Источник: https://semantica.in/blog/servisy-kompleksnogo-analiza-tekstov-i-khrelion-faktorov-dlya-analiza-tekstov.html

Закон Ципфа – естественность текста

SEO копирайтинг

20.03.2019

19 комментариев

Лингвист по образованию Джордж Ципф обратил внимание на слова, которые люди используют в речи. Его исследования привели к тому, что он выделил набор слов, которые применяются постоянно, в то же время остальные слова употребляются редко. При оценке слов Джордж Ципф отметил закономерность.

Слова первого ранга в два раза популярнее, чем слова второго и в три раза популярнее, чем слова третьего ранга. Использование закона Ципфа помогает в оптимизации текстов под поисковых роботов.

Чтобы понимать, как работает закон на практике, была придумана специальная формула, по которой можно вычислить закономерность использования определенных слов.

Формула закона: F*R=C;

F — количество слов в тексте;

R — ранг слова;

C — постоянная величина.

Графическое изображение закона напоминает гиперболу.

Формула закона Ципфа

Для чего это нужно?

Когда тексты создаются не естественным путем (сгенерированные), у них много ключевых фраз, то они не вписываются в рамки закона Ципфа. Поисковые роботы при анализе страниц обращают внимание на «естественность» материала.

В связи с последними фильтрами Яндекса и Google оптимизаторы стали обращать внимание на тошноту текстов, сколько раз употребляются слова, учитываются даже стоп слова и предлоги.

Тексты, которые заспамлены ключевыми словами — они понижаются в выдаче, теряют популярность и свой рейтинг. И сайты с таким контентом ждет бан от поисковиков. Понижаются в выдаче тексты, которые содержат дешевый, но уникальный рерайт. Такому контенту никогда на занять первых мест в выдаче, не получить долю трафика.

Упражнение от Ципфа выглядит так: необходимо взять любой текст и посчитать, сколько раз повторяются в нём слово. Самые повторяемые отнести к первому рангу, следом идут слова 2 ранга и так далее. Расчеты будут точными с точки зрения математических данных, но в погоне за совершенством главное не потерять уникальность и читабельность информации.

На основании полученных цифр построить график. Получится резкая линия вниз, потом плавный переход в плоскость, далее движение по горизонтальной прямой.

Закон Парето-Ципфа

Закон Ципфа позволяет оценить словарный запас любого человека. Высокое значение – человек начитанный и использует много слов, низкое значение — бедный лексикон, мало слов. Когда у копирайтера не хватает слов для написания качественного текста, он не может умело заменять слова при их повторениях, он никогда не вырастет как профессиональный автор.

Оптимизаторы стараются не работать с авторами, не способными качественно обрабатывать информацию, потому что у такого контента мало будущего, статьи не дадут необходимого трафика и это в результате закончится глубоким разочарованием. Ведь написать уникальную статью сможет человек с богатым словарным запасом.

Благодаря закону Ципфа легко измерять значения текстов, просто оценить в цифрах эрудицию человека.

Другой ученый Мандельброт решил использовать закон Ципфа в математике и модифицировал его, составив следующую формулу:

F = C*R-1/a;

а — богатство словарного запаса человека. Его высокое значение означает, что текст насыщен разными словами, а не одними и теми же.
Но закон Ципфа не всегда работает идеально и его применение уместно не во всех сферах, он больше напоминает закон «Парето», только наоборот.

Как использовать закон для оптимизации?

Предположим, что поисковые алгоритмы ранжируют сайты и проверяют тексты на «естественность». Тогда любые автоматические статьи, созданные с помощью программ, сразу же распознаются. Это является большим плюсом, не будет автоматического контента.

Затронем взаимосвязь тематики сайта и частотности слов. Образуются частотные словари, действующие в рамках наборов текстов тематики. Чтобы получить эталонную частотность слов, необходимо проанализировать набор текстов, собрать ядро повторяющихся слов.

Любой текст с выбранной темой можно проверить, сравнив его с эталонной частотностью.

Существует мнение, что поисковые роботы используют при анализе именно данный принцип. Это является лишь предположением, но все же естественность в текстах играет свою роль.

Как трактуется закон Ципфа в Вики?

Это закономерность использования повторяющихся слов в тексте. Если взять и посчитать слова, потом выложить и в виде графика по частоте повторяемости, то в результате частота n-го слова будет обратно пропорциональной номеру n. Первое по популярности слово будет встречаться в два раза чаще, чем второе, второе будет в два раза чаще, чем третье и так далее.

Модель Ципфа «Ранг-Размер»

Для лучшего понимания закона, будет уместным использовать следующие правила:

  1. Малое количество слов используется человеком очень часто, поэтому на графике линия почти вертикальная.
  2. Среднее число слов у человека используется также среднее количество раз, т.е. находится где-то посередине.
  3. Много слов применяется человеком очень редко, поэтому на графике правая линия почти горизонтальная прямая.

Сервисы для естественности текста:

По данным сайтам легко проверить весь сайт или отдельную страницу.

кто хочет в группу единомышленников присоединяйтесь к нам

Присоединиться

12

Интересное:

Источник: https://lisel85.ru/copywhiting/seo-copywriting/zakon_tcipfa_estesvennost