Как манипулировать «пауком» Google, чтобы получить наивысший рейтинг, который заслуживает ваш сайт!
Декабрь 13, 2007 8:20 amСегодня мы соединим вместе четыре нити, с помощью которых мастера SEO могут управлять хитроумными пауками поисковых систем, словно марионетками.
Конечно же, я имею в виду:
Атрибут nofollow (часто называемый
тегом «nofollow») – тег, работающий на уровне ссылки, когда вы помещаете его в отдельную ссылку.
Метатег nofollow - тег, работающий на уровне страницы, когда вы добавляете его в секцию <head> своей веб-страницы.
Метатег запрета индексации – другой тег, работающий на уровне страницы, когда вы помещаете его в секции <head> своей веб-страницы.
Файл robots.txt – работает на уровне сайта и контролирует индексацию всех ваших веб-страниц, когда вы его размещаете в ту же директорию, что и главную страницу сайта (т.е. в корневую директорию).
Каждый из этих инструментов выполняет свою уникальную функцию. Необходимо, чтобы вы понимали её прежде, чем приступите к управлению сбором информации с вашей страницы и её последующей индексацией и ранжированием. Итак, чтобы вы стали экспертом по «паукам», давайте определим четкие границы между сбором информации, индексированием и ранжированием.
Сбор информации – процесс, когда поисковая система загружает страницу, сканирует её на наличие ссылок, а затем проходит по этим ссылкам, чтобы найти больше страниц. Учтите, что, хотя поисковая система заходит на страницу, это не обязательно значит, что она в действительности сохраняет контент этой страницы на своих серверах; это также не означает, что поисковая система будет отображать страницу в результатах поиска. С технической точки зрения, это значит, что поисковая система знает о данной странице.
Индексация происходит после того, как поисковая система зашла на страницу и обработала её контент, чтобы извлечь из него ключевые слова, определяющие, о чем эта страница. Затем данные о странице сохраняются для последующих показов в результатах поиска. Каждая проиндексированная страница должна сначала подвергнуться собору информации, но, как видите, не все страницы, прошедшие сбор информации, проходят индексацию
Ранжирование – результат расчета поисковой системы, учитывающего контент, найденный на странице, на сайте и по ссылкам, расположенным на странице и сайте. Здесь вступает в дело алгоритм расчета авторитетности страницы (Google PageRank), чтобы определить, где и по каким ключевым словам/фразам должна отображаться ваша страница в результатах поиска.
Подробнее об алгоритмах поисковых систем см. в Базовом SEO курсе.
Заметьте, что когда мы в этой статье говорим о PageRank (PR), мы не имеем в виду рейтинг страницы, отображающийся на панели инструментов Google. Важно знать разницу, потому что PageRank на панели инструментов (TPR) это лишь приближенное значение действительного PageRank (APR). Известно, что Google отображает данные PageRank месячной давности (а то и старее).
Вместо этого, мы ссылаемся на APR по вопросам того, что в англоязычной части интернета обычно именуют термином link juice, что значит «способность страницы зарабатывать рейтинг для себя и других страниц, основанная на качестве и количестве входящих ссылок страницы».
Веб-страницы реализуют этот принцип, когда ссылаются друг на друга. Все крупные поисковые системы используют принцип link juice в качестве главного фактора при ранжировании.
Кстати, интересно проанализировать работу иностранных линк-брокеров, например, linkjuice.net. Они дают информацию не только по PageRank ссылающейся страницы, но и подсеть IP класса C, местонахождение сайта и кол-во слов в анкоре, т.е. в тексте ссылки. Более подробно о влиянии этих параметров расписано в Базовом SEO курсе.
Оставить комментарий
- 2008-03-11 / Сегментация посетителей при ...
- 2008-02-29 / Семинар - Современный интернет-маркетинг ...
- 2008-02-26 / Как перенаправить существующих ...
- 2008-02-26 / Как оптимизировать Flash-сайты
- 2008-02-25 / Купить SEO софт по выгодной цене
Возможности парсера текстов
- Простая утсановка
- Выдирание контента напрямую из RSS ленты
- Выдирание контента из html файлов
- Сохранение и изменение размеров награбленых изображений. Рисунки можно сохранять у себя на сервере или же просто оставлять как было (hotlink)
- Поддержка ArticleMS, Danneo, DataLife Engine, Seditio, Strawberry, Subdreamer, WordPress
- Модерирование уже отпарсенного контента
- Возможность автоматической замены текстовых блоков или слов
- Фильтр ключевых слов позволяет задавать обязательные или запретные ключевые слова
- Определение раздела статьи по плотности ключевых слов
- Замена ключевых слов ссылками (можно использовать маски для определения ссылок от списка ключевиков).
- Создание неограниченного количества парсеров позволяет тянуть контент с многих источников, тем самым повышая уникальность проекта.
- Нет ограничений по времени, количество сайтов зависит от выбранного пакета.
- Фильтр html тегов позволяет очистить контент от исходящих ссылок или других ненужных елементов.
- Можно изменять длину превью текста. Разумное разделение текста между абзацами.
- Возможность добавления копирайта в конец текста статьи
- Встроеный скрипт редиректа ссылок
- Простота установки и настройки
- Хорошее понимание как английского так и русского текста, благодаря наличию встроенных конвертеров кодировок (UTF-8, windows-1251)
- Работа с прокси серверами
- Отправка напарсенного контента на e-mail администратора
- Поддержка WPKeys плагина
Подробнее о возможностях парсера контента »


























