Как манипулировать «пауком» Google, чтобы получить наивысший рейтинг, который заслуживает ваш сайт!
Декабрь 13, 2007 8:20 amСегодня мы соединим вместе четыре нити, с помощью которых мастера SEO могут управлять хитроумными пауками поисковых систем, словно марионетками.
Конечно же, я имею в виду:
Атрибут nofollow (часто называемый
тегом «nofollow») – тег, работающий на уровне ссылки, когда вы помещаете его в отдельную ссылку.
Метатег nofollow - тег, работающий на уровне страницы, когда вы добавляете его в секцию <head> своей веб-страницы.
Метатег запрета индексации – другой тег, работающий на уровне страницы, когда вы помещаете его в секции <head> своей веб-страницы.
Файл robots.txt – работает на уровне сайта и контролирует индексацию всех ваших веб-страниц, когда вы его размещаете в ту же директорию, что и главную страницу сайта (т.е. в корневую директорию).
Каждый из этих инструментов выполняет свою уникальную функцию. Необходимо, чтобы вы понимали её прежде, чем приступите к управлению сбором информации с вашей страницы и её последующей индексацией и ранжированием. Итак, чтобы вы стали экспертом по «паукам», давайте определим четкие границы между сбором информации, индексированием и ранжированием.
Сбор информации – процесс, когда поисковая система загружает страницу, сканирует её на наличие ссылок, а затем проходит по этим ссылкам, чтобы найти больше страниц. Учтите, что, хотя поисковая система заходит на страницу, это не обязательно значит, что она в действительности сохраняет контент этой страницы на своих серверах; это также не означает, что поисковая система будет отображать страницу в результатах поиска. С технической точки зрения, это значит, что поисковая система знает о данной странице.
Индексация происходит после того, как поисковая система зашла на страницу и обработала её контент, чтобы извлечь из него ключевые слова, определяющие, о чем эта страница. Затем данные о странице сохраняются для последующих показов в результатах поиска. Каждая проиндексированная страница должна сначала подвергнуться собору информации, но, как видите, не все страницы, прошедшие сбор информации, проходят индексацию
Ранжирование – результат расчета поисковой системы, учитывающего контент, найденный на странице, на сайте и по ссылкам, расположенным на странице и сайте. Здесь вступает в дело алгоритм расчета авторитетности страницы (Google PageRank), чтобы определить, где и по каким ключевым словам/фразам должна отображаться ваша страница в результатах поиска.
Подробнее об алгоритмах поисковых систем см. в Базовом SEO курсе.
Заметьте, что когда мы в этой статье говорим о PageRank (PR), мы не имеем в виду рейтинг страницы, отображающийся на панели инструментов Google. Важно знать разницу, потому что PageRank на панели инструментов (TPR) это лишь приближенное значение действительного PageRank (APR). Известно, что Google отображает данные PageRank месячной давности (а то и старее).
Вместо этого, мы ссылаемся на APR по вопросам того, что в англоязычной части интернета обычно именуют термином link juice, что значит «способность страницы зарабатывать рейтинг для себя и других страниц, основанная на качестве и количестве входящих ссылок страницы».
Веб-страницы реализуют этот принцип, когда ссылаются друг на друга. Все крупные поисковые системы используют принцип link juice в качестве главного фактора при ранжировании.
Кстати, интересно проанализировать работу иностранных линк-брокеров, например, linkjuice.net. Они дают информацию не только по PageRank ссылающейся страницы, но и подсеть IP класса C, местонахождение сайта и кол-во слов в анкоре, т.е. в тексте ссылки. Более подробно о влиянии этих параметров расписано в Базовом SEO курсе.
- 2008-03-11 / Сегментация посетителей при ...
- 2008-02-29 / Семинар - Современный интернет-маркетинг ...
- 2008-02-26 / Как перенаправить существующих ...
- 2008-02-26 / Как оптимизировать Flash-сайты
- 2008-02-25 / Купить SEO софт по выгодной цене
- 2008-02-25 / Запуск курса контекстной рекламы
- 2008-02-25 / Как проверить интернет-маркетолога ...
- 2008-02-25 / Как тестирование целевых страниц ...
- 2007-12-13 / Как манипулировать «пауком» ...
- 2007-12-10 / Схема «Стратегии получения ...
Возможности парсера текстов
- разработали и внедрили систему «портатор» которая позволяет парсить контент без использования сигнатур
- возможность парсить ленты которые работают через фидбурнер редирект
- многоязычность интерфейса
- добавление публикаций в блог через xml-rpc (стандарт Metablogger)! Теперь все другие плагины и системы
- блога полноценно отробатывают. В их числе системы кроспостинга в ЖЖ и т.п. а также пинг!
- новый тэг title позволяет парсить любой участок контента и устанавливать его как заголовок
- принудительная установка кодировки контента
- возможность вводить логин и пароль для использования платных прокси
- исправлена проблема двойных тайтлов и альтов для картинок
- CSV формат базы данных синонимов который позволяет импортировать словосочетания
- принудительная установка кодировки контента для статического парсера
- заменять некоторые символу русского языка на латинские, которые внешне совпадают. а, с, o
- экспорт/импорт всех настроек в файл
- исправлена проблема в сортировщике по категориям в зависимости от наличия ключевых слов
- исправлена и доработана система Highlight keywords? позволяющая «подсвечивать» нужные ключевые слова
- жирным либо италиком.
- замена словосочетаний (если таковые есть в базе синонимов)
- «умная» вставка тэга more. Не в разрыв тегов типа b и i.
- вернули параметр Max post on day: и сделали выбор между текущим ограничителем и Max post on day:. Теперь
- можно устанавливать ограничение на парсинг как определенного количества публикаций в день так и в запуск.
- возможность синонимизировать тексты уже наполненного wp
- при активации плагина выполняется команда для базы данных ALTER DATABASE `база` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci которая производит изменение кодировки базы данных в правильную.
- кнопка «тест» позволяющая протестировать парсинг источника.
- возможность использовать несколько {skip}
- возможность грабить картинки с RSS
- возможность грабить видео с youtube.com по кивордам и вставка его до или после контента
- добавили поддержку кодировки charset=ISO-8859-1
- улучшили эргономику и информативность системы
- добавили лог ошибок
- система добавления ссылок на публикации в популярные сервисы закладочники.
- функция удаления всех публикаций добавленных в блог одной кнопкой.
- возможность синонимизировать заголовок публикации
- проверка новых версий
