Первые шаги. Настройка парсера
Январь 10, 2007 8:35 pm1. Создайте парсер для вашего сайта-источника, укажите " " (пробел) как границы парсинга.
2. Добавьте RSS или Atom ленту. Укажите раздел на сайте, куда будут вставлятся новые статьи и выберите созданный парсер.
3. Перейдите в раздел "Параметры" и включите режим debug.
4. Вернитесь в раздел "RSS ленты" и запустите тестер ленты, нажав на иконку листа с зеленой стрелкой.
5. Найдите на странице тестера ссылку на страницу-источник и откройте ее в новом окне. Скопируйте в буфер обмена несколько первых слов вначале текста статьи. Вернитесь на страницу тестера и с помощью команды "Найти на странице" (Ctrl + F) и найдите начало статьи в html коде после заголовка Trimmed spaces. Выделите верхнюю границу парсера и вставьте в настройки парсера.
Аналогично найдите нижнюю границу парсера.
6. Проверьте правильно ли парсится статья - текст под заголовком Parsed article. После чего отключите режим debug в разделе "Параметры".
Парсер готов к работе. Запускайте парсер с помощью ссылок в разделе Действия в меню.
Скриншоты процеса настройки
Оставить комментарий
- 2008-03-11 / Сегментация посетителей при ...
- 2008-02-29 / Семинар - Современный интернет-маркетинг ...
- 2008-02-26 / Как перенаправить существующих ...
- 2008-02-26 / Как оптимизировать Flash-сайты
- 2008-02-25 / Купить SEO софт по выгодной цене
Возможности парсера текстов
- Простая утсановка
- Выдирание контента напрямую из RSS ленты
- Выдирание контента из html файлов
- Сохранение и изменение размеров награбленых изображений. Рисунки можно сохранять у себя на сервере или же просто оставлять как было (hotlink)
- Поддержка ArticleMS, Danneo, DataLife Engine, Seditio, Strawberry, Subdreamer, WordPress
- Модерирование уже отпарсенного контента
- Возможность автоматической замены текстовых блоков или слов
- Фильтр ключевых слов позволяет задавать обязательные или запретные ключевые слова
- Определение раздела статьи по плотности ключевых слов
- Замена ключевых слов ссылками (можно использовать маски для определения ссылок от списка ключевиков).
- Создание неограниченного количества парсеров позволяет тянуть контент с многих источников, тем самым повышая уникальность проекта.
- Нет ограничений по времени, количество сайтов зависит от выбранного пакета.
- Фильтр html тегов позволяет очистить контент от исходящих ссылок или других ненужных елементов.
- Можно изменять длину превью текста. Разумное разделение текста между абзацами.
- Возможность добавления копирайта в конец текста статьи
- Встроеный скрипт редиректа ссылок
- Простота установки и настройки
- Хорошее понимание как английского так и русского текста, благодаря наличию встроенных конвертеров кодировок (UTF-8, windows-1251)
- Работа с прокси серверами
- Отправка напарсенного контента на e-mail администратора
- Поддержка WPKeys плагина
Подробнее о возможностях парсера контента »


























