Собираем свежие проксилисты

Колега обратился в аську с просьбой дать адресса прокси листов для парсинга.

расмотрим как их находить самим за десять минут.

Для этого я использую Hrefer , который идет в комплекте с хрумером. (покупайте сию штуку если знаете как её применить. Малая часть отбивает леньги затраченые на покупку даного продукта).

И так, начнем. Открываем папку с хрефером и копируем подпапку proxyc на свой сервер. Прописуем путь в настройках парсера и чекаем прокси  со старым листом. Как наберется хоть 50 анонимных прокси останавливаем чек. Дальше берем этот список и копируем в (words/proxy.txt) текстовый файл слов для парсинга.

находим файл engines.ini и заменяем строчку после Hostname=http://[GOOGLEHOST]  на:
q=[QUERY]&num=100&hl=en&tbs=qdr:d

&tbs=qdr:d — фильтр на показ выдачи за последние 24 часа.

В Additive words добавляем следующие:

  • прокси
  • список
  • list
  • proxy

Теперь запускаем парсинг.  Копируем сохраненые линки с проксилистами в файл links.txt на вашем сервере с чекалкой.

После этого можно спокойно запустить чекалку проксяков. +500 анонимных прокси гарантирую.

П.с. даную процедуру советую проводить раз в неделю.

Опубликовано 17.11.2009в 13:50. В рубриках: Основы, сервисы. Вы можете следить за ответами к этой записи через RSS 2.0. Вы можете оставить свой отзыв или трекбек со своего сайта.

Оставьте свой комментарий