Собираем свежие проксилисты
Колега обратился в аську с просьбой дать адресса прокси листов для парсинга.
расмотрим как их находить самим за десять минут.
Для этого я использую Hrefer , который идет в комплекте с хрумером. (покупайте сию штуку если знаете как её применить. Малая часть отбивает леньги затраченые на покупку даного продукта).
И так, начнем. Открываем папку с хрефером и копируем подпапку proxyc на свой сервер. Прописуем путь в настройках парсера и чекаем прокси со старым листом. Как наберется хоть 50 анонимных прокси останавливаем чек. Дальше берем этот список и копируем в (words/proxy.txt) текстовый файл слов для парсинга.
находим файл engines.ini и заменяем строчку после Hostname=http://[GOOGLEHOST] на:
q=[QUERY]&num=100&hl=en&tbs=qdr:d
&tbs=qdr:d - фильтр на показ выдачи за последние 24 часа.
В Additive words добавляем следующие:
- прокси
- список
- list
- proxy
Теперь запускаем парсинг. Копируем сохраненые линки с проксилистами в файл links.txt на вашем сервере с чекалкой.
После этого можно спокойно запустить чекалку проксяков. +500 анонимных прокси гарантирую.
П.с. даную процедуру советую проводить раз в неделю.
