Тема: Використання Tor зі Scrapy
У одній книжці я знайшов ось такий варіант використання Tor за допомогою Pysocks:
import socks
import socket
from urllib.request import urlopen
socks.set_default_proxy(socks.PROXY_TYPE_SOCKS5, "localhost", 9150)
socket.socket = socks.socksocket
print(urlopen('http://icanhazip.com').read())Я, звісно, можу все це запхати в клас «павука» Scrapy десь в ініт, але чи варто саме так робити?
На гіті Pysocks пишуть, що це monkeypatching і взагалі антипатерн.
Як краще налаштувати анонімне вебнишпорення (web scraping)?
Просто не хочеться, щоб мене забанили по ІР на якомусь потрібному мені сайті
лише тому, що я десь перестарався із вебнишпоркою.