1

Тема: Проблема з кодуванням завантажуваної сторінки

Хай. От завантажую сторіночку

# -*- coding: utf-8 -*-
import urllib.request

url = "http://replace.org.ua/"
page = urllib.request.urlopen(url);
html = str(page.read());
print(html)

Але замість українських текстів бачу

\xd0\xbe\xd0\xb2\xd1\x96\xd0\xb4\xd0\xbe\xd0\xbc\xd0\xbb\xd0\xb5\xd0\

Як зробити нормальне кодування? га?

2

Re: Проблема з кодуванням завантажуваної сторінки

FakiNyan написав:

Нащо той Бідон взагалі треба? Що на ньому пишуть?

http://replace.org.ua/post/31654/#p31654

3

Re: Проблема з кодуванням завантажуваної сторінки

Singularity написав:
FakiNyan написав:

Нащо той Бідон взагалі треба? Що на ньому пишуть?

http://replace.org.ua/post/31654/#p31654

Це не відповідь.

4

Re: Проблема з кодуванням завантажуваної сторінки

wget вам у руки

5 Востаннє редагувалося Singularity (16.08.2014 21:23:49)

Re: Проблема з кодуванням завантажуваної сторінки

# -*- coding: utf-8 -*-
import urllib.request
 
url = "http://replace.org.ua/"
html = urllib.request.urlopen(url).read().decode('utf-8')
print(html)
Подякували: koala, FakiNyan2

6

Re: Проблема з кодуванням завантажуваної сторінки

Singularity написав:
# -*- coding: utf-8 -*-
import urllib.request
 
url = "http://replace.org.ua/"
html = urllib.request.urlopen(url).read().decode('utf-8')
print(html)

хм, от капець, я ж теж бачив це в гуглах, але тоді чомусь вилазила помилка на decode -_-