Тема: бібліотека BeautifulSoup4 парсер covid19.gov.ua
Привіт!
Ліньки завжди заходити у гугл новини чи на офіційний сайт МОЗ тому вирішив зробити такий парсер
import requests
from bs4 import BeautifulSoup as BS
if __name__ == '__main__':
r = requests.get("https://covid19.gov.ua/")
html = BS(r.content, 'html.parser')
item = html.select("div.fields:nth-child(1) > .light-pink-box")
for el in item:
title = el.select('div:nth-child(2)')
title = str(title).split()
title = f"{title[2]} {title[3]}"
item = html.select("div.fields:nth-child(1) > div.one-field:nth-child(7) > div:nth-child(1) > p:nth-child(1) > span:nth-child(1)")
item = str(item).split()
text_data = list(item[6])
new_data = ''
for t in text_data:
if t == "<":
break
else:
new_data += t
text = item[5] + " " + new_data
print(f"{title} нових випадків за добу\nІнформація станом на {text}.")
Цей код нікуди не годиться.
Робив чисто на вгад
Селектори копіював за допомогою інспектора.
свою роботу він виконує
PS C:\Users\user> & C:/Users/user/AppData/Local/Programs/Python/Python310/python.exe c:/Users/user/Desktop/pars.py
24 058 нових випадків за добу
Інформація станом на 12 листопада
але чомусь воно мене не радує
потім нормально перепишу
якщо порадите щось, буду вдячний