1

Тема: Парсер

Доброго вечора усім хто читає зараз це повідомлення.
Вирішив зробити парсер веб-сторінок, але дійшов до проблеми і сам не можу її вирішити.
Наприклад http://mobdisc.com/dw97abfd29/Flowerpop … 7.apk.html
сторінка з якої хочу завантажити файл, але проблема що отримаю посилання тільки в такому варіанту
/download/Flowerpop-Adventures-v1-0-7.apk
А потрібно:
/download/Flowerpop-Adventures-v1-0-7.apk?k=6d2c55ef-8454-4b3d-beea-97bc8f897d42
Як можна витягнути посилання за js.
Дякую.

2

Re: Парсер

Залежить від конкретного скрипта. Десь посилання можна відшукати, просто перебираючи текст скрипта на наявність url'ок, для багатьох сторінок неважко написати індивідуальний алгоритм пошуку в них заджаваскрипчених адрес, а в загальному випадку доведеться робити власний інтерпритатор js...

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊

3

Re: Парсер

Якщо ви відкриєте сирцевий код сторінки за вашим посиланням, то побачите, що до неї приєднаний скрипт http://mobdisc.com/js/wp.js, який запитує потрібну вам інформацію ajax-ом. Далі - самі.

4

Re: Парсер

Покажи свій код?

Думаю регуляркою треба бо lxml в мене теж відкидає ?ав