1

Тема: Don't parse HTML with regexp, or...

http://stackoverflow.com/questions/1732 … gs/1732454

Подякували: Replace, leofun013

2 Востаннє редагувалося funivan (20.05.2013 09:42:16)

Re: Don't parse HTML with regexp, or...

Це залежить від ситуації. я писав у себе на блозі статтю про xpath корисна штука для парсингу структурованих xml/html даних але як завжди є але)

Розглянемо приклад:
Вам потрібно скачати певний тип сторінок сайту. ви шукаєте посилання не через xpath і вуаля качаєте сторінку)
А якщо вам треба дізнатись кількість сторінок в категорії ?:)
Ви шукаєте ссилку виду <a href="/page/45/" class="last">Сторінка 45</a>
Тут уже просто парсити а чисті дані вам не видасть. Тому паралельно і реги юзаються))

p.s Як тільки викину бібліотеку в паблік можна буде до таких даних достукуватись через конструкцію виду

$pagesNum = $parser->repalce('!^d!')->_val('//a[@href="last"]');
Подякували: miroslav.chandler1