1

Тема: Класифікація веб сторінок

Потрібно класифікувати веб сторінки blog(article), forum, landing, product, other по html коду. Прикладів мало, по 100 на кожен клас.

Які фічі характерні для кожного класу  з точки зору вебу?

Наприклад, для product знайшов shop, product, cart, price.

2

Re: Класифікація веб сторінок

Різниця — в структурі сайтів (тому, ймовірно, однієї сторінки може бути недостатньо для висновку. Хоча людина якось навчилась упізнавати ці типи сторінок з першого погляду). Для будь-якого типу можливі типові варіанти реалізації, ознаки використання найпоширеніших рушіїв можна розпізнати. Але що, як хтось зробить блог на якомусь саморобному рушії, написаному з нуля? Ніяких знайомих імен класів, скриптів, посилань на оф. сайт рушія і т.п. Навіть з адрес сторінок відгадати не завжди можна, чи належать вони блогу: блог може бути статичним (або маскуватись під статичний на рівні імен), або ж використовувати шляхи з параметрами (структура яких залежить від конкретного рушія).

Подякували: dialectstat1

3

Re: Класифікація веб сторінок

P.Y. написав:

Різниця — в структурі сайтів (тому, ймовірно, однієї сторінки може бути недостатньо для висновку. Хоча людина якось навчилась упізнавати ці типи сторінок з першого погляду). Для будь-якого типу можливі типові варіанти реалізації, ознаки використання найпоширеніших рушіїв можна розпізнати. Але що, як хтось зробить блог на якомусь саморобному рушії, написаному з нуля? Ніяких знайомих імен класів, скриптів, посилань на оф. сайт рушія і т.п. Навіть з адрес сторінок відгадати не завжди можна, чи належать вони блогу: блог може бути статичним (або маскуватись під статичний на рівні імен), або ж використовувати шляхи з параметрами (структура яких залежить від конкретного рушія).


Це в контексті ML. Набирати тисячі сторінок не варіант, довго і дорого.
Можливо веб дизайнери можуть вказати на якісь спільні особливості кожного з цих типів?

4

Re: Класифікація веб сторінок

Якщо дуже наближено і розмито, то

  1. На класичних форумах повинно бути багато таблиць (але не впевнений, чи все ще актуально)

  2. У блозі - багато просто тексту, можливо сайдбари (тобто 2-3 колонки)

  3. Landing - навіть не знаю... Мало тексту, багато різних колонок, картинок на пів екрана?

  4. Product - не знаю чим від Landing відрізняється