1 Востаннє редагувалося 0xDADA11C7 (15.02.2014 00:55:05)

Тема: [Phantom JS] Парсер онлайн словника Грінченка

Для одного мого задуму, мені знадобився перелік українських слів, якого я ніде не міг знайти, тому я написав парсер для онлайн словника Грінченка. Ідеальним середовищем для написання парсерів та усілякої автомотизації веб є Phantom JS (headless оглядач). До поста долучив одержаний від скрипта результат.

#!/usr/bin/phantomjs
/*\
* Parser for Hrinchenko`s dictionary (c) 0xDADA11C7, 2014
\*/
var webpage = require('webpage'), fs = require('fs');
var page = webpage.create();

page.open('http://hrinchenko.com/alfavit.html', function(status) {
    var pages = [];
    var words = [];
    var iPages = 0;
    if (status === 'success') {
        page.includeJs("http://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js", function() {
            var links = page.evaluate(function() {
                var l = [];    
                $('.list_of_letters a').each(function () {
                    l.push('http://hrinchenko.com'+$(this).attr('href'));
                });
                return(l);
});
            function asyncLetterPage (arg, callback) {
                var letterPages = [];
                var pageletter = webpage.create();
                pageletter.open(arg, function (status) {
                    if (status === 'success') {
                        pageletter.includeJs("http://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js", function() {
                            var letterPages = pageletter.evaluate(function() {
                                var l = [];
                                $(".list_pagination a").each( function() {
                                    l.push("http://hrinchenko.com/spisok/bukva/"+$(this).attr('href'));
                                });
                                return(l);
                            });
                            pageletter.close();
                            callback(letterPages);
                        });
                    }
                });
            }
            function asyncDictionary (arg, callback) {
                var pagewords = [];
                var pageword = webpage.create();
                pageword.open(arg, function (status) {
                    if (status === 'success') {
                        pageword.includeJs("http://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js", function() {
                            var pagewords = pageword.evaluate(function() {
                                var l = [];
                                $(".list_of_words a").each( function() {
                                    l.push($(this).text());
                                });
                                return(l);
                            });
                            pageword.close();
                            callback(pagewords);
                        });
                    }
                });
            }
            links.forEach( function (item) {
                asyncLetterPage(item, function(result) {
                    pages = pages.concat(result);
                    iPages++;
                    if (iPages === links.length) {
                        var dictSeries = function (item) {
                            if (item) {
                                asyncDictionary(item, function (result) {
                                    words = words.concat(result);
                                    return (dictSeries(pages.shift()));
                                });
                            } else {
                                console.log('Parsing is complete!\n');
                                fs.write('./hrinchenko.dict.txt', words.join('\n'), 'w');
                                phantom.exit();
                            }
                        }
                        dictSeries(pages.shift());
                    }
                })
            });
        });
    }
});

GitHub

P.S.
Як буде українською "headless" - безголовий?

Post's attachments

hrinchenko.dict.txt 1.14 mb, 16241 downloads since 2014-02-14 

2

Re: [Phantom JS] Парсер онлайн словника Грінченка

В мене колись теж така була задумка, навіть собі диск дістав, але нажаль, там лише по сторінкам можна витягувати слова. А Оскільки там слів сотні тисяч, то копіювати а потім парсити в ручну не сильно вийде. Якщо ви зможете пропарсити, автоматично, то спробуйте на цьому сайті http://lcorp.ulif.org.ua/dictua/

Подякували: 0xDADA11C7, ostap34PHP2

3

Re: [Phantom JS] Парсер онлайн словника Грінченка

Ulif я уже пропарсив:-)

Подякували: 0xDADA11C7, ostap34PHP2

4

Re: [Phantom JS] Парсер онлайн словника Грінченка

funivan написав:

Ulif я уже пропарсив:-)

Ви пропарсили весь словниковий набір, я правильно вас розумію? В який це спосіб вам вдалось зробити? Там же лише закодовані параметри передаються на сервак через JavaScript.

Можна глянути ваш код?

5

Re: [Phantom JS] Парсер онлайн словника Грінченка

Схоже, що ніякого пропарсення насправді не було.

6

Re: [Phantom JS] Парсер онлайн словника Грінченка

@ktretyak для чого мені вас обманювати ;)
Я написав код на php закодовані параметри це всього навсього дані у формі.
Алгоритм був такий.
- скриптом відкриваю сторінку
- вбиваю в пошук букву А
- качаю всі слова із сторінки
- відправляю форму - наче клікаю на кнопку вправо
- вбиваю в пошук букву Б
все повторяємо

Тоді коли я це писав - 3-4 роки назад, я і гадки не мав про phantomjs зараз на ньому це зробити можна за 10 хв =)

Подякували: Djalin1

7

Re: [Phantom JS] Парсер онлайн словника Грінченка

Викладіть результат, якщо можна.

8 Востаннє редагувалося Djalin (02.07.2015 08:36:47)

Re: [Phantom JS] Парсер онлайн словника Грінченка

0xDADA11C7 - у вас починається з літери б, а де ж абетка?

Знайшов, але чомусь не з початку - збило з пантелику

9

Re: [Phantom JS] Парсер онлайн словника Грінченка

@Djalin викласти результат скачаної бази ;) ?

Подякували: ostap34PHP1

10

Re: [Phantom JS] Парсер онлайн словника Грінченка

funivan написав:

@Djalin викласти результат скачаної бази ;) ?


так, якщо можна

11

Re: [Phantom JS] Парсер онлайн словника Грінченка

@Djalin написав в ПП

12

Re: [Phantom JS] Парсер онлайн словника Грінченка

Та зрозуміло що "всього-навсього" у формі є дані форми, але якщо на це все діло глянути, то можна засумніватись що там реально щось зрозуміти і самому тоді програмно генерувати. Я намагався зробити декодування параметрів за допомогою стандартної PHP-функції base64_decode(), але схоже, що там по іншому закодовані дані.

Ось що відправляється на сервер, якщо натиснути букву а.

POST-запит
ctl00$ContentPlaceHolder1$ScriptManager1=ctl00$ContentPlaceHolder1$UpdText|ctl00$ContentPlaceHolder1$search&__EVENTTARGET=&__EVENTARGUMENT=&__VIEWSTATE=%2FwEPDwUKMTMzMzkyODU4Mw9kFgJmD2QWAgIDD2QWAgIDD2QWAgIDD2QWAmYPZBYQAhEPDxYCHghJbWFnZVVybAUcfi9pbWcvZGljdHVhL3BhcmFkaWdtX29uLmdpZmRkAhMPDxYCHwAFHH4vaW1nL2RpY3R1YS9zeW5vbmltX29mZi5naWZkZAIVDw8WAh8ABR5%2BL2ltZy9kaWN0dWEvZnJhc2VvbG9nX29mZi5naWZkZAIXDw8WBB8ABRx%2BL2ltZy9kaWN0dWEvYW50b25pbV9vZmYuZ2lmHgdWaXNpYmxlaGRkAhkPZBYCZg9kFgJmD2QWAgIBDzwrAA0BAA8WBB4LXyFEYXRhQm91bmRnHgtfIUl0ZW1Db3VudAIZZBYCZg9kFjQCAQ9kFgRmD2QWAmYPDxYCHgRUZXh0BRTQv9GA0LjQstGWzIHRgdC40YLQuGRkAgEPZBYEZg8PFgQfAAUVaW1nL2RpY3RfZmxhZy9zeW4uYm1wHg1BbHRlcm5hdGVUZXh0ZWRkAgEPDxYCHwFoZGQCAg9kFgRmD2QWAmYPDxYCHwQFEtC%2F0YDQuNCy0ZbMgdGB0LrQsGRkAgEPZBYEZg8PFgQfAAUVaW1nL2RpY3RfZmxhZy9zeW4uYm1wHwVlZGQCAQ8PFgIfAWhkZAIDD2QWBGYPZBYCZg8PFgIfBAUU0L%2FRgNC40LLRltGB0L3QuMyB0LlkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIED2QWBGYPZBYCZg8PFgIfBAUS0L%2FRgNC40LLRlsyB0YHQvtC6ZGQCAQ9kFgRmDw8WBB8ABRVpbWcvZGljdF9mbGFnL3N5bi5ibXAfBWVkZAIBDw8WAh8BaGRkAgUPZBYEZg9kFgJmDw8WAh8EBQ7Qv9GA0LjQstGWzIHRgmRkAgEPZBYEZg8PFgQfAAUZaW1nL2RpY3RfZmxhZy9zeW5mcmFzLmJtcB8FZWRkAgEPDxYCHwFoZGQCBg9kFgRmD2QWAmYPDxYCHwQFGtC%2F0YDQuNCy0ZbRgtCwzIHQu9GM0L3QuNC5ZGQCAQ9kFgRmDw8WBB8ABRVpbWcvZGljdF9mbGFnL3N5bi5ibXAfBWVkZAIBDw8WAh8BaGRkAgcPZBYEZg9kFgJmDw8WAh8EBRjQv9GA0LjQstGW0YLQsMyB0LvRjNC90L5kZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIID2QWBGYPZBYCZg8PFgIfBAUW0L%2FRgNC40LLRltGC0LDMgdC90L3Rj2RkAgEPZBYEZg8PFgQfAAUVaW1nL2RpY3RfZmxhZy9zeW4uYm1wHwVlZGQCAQ8PFgIfAWhkZAIJD2QWBGYPZBYCZg8PFgIfBAUU0L%2FRgNC40LLRltGC0LDMgdGC0LhkZAIBD2QWBGYPDxYEHwAFFWltZy9kaWN0X2ZsYWcvc3luLmJtcB8FZWRkAgEPDxYCHwFoZGQCCg9kFgRmD2QWAmYPDxYCHwQFGNC%2F0YDQuNCy0ZbRgtCwzIHRgtC40YHRj2RkAgEPZBYEZg8PFgQfAAUVaW1nL2RpY3RfZmxhZy9zeW4uYm1wHwVlZGQCAQ8PFgIfAWhkZAILD2QWBGYPZBYCZg8PFgIfBAUS0J%2FRgNC40LLRlsyB0YLRltCyZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCDA9kFgRmD2QWAmYPDxYCHwQFFtCf0YDQuNCy0ZbMgdGC0ZbQstC60LBkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIND2QWBGYPZBYCZg8PFgIfBAUc0L%2FRgNC40LLRlsyB0YLRltCy0YHRjNC60LjQuWRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAg4PZBYEZg9kFgJmDw8WAh8EBRjQv9GA0LjQstGWzIHRgtC70LjQstC40LlkZAIBD2QWBGYPDxYEHwAFFWltZy9kaWN0X2ZsYWcvc3luLmJtcB8FZWRkAgEPDxYCHwFoZGQCDw9kFgRmD2QWAmYPDxYCHwQFHNC%2F0YDQuNCy0ZbMgdGC0LvQuNCy0ZbRgdGC0YxkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIQD2QWBGYPZBYCZg8PFgIfBAUW0L%2FRgNC40LLRlsyB0YLQu9C40LLQvmRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhEPZBYEZg9kFgJmDw8WAh8EBRLQn9GA0LjQstGWzIHRgtC90LVkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAISD2QWBGYPZBYCZg8PFgIfBAUc0L%2FRgNC40LLRlsyB0YLQvdC10L3RjNC60LjQuWRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhMPZBYEZg9kFgJmDw8WAh8EBRrQv9GA0LjQstGWzIHRgtC90LXQvdGM0LrQvmRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhQPZBYEZg9kFgJmDw8WAh8EBRTQv9GA0LjQstGWzIHRgtC90LjQuWRkAgEPZBYEZg8PFgQfAAUVaW1nL2RpY3RfZmxhZy9zeW4uYm1wHwVlZGQCAQ8PFgIfAWhkZAIVD2QWBGYPZBYCZg8PFgIfBAUY0L%2FRgNC40LLRlsyB0YLQvdGW0YHRgtGMZGQCAQ9kFgRmDw8WBB8ABRVpbWcvZGljdF9mbGFnL3N5bi5ibXAfBWVkZAIBDw8WAh8BaGRkAhYPZBYEZg9kFgJmDw8WAh8EBRrQv9GA0LjQstGW0YLQvdGWzIHRiNCw0YLQuGRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhcPZBYEZg9kFgJmDw8WAh8EBRbQv9GA0LjQstGWzIHRgtC90ZbRiNC1ZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCGA9kFgRmD2QWAmYPDxYCHwQFEtC%2F0YDQuNCy0ZbMgdGC0L3QvmRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhkPZBYEZg9kFgJmDw8WAh8EBR7Qv9GA0LjQstGW0YLQvdGPzIHQvdGB0YzQutC40LlkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIaDw8WAh8BaGRkAhsPFgIeCWlubmVyaHRtbAWoJDxzdHlsZSB0eXBlPSJ0ZXh0L2NzcyI%2BIDwhLS0ud29yZF9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWNvbG9yOiAjQ0MzMzAwOw0KCXRleHQtYWxpZ246IGNlbnRlcjsNCglmb250LXdlaWdodDogYm9sZDsNCn0NCmJvZHkgew0KCWJhY2tncm91bmQtY29sb3I6ICNGRkZGRkY7DQp9DQouZ3JhbV9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWNvbG9yOiAjMzM5OTk5Ow0KCWZvbnQtd2VpZ2h0OiBub3JtYWw7DQp9DQouY29tbWVudF9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWZvbnQtc3R5bGU6IGl0YWxpYzsNCn0NCi50YWJsZV9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KfQ0KLnRkX3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJY29sb3I6ICNGRkZGRkY7DQoJYmFja2dyb3VuZC1jb2xvcjogIzAwNjY2NjsNCglmb250LXdlaWdodDogYm9sZDsNCgl0ZXh0LWFsaWduOiBjZW50ZXI7DQoJbGV0dGVyLXNwYWNpbmc6IDFweDsNCn0NCi50ZF9sZWZ0X3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJY29sb3I6ICNGRkZGRkY7DQoJYmFja2dyb3VuZC1jb2xvcjogIzAwNjY2NjsNCglmb250LXdlaWdodDogYm9sZDsNCgl0ZXh0LWFsaWduOiBsZWZ0Ow0KCWxldHRlci1zcGFjaW5nOiAxcHg7DQoJYm9yZGVyLXRvcC1jb2xvcjogIzAwNjY5OTsNCglwYWRkaW5nLWxlZnQ6IDRweDsNCn0NCi50ZF9pbm5lcl9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWNvbG9yOiAjMDAwMDAwOw0KCXRleHQtYWxpZ246IGxlZnQ7DQoJbGVmdDogNXB4Ow0KCXBhZGRpbmctbGVmdDogMTBweDsNCn0NCi50ZF9pbm5lcl9jZW50ZXJfc3R5bGUgew0KCWZvbnQtZmFtaWx5OiBBcmlhbCwgSGVsdmV0aWNhLCBzYW5zLXNlcmlmOw0KCWZvbnQtc2l6ZTogMTJweDsNCgljb2xvcjogIzAwMDAwMDsNCgl0ZXh0LWFsaWduOiBjZW50ZXI7DQoJbGVmdDogNXB4Ow0KCXBhZGRpbmctbGVmdDogMTBweDsNCn0NCi5jb21tX2VuZF9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWNvbG9yOiAjMDAwMDAwOw0KfQ0KLnBfY2wgew0KCWZvbnQtZmFtaWx5OiBBcmlhbDsNCglsZWZ0OiAwcHg7DQoJdG9wOiAwcHg7DQoJcmlnaHQ6IDBweDsNCglib3R0b206IDBweDsNCglwYWRkaW5nOiAxMHB4Ow0KCWZvbnQtc2l6ZTogMTJweDsNCn0NCg0KLmZfY2wgew0KCWZvbnQtZmFtaWx5OiBBcmlhbDsNCglsZWZ0OiAwcHg7DQoJdG9wOiAwcHg7DQoJcmlnaHQ6IDBweDsNCglib3R0b206IDBweDsNCglwYWRkaW5nOiAwcHg7DQoJYmFja2dyb3VuZC1jb2xvcjogI0UzRTNFMzsNCglmb250LXNpemU6IDEycHg7DQp9DQoNCi5mX3ogew0KCWZvbnQtZmFtaWx5OiBBcmlhbDsNCglsZWZ0OiAwcHg7DQoJdG9wOiAwcHg7DQoJcmlnaHQ6IDBweDsNCglib3R0b206IDBweDsNCglwYWRkaW5nOiAwcHg7DQoJdGV4dC1hbGlnbjogY2VudGVyOw0KCWZvbnQtc2l6ZTogMTJweDsNCgljb2xvcjogIzVEMUE5QjsNCglmb250LXdlaWdodDogYm9sZDsNCn0NCg0KLnRhYl9hbnQgew0KCWZvbnQtZmFtaWx5OiBBcmlhbDsNCglmb250LXNpemU6IDEycHg7DQoJcGFkZGluZzogMTBweDsNCglsZWZ0OiAxMHB4Ow0KfQ0KLmJsYWNrVHsNCgljb2xvcjpCbGFjazsNCglwYWRkaW5nLXRvcDogMHB4Ow0KCXBhZGRpbmctcmlnaHQ6IDBweDsNCglwYWRkaW5nLWJvdHRvbTogMHB4Ow0KCXBhZGRpbmctbGVmdDogMTBweDsNCglmb250LWZhbWlseTogQXJpYWw7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWZvbnQtd2VpZ2h0OiBib2xkOw0KfQ0KLmJsdWVUew0KCWNvbG9yOiM4MDAwMDA7DQoJY3Vyc29yOmhhbmQ7DQoJcGFkZGluZy10b3A6IDBweDsNCglwYWRkaW5nLXJpZ2h0OiAwcHg7DQoJcGFkZGluZy1ib3R0b206IDBweDsNCglwYWRkaW5nLWxlZnQ6IDEwcHg7DQoJZm9udC1mYW1pbHk6IEFyaWFsOw0KCWZvbnQtc2l6ZTogMTJweDsNCglmb250LXdlaWdodDogYm9sZDsNCn0NCi5yZWRUew0KCWZvbnQtZmFtaWx5OiBBcmlhbDsNCgljb2xvcjpSZWQ7DQoJY3Vyc29yOmhhbmQ7DQp9DQouRGVsVHsNCglkaXNwbGF5PW5vbmU7DQp9DQouRGlzcFR7DQoJZGlzcGxheT1ibG9jazsNCn0NCi0tPjwvc3R5bGU%2BPGJyPg0KPGRpdiBhbGlnbj0iY2VudGVyIj4gDQoJPHNwYW4gY2xhc3M9IndvcmRfc3R5bGUiID7Qv9GA0LjQstGWzIHRgiA8L3NwYW4%2BDQoJPHNwYW4gY2xhc3M9ImdyYW1fc3R5bGUiPuKAkyDRltC80LXQvdC90LjQuiDRh9C%2B0LvQvtCy0ZbRh9C%2B0LPQviDRgNC%2B0LTRgzwvc3Bhbj4NCjwvZGl2Pg0KPGJyPg0KPGRpdiBhbGlnbj0iY2VudGVyIiBjbGFzcz0iY29tbWVudF9zdHlsZSI%2BDQo8aHI%2BDQo8L2Rpdj4NCg0KPHRhYmxlIGFsaWduPSJjZW50ZXIiIGJvcmRlcj0iMSIgd2lkdGg9IjUxJSI%2BDQogIDx0ciBjbGFzcz0idGRfc3R5bGUiPg0KICAgIDx0ZCB3aWR0aD0iMjMlIiA%2BDQogICAgICDQstGW0LTQvNGW0L3QvtC6PC90ZD4NCiAgICA8dGQgd2lkdGg9IjQwJSI%2BDQogICAgINC%2B0LTQvdC40L3QsDwvdGQ%2BDQogICAgPHRkIHdpZHRoPSIzNyUiID4NCiAgICAg0LzQvdC%2B0LbQuNC90LA8L3RkPg0KICA8L3RyPg0KICA8dHI%2BDQogICAgPHRkIHdpZHRoPSIxNCUiIGNsYXNzPSJ0ZF9sZWZ0X3N0eWxlIiA%2BIA0KICAgICAg0L3QsNC30LjQstC90LjQuTwvdGQ%2BIA0KICAgIDx0ZCB3aWR0aD0iNDAlIiBjbGFzcz0idGRfaW5uZXJfc3R5bGUiID4NCiAgINC%2F0YDQuNCy0ZbMgdGCPC90ZD4NCiAgICA8dGQgd2lkdGg9IjM3JSIgY2xhc3M9InRkX2lubmVyX3N0eWxlIiA%2BDQogICAg0L%2FRgNC40LLRlsyB0YLQuDwvdGQ%2BDQogIDwvdHI%2BDQogIDx0cj4NCiAgICA8dGQgd2lkdGg9IjE0JSIgY2xhc3M9InRkX2xlZnRfc3R5bGUiPiANCiAgICAg0YDQvtC00L7QstC40Lk8L3RkPiANCiAgICA8dGQgd2lkdGg9IjQwJSIgY2xhc3M9InRkX2lubmVyX3N0eWxlIiA%2BDQogICAg0L%2FRgNC40LLRlsyB0YLRgzwvdGQ%2BDQogICAgPHRkIHdpZHRoPSIzNyUiIGNsYXNzPSJ0ZF9pbm5lcl9zdHlsZSIgPg0KICAg0L%2FRgNC40LLRlsyB0YLRltCyPC90ZD4NCiAgPC90cj4NCiAgPHRyPg0KICAgIDx0ZCB3aWR0aD0iMTQlIiBjbGFzcz0idGRfbGVmdF9zdHlsZSIgPiANCiAgICAg0LTQsNCy0LDQu9GM0L3QuNC5PC90ZD4gDQogICAgPHRkIHdpZHRoPSI0MCUiIGNsYXNzPSJ0ZF9pbm5lcl9zdHlsZSI%2BDQogICAg0L%2FRgNC40LLRlsyB0YLRgywg0L%2FRgNC40LLRlsyB0YLQvtCy0ZY8L3RkPg0KICAgIDx0ZCB3aWR0aD0iMzclIiBjbGFzcz0idGRfaW5uZXJfc3R5bGUiPg0KICAg0L%2FRgNC40LLRlsyB0YLQsNC8PC90ZD4NCiAgPC90cj4NCiAgPHRyPg0KICAgIDx0ZCB3aWR0aD0iMTQlIiBjbGFzcz0idGRfbGVmdF9zdHlsZSI%2BIA0KICAg0LfQvdCw0YXRltC00L3QuNC5PC90ZD4gDQogICAgPHRkIHdpZHRoPSI0MCUiIGNsYXNzPSJ0ZF9pbm5lcl9zdHlsZSI%2BDQogICDQv9GA0LjQstGWzIHRgjwvdGQ%2BDQogICAgPHRkIHdpZHRoPSIzNyUiIGNsYXNzPSJ0ZF9pbm5lcl9zdHlsZSI%2BDQogICAg0L%2FRgNC40LLRlsyB0YLQuDwvdGQ%2BDQogIDwvdHI%2BDQogIDx0cj4NCiAgICA8dGQgd2lkdGg9IjE0JSIgY2xhc3M9InRkX2xlZnRfc3R5bGUiPiANCiAgICAgINC%2B0YDRg9C00L3QuNC5PC90ZD4gDQogICAgPHRkIHdpZHRoPSI0MCUiIGFsaWduPSJsZWZ0IiBjbGFzcz0idGRfaW5uZXJfc3R5bGUiPg0KICAgINC%2F0YDQuNCy0ZbMgdGC0L7QvDwvdGQ%2BDQogICAgPHRkIHdpZHRoPSIzNyUiIGNsYXNzPSJ0ZF9pbm5lcl9zdHlsZSI%2BDQogICAg0L%2FRgNC40LLRlsyB0YLQsNC80Lg8L3RkPg0KICA8L3RyPg0KICA8dHI%2BDQogICAgPHRkIHdpZHRoPSIxNCUiIGNsYXNzPSJ0ZF9sZWZ0X3N0eWxlIj4gDQogICAgINC80ZbRgdGG0LXQstC40Lk8L3RkPiANCiAgICA8dGQgd2lkdGg9IjQwJSIgY2xhc3M9InRkX2lubmVyX3N0eWxlIj4NCiAgINC90LAv0YMg0L%2FRgNC40LLRlsyB0YLRljwvdGQ%2BDQogICAgPHRkIHdpZHRoPSIzNyUiIGNsYXNzPSJ0ZF9pbm5lcl9zdHlsZSI%2BDQogICAg0L3QsC%2FRgyDQv9GA0LjQstGWzIHRgtCw0YU8L3RkPg0KICA8L3RyPg0KICA8dHI%2BDQogICAgPHRkIHdpZHRoPSIyMyUiIGNsYXNzPSJ0ZF9sZWZ0X3N0eWxlIj7QutC70LjRh9C90LjQuSA8L3RkPg0KICAgIDx0ZCB3aWR0aD0iNDAlIiBjbGFzcz0idGRfaW5uZXJfc3R5bGUiPg0KICAgINC%2F0YDQuNCy0ZbMgdGC0LUqPC90ZD4NCiAgICA8dGQgd2lkdGg9IjM3JSIgY2xhc3M9InRkX2lubmVyX3N0eWxlIj4NCiAgICDQv9GA0LjQstGWzIHRgtC4KjwvdGQ%2BDQogIDwvdHI%2BDQo8L3RhYmxlPg0KPHAgY2xhc3M9ImNvbW1fZW5kX3N0eWxlIj48L3A%2BDQpkAh0PEA8WAh8BaGRkFgBkAiEPDxYCHwQFJtCg0LXRlNGB0YLRgNC%2B0LLQuNGFINGB0LvRltCyIC0gMjU2NjE4ZGQYAgUeX19Db250cm9sc1JlcXVpcmVQb3N0QmFja0tleV9fFggFImN0bDAwJENvbnRlbnRQbGFjZUhvbGRlcjEkYmFja3BhZ2UFImN0bDAwJENvbnRlbnRQbGFjZUhvbGRlcjEkbmV4dHBhZ2UFIWN0bDAwJENvbnRlbnRQbGFjZUhvbGRlcjEkYXJ0bmV4dAUhY3RsMDAkQ29udGVudFBsYWNlSG9sZGVyMSRhcnRiYWNrBSBjdGwwMCRDb250ZW50UGxhY2VIb2xkZXIxJHNlYXJjaAUdY3RsMDAkQ29udGVudFBsYWNlSG9sZGVyMSRwYXIFHWN0bDAwJENvbnRlbnRQbGFjZUhvbGRlcjEkc3luBR9jdGwwMCRDb250ZW50UGxhY2VIb2xkZXIxJHBocmFzBR1jdGwwMCRDb250ZW50UGxhY2VIb2xkZXIxJGRndg88KwAKAQgCAWTQDlO4mLYWyjKfqu7lfEmFbakR9g%3D%3D&__VIEWSTATEGENERATOR=7AC6B68E&__EVENTVALIDATION=%2FwEWIwL5i73iBQKOl5uxCwKx2bW4AwK6nJjcCQLDwfOuBQLxmIzIBwKE846rAwLB3riyBQKK9bp2Asb2s%2FYGAqPW%2BxACo9bv%2FQgCo9bTygICo9bHtwsCo9aLhA0Co9a%2F4QUCo9bj%2Fw8Co9aX2wQCo9ab%2BgUCo9aPpwIC3tfR7g8CodTR7g8C3NfR7g8C39fR7g8C2tfR7g8C3dfR7g8C2NfR7g8C29fR7g8CptTR7g8CqdTR7g8C3teV%2FwECodSV%2FwEC3NeV%2FwEC39eV%2FwEC2teV%2FwHBDdy%2FMES0jqQ32T5q9ZLs89zQ2g%3D%3D&ctl00$ContentPlaceHolder1$tsearch=%D0%B0&ctl00$ContentPlaceHolder1$search.x=15&ctl00$ContentPlaceHolder1$search.y=9

А ось що повертається у відповідь

Прихований текст
10650|updatePanel|ctl00_ContentPlaceHolder1_UpdText|
            <table width="1002" id="DictMainTab">
                <tr>
                    <td style="width: 252px; height: 21px">
                        <input type="image" name="ctl00$ContentPlaceHolder1$backpage" id="ctl00_ContentPlaceHolder1_backpage" title="Попередня сторінка" src="img/arrow/PPC_Back.bmp" align="left" style="border-width:0px;" />
                        <input type="image" name="ctl00$ContentPlaceHolder1$nextpage" id="ctl00_ContentPlaceHolder1_nextpage" title="Наступна сторінка" src="img/arrow/PPC_Forward.bmp" align="left" style="border-width:0px;" />
                        <input type="image" name="ctl00$ContentPlaceHolder1$artnext" id="ctl00_ContentPlaceHolder1_artnext" title="Наступна стаття" src="img/arrow/forward.gif" align="right" style="border-width:0px;" />
                        <input type="image" name="ctl00$ContentPlaceHolder1$artback" id="ctl00_ContentPlaceHolder1_artback" title="Попередня стаття" src="img/arrow/back.gif" align="right" style="border-width:0px;" /></td>
                    <td style="width: 730px; height: 21px">
                        <img id="ctl00_ContentPlaceHolder1_Image1" src="img/title/dictua.gif" style="border-width:0px;" /></td>
                    <td style="height: 21px">
                        &nbsp;</td>
                </tr>
                <tr>
                    <td style="width: 252px; height: 21px; text-align: left">
                        <input name="ctl00$ContentPlaceHolder1$tsearch" type="text" value="а" id="ctl00_ContentPlaceHolder1_tsearch" style="width:175px;" />
                        <input type="image" name="ctl00$ContentPlaceHolder1$search" id="ctl00_ContentPlaceHolder1_search" title="Пошук слова" src="img/button/srh.gif" align="top" style="border-width:0px;" /></td>
                    <td style="width: 730px; height: 21px">
                        <input type="image" name="ctl00$ContentPlaceHolder1$par" id="ctl00_ContentPlaceHolder1_par" src="img/dictua/paradigm_on.gif" style="border-width:0px;" />
                        
                        
                        </td>
                    <td style="height: 21px">
                        &nbsp;</td>
                </tr>
                <tr>
                    <td style="width: 252px; height: 239px; text-align: left; vertical-align: top; margin-top: 0px; padding-top: 0px;">
                        <table id="ctl00_ContentPlaceHolder1_WordList" style="background-color: transparent; vertical-align: top;">
    <tr>
        <td style="width: 252px; height: 21px; vertical-align: top; padding-top: 0px; margin-top: 0px;">
                                    <div>
            <table cellspacing="0" rules="all" border="1" id="ctl00_ContentPlaceHolder1_dgv" style="width:100%;border-collapse:collapse;">
                <tr>
                    <th scope="col">Реєстр</th><th scope="col">&nbsp;</th>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$0')">а</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$1')">а</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$2')">а</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$3')">Аальє́т</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$4')">Аара́у</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$5')">Аа́ре</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$6')">Аа́хен</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$7')">аа́хенський</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$8')">А́ба</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$9')">А́бава</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$10')">Абада́н</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$11')">абада́нський</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$12')">абажу́р</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$13')">абажу́рний</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$14')">абажу́рчик</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$15')">аба́з</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$16')">Абаза́</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$17')">абази́н</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$18')">абази́нець</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$19')">абази́нка</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$20')">абази́нський</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$21')">Аба́зівка</a></td><td style="width:10%;"><span></span></td>
                </tr><tr>
                    <td style="width:90%;"><a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$dgv','Select$22')">аба́зія</a></td><td style="width:10%;"><span></span></td>
                </tr>
            </table>
        </div>
                                </td>
    </tr>
</table>

                    </td>
                    <td id="article_full" style="width: 730px; height: 239px; vertical-align: top; text-align: left; background-color: transparent;">
                        &nbsp;<table style="width: 100%; height: 100%;">
                            <tr>
                                <td id="ctl00_ContentPlaceHolder1_article" style="height: 100%; vertical-align: top; text-align: left;"><style type="text/css"> <!--.word_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #CC3300;
    text-align: center;
    font-weight: bold;
}
body {
    background-color: #FFFFFF;
}
.gram_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #339999;
    font-weight: normal;
}
.comment_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    font-style: italic;
}
.table_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
}
.td_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #FFFFFF;
    background-color: #006666;
    font-weight: bold;
    text-align: center;
    letter-spacing: 1px;
}
.td_left_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #FFFFFF;
    background-color: #006666;
    font-weight: bold;
    text-align: left;
    letter-spacing: 1px;
    border-top-color: #006699;
    padding-left: 4px;
}
.td_inner_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #000000;
    text-align: left;
    left: 5px;
    padding-left: 10px;
}
.td_inner_center_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #000000;
    text-align: center;
    left: 5px;
    padding-left: 10px;
}
.comm_end_style {
    font-family: Arial, Helvetica, sans-serif;
    font-size: 12px;
    color: #000000;
}
.p_cl {
    font-family: Arial;
    left: 0px;
    top: 0px;
    right: 0px;
    bottom: 0px;
    padding: 10px;
    font-size: 12px;
}

.f_cl {
    font-family: Arial;
    left: 0px;
    top: 0px;
    right: 0px;
    bottom: 0px;
    padding: 0px;
    background-color: #E3E3E3;
    font-size: 12px;
}

.f_z {
    font-family: Arial;
    left: 0px;
    top: 0px;
    right: 0px;
    bottom: 0px;
    padding: 0px;
    text-align: center;
    font-size: 12px;
    color: #5D1A9B;
    font-weight: bold;
}

.tab_ant {
    font-family: Arial;
    font-size: 12px;
    padding: 10px;
    left: 10px;
}
.blackT{
    color:Black;
    padding-top: 0px;
    padding-right: 0px;
    padding-bottom: 0px;
    padding-left: 10px;
    font-family: Arial;
    font-size: 12px;
    font-weight: bold;
}
.blueT{
    color:#800000;
    cursor:hand;
    padding-top: 0px;
    padding-right: 0px;
    padding-bottom: 0px;
    padding-left: 10px;
    font-family: Arial;
    font-size: 12px;
    font-weight: bold;
}
.redT{
    font-family: Arial;
    color:Red;
    cursor:hand;
}
.DelT{
    display=none;
}
.DispT{
    display=block;
}
--></style><p class="word_style" >а 3<span class="gram_style"> - частка</span></p><p class="td_inner_center_style"><i></i></p><hr><p class="td_inner_center_style">незмінювана словникова одиниця</p><p class="comm_end_style"></p></td>

                            </tr>
                            <tr>
                                <td id="phras_list" style="vertical-align: bottom; text-align: left;">
                        
                        </td>
                            </tr>
                        </table>
                    </td>
                    <td id="ctl00_ContentPlaceHolder1_fras_cell" style="vertical-align: top; text-align: left; height: 239px;">
                        </td>

                </tr>
                <tr>
                    <td style="width: 252px; height: 41px; text-align: left;">
                        <span id="ctl00_ContentPlaceHolder1_rlength">Реєстрових слів - 256618</span></td>
                    <td style="width: 730px; height: 41px; vertical-align: bottom; text-align: right; font-size: x-small;">
                        <span id="ctl00_ContentPlaceHolder1_cbtimer" style="visibility:hidden;display:none;"></span>
                        "Словники України on-line" розроблено на основі CD-версії 3.2 (2008р.) © ULIF, 2001-2014
                        <!-- http://lcorp.ulif.org.ua/xclientinfo/ -->
                        <!-- http://lcorp.ulif.org.ua/xclient/ -->
                    </td>
                    <td style="height: 41px; vertical-align: top; text-align: left;">
                        </td>
                </tr>
            </table>
        |0|hiddenField|__EVENTTARGET||0|hiddenField|__EVENTARGUMENT||6752|hiddenField|__VIEWSTATE|/wEPDwUKMTMzMzkyODU4Mw9kFgJmD2QWAgIDD2QWAgIDD2QWAgIDD2QWAmYPZBYQAhEPDxYCHghJbWFnZVVybAUcfi9pbWcvZGljdHVhL3BhcmFkaWdtX29uLmdpZmRkAhMPDxYEHwAFHH4vaW1nL2RpY3R1YS9zeW5vbmltX29mZi5naWYeB1Zpc2libGVoZGQCFQ8PFgQfAAUefi9pbWcvZGljdHVhL2ZyYXNlb2xvZ19vZmYuZ2lmHwFoZGQCFw8PFgQfAAUcfi9pbWcvZGljdHVhL2FudG9uaW1fb2ZmLmdpZh8BaGRkAhkPZBYCZg9kFgJmD2QWAgIBDzwrAA0BAA8WBB4LXyFEYXRhQm91bmRnHgtfIUl0ZW1Db3VudAIXZBYCZg9kFjACAQ9kFgRmD2QWAmYPDxYCHgRUZXh0BQLQsGRkAgEPZBYEZg8PFgYfAGQeDUFsdGVybmF0ZVRleHRlHwFoZGQCAQ8PFgQfBGUfAWdkZAICD2QWBGYPZBYCZg8PFgIfBAUC0LBkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIDD2QWBGYPZBYCZg8PFgIfBAUC0LBkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIED2QWBGYPZBYCZg8PFgIfBAUO0JDQsNC70YzRlMyB0YJkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIFD2QWBGYPZBYCZg8PFgIfBAUM0JDQsNGA0LDMgdGDZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCBg9kFgRmD2QWAmYPDxYCHwQFCtCQ0LDMgdGA0LVkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIHD2QWBGYPZBYCZg8PFgIfBAUM0JDQsMyB0YXQtdC9ZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCCA9kFgRmD2QWAmYPDxYCHwQFFtCw0LDMgdGF0LXQvdGB0YzQutC40LlkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIJD2QWBGYPZBYCZg8PFgIfBAUI0JDMgdCx0LBkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIKD2QWBGYPZBYCZg8PFgIfBAUM0JDMgdCx0LDQstCwZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCCw9kFgRmD2QWAmYPDxYCHwQFDtCQ0LHQsNC00LDMgdC9ZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCDA9kFgRmD2QWAmYPDxYCHwQFGNCw0LHQsNC00LDMgdC90YHRjNC60LjQuWRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAg0PZBYEZg9kFgJmDw8WAh8EBQ7QsNCx0LDQttGDzIHRgGRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAg4PZBYEZg9kFgJmDw8WAh8EBRTQsNCx0LDQttGDzIHRgNC90LjQuWRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAg8PZBYEZg9kFgJmDw8WAh8EBRTQsNCx0LDQttGDzIHRgNGH0LjQumRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhAPZBYEZg9kFgJmDw8WAh8EBQrQsNCx0LDMgdC3ZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCEQ9kFgRmD2QWAmYPDxYCHwQFDNCQ0LHQsNC30LDMgWRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhIPZBYEZg9kFgJmDw8WAh8EBQ7QsNCx0LDQt9C4zIHQvWRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhMPZBYEZg9kFgJmDw8WAh8EBRTQsNCx0LDQt9C4zIHQvdC10YbRjGRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhQPZBYEZg9kFgJmDw8WAh8EBRLQsNCx0LDQt9C4zIHQvdC60LBkZAIBD2QWBGYPDxYGHwBkHwVlHwFoZGQCAQ8PFgQfBGUfAWdkZAIVD2QWBGYPZBYCZg8PFgIfBAUY0LDQsdCw0LfQuMyB0L3RgdGM0LrQuNC5ZGQCAQ9kFgRmDw8WBh8AZB8FZR8BaGRkAgEPDxYEHwRlHwFnZGQCFg9kFgRmD2QWAmYPDxYCHwQFEtCQ0LHQsMyB0LfRltCy0LrQsGRkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhcPZBYEZg9kFgJmDw8WAh8EBQ7QsNCx0LDMgdC30ZbRj2RkAgEPZBYEZg8PFgYfAGQfBWUfAWhkZAIBDw8WBB8EZR8BZ2RkAhgPDxYCHwFoZGQCGw8WAh4JaW5uZXJodG1sBYcVPHN0eWxlIHR5cGU9InRleHQvY3NzIj4gPCEtLS53b3JkX3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJY29sb3I6ICNDQzMzMDA7DQoJdGV4dC1hbGlnbjogY2VudGVyOw0KCWZvbnQtd2VpZ2h0OiBib2xkOw0KfQ0KYm9keSB7DQoJYmFja2dyb3VuZC1jb2xvcjogI0ZGRkZGRjsNCn0NCi5ncmFtX3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJY29sb3I6ICMzMzk5OTk7DQoJZm9udC13ZWlnaHQ6IG5vcm1hbDsNCn0NCi5jb21tZW50X3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJZm9udC1zdHlsZTogaXRhbGljOw0KfQ0KLnRhYmxlX3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQp9DQoudGRfc3R5bGUgew0KCWZvbnQtZmFtaWx5OiBBcmlhbCwgSGVsdmV0aWNhLCBzYW5zLXNlcmlmOw0KCWZvbnQtc2l6ZTogMTJweDsNCgljb2xvcjogI0ZGRkZGRjsNCgliYWNrZ3JvdW5kLWNvbG9yOiAjMDA2NjY2Ow0KCWZvbnQtd2VpZ2h0OiBib2xkOw0KCXRleHQtYWxpZ246IGNlbnRlcjsNCglsZXR0ZXItc3BhY2luZzogMXB4Ow0KfQ0KLnRkX2xlZnRfc3R5bGUgew0KCWZvbnQtZmFtaWx5OiBBcmlhbCwgSGVsdmV0aWNhLCBzYW5zLXNlcmlmOw0KCWZvbnQtc2l6ZTogMTJweDsNCgljb2xvcjogI0ZGRkZGRjsNCgliYWNrZ3JvdW5kLWNvbG9yOiAjMDA2NjY2Ow0KCWZvbnQtd2VpZ2h0OiBib2xkOw0KCXRleHQtYWxpZ246IGxlZnQ7DQoJbGV0dGVyLXNwYWNpbmc6IDFweDsNCglib3JkZXItdG9wLWNvbG9yOiAjMDA2Njk5Ow0KCXBhZGRpbmctbGVmdDogNHB4Ow0KfQ0KLnRkX2lubmVyX3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJY29sb3I6ICMwMDAwMDA7DQoJdGV4dC1hbGlnbjogbGVmdDsNCglsZWZ0OiA1cHg7DQoJcGFkZGluZy1sZWZ0OiAxMHB4Ow0KfQ0KLnRkX2lubmVyX2NlbnRlcl9zdHlsZSB7DQoJZm9udC1mYW1pbHk6IEFyaWFsLCBIZWx2ZXRpY2EsIHNhbnMtc2VyaWY7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWNvbG9yOiAjMDAwMDAwOw0KCXRleHQtYWxpZ246IGNlbnRlcjsNCglsZWZ0OiA1cHg7DQoJcGFkZGluZy1sZWZ0OiAxMHB4Ow0KfQ0KLmNvbW1fZW5kX3N0eWxlIHsNCglmb250LWZhbWlseTogQXJpYWwsIEhlbHZldGljYSwgc2Fucy1zZXJpZjsNCglmb250LXNpemU6IDEycHg7DQoJY29sb3I6ICMwMDAwMDA7DQp9DQoucF9jbCB7DQoJZm9udC1mYW1pbHk6IEFyaWFsOw0KCWxlZnQ6IDBweDsNCgl0b3A6IDBweDsNCglyaWdodDogMHB4Ow0KCWJvdHRvbTogMHB4Ow0KCXBhZGRpbmc6IDEwcHg7DQoJZm9udC1zaXplOiAxMnB4Ow0KfQ0KDQouZl9jbCB7DQoJZm9udC1mYW1pbHk6IEFyaWFsOw0KCWxlZnQ6IDBweDsNCgl0b3A6IDBweDsNCglyaWdodDogMHB4Ow0KCWJvdHRvbTogMHB4Ow0KCXBhZGRpbmc6IDBweDsNCgliYWNrZ3JvdW5kLWNvbG9yOiAjRTNFM0UzOw0KCWZvbnQtc2l6ZTogMTJweDsNCn0NCg0KLmZfeiB7DQoJZm9udC1mYW1pbHk6IEFyaWFsOw0KCWxlZnQ6IDBweDsNCgl0b3A6IDBweDsNCglyaWdodDogMHB4Ow0KCWJvdHRvbTogMHB4Ow0KCXBhZGRpbmc6IDBweDsNCgl0ZXh0LWFsaWduOiBjZW50ZXI7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWNvbG9yOiAjNUQxQTlCOw0KCWZvbnQtd2VpZ2h0OiBib2xkOw0KfQ0KDQoudGFiX2FudCB7DQoJZm9udC1mYW1pbHk6IEFyaWFsOw0KCWZvbnQtc2l6ZTogMTJweDsNCglwYWRkaW5nOiAxMHB4Ow0KCWxlZnQ6IDEwcHg7DQp9DQouYmxhY2tUew0KCWNvbG9yOkJsYWNrOw0KCXBhZGRpbmctdG9wOiAwcHg7DQoJcGFkZGluZy1yaWdodDogMHB4Ow0KCXBhZGRpbmctYm90dG9tOiAwcHg7DQoJcGFkZGluZy1sZWZ0OiAxMHB4Ow0KCWZvbnQtZmFtaWx5OiBBcmlhbDsNCglmb250LXNpemU6IDEycHg7DQoJZm9udC13ZWlnaHQ6IGJvbGQ7DQp9DQouYmx1ZVR7DQoJY29sb3I6IzgwMDAwMDsNCgljdXJzb3I6aGFuZDsNCglwYWRkaW5nLXRvcDogMHB4Ow0KCXBhZGRpbmctcmlnaHQ6IDBweDsNCglwYWRkaW5nLWJvdHRvbTogMHB4Ow0KCXBhZGRpbmctbGVmdDogMTBweDsNCglmb250LWZhbWlseTogQXJpYWw7DQoJZm9udC1zaXplOiAxMnB4Ow0KCWZvbnQtd2VpZ2h0OiBib2xkOw0KfQ0KLnJlZFR7DQoJZm9udC1mYW1pbHk6IEFyaWFsOw0KCWNvbG9yOlJlZDsNCgljdXJzb3I6aGFuZDsNCn0NCi5EZWxUew0KCWRpc3BsYXk9bm9uZTsNCn0NCi5EaXNwVHsNCglkaXNwbGF5PWJsb2NrOw0KfQ0KLS0+PC9zdHlsZT48cCBjbGFzcz0id29yZF9zdHlsZSIgPtCwIDM8c3BhbiBjbGFzcz0iZ3JhbV9zdHlsZSI+IC0g0YfQsNGB0YLQutCwPC9zcGFuPjwvcD48cCBjbGFzcz0idGRfaW5uZXJfY2VudGVyX3N0eWxlIj48aT48L2k+PC9wPjxocj48cCBjbGFzcz0idGRfaW5uZXJfY2VudGVyX3N0eWxlIj7QvdC10LfQvNGW0L3RjtCy0LDQvdCwINGB0LvQvtCy0L3QuNC60L7QstCwINC+0LTQuNC90LjRhtGPPC9wPjxwIGNsYXNzPSJjb21tX2VuZF9zdHlsZSI+PC9wPmQCHQ8QDxYCHwFoZGQWAGQCIQ8PFgIfBAUm0KDQtdGU0YHRgtGA0L7QstC40YUg0YHQu9GW0LIgLSAyNTY2MThkZBgCBR5fX0NvbnRyb2xzUmVxdWlyZVBvc3RCYWNrS2V5X18WBgUiY3RsMDAkQ29udGVudFBsYWNlSG9sZGVyMSRiYWNrcGFnZQUiY3RsMDAkQ29udGVudFBsYWNlSG9sZGVyMSRuZXh0cGFnZQUhY3RsMDAkQ29udGVudFBsYWNlSG9sZGVyMSRhcnRuZXh0BSFjdGwwMCRDb250ZW50UGxhY2VIb2xkZXIxJGFydGJhY2sFIGN0bDAwJENvbnRlbnRQbGFjZUhvbGRlcjEkc2VhcmNoBR1jdGwwMCRDb250ZW50UGxhY2VIb2xkZXIxJHBhcgUdY3RsMDAkQ29udGVudFBsYWNlSG9sZGVyMSRkZ3YPPCsACgEIAgFklC27MWCF9dBDwM66j8r1tZfJF0M=|8|hiddenField|__VIEWSTATEGENERATOR|7AC6B68E|280|hiddenField|__EVENTVALIDATION|/wEWHwL5j46WAgKOl5uxCwKx2bW4AwK6nJjcCQLDwfOuBQLxmIzIBwKE846rAwLB3riyBQKj1vsQAqPW7/0IAqPW08oCAqPWx7cLAqPWi4QNAqPWv+EFAqPW4/8PAqPWl9sEAqPWm/oFAqPWj6cCAt7X0e4PAqHU0e4PAtzX0e4PAt/X0e4PAtrX0e4PAt3X0e4PAtjX0e4PAtvX0e4PAqbU0e4PAqnU0e4PAt7Xlf8BAqHUlf8BAtzXlf8BTT70sMb3afBBbbvijMGtXHGCBV4=|230|asyncPostBackControlIDs||ctl00$ContentPlaceHolder1$dgv,ctl00$ContentPlaceHolder1$search,ctl00$ContentPlaceHolder1$backpage,ctl00$ContentPlaceHolder1$nextpage,ctl00$ContentPlaceHolder1$artback,ctl00$ContentPlaceHolder1$artnext,ctl00$ContentPlaceHolder1$par|0|postBackControlIDs|||34|updatePanelIDs||tctl00$ContentPlaceHolder1$UpdText|0|childUpdatePanelIDs|||33|panelsToRefreshIDs||ctl00$ContentPlaceHolder1$UpdText|2|asyncPostBackTimeout||90|11|formAction||dictua.aspx|24|pageTitle||Словники України on-line|227|scriptBlock|ScriptPath|/dictua/ScriptResource.axd?d=lNEsLEpymteGCdQI20uQoRgIyCGcYI0j7cgshzwUt87271ZGpe8HJZR9DzE71iB5ndPLnBxBdwPB9BxIhKi6KXSlg4EkQzanOwU4Dw-QUyFRdhF0EOybKHgJDahiv0MSyu79uEEu3rJ_caGlljwFvSVKSfgvOaq85KQEXJ-lfLLjdY3n0&t=634819374914311271|211|scriptBlock|ScriptContentNoTags|Sys.Application.add_init(function() {
    $create(Sys.UI._Timer, {"enabled":true,"interval":300000,"uniqueID":"ctl00$ContentPlaceHolder1$cbtimer"}, null, null, $get("ctl00_ContentPlaceHolder1_cbtimer"));
});
|

Тобто видаються лише перші декілька десятків слів, а не весь набір слів, що починаються на а

funivan чим ви розкодовували ці параметри? Можливо знаєте для чого така велика їх кількість?

13

Re: [Phantom JS] Парсер онлайн словника Грінченка

funivan чим ви розкодовували ці параметри? Можливо знаєте для чого така велика їх кількість?

для чого їх розкодовувати ;) Вам потрібно просто емулювати поведінку.
Наскільки мені відомо ці сайти на asp так замучені що передають туєву тучу параметрів.
Вам потрібно просто визначити алгоритм. для того що б відкрити слово треба бути на сторінці з цим словом і глянути ідентифікатор цього слова.
http://i.imgur.com/vcHQjev.png
Дальше глянути куди цей параметр іде
http://i.imgur.com/ZKkUWLa.png
попадає у eventtager

все =) Для того що б переглянути слова на сторінці треба буде знати ідентифікатори і передавати кожен раз різний eventtarget
Дані для форми можна позбирати на даній сторінці і підставити тільки 1не значення.

Тобто видаються лише перші декілька десятків слів, а не весь набір слів, що починаються на а

ну є дальше кнопка next такий самий алгоритм як і зі словами ;)

Оновлено: також передається eventargument =)

14

Re: [Phantom JS] Парсер онлайн словника Грінченка

Ось, інша справа! І варто було лише потролити трохи, щоб суттєво підвищити швидкість відповіді.  ]:->

Неймовірно, але справді - якщо передавати незмінну скопійовану частину у параметрі __VIEWSTATE та параметр ctl00$ContentPlaceHolder1$ScriptManager1=ctl00$ContentPlaceHolder1$UpdText|ctl00$ContentPlaceHolder1$nextpage, то дійсно видно що відбувається пролистування контента...

Аналогічно - лівою ногою через праве вухо - можна навіть отримувати контент для конкретного слова.

15

Re: [Phantom JS] Парсер онлайн словника Грінченка

[
Шукав також список слів, дали посилання на ваш пост
Але виникло інше завдання - залишити лише іменники ?
Як це можна зробити ?
Потрібно заново парсити із сайту ?