Як я зрозумів, або серед присутніх ніхто не бавився з Google Customserch API, або не було бажання пояснити, тому, коротко розпишу як організувати свій пошук в гугл програмно. Писати буду на python. Так от, поїхали.
1. Спочатку потрібно зарареєструвати свій Google пошук, так званий Користувацький пошук - https://cse.google.com.ua/cse/all .
Ось тут і починаються проблеми і обмеження: є вибір, шукати на окремому сайті, або ж, "по всьому інтернету". Звісно, мені потрібен був пошук по всьому інтернету, внизу були налаштування пошуку по всьому інтернету. Самі ж обмеження - шукати можна тільки по сайтах з шаблонами schem.org. Добавити можна всього 10 шаблонів. В реалі їх є дуже багато.
Зареєструваши, берем користувацький id. Він виглядає типу "0182************37171:ysu****7xw8") Зірочки вписую тому, що користуюсь даним кодом.
2. Дальше нам потрібно зареєструвати АРІ-ключ
Рядки в json-об'єкті які повертає гугл. Документація, одним словом)
Виглядає типу "AIzaSyCAoU*************ANe3PYXeLzBdspi50"
3. Більша частина пройдена. Тепер потрібно встановити бібліотеку. Як я зрозумів, бібліотека є тільки для 3 гілки пайтона.
Linux:
$ pip install --upgrade google-api-python-client
or
$ easy_install --upgrade google-api-python-client
Windows:
pip install google-api-python-client
4. А тепер сама програма:
# -*- coding: utf-8 -*-
from googleapiclient.discovery import build
import config
def main(query, numb):
service = build("customsearch", "v1",
developerKey = config.keyGoogleAPI)
res = service.cse().list(
q = query,
cx = config.idGoogle,
num = numb,
googlehost = 'www.google.com.ua',
).execute()
return res['items'][0]['formattedUrl']
if __name__ == '__main__':
main()
Програма повертає посилання на перший пропонований сайт в гугл. Використовую її як модуль в іншій програмі.
Щоб роздрукувати весь json-об'єкт добавляємо модуль pprint і прописуємо замість return:
pprint.pprint(res)
Файл config:
# -*- coding: utf-8 -*-
keyGoogleAPI = 'AIzaSyCAoU*************ANe3PYXeLzBdspi50'
idGoogle = '0182************37171:ysu****7xw8'