1

Тема: Шукаю ідеї

Отже, є ресурси і пошуковий робот який зберігає 10k новин за годину. Новини класифікуються по 11 категоріям: політика, культура, ... і по ~200 країнах. Все це працює для 15-ти топ мов. Не проблема реалізувати для будь-якої іншої притомної мови.
Що з цього можна зробити цікаве?

2

Re: Шукаю ідеї

Ну, можна зберігати і класифікувати новини по різних категоріях і різних країнах.

П.С. Навіщо дублювати інформацію, яка й так дублюється по 100500 разів?

П.П.С. Хіба, якщо Вам вдасться написати якийсь ШІ, що зможе якимось чином визначати хоча би ймовірність, наскільки інформація подана в новинах достовірна, це була б ідея на мільйон.

Мій блог про ОС сімейства *nix - http://nixtravelling.blogspot.com/
Подякували: FakiNyan1

3

Re: Шукаю ідеї

Master_Sergius написав:

Ну, можна зберігати і класифікувати новини по різних категоріях і різних країнах.

зроблено

Master_Sergius написав:

П.П.С. Хіба, якщо Вам вдасться написати якийсь ШІ, що зможе якимось чином визначати хоча би ймовірність, наскільки інформація подана в новинах достовірна, це була б ідея на мільйон.

Типу категорії пропаганда, фейк, правда?

4

Re: Шукаю ідеї

dialectstat написав:
Master_Sergius написав:

Ну, можна зберігати і класифікувати новини по різних категоріях і різних країнах.

зроблено

Це був стьоб :)

dialectstat написав:

Типу категорії пропаганда, фейк, правда?

Ні. А от наприклад:
Новина - Половину депутатів заарештували і кинули до в'язниці.
Ваша програма зберігає новину і в поле "достовірність" записує 0.00

Новина - Тарифи знову зростають
Ваша програма в поле достовірність пише 100.00

Мій блог про ОС сімейства *nix - http://nixtravelling.blogspot.com/

5

Re: Шукаю ідеї

Цінність в такому лише навчальна. Відсоток новин штибу "Половину депутатів заарештували і кинули до в'язниці." мізерний, хіба що на 1 квітня це було б актуально :)

6

Re: Шукаю ідеї

Master_Sergius написав:
dialectstat написав:
Master_Sergius написав:

Ну, можна зберігати і класифікувати новини по різних категоріях і різних країнах.

зроблено

Це був стьоб :)

dialectstat написав:

Типу категорії пропаганда, фейк, правда?

Ні. А от наприклад:
Новина - Половину депутатів заарештували і кинули до в'язниці.
Ваша програма зберігає новину і в поле "достовірність" записує 0.00

Новина - Тарифи знову зростають
Ваша програма в поле достовірність пише 100.00

Тут іще такий нюанс, що заголовок новини зазвичай на порядок сенсаційніший за саму новину. Скажімо, заголовок: «Половина депутатів сиділи!», сама ж новина про те, що на останньому засіданні сиділа лише половина депутатів, тому кворуму не було. Формально — заголовок відповідає новині (яка сама по собі цілком достовірна), фактично — спотворює її зміст. Як міряти достовірність у таких випадках?

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊
Подякували: leofun01, 221VOLT2

7

Re: Шукаю ідеї

Master_Sergius написав:

Ні. А от наприклад:
Новина - Половину депутатів заарештували і кинули до в'язниці.
Ваша програма зберігає новину і в поле "достовірність" записує 0.00

А потім виясниться, що в Зімбабве Мугабе шукав крайніх і таки знайшов.

МАКЕ ЦКЯАІИЕ БЯЕАТ АБАІИ

8

Re: Шукаю ідеї

Master_Sergius написав:

П.С. Навіщо дублювати інформацію, яка й так дублюється по 100500 разів?

А й справді, кому зараз потрібен ще один сайт новин (чи, тим більше, ще один агрегатор новин — враховуючи, що більшість новин і на «справжніх» новинних сайтах є репостом)?
Ось минулого місяця їду я, бачу графіті — mama.net, ну, думаю, хтось піарить ресурс для матусь та інших овуляшок. Незрозуміло, правда, чого реклама в таких бомжацьких місцях. Може, щось антинаркоманське (типу, «мама, нет!»), що було б більш логічно?.. Коротше, заходжу туди — «ми відкриваємо новий супер мега агрегатор з усіма новинами з усього світу!».  *FACEPALM*

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊

9 Востаннє редагувалося tim (17.10.2016 08:55:14)

Re: Шукаю ідеї

P.Y. написав:

А й справді, кому зараз потрібен ще один сайт новин (чи, тим більше, ще один агрегатор новин — враховуючи, що більшість новин і на «справжніх» новинних сайтах є репостом)?

Люди мають доступ до повідомлень з різним відсотком інформації в них:

В теорії інформації системи моделюються передавачем, каналом та приймачем. Передавач продукує повідомлення, які надсилаються каналом. Канал якимось чином змінює ці повідомлення. Приймач намагається визначити, яке повідомлення було надіслано. В цьому контексті ентропі́я (точніше, ентропі́я Ше́ннона, англ. entropy, Shannon entropy) — це математичне сподівання (усереднене значення) інформації, яка міститься в кожному повідомленні. «Повідомлення» може бути модельовано будь-яким потоком інформації.

Через те, що повідомлення містять малий відсоток інформації в людей виникає розчарування в передавачах і каналах повідомлень. Люди змушені витрачати багато зусиль на видобування інформації з повідомлень. Часто вони подібні до старателів, які перемивають тони породи(повідомлень) щоб здобути грами золота(інформації).
Саме тому виникає ейфорія, коли людина нападає на золоту жилу, - передавач і канал з великим відсотком інформаціі в повідомленнях.

Якщо сайт новин буде давати 80-90% інформації в потоці повідомлень, то він потрібен. Більшість сайтів новин, телеканали зараз дають 5-20% інформації в повідомленнях.
Подивіться 30-50 хвилинний випуск новин. З всього часу, який Ви витратили на перегляд, корисну для Вас інформацію Ви отримували 1-5 хвилин максимум.
Якщо зробите систему фільтрів під "приймача"(глядача, читача, споживача), які людина сама зможе налаштувати, то в такому варіанті реалізації є сенс. На такому сервісі навіть можна добре заробити.

Подякували: bvn1

10 Востаннє редагувалося P.Y. (17.10.2016 14:16:10)

Re: Шукаю ідеї

Питання в тому, а чи справді людям треба стільки хронологічно впорядкованої інформації про поточні події? Інакше як новинні ресурси з низьким відсотком корисної інформації взагалі втримуються на ринку — по ідеї, їх мали б відтіснити конкуренти з більш насиченим контентом?

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊

11

Re: Шукаю ідеї

Думаю, це різні ніші. Як і з будь-яким іншим «продуктом».
Те, що нема «нормальних» з точки зору цієї теми ресурсів, швидше за все, означає надто вузьку нішу, на яку ніхто не хоче витрачатися.

printf("Nested comments is %s\n", */*/**/"*/"/*"/**/ == '*' ? "OFF" : "ON");

12

Re: Шукаю ідеї

Можна рахувати кількість цитувань, складати рейтинг.
Більш складне завдання, скласти граф посилань і знайти справжнє першоджерело.
Можна вигадати як рахувати впливовість (себто вплив на суспільство), через популярність (кількість цитувань + репостів + переглядів).
Продовжувати :)?

Подякували: bvn1

13 Востаннє редагувалося tim (18.10.2016 09:29:43)

Re: Шукаю ідеї

P.Y. написав:

Питання в тому, а чи справді людям треба стільки хронологічно впорядкованої інформації про поточні події? Інакше як новинні ресурси з низьким відсотком корисної інформації взагалі втримуються на ринку — по ідеї, їх мали б відтіснити конкуренти з більш насиченим контентом?

Конкурентів просто не існує. Точніше є прототипи, наприклад Stratfor.

Stratfor, або Strategic Forecasting, Inc. (укр. Корпорація «Стратегічне прогнозування»)  — американська приватна розвідувально-аналітична організація глобального радіусу дії, що була заснована американським політологом (родом з Ужгорода) Джорджем Фрідманом 1996-го року.

Уряди, розвідки,  які мають подібні інформаційні ресурси з 50-70% достовірної і важливої інформації захочуть мати конкурентів з 80% інформації в повідомленнях назагал, для всіх?
Державам, урядам, капіталістам вигідно мати сотні "лещенок", "наємів", "станко", "скрипіних", "кисельових", які дуритимуть довірливих виборців, народні маси. Продукуватимуть вал повідомлень з 5-20% достовірної і корисної інформації.
Інформація в інформаційну епоху - як капітал за капіталізму. Хто володіє інформацією, той контролює держави, корпорації.

14

Re: Шукаю ідеї

Справа навіть не в правдивості, а в реальній спроможності глядача/слухача/читача перетравити таку кількість інформації — особливо якщо далі він її ніде не застосовує. Що новинні ресурси є різновидом політреклами, всім давно відомо — досягається це, як правило, не свідомою фальсифікацією, а однобоким висвітленням подій. Скажу більше, таку ж задачу виконуватиме й новинний ресурс, що в усіх подробицях висвітлюватиме як позитивні, так і негативні риси певної політичної сили, повністю забиваючи канал сприйняття глядача, але лишаючи при цьому конкурентів поза увагою — в кінцевому підсумку, глядач таких новин або піде голосувати за «найменше зло» (єдину партію, про яку він знає хоч щось), або проігнорує вибори взагалі (що для партії-замовника краще, ніж коли б він пішов голосувати за її конкурентів).

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊

15 Востаннє редагувалося tim (18.10.2016 16:40:11)

Re: Шукаю ідеї

P.Y. написав:

Справа навіть не в правдивості, а в реальній спроможності глядача/слухача/читача перетравити таку кількість інформації — особливо якщо далі він її ніде не застосовує.

Люди ж якось вчаться в університетах, інститутах, читають наукову літературу. Під час 90 хвилин лекції дуже висока щільність інформації. Витримують.
Можна дозувати по 5-10 хвилин для неофітів :)

16

Re: Шукаю ідеї

tim написав:
P.Y. написав:

Справа навіть не в правдивості, а в реальній спроможності глядача/слухача/читача перетравити таку кількість інформації — особливо якщо далі він її ніде не застосовує.

Люди ж якось вчаться в університетах, інститутах, читають наукову літературу. Під час 90 хвилин лекції дуже висока щільність інформації. Витримують.
Можна дозувати по 5-10 хвилин для неофітів :)

По-перше, ті з них, що справді слухають лекції — люди достатньо мотивовані, їм же потім прослухане здавати, інакше армія. А новини?
По-друге, чи справді всі ті лекції слухають, а не сплять на парах чи займаються якоюсь фігнею?
По-третє, чи справді там така вже концентрація корисної інформації? Препод може взагалі теревенити про життя, а вся корисна інформація — в підручниках.

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊
Подякували: 0xDADA11C71

17

Re: Шукаю ідеї

Доброго дня! Я вважаю, що ідея взагалі не дуже. Подібних ресурсів з різноманітними новинами існує дуже багато і всі вони копіюють одне одного і переливають із пустого в порожнє. Особисто мені взагалі набридли всі новини, я їх не дивлюсь :) Нічого хорошого не розповідають..а як все погано всі і так знають. Мій висновок такий, що не потрібно із цим взагалі працювати. Дякую.

18

Re: Шукаю ідеї

dialectstat я для політичних нових хотів зробити одну цікаву фішку. Визначати імена і дії в тексті і робити перехресні посилання.
Для прикладу: Можна знайти з якими депутатами пересікався той чи інший політичний діяч.

Також можна побудувати свій словник синонімів. У вас є новина яка написана на 10 ресурах по різному. Придумайте як можна знайти речення які описують одну і ту саму дійю але в різному стилі. Дальше навчити програму генерувати подібні новини.

Також можна дивитись за трендами. Наприклад визначити самий популярний гаджет і на своєму сайті писати тільки про популярні штуки =)

19

Re: Шукаю ідеї

P.Y. написав:

Препод може взагалі теревенити про життя, а вся корисна інформація — в підручниках.

Дуже часто це і є цінною інформацією для 17-21 річних студентів. Розмови про життя будять студентів. Ліричні відступи розвантажують мозок.