Потрібно накінець створити український ШІ (Сторінка 3) - Обговорення

41 Відповідь від Slon115 13.12.2024 13:15:42

Slon115
Новий користувач
Поза форумом

Дата реєстрації: 06.12.2024
Повідомлень: 20

Репутація

: 0

Re: Потрібно накінець створити український ШІ

Добре, але поки що я працюю над іншим проектом

42 Відповідь від frz 13.12.2024 13:51:47

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 425

Re: Потрібно накінець створити український ШІ

Тримайте в курсі.

frz вебсайт

43 Відповідь від Nick9956 26.02.2025 23:27:39

Nick9956
Користувач
Поза форумом

Дата реєстрації: 05.03.2015
Повідомлень: 301

Репутація

: 56

Re: Потрібно накінець створити український ШІ

javascriptIsLife написав:

Абсолютно впевнений що 99% школярів які використовують ChatGPT роблять це для того щоб самим нічого не робити. Давайте за створення візьметеся ви. Через певний час галас довкола ChatGPT схлине і воно буде використовуватися для того щоб краще і дешевше засирати WWW і заробляти ще більше грошей на всякому SEO. Або для якихось подібних цілей. Сподіваюся на те що пошукові системи не переведуть все на цю фігню. Одноманітні картинки згенеровані цією фігнею які використовуються в якості ілюстрацій для новин і різноманітних публікацій це прям неймовірне космічне майбутнє з ШІ і зовсім не марна трата ресурсів.

свою нішу воно займе, переписати скрипт з пайтон на ts виходить так сяк, так й базові речі "вигадує" непогано.

44 Відповідь від P.Y. 18.06.2026 23:59:46

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

Перечитую цю тему — два роки по тому багато чого змінилося в багатьох питаннях, тогочасні погляди на перспективи ШІ (як автора теми, так і його критиків) виглядають дещо наївними.

Стартап, фінансування і т.д. — як і раніше, словосполучення «український стартап» є майже оксюмороном. Тобто, так, якщо вас узяло під крило велике державне цабе зі схемою відмивання крадених бюджетних грошів, то ваш стартап злетить, принаймні, у фінансовому плані, але нікому не буде потрібен як продукт. Здоровий глузд підказує, що про інвесторів слід забути.

Успішний український проект — це, як правило, не стартап з інвестиціями, а народний проект, розбудовуваний знизу, з мінімумом зовнішніх інвестицій. Файлозвалища, онлайн-бібліотеки, торент-трекери — всі вони успішно розвивалися, наповнювалися контентом, і лише пряме втручання держави ставило крапку на їх існуванні. Як би перенести цю стратегію на ШІ (якщо це можливо)? Легкі LLM у наш час достатньо легкі, щоб їх можна було ганяти навіть на слабкому залізі, і завантажити їх можна абсолютно безкоштовно — інша річ, вони менш функціональні, ближче до того, чим були топові ШІ кілька років тому. Донавчати на своїх даних — вимоги до заліза більші, але теж ніби нічого нереалістичного. Тобто, український файн-тюнінг — це те, що вже може стартувати без супер-пупер-інвестицій. Мені вже потрапляли до рук українські LLM на базі моделі Gemma3 — загалом враження непогане, але базова модель вже й без того цілком пристойно розмовляє українською, тому різниця не така помітна (от якби навчили так Qwen, особливо в легких модифікаціях...).

Але це поки що нішевий напрямок. Більшість досі думає, що для ШІ потрібен хмарний сервіс. Що ж, якщо так, то вам потрібен інвестор, якому треба мити гроші, і демпінгова маркетингова модель: запропонуйте безкоштовно (і, бажано, без реєстрації) більше, ніж пропонують провідні ШІ-сервіси. Так, найкрутіш моделі зараз закриті, але хмарний сервіс, що надає доступ до великих моделей з відкритим кодом, вже буде цілком життєздатним і функціональним. Плюс там різні варіації на тему кооперації між моделями, файн-тюнінгу і т.д. Але ключ до успіху — шара (на жаль, це не дуже себе окуповує фінансово, але реальний фінансовий успіх тут і непотрібен). Вільний доступ до API, збереження/відновлення розмов, необмежена робота з картинками тощо — і ось ваш сервіс уже виганяє провідні західні ШІ з їхніх ніш.

Щодо експертної системи, енциклопедії і т.п. Модель на чомусь навчається — їй згодовують зразки з певною мовою, певними концепціями, певною ідеологією. Тобто, можна зробити LLM з певним світоглядом, набором закладених у неї фактів — багато в чому це нагадує наповнення енциклопедії. Так, звичайно, будь-який просунутий ШІ-сервіс також уміє шукати в мережі, але вбудовані в модель факти, вочевидь, він видаватиме в першу чергу.

Що ще точно не спрацює, так це асоціація з державними структурами. Ви б хотіли, щоб ваш ШІ-чатик читали силовики, а потім прийшли по вас з офіційними скріншотами, коли вас кинула дівчина, ви напилися й наговорили штучному інтелекту всякого лайна про все, що тільки бачили? Або коли ви просто експериментували з можливостями цензури і де вони проходять? Ні? Та невже?! Тобто, спілкування з державним ШІ стає гіпервідповідальним, користувач почувається затиснутим, для розважального спілкування звертається до закордонних ШІ, а популярність національного ШІ в такому виконанні прямує до популярності Резерву-плюс та веб-сторінки податкової служби, тільки без механізму примусу.

45 Відповідь від ostap34PHP 19.06.2026 13:44:13 Востаннє редагувалося ostap34PHP (19.06.2026 13:46:40)

ostap34PHP
Replace Team
Поза форумом

Дата реєстрації: 27.01.2016
Повідомлень: 800

Репутація

: 472

Re: Потрібно накінець створити український ШІ

Announcing MamayLM, an efficient state-of-the-art Ukrainian LLM
April 23, 2025
https://huggingface.co/blog/INSAIT-Institute/mamaylm

Можу протестувати 9B модель на своєму 16GB M1 Pro, скидайте запити якщо цікаво.

ostap34PHP вебсайт

46 Відповідь від frz 19.06.2026 14:47:17

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 425

Re: Потрібно накінець створити український ШІ

P.Y. написав:

словосполучення «український стартап» є майже оксюмороном.

Grammarly, GitLab, Reface, Petcube, Preply - і це лише "топ 5". Чи рахується лише суто ТзОВ? Бо ці перелічені, звісно, юридично поза ненькою.

frz вебсайт

47 Відповідь від HetmanNet 19.06.2026 14:54:49

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 859

Репутація

: 2548

Re: Потрібно накінець створити український ШІ

frz написав:

P.Y. написав:
словосполучення «український стартап» є майже оксюмороном.
Grammarly, GitLab, Reface, Petcube, Preply - і це лише "топ 5". Чи рахується лише суто ТзОВ? Бо ці перелічені, звісно, юридично поза ненькою.

Лише з юридичною особою в Україні.

48 Відповідь від frz 19.06.2026 15:36:53

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 425

Re: Потрібно накінець створити український ШІ

HetmanNet написав:

frz написав:
P.Y. написав:
словосполучення «український стартап» є майже оксюмороном.
Grammarly, GitLab, Reface, Petcube, Preply - і це лише "топ 5". Чи рахується лише суто ТзОВ? Бо ці перелічені, звісно, юридично поза ненькою.
Лише з юридичною особою в Україні.

Ajax Systems, MacPaw, Creatio, Readdle, Serpstat

frz вебсайт

49 Відповідь від frz 22.06.2026 11:27:56

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 425

Re: Потрібно накінець створити український ШІ

Чи на сьогодні має сенс витрачати час та бюджет на розробку державної LLM? Нагадаю, що Київстар планує завершення робіт по держзамовленню на листопад 2026 року і для майбутньої системи на березневому голосуванні в Дія вже навіть обрали назву - Сяйво (Siaivo).
Коли проект лише запускали, то спершу планували використати Llama від Meta, але врешті обрали Gemma 3 від Google, яка себе добре зарекомендувала як база для інших українських LLM - MamayLM (на честь легендарного козака Мамая) і LapaLLM (на честь всесвітньовідомого київського професора Валентина Лапи, який заклав основи сучасного машинного навчання). Окрім платформи ці три LLM мають спільну концепцію доробок - українська в якості базової для токенізатору, претрейнінг вагів на корпусах українських текстів та додатковий файнтюнінг на чутливих темах типу "Чий Крим?".
Та на відміну від Київстару, у інших розробників українських LLM не було контракту з державою та бездонних бюджетів, а тому вони вже давно опублікували свої роботи на HuggingFace для усіх охочих. А також створили бенчмарки для порівняння якості роботи LLM з українською мовою, де на лідборді зараз дуже цікаві результати: https://lnkd.in/duaT8rdB
Очевидно, що в тестах на володіння українською мовою українські LLM на будуть на голову вищі за свою базову Gemma 3, а також за інші схожі опенсурси (окрім Qwen 3, яка несподівано займає перше місце по резюмуванню та є одним з лідерів у перекладах). Але перевага лишається лише якщо ігнорувати появу Gemma 4, яка без жодного додаткового навчання займає перші місця у всіх тестах, а особливо у ЗНО по шкільним предметам.
Якщо Київстар будуть свій довгобуд запускати на Gemma 3, то на кінець року отримаємо результат гірший за сьогоднішню "сиру" опенсорсну Gemma 4, і яким бізнеси будуть користуватись лише під загрозою штрафів за використання інших ШІ.
Якщо Київстар не захоче сидіти на старій моделі, то їм для нової MoE-архітектури треба створити новий токенайзер та проводити донавчання "з нуля". Але де гарантія, що восени не вийде проміжна більш потужна Gemma 4,5 чи взагалі щось абсолютно нове?
Може здатися, що головна проблема в тому, що це Київстар повільний і, не маючи власної команди науковців, місяцями робить те, що інші роблять за тижні.
Але, на мою думку, проблема скоріше у зникненні потреби! Чи потрібно взагалі створювати та підтримувати національні LLM, які будуть добре працювати на "державній" (і погано на інших), коли вже доступні універсальні опенсурсні Gemma і Qwen, які одразу і без донавчання показують експертне володіння одразу українською мовою і усіма мовами нацменшинств?

https://www.linkedin.com/posts/dv-kinas … 6928-4Wtb/

frz вебсайт

50 Відповідь від HetmanNet 22.06.2026 15:12:58

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 859

Репутація

: 2548

Re: Потрібно накінець створити український ШІ

frz написав:

Чи на сьогодні має сенс витрачати час та бюджет на розробку державної LLM? Нагадаю, що Київстар планує завершення робіт по держзамовленню на листопад 2026 року і для майбутньої системи на березневому голосуванні в Дія вже навіть обрали назву - Сяйво (Siaivo).
Коли проект лише запускали, то спершу планували використати Llama від Meta, але врешті обрали Gemma 3 від Google, яка себе добре зарекомендувала як база для інших українських LLM - MamayLM (на честь легендарного козака Мамая) і LapaLLM (на честь всесвітньовідомого київського професора Валентина Лапи, який заклав основи сучасного машинного навчання). Окрім платформи ці три LLM мають спільну концепцію доробок - українська в якості базової для токенізатору, претрейнінг вагів на корпусах українських текстів та додатковий файнтюнінг на чутливих темах типу "Чий Крим?".
Та на відміну від Київстару, у інших розробників українських LLM не було контракту з державою та бездонних бюджетів, а тому вони вже давно опублікували свої роботи на HuggingFace для усіх охочих. А також створили бенчмарки для порівняння якості роботи LLM з українською мовою, де на лідборді зараз дуже цікаві результати: https://lnkd.in/duaT8rdB
Очевидно, що в тестах на володіння українською мовою українські LLM на будуть на голову вищі за свою базову Gemma 3, а також за інші схожі опенсурси (окрім Qwen 3, яка несподівано займає перше місце по резюмуванню та є одним з лідерів у перекладах). Але перевага лишається лише якщо ігнорувати появу Gemma 4, яка без жодного додаткового навчання займає перші місця у всіх тестах, а особливо у ЗНО по шкільним предметам.
Якщо Київстар будуть свій довгобуд запускати на Gemma 3, то на кінець року отримаємо результат гірший за сьогоднішню "сиру" опенсорсну Gemma 4, і яким бізнеси будуть користуватись лише під загрозою штрафів за використання інших ШІ.
Якщо Київстар не захоче сидіти на старій моделі, то їм для нової MoE-архітектури треба створити новий токенайзер та проводити донавчання "з нуля". Але де гарантія, що восени не вийде проміжна більш потужна Gemma 4,5 чи взагалі щось абсолютно нове?
Може здатися, що головна проблема в тому, що це Київстар повільний і, не маючи власної команди науковців, місяцями робить те, що інші роблять за тижні.
Але, на мою думку, проблема скоріше у зникненні потреби! Чи потрібно взагалі створювати та підтримувати національні LLM, які будуть добре працювати на "державній" (і погано на інших), коли вже доступні універсальні опенсурсні Gemma і Qwen, які одразу і без донавчання показують експертне володіння одразу українською мовою і усіма мовами нацменшинств?
https://www.linkedin.com/posts/dv-kinas … 6928-4Wtb/

LLM заради LLM

51 Відповідь від P.Y. 25.06.2026 10:45:03

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

Gemma 4 в мовному плані дуже непогана, а от Qwen треба ще трохи поганяти по українському корпусу (хоча в Qwen 3.5 порівняно з 2.5 прогрес помітний). Я б сказав, робити «солов'їну LLM» на базі Gemma — справа дещо марна, за пів року-рік нова версія базової моделі обжене ваш файнтюн.

Хоча серед більш нішевих моделей простір для вдосконалення є. Той же Qwen у малорозмірних моделях говорить українською з помітним «акцентом», а коли ця модель ще й відволікається, наприклад, на задачу розпізнавання зображень, якість української може зовсім деградувати.

▼Прихований текст

Ось приклад аналізу зображення українською мовою від моделі, побудованої на базі Qwen 3.5 0.8B:

Дай опис цього зображення

MiniCPM-V-4_6-Thinking-Q4_K_M.gguf написав:

Цекале зображення демонструє художню, ідеалізовану ілюстрацію сусідастого тварина — великого, м’яко-коричневого бобра — що стоїть або сидить на нейтральному, Neutralним тлісі. Вона дзьобне зовнішній бік, поглядавши вправо, і з його правого боку тримає велику, темно-синю, аероспратичну стрільбу. Стрілка має довгу, вертикальну циліндрову трубу, темну металеву корпусу, з видимими деталями, такими як акцент на стрілку та ланцюж, і прилегле до неї зрідкове, темноворохове збиране зовнішні тварини.
Бобровий тіло виглядає приємним та текстуризованим, з м’яким, приглушеним кольором тваринної хвиди та лоска, а його голова та обличня мають м’які, приглушених тонів, контрастуючи з темнішою куттурною частиною. Стрілка, на жаль, виглядає як зовнішній інструмент, майже як армалета, з чітким, реалістичним дизайном, що надає зображенню ідентичності та прикладеності.
На тлісі тонка, елегантна обстановка з нейтральним, нейтральним фоном, що підсилює фокус на тварині та стрільці. Відображення художнього стилю — з сильним контрастом, гармонійними кольорами та майстерним текстуралом — надає зображенню драматичного, ідеалізованого прикладу, що може стосуватися тематичних або фанатичних ілюстрацій.
Загаловно, зображення створює сюрреалістичний, сюрреалістичний та трохи монументальний візуальний нав’язок, оскільки боброве тварини, що зберігає природні елементи, зображене в стилі армалету, створює сучасний контраст та прикладену в綡ку фанатичну або символічну імпресіоністичну композицію.

А ось аналіз трохи іншого зображення від більш потужної моделі Qwen:

Ось третє зображення. Що можна побачити на ньому?

Qwen3.5-9B-Q4_K_M.gguf написав:

Це дуже сюрреалістичне (мистецькі) зображення. Ось що можна побачити на ньому:
1. **Військовий ведмідь:** Головний герой — великий бурий ведмідь, який стоїть на задніх лапах у лісі. Він виглядає дуже серйозним.
2. **Зброя та обладнання:** Ведмідь одягнений у тактичний жилет (бронежилет) з багатьма кишенями. У лапі він тримає сучасну шалену автомат (штурмову винтовку).
3. **Дивний фон:** Навколо ведмедя в повітрі ледь помітні зелені рядки тексту або коду. Вони нагадують інтерфейс комп'ютерного терміналу або хакерського сканування. Це створює відчуття, що ведмідь — це частина "цифрового світу" або кібернетичний монстр.
4. **Атмосфера:** Місце виглядає як густий, туманний ліс.
5. **Деталі на землі:** Біля коренів дерева праворуч лежить підривний пристрій (граната або міна).
Загалом це виглядає як сценарій для фантастичної ігри або коміксу про військових тварин.

2B-модель на цьому зображенні збилась на англійську (хоча питання було поставлено українською).

Розкажи, що зображено тут

Qwen3.5-2B-Q4_K_M.gguf написав:

This is a surreal image that blends elements of nature, fantasy, and technology. Here is a detailed description:
**The Subject:**
* A large brown bear stands upright on its hind legs, mimicking a human soldier's posture.
* The bear is wearing a rugged, tan-colored **tactical vest** with pouches and a belt, giving it a military appearance.
* It is holding an **assault rifle** (which looks like an AK-style weapon) slung over its shoulder.
**The Setting:**
* The bear is standing in a **misty, forest environment**. There are tall pine trees and a dirt ground with some fallen leaves.
* The lighting is somewhat dim, with the green digital elements creating a hazy atmosphere.
**The Visual Effect (The Key Element):**
* The most distinctive feature is the **green digital overlay**.
* A stream of "code" or data streams floats around the bear and the background trees.
* It looks like a **hacker interface** or a futuristic computer terminal. This gives the image a "cyberpunk" aesthetic, mixing a wild animal with a military theme and high-tech technology.

Українське ж розпізнавання зображень від Qwen 3.5 2B виглядає так:

Що тут зображено?

Qwen3.5-2B-uncensored-ara.Q4_K_M.gguf написав:

Зображено **великого тигра** (або великої черепахи з великим скребком), яка намагається вбити маленьку суску.
Ось деталі:
1. **Гигантський тигр:** У центрі зображено велику голову черепахи з великим скребком, яка тримає у лапі довгий, скребкий меч (рапію).
2. **Суска:** У передньому плані, на псці, стоїть мала суска, яка стоїть на задніх лапах і виглядає напівривалом.
3. **Окружеж:** Це сухе місце (песка) з кривавою лінією (сміх), в якому тигр рухається і б'є мисливця.

Проте, в чаті якість української мови Qwen загалом краща, ніж під час роботи з зображеннями — схоже, частина моделі, відповідальна за багатомовність, при додатковому навантаженні частково вимикається.

52 Відповідь від P.Y. 25.06.2026 11:36:43

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

ostap34PHP написав:

Announcing MamayLM, an efficient state-of-the-art Ukrainian LLM
April 23, 2025
https://huggingface.co/blog/INSAIT-Institute/mamaylm

Можу протестувати 9B модель на своєму 16GB M1 Pro, скидайте запити якщо цікаво.

Тестував Mamay 4B. Суб'єктивно — Gemma як Gemma. Краща українська, ніж у Gemma 2, але суттєвої різниці з Gemma 4 не помітив.

LapaLLM — для 16 ГБ дещо важкувата, не літатиме, якість мови — може десь трохи краща, ніж Gemma 4, але важко сказати. Хоча суттєва перевага — краще розуміє український культурний контекст. З усіх LLM, які мені потрапили до рук, лише Lapa правильно відповіла на питання «яку форму має вареник?» (Mamay теж на ньому валиться).

Для чого інші LLM, коли є Gemma? Ну, наприклад, зображення вона аналізує гірше, ніж Qwen — дає гарний атмосферний опис правильною українською, але може пропустити важливі деталі.

▼Прихований текст

Ось так Gemma бачить зображення військового ведмедя з попереднього повідомлення:

gemma-4-E2B-it-uncensored-Q4_K_M.gguf написав:

Це фотографія, яка передає атмосферу дикої природи та густої порослих лісів.
**Основні елементи опису:**
1. **Центральна фігура:** На передньому плані зображено велику тварину, схожу на **ведмедя** або іншого великого хижого звіра. Тварина має густу, темну, пухнасту шерсть і стоїть на передніх лапах, погляд її спрямований прямо на глядача. Вона займає значну частину нижньої половини кадру.
2. **Середовище та фон:** Сцена розгортається у лісовій місцевості. Фон заповнений темними силуетами дерев, які створюють глибоке, темне та трохи сумне середовище.
3. **Атмосфера:** Картина насичена **туманом або легким туманом**, що створює м'яке, розсіяне освітлення і додає сцені загадковості та таємничості.
4. **Передній план:** Земля, на якій стоїть тварина, показана як темна, волога, глиниста або каміння, що контрастує з темною шерстю звіра.
**Загальне враження:**
Фотографія має **темну, мрійливу та дику атмосферу**. Вона ідеально передає відчуття спокою, ізоляції та глибини лісового простору, натякаючи на зустріч із дикою природою. Освітлення м'яке, підкреслюючи текстуру шерсті та вологий, густий туман.

53 Відповідь від P.Y. 25.06.2026 12:00:37

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

Чи потрібно взагалі створювати та підтримувати національні LLM, які будуть добре працювати на "державній" (і погано на інших), коли вже доступні універсальні опенсурсні Gemma і Qwen, які одразу і без донавчання показують експертне володіння одразу українською мовою і усіма мовами нацменшинств?

У ніші малих моделей сенс є. Якщо універсальна модель максимально компактна, то українська й решта мов у ній (крім англійської та ще, можливо, кількох топових мов) будуть малопридатними для реального використання — для нормальної української потрібне донавчання.

З іншого боку, надкомпактна модель з гарною українською мовою — це незовсім те, з чим можна носитися як з писаною торбою й подавати як національну гордість. Хіба що вам вдасться запхнути її в кожну українську праску.

54 Відповідь від P.Y. 26.06.2026 02:07:28

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

А ще існує така глобально невирішена проблема, як наголоси. Завдяки тому, що українська, маючи складну й заплутану логіку наголосів, на письмі їх переважно не позначає, моделям просто нема на чому вчитися (наголос у базовій формі слова ще можна відшукати у словнику, але в решті форм слова наголос часто зміщується, часто різні словоформи відрізняються лише наголосом). Звідси численні приклади машинного голосового відтворення з переплутаними наголосами (які вже почали переймати і самі україномовні гомосапієнси) або, наприклад, проблема з віршуванням: та ж Gemma 4 може підібрати кількість складів і римовані закінчення, але в неї просто нема даних, як зробити вірш ритмічним.

Тобто, це проблема на рівні зайвих пальців на комп'ютернозгенерованих зображеннях, але цікава лише українцям.

Якби в нас був великий набір українських аудіозаписів (причому, не пісень, а звичайної прозової мови), і його можна було транскрибувати зі збереженням наголосів, це б стало чудовим підґрунтям для навчання «солов'їної LLM». Наскільки я розумію, архів «Українського радіо» з цими цінними матеріалами згорів у 1996, про якісь інші подібні великі архіви чути не доводилось.

Подякували: ReAl1

55 Відповідь від P.Y. 12.07.2026 10:36:23

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

Хоча, взагалі-то, про ШІ-суверенітет замислюються і в інших країнах. Бо що ви робитимете, наприклад, коли країни з провідними ШІ-сервісами раптом вирішать різко обмежити вам доступ до своїх унікальних сервісів та технологій? Або застосування ШІ в оборонній сфері — тут узагалі буде диво, якщо нам дадуть здалеку подивитися на їхнього ШІ-стратега. Тому, наприклад, існує Mistral як європейська альтернатива американським і китайським ШІ-розробкам. (Французи з типово французькими комплексами — що з них візьмеш...)

Тепер, Україна. Зрозуміло, що донавчання Джемми — взагалі не про те (незалежно від того, чи це створена ентузіастами Лапа, чи розрекламоване київстарівське Сіа-іва-о) — так, покращити існуючу досить непогану модель, донавчивши її на українському корпусі — річ важлива і корисна, але це зовсім не той рівень розробки, самі розумієте. І навіть якщо держава вирішить вбухати у створення «національного ШІ» бюджетних коштів як у створення з нуля власного аналога ЧатуGPT, а на виході буде та ж сама трохи причесана Джемма. (Українці з типово українськими комплексами — що з них візьмеш...).

Можливо, задум автора цієї теми в чомусь навіть ближчий до створення суверенного ШІ, ніж те, що зараз реально розробляється під соусом «національної LLM». Так, він узагалі не уявляє реальних масштабів і реального сенсу такої розробки, але, принаймні, дивиться в напрямку створення чогось свого з незалежною архітектурою. Але, знову ж, для створення чогось справді незалежного потрібні а) справді серйозні капіталовкладення в машинні ресурси, б) команда фанатичних дослідників, які скоріш погодяться на невдалий ресурсоємний експеримент з нульовим результатом, ніж на розпил капіталу і трохи причесану Джемму на виході.

56 Відповідь від P.Y. 13.07.2026 06:58:58

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5157

Re: Потрібно накінець створити український ШІ

Узагалі, гей-ай-помічник у Дія, який, коли користувач натискати кнопка, молоти якийсь дурниця — непотріб за визначенням, ніхто тими вбудованими помічниками не користується. І так, сира Джемма 4 впоралася б із цією роботою краще, ніж уже застаріла Джемма 3 з приклеєною українською лейблочкою.

Справді цікаво було б замахнутись на щось рівня Claude. Український кодер пише код, але за нього пише Клод, грошики за токени йдуть за океан. А чому ми так не можемо — підняти мегасервер з достатньо розумною великою моделлю і продавати токени самим? Так, у вільному доступі є лише менш розумні моделі (але код вони вам напишуть — питання лише в якості), і ще треба дивитися, що там пишуть у ліцензії про їх комерційне використання. Найпотужніші моделі лишаються закритими. Отже, треба вкладатися у створення власних більш інтелектуальних моделей (на щастя, основа для них уже є — технологічний прорив зробили вже за нас). Мені здається, в такому напрямку українці поки що взагалі не думають.

57 Відповідь від HetmanNet 13.07.2026 10:01:50

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 859

Репутація

: 2548

Re: Потрібно накінець створити український ШІ

P.Y. написав:

А чому ми так не можемо — підняти мегасервер з достатньо розумною великою моделлю і продавати токени самим?

Тому що немає такої зайвої кількості бабла яку можемо спалити на цю дурню. Було би то прибутково то вже давно бачили щоденну появу компаній які здають гігантам індустрії свої датацентри, а в реальності бачимо що все навпаки, бо гіганти індустрії шукають кому обладнання здати в оренду. Не модель, а саме голе обладнання.

Такого рівня модель не скачати, і ще треба мати дані для її навчання. У нас немає не вчених не розробників такого рівня.

Крім того навіть поточні ціни на токени не покривають собівартості і ніхто не бачить на горизонті щось що знизить ціну достатньо щоб вийти хоча би в нуль. Тож перспективи для інвестицій так собі, хіба у тебе бабла жопой жуй і тому вже встиг інвестувати ледь не в усе досяжне, і вже крім авантюр не лишилося куди дівати.

Подякували: P.Y.1

58 Відповідь від HetmanNet 13.07.2026 10:32:07

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 859

Репутація

: 2548

Re: Потрібно накінець створити український ШІ

P.Y. написав:

Але, знову ж, для створення чогось справді незалежного потрібні а) справді серйозні капіталовкладення в машинні ресурси, б) команда фанатичних дослідників, які скоріш погодяться на невдалий ресурсоємний експеримент з нульовим результатом, ніж на розпил капіталу і трохи причесану Джемму на виході.

Є головніше питання:
1. чи воно справді треба?
2. чи воно справді зараз актуально?

Ось давайте серйозно, на поточний момент LLM то дорога забавка з нульовим профітом.

Є купа інших нейронок які актуальніші для нас, і які є сенс розробляти (а не натягувати створену для іншої мети на щось), бо вони не лише корисні а й економічно вигідні.
Наприклад:
1. для класифікації зображень, які навіть з нуля створити можна бо інформації про них доступно чимало, а того що у вигляді зображень доступно просто до біса тому і роботи чимало
2. розпізнавання мови (впершу чергу не української та за наявності спотворень), це доволі складна задача бо це насправді поєднання цілого ряду алгоритмів і моделей, але воно має подвійне призначення, тож можна зменшити з часом фінансове навантаження
3. розпізнавання протоколів зв'язку, так, в цьому випадку це схоже на дуже спрощену llm і яку по силам створити навіть з нуля і так само навчити, бо не вимагає найтаємніших знань про останні досягнення llm та надвеликих потужностей, а дані для навчання значно легше отримати в зручному форматі

Та навіть ці речі, зараз менш критичні ніж брак заліза для збору даних для цих продуктів.

Так, ці речі вже є доступними у вигляді готових продуктів, але від цих речей справді залежить національна безпеки, тож залежити від чогось типу палантір стрьомно, бо якщо вимкнення llm то купа людей радих смерті тупих ботів та кілька самовипилів гімнокодерів та вою школоти, то вимкнення цих продуктів під час бою то тисячі смертей, тисячі скалічених життів та сотні програних битв за лічені дні.

Подякували: P.Y.1

Потрібно накінець створити український ШІ (Сторінка 3 з 3)

Ласкаво просимо!

Повідомлення: з 41 по 58 з 58

41 Відповідь від Slon115 13.12.2024 13:15:42

Re: Потрібно накінець створити український ШІ

42 Відповідь від frz 13.12.2024 13:51:47

Re: Потрібно накінець створити український ШІ

43 Відповідь від Nick9956 26.02.2025 23:27:39

Re: Потрібно накінець створити український ШІ

44 Відповідь від P.Y. 18.06.2026 23:59:46

Re: Потрібно накінець створити український ШІ

45 Відповідь від ostap34PHP 19.06.2026 13:44:13 Востаннє редагувалося ostap34PHP (19.06.2026 13:46:40)

Re: Потрібно накінець створити український ШІ

46 Відповідь від frz 19.06.2026 14:47:17

Re: Потрібно накінець створити український ШІ

47 Відповідь від HetmanNet 19.06.2026 14:54:49

Re: Потрібно накінець створити український ШІ

48 Відповідь від frz 19.06.2026 15:36:53

Re: Потрібно накінець створити український ШІ

49 Відповідь від frz 22.06.2026 11:27:56

Re: Потрібно накінець створити український ШІ

50 Відповідь від HetmanNet 22.06.2026 15:12:58

Re: Потрібно накінець створити український ШІ

51 Відповідь від P.Y. 25.06.2026 10:45:03

Re: Потрібно накінець створити український ШІ

52 Відповідь від P.Y. 25.06.2026 11:36:43

Re: Потрібно накінець створити український ШІ

53 Відповідь від P.Y. 25.06.2026 12:00:37

Re: Потрібно накінець створити український ШІ

54 Відповідь від P.Y. 26.06.2026 02:07:28

Re: Потрібно накінець створити український ШІ

55 Відповідь від P.Y. 12.07.2026 10:36:23

Re: Потрібно накінець створити український ШІ

56 Відповідь від P.Y. 13.07.2026 06:58:58

Re: Потрібно накінець створити український ШІ

57 Відповідь від HetmanNet 13.07.2026 10:01:50

Re: Потрібно накінець створити український ШІ

58 Відповідь від HetmanNet 13.07.2026 10:32:07

Re: Потрібно накінець створити український ШІ

Повідомлення: з 41 по 58 з 58

Переглядають тему: 1 гість, 0 користувачів