залізо під GPU*x

1 Тема від frz 06.06.2026 10:44:08

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Тема: залізо під GPU*x

Дозріваю до того, що мені для LLM потрібно вживане залізо під GPU, і то декілька GPU, мінімум 2 з можливістю подальшого розширення.

Пошуки поки привели до такої конфігурації

Workstation: Dell Precision 7920 Tower
CPU: 2× Xeon Gold 5218 (Gold/Silver dual)
RAM: 128GB DDR4 ECC RDIMM (8× 16GB)
Storage: 512GB NVMe (OS + models) + HDD
PSU: 1400W (stock Dell)
OS: Ubuntu 24.04
GPU: RTX 3090 24GB (ASUS TUF / MSI Suprim / Gigabyte Eagle)
PCIe: x16 slot, triple-slot
Вартість: Workstation €250–350 / GPU €400–500
Разом: ~€700–800

Це дозволить ганяти локально моделі рівня 3B Q4, а також 7B Q4 (реалістично, однак повільніше).

Потестив на значно слабшому залізі, перші враження "ок, треба тестувати далі".

Проблема вибраної поки конфігурації - там три слоти під GPU, однак через особливості самих комплектуючих реально поміститься лише 2 (не знаю чи існує щось типу "продовжувачів" для слотів).

А якщо все буде добре і відкладу під це діло більший бюджет, тоді можна зачекати і думати вже про щось солідніше, з більшим запасом розширення GPU.

При цьому зацікавився можливостями розширення у співвідношенні до приросту ефекту - а він (приріст) падає:

Потужність
│
│ ████ ← 2× RTX 3090 (~€1,200)
│ ████
│ ████ ████ ← 2× RTX 4090 (~€3,500)
│ ████ ████
│ ████ ████ ████ ← 4× A100 (~€20,000+)
│ ████ ████ ████ ████ ← +
└──────────────────────────────────────
€750 €1.2k €3.5k €20k+

Такі поки сирі думки, оскільки я зовсім не залізячник і не знаю з чого толком почати. Тому спершу спробував зібрати хоч якусь інформацію, далі прийшов з цим сюди. Не певен на що саме я розраховую почути у можливих відповідях, мабуть просто буду додавати роздуми, знахідки, врешті пізніше напишу чи щось втілилося в життя і які результати.

frz вебсайт

2 Відповідь від wander 06.06.2026 11:32:11

wander
Replace Team
Поза форумом

Звідки: No-man's land
Дата реєстрації: 28.02.2019
Повідомлень: 1 370

Репутація

: 1288

Re: залізо під GPU*x

frz написав:

Дозріваю до того, що мені для LLM

Я чи можна поцікавитись, для яких задач?

frz написав:

CPU: 2× Xeon Gold 5218 (Gold/Silver dual)
RAM: 128GB DDR4 ECC RDIMM (8× 16GB)
Вартість:  Workstation €250–350

Хочете сказати, що 128 GB DDR4 пам'яті + 2× Xeon Gold 5218 вийде у 350 євро? Це де такі ціни?
І нащо вам 2× Xeon Gold?

Я так розумію, ви хочете жирні LLM крутити на CPU та RAM? Я б так не робив. Ви отримаєте дуже повільну кількість токенів. Якщо ви хочете, щоб LLM була як агент, а не просто чат-бот, то це буде дуже критично. Я б радив докласти і взяти "жирнішу" GPU, щоб крутити LLMки саме на ній, тим більше зараз компактні моделі дуже навіть гарно себе показують.

3 Відповідь від frz 06.06.2026 11:45:58 Востаннє редагувалося frz (06.06.2026 12:10:48)

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

wander написав:

для яких задач?

В основному обфускація масивів даних перед тим як скерувати в щось потужніше онлайн (не всі дані можна ось так просто надсилати напряму як є).

де такі ціни?

Німецький eBay, з якого в мене тут зручна доставка.

нащо вам 2× Xeon Gold?

В мене зародкове розуміння, що саме оптимально, спробую подумати і відповісти.

хочете жирні LLM крутити на CPU та RAM?

Так - помірно жирніші, але ні - CPU тут мало допоможе, лише для деяких допоміжних процесів.

докласти і взяти "жирнішу" GPU

Це має сенс, я тому і написав щоб мене закидали тапками разом з кращими ідеями.

frz вебсайт

4 Відповідь від Torbins 06.06.2026 14:41:44 Востаннє редагувалося Torbins (06.06.2026 14:48:21)

Torbins
Replace Team
Поза форумом

Дата реєстрації: 07.05.2012
Повідомлень: 3 163

Репутація

: 2330

Re: залізо під GPU*x

frz написав:

Проблема вибраної поки конфігурації - там три слоти під GPU, однак через особливості самих комплектуючих реально поміститься лише 2 (не знаю чи існує щось типу "продовжувачів" для слотів).

Подовжувачі існують, але лишається іще питання додаткового живлення для відях. Рідний PSU повинен мати достатню кількість роз'ємів.
Також можна замінювати рідні радіатори рідинним охолодженням. Щось типу такого: https://www.corsair.com/ww/en/c/custom-liquid-cooling/gpu-water-blocks Більшість таких модулів однослотові. Але вони зазвичай розраховані лише на одну конкретну модель відяхи, це сильно обмежує список моделей відях які ви можете купити.

wander написав:

І нащо вам 2× Xeon Gold?

Може бути таке, що половина слотів під відяхи обслуговується одним процесором, а інша - другим. Відповідно з одним процесором половина слотів перестане працювати. Інтел каже, що Xeon Gold 5218 має 48 ліній PCI-E, а материнка в Dell Precision 7920 Tower має 4 слоти PCI-Ex16. Тому тут не зовсім зрозуміло як вони розведені. А ще ж частина ліній витрачається на чіпсет та NVME. З іншого боку, для AI висока швидкість підключення відяхи не потрібна. Для більшості задач PCI-E 3.0 x4 буде вистачати з головою.

Якби я робив щось подібне, то шукав би сервак з одним процесором і дві відяхи. Також я б придивився до відях від AMD, бо їхній ROCm уже добре розвинувся, і скоріше за все без проблем потягне усі потрібні мені моделі. Питання лише в різниці цін порівняно з nVidia.

5 Відповідь від wander 07.06.2026 15:42:40

wander
Replace Team
Поза форумом

Звідки: No-man's land
Дата реєстрації: 28.02.2019
Повідомлень: 1 370

Репутація

: 1288

Re: залізо під GPU*x

frz написав:

Німецький eBay, з якого в мене тут зручна доставка.

А можна лінк? Просто ціни зовсім не реалістичні або 2-річної давнини. Ну, можливо, ще ладно 2× Xeon Gold, але 3090 за 400 євро? Спеціально зайшов на eBay: найдешевша 3090 вийде у 800–900 доларів (по США і Європі). У нас на Лоху ціни в тому ж діапазоні. На Kleinanzeigen — 700–800 євро і вище. І це я мовчу, що 30хх лінійка у нвідіа мала проблеми з відвалами + на них майнили, бо їх реліз припав якраз на бум. Тож реалістично RTX 3090 в стані: "ще попрацює, а не вмре завтра" — обійдеться у 1000+ доларів.

frz написав:

Так - помірно жирніші, але ні - CPU тут мало допоможе, лише для деяких допоміжних процесів.

А які саме моделі розглядаєте? Можете назвати кілька, до прикладу? Десь на 70B чи більше/менше? Це допоможе краще зорієнтувати.

P.S. — рекомендую ще звернути увагу на міні-ПК типу AMD Strix Halo зі 128 ГБ ОЗП.

6 Відповідь від frz 07.06.2026 19:02:19

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

Моделі розглядаю qwen2.5:72b i qwen2.5-coder:32b

З цінами це швидше в режимі "алерт на діапазон бажаної ціни" і бігом купувати як тільки з'являється - і то екземпляри після майнингу.

frz вебсайт

7 Відповідь від wander 07.06.2026 19:26:06

wander
Replace Team
Поза форумом

Звідки: No-man's land
Дата реєстрації: 28.02.2019
Повідомлень: 1 370

Репутація

: 1288

Re: залізо під GPU*x

frz написав:

З цінами це швидше в режимі "алерт на діапазон бажаної ціни" і бігом купувати як тільки з'являється - і то екземпляри після майнингу.

Це трохи не так працює: бажане ≠ реальне. Як я розумію, ваш бюджет в районі ~€700–800? Якщо так, то зайдіть і прикиньте реально, яке залізо ви зможете придбати на цю суму. Ви здивуєтеся, наскільки іншою буде ситуація від ваших побажань. Ви не знайдете 3090 за €400 — я б закладав мінімум х2 за 3090 (і це дуже оптимістично). Це важливо: якщо стеля вашого бюджету — €800, то я б рекомендував трохи інше залізо, зокрема, глянути на АМД-картки, як от радив пан Torbins, і не серверне залізо. Взагалі, залізо зараз дуже дороге, не найкращий час збирати ПК/сервер.

8 Відповідь від frz 07.06.2026 19:50:58

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

Бюджет може бути більшим, це побажання десь на осінь.

Поки що більш пріоритетно протестувати воркфлоу обфускації на обраних моделях або їхніх аналогах з тих, які вдасться знайти онлайн. Бо якщо потужностей моделей не вистачить для задач, а реальний бюджет для потрібних моделей виявиться 10к+, то все доведеться переписувати з іншою логікою обфускації, без LLM.

frz вебсайт

9 Відповідь від Torbins 07.06.2026 23:41:18

Torbins
Replace Team
Поза форумом

Дата реєстрації: 07.05.2012
Повідомлень: 3 163

Репутація

: 2330

Re: залізо під GPU*x

frz написав:

Моделі розглядаю qwen2.5:72b i qwen2.5-coder:32b

Не зрозуміло навіщо вам такі старі моделі, коли уже є Qwen3.6. Якщо хочеться щось таке ж велике, то є Qwen3.5-122B-A10B-FP8. А так, я думаю, що і Qwen3.6-27B, і навіть Qwen3.6-27B-FP8, будуть в усьому кращі за найкращу версію qwen2.5. Тим більше, що одна 4080 в FP8 видає близько 200 TFLOPS.

10 Відповідь від wander 08.06.2026 20:47:15

wander
Replace Team
Поза форумом

Звідки: No-man's land
Дата реєстрації: 28.02.2019
Повідомлень: 1 370

Репутація

: 1288

Re: залізо під GPU*x

frz написав:

Бюджет може бути більшим, це побажання десь на осінь.

Більшим на скільки? Це ключова інформація: від бюджету фактично все і залежить.

Подякували: Torbins1

11 Відповідь від frz 10.06.2026 17:16:03

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

Думаю 3 тис. євро це та сума, яку було б не боляче для загального бюджету вкласти в це діло восени, за умови якщо надалі будуть стабільні проекти.

frz вебсайт

12 Відповідь від HetmanNet 11.06.2026 10:05:52

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 864

Репутація

: 2550

Re: залізо під GPU*x

Torbins написав:

wander написав:
І нащо вам 2× Xeon Gold?
Може бути таке, що половина слотів під відяхи обслуговується одним процесором, а інша - другим.

Не може, а так і є.

13 Відповідь від frz 13.06.2026 21:36:27

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

Поки що задача дещо спростилася. Отже, обфускація тут складається з:
(1) заміни в тексті Name1 -> N3096803549678047 Surname1 -> S3069834509768457 і потім назад, це насправді regex / replace, хоча може використовуватися непотужний локальний LLM теж
(2) от аналіз тексту на предмет нових потенційно сенсітів значень Name2 Surname1 - це вже задачка для LLM, однак для незаможних завжди є варіант робити це лише на CPU i в батчах по 2000 символів (ну до 10 тис. але вже зі скрипом / довгим очікуванням).

Можливі моделі:
qwen2.5:7b
mistral:7b
llama3.1:8b
gemma2:9b

Поки що буду тестувати ці на CPU (окремий інстанс), далі відкладати кошти на щось потужніше щоб збільшити ємність батчів / позбутися батчів зовсім.

frz вебсайт

14 Відповідь від frz 16.06.2026 12:15:46

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

Цікаво читати власну тему, створену за декілька днів до того, як штати заблокували найновіші моделі компанії Anthropic і зараз стрічка Linkedin кишить повідомленнями типу "ну його в пень, розгортаю власний сервак".

frz вебсайт

15 Відповідь від HetmanNet 16.06.2026 15:28:06 Востаннє редагувалося HetmanNet (16.06.2026 15:29:11)

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 864

Репутація

: 2550

Re: залізо під GPU*x

frz написав:

Цікаво читати власну тему, створену за декілька днів до того, як штати заблокували найновіші моделі компанії Anthropic і зараз стрічка Linkedin кишить повідомленнями типу "ну його в пень, розгортаю власний сервак".

На такі дописи виникають питання:

Ну не зрівняться твоя модель на серваку з їхньою, то заради чого розгортати?
А якщо тобі не треба їхня і досить простішої яку можна розгорнути самому, то чого досі не розгорнув свою? Розумію коли то було до підвищення цін, але зараз чого то досі актуальне питання?

Брав би отих хто таке пише на список, щоб знати на чиї судження краще увагу не звертати.

16 Відповідь від frz 16.06.2026 17:03:28 Востаннє редагувалося frz (16.06.2026 20:04:20)

frz
Data / DB Engineer
Поза форумом

Звідки: PL
Дата реєстрації: 28.12.2019
Повідомлень: 8 450

Re: залізо під GPU*x

HetmanNet написав:

frz написав:
Цікаво читати власну тему, створену за декілька днів до того, як штати заблокували найновіші моделі компанії Anthropic і зараз стрічка Linkedin кишить повідомленнями типу "ну його в пень, розгортаю власний сервак".
На такі дописи виникають питання:
Ну не зрівняться твоя модель на серваку з їхньою, то заради чого розгортати?
А якщо тобі не треба їхня і досить простішої яку можна розгорнути самому, то чого досі не розгорнув свою? Розумію коли то було до підвищення цін, але зараз чого то досі актуальне питання?
Брав би отих хто таке пише на список, щоб знати на чиї судження краще увагу не звертати.

Ну це мислення в напрямку "що якщо".
Німці скажімо масово переходять з мейнстрімових aws / azure / gcp на менш для нас відомий але популярний там Hetzner (щоб дані не покидали межі країни), а хтось йде далі і на рівні компанії відновлює рішення 2000-х у вигляді on-prem (банки і не згортали). Комусь це все здається дивним і у відповідь закликає йти до кінця - купувати модеми dial-up, будувати lora wan, тренувати поштових голубів.

frz вебсайт

17 Відповідь від HetmanNet 16.06.2026 21:22:29

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 864

Репутація

: 2550

Re: залізо під GPU*x

frz написав:

Ну це мислення в напрямку "що якщо".

Ну ось завтра відключать доступ до всіх моделей.
Зможеш їх замінити в усіх випадках? Ні. А якщо не можеш замінити в якихось випадках, то навіщо покладаєшся на неї в цих випадках так що без неї не можеш?
В тих що можеш замінити, чого досі не замінив? Не зміг? То чому думаєш що зараз зможеш?

frz написав:

Німці скажімо масово переходять з мейнстрімових aws / azure / gcp на менш для нас відомий але популярний там Hetzner (щоб дані не покидали межі країни), а хтось йде далі і на рівні компанії відновлює рішення 2000-х у вигляді on-prem (банки і не згортали).

Ну ось німцям дійшло на скільки тупо вчиняли покладаючись на aws / azure / gc до міри коли без них їм торба, тому єдиний спосіб переконатися що позбувся залежностей це піти з них вже зараз. Як показує досвід поки того не зробиш не можеш бути певний що до того готовий. Крім того, якщо вже йдеш, то йти туди де можеш не лише один ризик прибрати, а ще один за один той самий хід.
Мене завжди дивувала коли будували свої системи навколо сервісів хмар так що навіть від однієї до іншої не можеш мігрувати навіть якщо зупиниш систему. Кому така дурня прийшла у голову? Чому було не обмежитися використанням того що можеш замінити? Ось реально, завтра якогось Amazon повідомляє про банкрутство, і що далі робиш зі своїм лайном яке якогось дуру так зав'язано щоб без переписування сервісів не мігрувати? Наступним подаєш?
Розумію, що топам у публічних акціонерних байдуже, бо там головне бонуси зараз, а те що буде за роки по тому то проблема наступників: тож показуємо чергове щось там незрозуміло що аби бажано ніби в зменшені витрат, акції ростуть, бонуси капають, а ти якщо що звалюєш на обрії із заходом сонця скидаючи все у гроші. Але є купа інших контор, де контрольний у засновників, чи взагалі приватні, чого там таку дурню хай менше але теж не рідко роблять?

18 Відповідь від Torbins 16.06.2026 22:22:41

Torbins
Replace Team
Поза форумом

Дата реєстрації: 07.05.2012
Повідомлень: 3 163

Репутація

: 2330

Re: залізо під GPU*x

Мені здається, що ймовірність закриття aws / azure / gc, або закриття усіх основних AI-шок приблизно дорівнює ймовірності падіння метеориту мені на голову. Тому я не парюсь. Усім цим чувакам треба бабло заробляти, а як це зробити, якщо сервіс закритий? Тому максимум обмежать доступ до нових моделей, а існуючі будуть як були.

19 Відповідь від HetmanNet 17.06.2026 09:26:43

HetmanNet
Ліцензований троль форуму Replace
Поза форумом

Звідки: Кременчук, Україна
Дата реєстрації: 18.07.2012
Повідомлень: 4 864

Репутація

: 2550

Re: залізо під GPU*x

Torbins написав:

Мені здається, що ймовірність закриття aws / azure / gc, або закриття усіх основних AI-шок приблизно дорівнює ймовірності падіння метеориту мені на голову.

Ніхто не каже, що всі закриються, але може саме та якою користуєшся.
Це сценарій більш ймовірний ніж здається, і чим більша компанія тим раптовіше то відбувається. Історія то вже не раз доводила. Є регулярні економічні кризи, є все нові і нові війни і т.д.
Більше десяти років тому вважалося, що відмова aws то щось не можливе, а зараз маємо щорічні їх падіння, а справжній аптайм більше 99.9% яким хвалилися півтора десятиліття тому здається зараз чимось недосяжним. Так, саме справжній, а не "збої менше 4 хв не рахуємо, збій який не охопив весь регіон теж і бла бла.. У нас навіть github має аптайм нижче 90%.
Тож який шанс що одна впаде на довго чи раптово скаже "нажаль економічно не склалося"?

Torbins написав:

Усім цим чувакам треба бабло заробляти, а як це зробити, якщо сервіс закритий?

Якщо про компанії які надають доступ, то моделі збиткові та лиш спалюють гроші, тож тим хто має інший дохід можна то закривати повністю за першої ж нагоди. Крім того, не забуваймо, що завжди можиш бути змушений закрити навіть якщо то лиш єдина твоя діяльність. Треба пам'ятати, що для тих хто надає послуги ти важливий поки приносиш дохід, а стабільність наявность цих послуг залежить від того на скільки стабільний дохід. Хоча історія показує навіть стабільний дохід від дурних рішень поставити все на дурню не рятує.

20 Відповідь від P.Y. 18.06.2026 09:02:52 Востаннє редагувалося P.Y. (18.06.2026 09:47:10)

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 947

Репутація

: 5158

Re: залізо під GPU*x

Torbins написав:

frz написав:
Моделі розглядаю qwen2.5:72b i qwen2.5-coder:32b
Не зрозуміло навіщо вам такі старі моделі, коли уже є Qwen3.6. Якщо хочеться щось таке ж велике, то є Qwen3.5-122B-A10B-FP8. А так, я думаю, що і Qwen3.6-27B, і навіть Qwen3.6-27B-FP8, будуть в усьому кращі за найкращу версію qwen2.5. Тим більше, що одна 4080 в FP8 видає близько 200 TFLOPS.

Не можу нічого сказати про великорозмірні моделі Qwen, але, наприклад, малорозмірний Qwen 2.5 3B поводиться стабільніше, ніж новіший 3.5 порівнюваних розмірів (зависання в роздумах, плутанина між повідомленнями і т.п.). Міні-моделі Qwen 3.6 не виходили, тому нічого про цю версію сказати не можу.

З іншого боку, якщо frz обирав модель, керуючись порадами ЧатуGPT (теж так роблю), то часто він радить застарілі моделі (про найновіші може і не знати, поки сам не даси йому посилання). Без додаткового підштовхування він запропонує, максимум, Qwen 3.

Ласкаво просимо!

Повідомлення: 20

1 Тема від frz 06.06.2026 10:44:08

Тема: залізо під GPU*x

2 Відповідь від wander 06.06.2026 11:32:11

Re: залізо під GPU*x

3 Відповідь від frz 06.06.2026 11:45:58 Востаннє редагувалося frz (06.06.2026 12:10:48)

Re: залізо під GPU*x

4 Відповідь від Torbins 06.06.2026 14:41:44 Востаннє редагувалося Torbins (06.06.2026 14:48:21)

Re: залізо під GPU*x

5 Відповідь від wander 07.06.2026 15:42:40

Re: залізо під GPU*x

6 Відповідь від frz 07.06.2026 19:02:19

Re: залізо під GPU*x

7 Відповідь від wander 07.06.2026 19:26:06

Re: залізо під GPU*x

8 Відповідь від frz 07.06.2026 19:50:58

Re: залізо під GPU*x

9 Відповідь від Torbins 07.06.2026 23:41:18

Re: залізо під GPU*x

10 Відповідь від wander 08.06.2026 20:47:15

Re: залізо під GPU*x

11 Відповідь від frz 10.06.2026 17:16:03

Re: залізо під GPU*x

12 Відповідь від HetmanNet 11.06.2026 10:05:52

Re: залізо під GPU*x

13 Відповідь від frz 13.06.2026 21:36:27

Re: залізо під GPU*x

14 Відповідь від frz 16.06.2026 12:15:46

Re: залізо під GPU*x

15 Відповідь від HetmanNet 16.06.2026 15:28:06 Востаннє редагувалося HetmanNet (16.06.2026 15:29:11)

Re: залізо під GPU*x

16 Відповідь від frz 16.06.2026 17:03:28 Востаннє редагувалося frz (16.06.2026 20:04:20)

Re: залізо під GPU*x

17 Відповідь від HetmanNet 16.06.2026 21:22:29

Re: залізо під GPU*x

18 Відповідь від Torbins 16.06.2026 22:22:41

Re: залізо під GPU*x

19 Відповідь від HetmanNet 17.06.2026 09:26:43

Re: залізо під GPU*x

20 Відповідь від P.Y. 18.06.2026 09:02:52 Востаннє редагувалося P.Y. (18.06.2026 09:47:10)

Re: залізо під GPU*x

Повідомлення: 20

Переглядають тему: 1 гість, 0 користувачів