Тема: залізо під GPU*x
Дозріваю до того, що мені для LLM потрібно вживане залізо під GPU, і то декілька GPU, мінімум 2 з можливістю подальшого розширення.
Пошуки поки привели до такої конфігурації
Workstation: Dell Precision 7920 Tower
CPU: 2× Xeon Gold 5218 (Gold/Silver dual)
RAM: 128GB DDR4 ECC RDIMM (8× 16GB)
Storage: 512GB NVMe (OS + models) + HDD
PSU: 1400W (stock Dell)
OS: Ubuntu 24.04GPU: RTX 3090 24GB (ASUS TUF / MSI Suprim / Gigabyte Eagle)
PCIe: x16 slot, triple-slotВартість: Workstation €250–350 / GPU €400–500
Разом: ~€700–800
Це дозволить ганяти локально моделі рівня 3B Q4, а також 7B Q4 (реалістично, однак повільніше).
Потестив на значно слабшому залізі, перші враження "ок, треба тестувати далі".
Проблема вибраної поки конфігурації - там три слоти під GPU, однак через особливості самих комплектуючих реально поміститься лише 2 (не знаю чи існує щось типу "продовжувачів" для слотів).
А якщо все буде добре і відкладу під це діло більший бюджет, тоді можна зачекати і думати вже про щось солідніше, з більшим запасом розширення GPU.
При цьому зацікавився можливостями розширення у співвідношенні до приросту ефекту - а він (приріст) падає:
Потужність
│
│ ████ ← 2× RTX 3090 (~€1,200)
│ ████
│ ████ ████ ← 2× RTX 4090 (~€3,500)
│ ████ ████
│ ████ ████ ████ ← 4× A100 (~€20,000+)
│ ████ ████ ████ ████ ← +
└──────────────────────────────────────
€750 €1.2k €3.5k €20k+
Такі поки сирі думки, оскільки я зовсім не залізячник і не знаю з чого толком почати. Тому спершу спробував зібрати хоч якусь інформацію, далі прийшов з цим сюди. Не певен на що саме я розраховую почути у можливих відповідях, мабуть просто буду додавати роздуми, знахідки, врешті пізніше напишу чи щось втілилося в життя і які результати.