Een eigen LLM op onze hardware, voor wie zinvol?

Question

Accepted Answer

1. Wie heeft baat: organisaties die contractueel echt geen data buiten eigen serverruimte mogen sturen (defensie-toelevering, sommige zorg, sommige juridisch).
2. Hardware: een 70B-class model (zoals Llama 3.x 70B) wil minimaal 1x H100 80GB voor FP16, met quantisatie (FP8/INT4) draait het op zwakkere GPUs maar tegen kwaliteits-trade-off. Dat is een investering, geen abonnement.
3. Beheer: model-updates, monitoring, security-patches. Reken op een halve fte voor lopend beheer als het serieus is.
4. Kwaliteit: open-source modellen kunnen op specifieke taken na fine-tuning concurreren met eerdere generaties closed-source modellen, niet automatisch general-purpose.
5. Eerst de business-case rekenen. Veel partijen die hier vragen, hebben een DPA bij Azure OpenAI met EU-residency niet eens overwogen.

Wanneer ons inschakelen: 
Pre-investering checken voor je hardware koopt: wij doen de Total Cost vergelijking tussen lokaal en cloud, voorkomt een dure misstap.

Een eigen LLM op onze hardware, voor wie zinvol?

Probeer dit eerst zelf

Wanneer ons inschakelen

Zie ook

Past het bovenstaande niet?

Wie ben je?

Of doe het helemaal niet zelf