JetBrains brengt codeermodel Mellum2 uit
In dit artikel:
JetBrains heeft Mellum2 open source vrijgegeven: een 12 miljard-parameter model bedoeld voor softwareengineering-omgevingen en AI-workflows. Het model staat op Hugging Face en valt onder de Apache 2.0‑licentie, zodat teams het lokaal kunnen draaien, zelf hosten of fine-tunen voor eigen toepassingen.
Technisch gebruikt Mellum2 een Mixture‑of‑Experts (MoE)-architectuur: per token zijn er slechts circa 2,5 miljard parameters actief. Daardoor dalen rekenkosten en latentie aanzienlijk—JetBrains meldt dat de inferencetijd minder dan de helft is vergeleken met vergelijkbare dichte modellen—waardoor het zich leent voor real‑time en hoge‑frequentie taken. Mellum2 is niet multimodaal; het is specifiek getraind op natural language en code, en presteert op benchmarks voor codegeneratie, wiskunde en redeneren vergelijkbaar met andere modellen van dezelfde schaal.
JetBrains positioneert Mellum2 als een ‘focal model’: een snel, gespecialiseerd component dat samenwerkt met grotere frontier‑modellen in gecoördineerde systemen. Concrete toepassingen zijn het routeren van AI‑workloads, bouwen van RAG‑pipelines, aansturing van sub‑agents in complexe workflows en privé‑deployment op eigen infrastructuur. Met deze vrijgave wil JetBrains een lichtgewicht, latency‑vriendelijke bouwsteen bieden én organisaties de vrijheid geven om het model intern te gebruiken en aan te passen.