Nebius-platform richt zich op schaalbare AI-inferencing

maandag, 10 november 2025 (12:40) - Techzine

In dit artikel:

Nebius heeft Token Factory gelanceerd, een platform dat bedrijven moet helpen open-source en eigen taalmodellen snel en veilig in productie te nemen. De dienst combineert inferencing, fine-tuning, toegangs- en teambeheer en monitoring in één omgeving en draait op de eigen Nebius AI Cloud 3.0 (Aether). Volgens de organisatie is Token Factory per direct beschikbaar; bestaande gebruikers van Nebius AI Studio worden automatisch gemigreerd.

Het platform ondersteunt tientallen open modellen — meer dan zestig volgens Nebius — waaronder DeepSeek, Llama, GPT-OSS, NVIDIA Nemotron en Qwen, en staat toe dat klanten hun eigen modelgewichten inzetten. Token Factory automatiseert veel operationele taken rond schaalbaarheid, beveiliging en kostenbeheer, met als doel sneller opschalen zonder voortdurend handmatig ingrijpen. Nebius noemt voorspelbare kosten per token als belangrijke feature en biedt ingebouwde fine-tuning en distillatie om modellen aan bedrijfsdata te koppelen en responstijden en kosten substantieel te verlagen.

Op het vlak van governance en compliance biedt Token Factory rolgebaseerd beheer, projectisolatie, single sign-on en voldoet de infrastructuur aan standaarden zoals SOC 2 Type II, HIPAA en ISO 27001. Datacenters staan in de EU en de VS, met opties voor datalokalisatie en een zero-retentionbeleid voor klantdata. De onderliggende cloudinfrastructuur is getoetst aan industriestandaarden zoals MLPerf Inference voor prestaties en monitoring.

Nebius, gevestigd in Amsterdam en beursgenoteerd aan de Nasdaq, ontwikkelt zowel software als hardware voor AI-rekenkracht en heeft onderzoeksteams in Europa, Noord-Amerika en Israël. Token Factory richt zich op organisaties die van proefprojecten naar bedrijfsbrede AI-toepassingen willen doorgroeien en daarvoor meer controle en transparantie zoeken dan commerciële modellen bieden.