Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

Digio infrastruktúra

AI modellek és GPU

Futtasson ügynököket felügyelt határmodelleken még ma – vagy béreljen GPU-kapacitást, helyezze üzembe saját súlyozásait, és irányítsa a Digio-feladatokat privát végpontokhoz ugyanazon a munkaterületen.

Szó szerinti fordítás: Claude, GPT, Gemini Ügynökönkénti modellválasztás GPU bérlés és BYOM

Hozzon létre munkaterületet Tervek és tokenek

Menedzselt modellek

A Digio-ban ma elérhető modellek

Rendeljen hozzá alapértelmezett modellt ügynökönként vagy felülbírálja feladatonként. A használatot Digio Tokenben mérik a terv egyenlegéből – ugyanaz a pénztárca, függetlenül attól, hogy az ügyintéző hívja a Sonnet, a GPT-4o vagy a Gemini Flash-t.

Antropikus Claude

Claude Opus 4.7 Flagship érvelés, hosszú kontextus, architektúra és stratégiai munka.
Claude Opus 4.6 Előző generációs Opus a stabil, kiváló minőségű elemzéshez.
Claude Sonnet 4.6 Napi illesztőprogram – kódolás, írás és többlépcsős ügynökhurkok.
Claude Sonnet 4.5 / 4 Gyors Sonnet szintek azonnali gyorsítótárral a támogatott munkaterheléseken.
Claude Haiku 4.5 Alacsony késleltetésű piszkozatok, osztályozás és nagy mennyiségű részfeladatok.

Szó szerinti fordítás: OpenAI

GPT-5.5 / GPT-5.4 / GPT-5.2 A legújabb GPT-5 család általános és ügynöki munkaterhelésekhez.
GPT-4.1 & GPT-4o Megbízható multimodális csevegés és szerszámhasználat a termelési ügynökök számára.
GPT-4o mini Költséghatékony útválasztás az összefoglalókhoz és a könnyű lépésekhez.
o3 / o3-pro / o3-mini / o4-mini Érvelésre összpontosító modellek matematikához, tervezéshez és ellenőrzéshez.
GPT-5.3 Codex & Codex mini Kódgenerálás, refaktorok és repo-tudatos ügynöki készségek.

Szó szerinti fordítás: Google Gemini

Gemini 2.5 Pro Hosszú kontextusú kutatás és strukturált kinyerés.
Gemini 2.5 Flash Nagy áteresztőképességű ügynöklépések versenyképes token-arányokkal.
Gemini 2.0 Flash Ultragyors menetek elemzési, címkézési és kötegelt feladatokhoz.

Nyílt és speciális API-k

DeepSeek Chat & Reasoner Nagy érték a chat- és gondolatlánc-stílusú feladatokhoz.
Mistral Large Többnyelvű ügynökcsapatok számára, európai fogadási lehetőség.
Llama 3.3 70B Nyílt súlyozási osztályú modell API-n keresztül – jól párosítható a privát GPU-val.
Grok 3 Valós idejű orientált modell hírek és közösségi megfigyelő ügynökök számára.
Sonar Pro Keresésre alapozott válaszok kutatóügynökök számára.
Command R+ RAG-barát vállalati csevegés és visszakeresési munkafolyamatok.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Használat

Hogyan választanak modellt az ügynökök

A koordinátor a feladat típusa alapján ajánlhat Sonnet vs Opus és olcsóbb flash modellt. A hatékony felhasználók ügynöki szerepkörenként állítják be az alapértelmezett értékeket – kutatás a Sonneten, végső áttekintés az Opuson, tömeges címkézés a Haiku-n vagy a Gemini Flash-en.

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU bérlés

Béreljen GPU-t, és futtassa saját modelljeit

Finomhangolásra, légrés ellenőrző pontra vagy kiszámítható következtetési árképzésre van szüksége? Adjon hozzá dedikált GPU-kapacitást Digio-munkaterületéhez, telepítse a kívánt kiszolgálóvermet, és mutasson ügynököket privát végpontjára.

Dedikált példányok

Óránkénti vagy havi GPU-csomópontok (A100, H100, L40S osztály) a bérlőhöz kapcsolva – elszigetelve a többi ügyféltől.

A súlyaidat

Töltsön fel széfeket, GGUF-ot, vagy húzza le a rendszerleíró adatbázisból; futtassa a Llama, Mistral, Qwen és egyéni finomhangolásokat.

Normál tálalás

Az Ön által karbantartott vLLM, TGI, Ollama vagy tárolóképek – a Digio ügynökök OpenAI-kompatibilis alap URL-t hívnak.

Ugyanaz a hangszerelés

A tennivalók, a csapatbeszélgetés, a készségek és az együttműködés változatlanok – csak a következtetési háttér az Öné.

Hibrid útválasztás

Érzékeny lépéseket küldjön privát GPU-nak, és egyetlen munkafolyamatban használja a Claude-ot vagy a GPT-t nyilvános kutatásokhoz.

Vállalati ellenőrzések

VPC társviszony-létesítés, statikus kilépés, ellenőrzési naplók és modell engedélyezési listák a szabályozott csapatokhoz.

Hozd el a saját modelledet

Telepítsen és csatlakoztasson egy egyedi modellt

Tipikus beállítás nullától a végpontot hívó ügynökökig:

GPU tartalék

Válassza ki a VRAM-ot, a régiót és az üzemidőt (sorozatfelvétel vs. mindig bekapcsolva). A súlyok tárolására szolgáló tárolót a példányhoz szállítjuk, vagy felszereljük a vödörre.
Telepítse a veremet

Indítson el egy kiszolgáló képet vagy SSH-t, telepítse a CUDA illesztőprogramokat, és töltse be az ellenőrzőpontokat. Az állapotfelmérés megerősíti, hogy a modell készen áll.
Regisztrálja a végpontot

Adja hozzá az alap URL-t, az API-kulcsot és a modellazonosítót a munkaterület-beállításokban. A Digio az éles indítás előtt ellenőrzi a késleltetést és a token formátumot.
Hozzárendelés ügynökökhöz

Válassza ki a privát modellt alapértelmezettként a kiválasztott ügynökök számára; A kezelt Claude/GPT modellek egymás mellett állnak rendelkezésre.

A GPU kölcsönzése a Digio előfizetéseitől külön fizetendő. Forduljon hozzánk a kapacitástervezés, az SLA-k és a meglévő következtetési fürtről történő migráció miatt.

GYIK

Modellekkel és GPU-val kapcsolatos kérdések

A felügyelt API-k és a saját üzemeltetésű következtetések kiválasztása a Digio-n.

Kétszer fizetek – terv plusz API?

Digio-előfizetése az infrastruktúrára, az ügynökökre és a mellékelt Digio-tokenekre vonatkozik. A felügyelt modellhasználat megterheli a jogkivonatot a tényleges bemeneti/kimeneti tokenekkel. A GPU-kölcsönzés egy kiegészítő az Ön által irányított gépekhez.

A különböző ügynökök különböző modelleket használhatnak?

Igen – minden ügynöknek lehet saját alapértelmezett beállítása. A feladatok és a csevegések felülbírálhatók egyetlen futtatásra a globális alapértelmezés megváltoztatása nélkül.

Mi a különbség a Sonnet és az Opus között?

Az Opust keményebb érvelésre és hosszabb koherens tervekre hangolják; A szonett gyorsabb és olcsóbb a mindennapi ügynökhurkok számára. A haiku és a flash-osztályú modellek a legjobbak a mennyiségi részfeladatokhoz.

Futtathatom csak a saját modellemet, és blokkolhatom a felhő API-kat?

A vállalati munkaterületek korlátozhatják a kimenő modellszolgáltatókat, és az összes ügynökforgalmat a GPU-végponthoz irányíthatják. A legtöbb csapatnál a hibrid mód az alapértelmezett.

Milyen GPU-méretek érhetők el?

A kínálat a régiótól és a kereslettől függ – általában 24–80 GB-os VRAM-szintek a 7B–70B osztályú modellekhez és több GPU-s csomópontok a nagyobb kötegekhez. Segítünk a VRAM méretében a paraméterek számából és kvantálásából.

A privát GPU-használat továbbra is fogyaszt Digio tokeneket?

A hangszerelés (ügynökök, feladatok, tárolás) a tervben marad. A GPU-ra vonatkozó következtetés GPU-időként kerül számlázásra; opcionálisan mérheti a token alakú használatot a belső visszaterheléshez.

Fedezze fel a Digio-t

Állítsd munkába a modelleket

Ügynökök, feladatok és készségek – a kiválasztott modell körüli munkaterület.

Válasszon felügyelt modelleket, vagy hozza magával GPU-ját

Kezdje el a Claude-ot és a GPT-t még ma, majd adjon hozzá dedikált GPU-t, ha készen áll az egyéni súlyok fogadására – ugyanazok az ügynökök, ugyanazok a feladatok, az Ön következtetése.

Kezdje el Hasonlítsa össze a terveket