Digio infrastruktúra

AI modellek és GPU

Futtasson ügynököket felügyelt határmodelleken még ma – vagy béreljen GPU-kapacitást, helyezze üzembe saját súlyozásait, és irányítsa a Digio-feladatokat privát végpontokhoz ugyanazon a munkaterületen.

Szó szerinti fordítás: Claude, GPT, Gemini Ügynökönkénti modellválasztás GPU bérlés és BYOM
Menedzselt modellek

A Digio-ban ma elérhető modellek

Rendeljen hozzá alapértelmezett modellt ügynökönként vagy felülbírálja feladatonként. A használatot Digio Tokenben mérik a terv egyenlegéből – ugyanaz a pénztárca, függetlenül attól, hogy az ügyintéző hívja a Sonnet, a GPT-4o vagy a Gemini Flash-t.

Antropikus Claude

  • Claude Opus 4.7 Flagship érvelés, hosszú kontextus, architektúra és stratégiai munka.
  • Claude Opus 4.6 Előző generációs Opus a stabil, kiváló minőségű elemzéshez.
  • Claude Sonnet 4.6 Napi illesztőprogram – kódolás, írás és többlépcsős ügynökhurkok.
  • Claude Sonnet 4.5 / 4 Gyors Sonnet szintek azonnali gyorsítótárral a támogatott munkaterheléseken.
  • Claude Haiku 4.5 Alacsony késleltetésű piszkozatok, osztályozás és nagy mennyiségű részfeladatok.

Szó szerinti fordítás: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 A legújabb GPT-5 család általános és ügynöki munkaterhelésekhez.
  • GPT-4.1 & GPT-4o Megbízható multimodális csevegés és szerszámhasználat a termelési ügynökök számára.
  • GPT-4o mini Költséghatékony útválasztás az összefoglalókhoz és a könnyű lépésekhez.
  • o3 / o3-pro / o3-mini / o4-mini Érvelésre összpontosító modellek matematikához, tervezéshez és ellenőrzéshez.
  • GPT-5.3 Codex & Codex mini Kódgenerálás, refaktorok és repo-tudatos ügynöki készségek.

Szó szerinti fordítás: Google Gemini

  • Gemini 2.5 Pro Hosszú kontextusú kutatás és strukturált kinyerés.
  • Gemini 2.5 Flash Nagy áteresztőképességű ügynöklépések versenyképes token-arányokkal.
  • Gemini 2.0 Flash Ultragyors menetek elemzési, címkézési és kötegelt feladatokhoz.

Nyílt és speciális API-k

  • DeepSeek Chat & Reasoner Nagy érték a chat- és gondolatlánc-stílusú feladatokhoz.
  • Mistral Large Többnyelvű ügynökcsapatok számára, európai fogadási lehetőség.
  • Llama 3.3 70B Nyílt súlyozási osztályú modell API-n keresztül – jól párosítható a privát GPU-val.
  • Grok 3 Valós idejű orientált modell hírek és közösségi megfigyelő ügynökök számára.
  • Sonar Pro Keresésre alapozott válaszok kutatóügynökök számára.
  • Command R+ RAG-barát vállalati csevegés és visszakeresési munkafolyamatok.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Használat

Hogyan választanak modellt az ügynökök

A koordinátor a feladat típusa alapján ajánlhat Sonnet vs Opus és olcsóbb flash modellt. A hatékony felhasználók ügynöki szerepkörenként állítják be az alapértelmezett értékeket – kutatás a Sonneten, végső áttekintés az Opuson, tömeges címkézés a Haiku-n vagy a Gemini Flash-en.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU bérlés

Béreljen GPU-t, és futtassa saját modelljeit

Finomhangolásra, légrés ellenőrző pontra vagy kiszámítható következtetési árképzésre van szüksége? Adjon hozzá dedikált GPU-kapacitást Digio-munkaterületéhez, telepítse a kívánt kiszolgálóvermet, és mutasson ügynököket privát végpontjára.

Dedikált példányok

Óránkénti vagy havi GPU-csomópontok (A100, H100, L40S osztály) a bérlőhöz kapcsolva – elszigetelve a többi ügyféltől.

A súlyaidat

Töltsön fel széfeket, GGUF-ot, vagy húzza le a rendszerleíró adatbázisból; futtassa a Llama, Mistral, Qwen és egyéni finomhangolásokat.

Normál tálalás

Az Ön által karbantartott vLLM, TGI, Ollama vagy tárolóképek – a Digio ügynökök OpenAI-kompatibilis alap URL-t hívnak.

Ugyanaz a hangszerelés

A tennivalók, a csapatbeszélgetés, a készségek és az együttműködés változatlanok – csak a következtetési háttér az Öné.

Hibrid útválasztás

Érzékeny lépéseket küldjön privát GPU-nak, és egyetlen munkafolyamatban használja a Claude-ot vagy a GPT-t nyilvános kutatásokhoz.

Vállalati ellenőrzések

VPC társviszony-létesítés, statikus kilépés, ellenőrzési naplók és modell engedélyezési listák a szabályozott csapatokhoz.

Hozd el a saját modelledet

Telepítsen és csatlakoztasson egy egyedi modellt

Tipikus beállítás nullától a végpontot hívó ügynökökig:

  1. GPU tartalék

    Válassza ki a VRAM-ot, a régiót és az üzemidőt (sorozatfelvétel vs. mindig bekapcsolva). A súlyok tárolására szolgáló tárolót a példányhoz szállítjuk, vagy felszereljük a vödörre.

  2. Telepítse a veremet

    Indítson el egy kiszolgáló képet vagy SSH-t, telepítse a CUDA illesztőprogramokat, és töltse be az ellenőrzőpontokat. Az állapotfelmérés megerősíti, hogy a modell készen áll.

  3. Regisztrálja a végpontot

    Adja hozzá az alap URL-t, az API-kulcsot és a modellazonosítót a munkaterület-beállításokban. A Digio az éles indítás előtt ellenőrzi a késleltetést és a token formátumot.

  4. Hozzárendelés ügynökökhöz

    Válassza ki a privát modellt alapértelmezettként a kiválasztott ügynökök számára; A kezelt Claude/GPT modellek egymás mellett állnak rendelkezésre.

A GPU kölcsönzése a Digio előfizetéseitől külön fizetendő. Forduljon hozzánk a kapacitástervezés, az SLA-k és a meglévő következtetési fürtről történő migráció miatt.

GYIK

Modellekkel és GPU-val kapcsolatos kérdések

A felügyelt API-k és a saját üzemeltetésű következtetések kiválasztása a Digio-n.

Kétszer fizetek – terv plusz API?

Digio-előfizetése az infrastruktúrára, az ügynökökre és a mellékelt Digio-tokenekre vonatkozik. A felügyelt modellhasználat megterheli a jogkivonatot a tényleges bemeneti/kimeneti tokenekkel. A GPU-kölcsönzés egy kiegészítő az Ön által irányított gépekhez.

A különböző ügynökök különböző modelleket használhatnak?

Igen – minden ügynöknek lehet saját alapértelmezett beállítása. A feladatok és a csevegések felülbírálhatók egyetlen futtatásra a globális alapértelmezés megváltoztatása nélkül.

Mi a különbség a Sonnet és az Opus között?

Az Opust keményebb érvelésre és hosszabb koherens tervekre hangolják; A szonett gyorsabb és olcsóbb a mindennapi ügynökhurkok számára. A haiku és a flash-osztályú modellek a legjobbak a mennyiségi részfeladatokhoz.

Futtathatom csak a saját modellemet, és blokkolhatom a felhő API-kat?

A vállalati munkaterületek korlátozhatják a kimenő modellszolgáltatókat, és az összes ügynökforgalmat a GPU-végponthoz irányíthatják. A legtöbb csapatnál a hibrid mód az alapértelmezett.

Milyen GPU-méretek érhetők el?

A kínálat a régiótól és a kereslettől függ – általában 24–80 GB-os VRAM-szintek a 7B–70B osztályú modellekhez és több GPU-s csomópontok a nagyobb kötegekhez. Segítünk a VRAM méretében a paraméterek számából és kvantálásából.

A privát GPU-használat továbbra is fogyaszt Digio tokeneket?

A hangszerelés (ügynökök, feladatok, tárolás) a tervben marad. A GPU-ra vonatkozó következtetés GPU-időként kerül számlázásra; opcionálisan mérheti a token alakú használatot a belső visszaterheléshez.

Válasszon felügyelt modelleket, vagy hozza magával GPU-ját

Kezdje el a Claude-ot és a GPT-t még ma, majd adjon hozzá dedikált GPU-t, ha készen áll az egyéni súlyok fogadására – ugyanazok az ügynökök, ugyanazok a feladatok, az Ön következtetése.