Digio инфрақұрылымы

AI үлгілері және GPU

Бүгін басқарылатын шекаралық үлгілерде агенттерді іске қосыңыз немесе GPU сыйымдылығын жалға алыңыз, өз салмақтарыңызды орналастырыңыз және Digio тапсырмаларын бір жұмыс кеңістігіндегі жеке соңғы нүктелерге бағыттаңыз.

Клод, GPT, Егіздер Әр агент үлгісін таңдау GPU жалға алу және BYOM
Басқарылатын модельдер

Модельдер бүгін Digio-да қол жетімді

Әр агент үшін әдепкі үлгіні тағайындаңыз немесе әрбір тапсырманы қайта анықтау. Пайдалану Digio Tokens-те жоспардағы теңгерімнен өлшенеді — агент Sonnet, GPT-4o немесе Gemini Flash-ке қоңырау шалса да, сол әмиян.

Антропик Клод

  • Claude Opus 4.7 Флагмандық негіздеме, ұзақ контекст, архитектура және стратегиялық жұмыс.
  • Claude Opus 4.6 Тұрақты, жоғары сапалы талдау үшін алдыңғы буын Opus.
  • Claude Sonnet 4.6 Күнделікті драйвер — кодтау, жазу және көп сатылы агент циклдері.
  • Claude Sonnet 4.5 / 4 Қолдау көрсетілетін жұмыс жүктемелерінде жедел кэштеу бар жылдам Sonnet деңгейлері.
  • Claude Haiku 4.5 Төмен кідіріс нобайлары, жіктеу және үлкен көлемді қосалқы тапсырмалар.

Сөзбе-сөз аударыңыз: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Жалпы және агенттік жұмыс жүктемелеріне арналған соңғы GPT-5 тобы.
  • GPT-4.1 & GPT-4o Өндіріс агенттері үшін сенімді мультимодальды чат және құралды пайдалану.
  • GPT-4o mini Қорытындылар мен жеңіл қадамдар үшін үнемді бағыттау.
  • o3 / o3-pro / o3-mini / o4-mini Математикаға, жоспарлауға және тексеруге арналған пайымдауға бағытталған модельдер.
  • GPT-5.3 Codex & Codex mini Код жасау, рефакторлар және репо-хабарлама агент дағдылары.

Сөзбе-сөз аударыңыз: Google Gemini

  • Gemini 2.5 Pro Ұзақ контекстік зерттеу және құрылымдық экстракция.
  • Gemini 2.5 Flash Бәсекеге қабілетті таңбалауыш мөлшерлемелері бар жоғары өнімді агент қадамдары.
  • Gemini 2.0 Flash Талдау, тегтеу және пакеттік тапсырмалар үшін өте жылдам өтулер.

Ашық және арнайы API интерфейстері

  • DeepSeek Chat & Reasoner Чат және ой тізбегі стилі тапсырмалары үшін күшті мән.
  • Mistral Large Көптілді агент командалары үшін Еуропада орналастырылған опция.
  • Llama 3.3 70B API арқылы ашық салмақ класының үлгісі — жеке GPU-мен жақсы жұптасады.
  • Grok 3 Жаңалықтар мен әлеуметтік мониторинг агенттері үшін нақты уақыттағы бағдарланған модель.
  • Sonar Pro Зерттеу агенттері үшін іздеуге негізделген жауаптар.
  • Command R+ RAG-ға ыңғайлы кәсіпорын чаты және іздеу жұмыс процестері.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Қолданылуы

Агенттер үлгіні қалай таңдайды

Үйлестіруші тапсырма түріне негізделген Sonnet vs Opus және арзанырақ флэш үлгісін ұсына алады. Қуатты пайдаланушылар әр агент рөліне әдепкі мәндерді орнатады — Sonnet бойынша зерттеу, Opus жүйесінде соңғы шолу, Haiku немесе Gemini Flash қолданбаларында жаппай тегтеу.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU жалға алу

GPU жалға алып, өз үлгілеріңізді іске қосыңыз

Нақты баптау, ауа саңылаулары бар бақылау нүктесі немесе болжамды баға белгілеу керек пе? Digio жұмыс кеңістігіне арнайы GPU сыйымдылығын қосыңыз, өзіңіз қалаған қызмет көрсету стегін орнатыңыз және агенттерді жеке соңғы нүктеге көрсетіңіз.

Арнайы инстанциялар

Жалға алушыға тіркелген сағаттық немесе айлық GPU түйіндері (A100, H100, L40S класы) басқа тұтынушылардан оқшауланған.

Сіздің салмақтарыңыз

Safetensors, GGUF жүктеңіз немесе тізілімнен алыңыз; Llama, Mistral, Qwen және реттелетін дәл реттеулерді іске қосыңыз.

Стандартты қызмет көрсету

vLLM, TGI, Ollama немесе сіз ұстайтын контейнер кескіндері — Digio агенттері OpenAI-үйлесімді негізгі URL мекенжайын шақырады.

Дәл сол оркестр

Орындау үшін топтық чат, дағдылар және ынтымақтастық өзгермейді — тек қорытынды сервері сіздікі.

Гибридті маршруттау

Жеке GPU-ға құпия қадамдарды жіберіңіз және бір жұмыс процесінде жалпыға ортақ зерттеу үшін Клод немесе GPT пайдаланыңыз.

Кәсіпорын бақылаулары

VPC пирингі, статикалық шығу, аудит журналдары және реттелетін топтарға арналған үлгі рұқсат тізімдері.

Өз үлгіңізді әкеліңіз

Пайдаланушы үлгісін орнатыңыз және қосыңыз

Нөлден бастап соңғы нүктеге қоңырау шалатын агенттерге дейін әдеттегі орнату:

  1. Резервтік GPU

    VRAM, аймақты және жұмыс уақытын таңдаңыз (әрдайым қосулы және жарылыс). Салмақ сақтау орны данамен бірге жеткізіледі немесе шелекті бекітеді.

  2. Стекті орналастырыңыз

    Қызмет көрсететін кескінді немесе SSH жүйесін іске қосыңыз, CUDA драйверлерін орнатыңыз және бақылау нүктелерін жүктеңіз. Денсаулықты тексеру үлгінің дайын екенін растайды.

  3. Соңғы нүктені тіркеңіз

    Негізгі URL мекенжайын, API кілтін және жұмыс кеңістігі параметрлерінде үлгі идентификаторын қосыңыз. Digio тікелей эфирге шықпас бұрын кідіріс пен токен пішімін тексереді.

  4. Агенттерге тағайындаңыз

    Таңдалған агенттер үшін әдепкі ретінде жеке үлгіні таңдаңыз; басқарылатын Claude/GPT үлгілері қатар қол жетімді болып қалады.

GPU жалға алу Digio жоспарына жазылулардан бөлек төленеді. Сыйымдылықты жоспарлау, SLA және бар қорытынды кластерінен тасымалдау үшін бізге хабарласыңыз.

Жиі қойылатын сұрақтар

Модельдер және GPU сұрақтары

Басқарылатын API интерфейстерін және Digio-да өзін-өзі басқаратын қорытындыны таңдау.

Мен екі рет төлеймін бе, жоспар плюс API?

Сіздің Digio жазылымыңыз инфрақұрылымды, агенттерді және енгізілген Digio токендерін қамтиды. Нақты енгізу/шығару таңбалауыштары бойынша таңбалауыш балансы басқарылатын үлгіні пайдалану дебеттері. GPU жалға алу - сіз басқаратын машиналарға арналған қосымша.

Әртүрлі агенттер әртүрлі үлгілерді пайдалана ала ма?

Иә—әр агенттің өзінің әдепкі болуы мүмкін. Тапсырмалар мен чаттар жаһандық әдепкі параметрді өзгертпестен бір іске қосу үшін қайта анықтай алады.

Сонет пен Опустың айырмашылығы неде?

Opus қиынырақ пайымдаулар мен ұзағырақ үйлесімді жоспарлар үшін бапталған; Сонет күнделікті агент циклдері үшін жылдамырақ және арзанырақ. Хайку және флэш-сынып үлгілері көлемді қосалқы тапсырмалар үшін ең қолайлы.

Мен тек өз үлгімді іске қосып, бұлттық API интерфейстерін блоктай аламын ба?

Кәсіпорын жұмыс кеңістігі шығыс үлгі провайдерлерін шектей алады және барлық агент трафигін GPU соңғы нүктесіне бағыттай алады. Көптеген командалар үшін гибридті режим әдепкі болып табылады.

Қандай GPU өлшемдері қол жетімді?

Ұсыныстар аймаққа және сұранысқа байланысты – әдетте 7B–70B сынып үлгілері үшін 24–80 ГБ VRAM деңгейлері және үлкенірек стектерге арналған көп GPU түйіндері. Біз сіздің параметрлерді санау және кванттау арқылы VRAM өлшемін алуға көмектесеміз.

Жеке GPU пайдалану әлі де Digio Tokens пайдаланады ма?

Оркестрация (агенттер, тапсырмалар, сақтау) сіздің жоспарыңызда қалады. GPU туралы қорытынды GPU уақыты ретінде есептеледі; ішкі төлемді қайтару үшін таңбалауыш пішінді пайдалануды таңдауға болады.

Басқарылатын үлгілерді таңдаңыз немесе GPU алып келіңіз

Бүгін Клод пен GPT-тен бастаңыз, содан кейін теңшелетін салмақтарды орналастыруға дайын болған кезде арнайы GPU қосыңыз - бірдей агенттер, бірдей тапсырмалар, қорытынды.