Chat

Nessuna chat precedente

NVIDIA ~191 tokens/msg
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

Ciao! NVIDIA: Llama 3.3 Nemotron Super 49B V1.5. Chiedimi qualsiasi cosa.

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 richiede gettoni acquistati. Ottieni i token | Iscriviti gratis 10K | Usa invece il modello libero
Tutti i modelli con un abbonamento vedi piani →
~191 tokens/msg Inserisci per inviare
Dettagli del modello

Dettagli del modello

Fornitore NVIDIA
Categoria Chat
Contesto 131072 tokens
Costo ~191 tokens/msg
4.3 da 10 utenti di questa categoria

Informazioni

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 è a Modello di chat built by NVIDIA. Accetta fino a 131K token di contesto per richiesta. Instradato attraverso modelli esterni Tokens 191 per messaggio (con un markup del 50% rispetto al costo upstream).

Utilizzare tramite API

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"nvidia/llama-3.3-nemotron-super-49b-v1.5"}'
Documenti API

FAQ

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 è a Modello di chat built by NVIDIA. Accetta fino a 131K token di contesto per richiesta. Instradato attraverso modelli esterni Tokens 191 per messaggio (con un markup del 50% rispetto al costo upstream).

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 funziona bene per conversazione generale, assistenza alla scrittura, brainstorming, aiuto in codice e analisi. Prova i suggerimenti del campione sopra per vedere il suo stile.

Circa 191 tokens per messaggio medio. $1 compra 750.000 tokens, quindi anche i modelli pagati costano centesimi per chat. Gli account gratuiti ricevono 10.000 token di iscrizione più una piscina giornaliera.

Dipende dall'attività. /chat/compare/ consente di inviare lo stesso prompt a NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 e qualsiasi altro confronto modello side-by-side è il modo più veloce per decidere.

Sì. I risultati sono i tuoi και Free.ai non rivendicano diritti a qualsiasi cosa si generi.

131,072 token.

Replies stream token-by-token entro ~1 secondo. Il tempo totale di risposta dipende dalla lunghezza e dalla dimensione del modello di modelli piccoli flusso più veloce, modelli di frontiera velocità di scambio per la profondità.

Sì. Gli utenti registrati vedono ogni chat in /account/?tab=history. Puoi anche condividere una copia di un link di qualsiasi conversazione tramite il pulsante Condividi.

Free.ai non allena i modelli sulle vostre conversazioni. I modelli self-hosted rimangono sulle nostre GPU. I modelli premium per il provider upstream per l'inferenza.

Sì. POST to /v1/chat/ with model="nvidia/llama-3.3-nemotron-super-49b-v1.5" and a messages array. Streaming SSE is supported. Full reference: /api/.

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 è un modello premium servito da un provider esterno, quindi non è disponibile l'auto-ospitalità. Free.ai lo espone attraverso token-based pricing.

Account gratuiti ottenere 10.000 gettoni di iscrizione più una piscina giornaliera. Quando che si esaurisce, top up a partire da $1 (750K gettoni) non è richiesto alcun abbonamento.

Love this tool? Share it!

Valuta questa pagina