Wizper (Whisper v3)

Free.ai · stt · ~500 Torneiras por minute

Carregar áudio

Deixe um arquivo de áudio ou vídeo ou cole uma URL abaixo

~500 Torneiras por minute

Corre livre nas nossas GPUs. Actualização para Wizper (Whisper v3) →

_ Encaminhado através de modelos externos — ~500 tokens por minuto (50% de marcagem sobre o custo a montante).

Utilizar através da API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'

Documentação da API Obter a chave da API

Similar models

ElevenLabs STT

Fal Speech-to-Text

Browse all models →

Perguntas Frequentes

Wizper (Whisper v3) transcribe áudio falado em texto. Envie um arquivo MP3, WAV, M4A ou vídeo e Wizper (Whisper v3) devolve a transcrição completa mais legendas SRT/VTT opcionais com selos de tempo.

A taxa de erro de palavra é de 5 a 10% em áudio de inglês limpo, de 10 a 20% em áudio ruidoso ou acentuado. Grandes variantes da mesma arquitetura fazem significativamente melhor em casos rígidos — escolher mais grande quando o áudio é duro.

Sim — cada segmento inclui start/end times horários. Exportar como SRT ou VTT e o mapa de tempos diretamente no seu vídeo.

Wizper (Whisper v3) é um motor de transcrição premium. Cerca de ~500–1.500 fichas por minuto de áudio. $1 = 750.000 fichas.

MP3, WAV, M4A, FLAC, OGG, mais vídeo (MP4, MOV, WebM) — extraimos o áudio. Máximo 500 MB por upload. Arquivos mais longos? Dividir com /audio/cut/ ou usar /v1/stt/batch /.

A diarização de falantes é um passe separado — commutar "diarizar" em /transcribe/. Wizper (Whisper v3) manipula a transcrição; etiquetas de diarização cada segmento com Speaker 1 / Speaker 2 / etc.

Sim — /batch/ aceita uma pasta de arquivos de áudio. Cada transcrição terras em /account /?tab=história com o nome de arquivo original. Para a preservação de pasta-árvore use a API.

Sim — POST seu áudio para /v1/stt/transcribe/ com model="Wizper (Whisper v3)". Devolve JSON com texto + segmentos + selos de tempo de nível de palavra. /api/ tem a referência completa.

Os modelos auto-hostados mantêm áudio em nosso GPUs; premium passa com um DPA. O áudio é excluído após o share-window (24h anon, 7d assinado). Nós não treinamos em seus insumos.

Sim — Free.ai concede o uso comercial de transcrições. Você precisa de direitos para o áudio que você enviou (o seu próprio registro, material licenciado ou conteúdo com consentimento).

O fator em tempo real é cerca de 0,05–0,2× — um podcast de 60 minutos transcribe em 3–12 minutos. Os modelos premium muitas vezes acabam mais rápido. Use o botão cola para fechar a aba.

Wizper (Whisper v3)

Utilizar através da API

Similar models

Perguntas Frequentes

O que faz Wizper (Whisper v3)?

Quantas línguas suporta Wizper (Whisper v3)?

Quão preciso é Wizper (Whisper v3)?

O Wizper (Whisper v3) inclui selos de tempo?

Quanto custa Wizper (Whisper v3) por minuto?

Que formatos de áudio posso fazer o upload para Wizper (Whisper v3)?

Pode Wizper (Whisper v3) identificar diferentes falantes?

Posso transpor lotes com Wizper (Whisper v3)?

Existe uma API para Wizper (Whisper v3)?

E a privacidade quando transcribo com Wizper (Whisper v3)?

A saída é segura Wizper (Whisper v3) para uso comercial?

Quanto tempo leva Wizper (Whisper v3)?

Obtenha 10.000 tokens gratuitos

Espera — Obtenha 10K Free Tokens!

Queres mais?