STT Online

Uso comercial aceptado Máis de 380 modelos Sen marca de auga Non é preciso rexistrarse
Modelo:
+ GPT-5, Claude, Gemini
Envíe un ficheiro de son ou vídeo — ou apegue un URL — e obteña unha transcrición limpa con marcas de tempo. Diarización de oradores, exportación de subtítulos SRT/VTT, máis de 100 idiomas con detección automática. O custo escala exactamente coa duración do clip. Xestionado por Whisper large-v3 e Parakeet (autoaloxado), ademais de Wizper premium e ElevenLabs STT.

Arrastre e solte son/vídeo ou prema para navegar

MP3, WAV, MP4, WebM, M4A - ata 500MB

Whisper large-v3 — 99 linguas, a mellor precisión da súa clase.
Estimación de token para este clip
YouTube, Instagram, TikTok, Spotify e máis de 1.300 plataformas
O custo da transcrición do URL está baseado na duración real do clip — cotizamos despois da descarga. Espere ~500 tokens/ minuto en Whisper.
Gravación: 0:00

Transcrición en tempo real usando o micrófono

Transcrición

A transcreber o seu son...

Isto pode tardar un pouco para os ficheiros máis longos.

O que a xente transcribe con Free.ai

Interviews + podcasts

A diarización etiqueta cada falante. Exporte SRT directamente ao seu editor de vídeo, ou texto simple para escribir un artigo.

Auto captions + subtitles

Envíe un vídeo de YouTube ou TikTok, escolla SRT ou WebVTT e grave os subtítulos en /video/subtitle/. Fluxo de traballo de subtítulos completo.

Notas da reunión

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcríbe unha conferencia de 90 minutos e logo usa /study/flashcards/ ou /write/summarize/ para convertela en material de estudo.

Son en lingua estranxeira

Whisper detecta automaticamente 99 linguas. Transcríbeo no orixinal e despois envía o texto a través de /translate/ para saltar as linguas.

Legal + medical

Marcas de tempo, etiquetas de oradores, exportación a JSON con hora de comezo/fin de cada palabra: preparación precisa para reporteiros de tribunais ou notas clínicas.

Como se compara a transcrición Free.ai

O que obtén Free.ai Otter.ai Descript Rev.com
Uso diario libre5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Linguas99English-focused2230+
Diarización do falante
Exportación de SRT / VTTPaidPaid
API públicaLimitedLimited
Transmisión en directo STT (libre) Paid
Requírese rexistroNonYesYesYes
As cifras dos competidores reflicten os niveis libres listados publicamente a partir de 2026. Comprobe cada provedor para os plans actuais.
Opcións avanzadas
Resultado
A faltar fichas. Get More Tokens
Want better results? Modelos Premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Amas Free.ai?

Regístrese para obter unha ligazón de referencia e gañar 25.000 tokens por amigo.

Queres máis? Inscríbete gratis para 5K tokens/día + 10K de bonificación
Inscríbete gratis

A procesar o seu pedido...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Como usar STT Online

1
Introduza a súa entrada

Escriba texto, envíe un ficheiro ou describa o que queira. Non se precisa conta.

2
Prema para xerar

A nosa IA procesa a túa solicitude en segundos empregando os mellores modelos de código aberto.

3
Obter e compartir

Obteña, copie ou comparta o seu resultado. Gratuito para uso persoal e comercial.

Empregar esta ferramenta mediante API

Automatice esta ferramenta a partir do seu propio código. Punto final REST compatíbel con OpenAI, autenticación por token de portador, non se require SDK adicional. Os custos dos tokens son iguais aos da interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech- to- Text) converte o son falado en texto escrito empregando IA. O Free.ai executa Whisper large- v3, o modelo de recoñecemento de voz de código aberto máis preciso, nas nosas propias GPU.

Si. Envíe ficheiros de son de ata 500 MB. STT custa ~500 tokens por minuto de son. Obtén 2. 500- 5. 000 tokens gratuítos por día — varios ficheiros por día de balde.

STT acepta MP3, WAV, MP4, WebM, M4A, OGG, FLAC — virtualmente calquera formato de audio ou vídeo — ata 500 MB por envío.

Si. Os resultados de STT son exportados como TXT, SRT (subtítulos) ou VTT (titularidades web). Perfecto para subtítulos de YouTube e subtítulos de vídeo.

O noso STT usa Whisper large- v3, normalmente con máis do 95% de precisión para un inglés claro e unha calidade excelente en 99 linguas. O ruído de fondo e os acentos pesados reducen a precisión.

Si. Activa a diarización do falante nas opcións de STT e a IA etiqueta os segmentos como Falante 1, Falante 2, etc. Custa un 50% máis de tokens.

Si. A API STT é compatíbel con OpenAI — envía o son a /v1/audio/transcriptions e recibe JSON. Funciona con calquera linguaxe que poida enviar peticións HTTP.

Si. A páxina En directo captura o micrófono e transmite a través de STT en tempo real cunha latencia mínima.

Si. Apegue un URL de YouTube, TikTok, Instagram, Spotify ou Vimeo e STT extraerá o son e transcribirono. Soporta máis de 1300 plataformas.

Rápido — un clip de 1 minuto remata en segundos, unha gravación de 30 minutos en aproximadamente un minuto, un ficheiro de 1 hora en aproximadamente 2 minutos. Whisper executase no noso cluster de GPU.

Si. O son é procesado nas nosas propias GPU e borrado despois de que remate o STT. Nunca se almacena a longo prazo, nunca se comparte e nunca se usa para adestramento de modelos.

Whisper large- v3 — o modelo Whisper máis grande e preciso (1. 55B de parámetros). Aloxámolo en GPU A100 para maior velocidade e privacidade.

Inscríbete gratis para obter 10.000 tokens

Crear unha conta libre

Non se require tarxeta de crédito

Como valora esta ferramenta?

Amas Free.ai?