Speech to Text

Uso comercial aceptado Máis de 380 modelos Sen marca de auga Non é preciso rexistrarse
Modelo:
+ GPT-5, Claude, Gemini
Envíe un ficheiro de son ou vídeo — ou apegue un URL — e obteña unha transcrición limpa con marcas de tempo. Diarización de oradores, exportación de subtítulos SRT/VTT, máis de 100 idiomas con detección automática. O custo escala exactamente coa duración do clip. Xestionado por Whisper large-v3 e Parakeet (autoaloxado), ademais de Wizper premium e ElevenLabs STT.

Arrastre e solte son/vídeo ou prema para navegar

MP3, WAV, MP4, WebM, M4A - ata 500MB

Whisper large-v3 — 99 linguas, a mellor precisión da súa clase.
Estimación de token para este clip
YouTube, Instagram, TikTok, Spotify e máis de 1.300 plataformas
O custo da transcrición do URL está baseado na duración real do clip — cotizamos despois da descarga. Espere ~500 tokens/ minuto en Whisper.
Gravación: 0:00

Transcrición en tempo real usando o micrófono

Transcrición

A transcreber o seu son...

Isto pode tardar un pouco para os ficheiros máis longos.

O que a xente transcribe con Free.ai

Interviews + podcasts

A diarización etiqueta cada falante. Exporte SRT directamente ao seu editor de vídeo, ou texto simple para escribir un artigo.

Auto captions + subtitles

Envíe un vídeo de YouTube ou TikTok, escolla SRT ou WebVTT e grave os subtítulos en /video/subtitle/. Fluxo de traballo de subtítulos completo.

Notas da reunión

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcríbe unha conferencia de 90 minutos e logo usa /study/flashcards/ ou /write/summarize/ para convertela en material de estudo.

Son en lingua estranxeira

Whisper detecta automaticamente 99 linguas. Transcríbeo no orixinal e despois envía o texto a través de /translate/ para saltar as linguas.

Legal + medical

Marcas de tempo, etiquetas de oradores, exportación a JSON con hora de comezo/fin de cada palabra: preparación precisa para reporteiros de tribunais ou notas clínicas.

Como se compara a transcrición Free.ai

O que obtén Free.ai Otter.ai Descript Rev.com
Uso diario libre5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Linguas99English-focused2230+
Diarización do falante
Exportación de SRT / VTTPaidPaid
API públicaLimitedLimited
Transmisión en directo STT (libre) Paid
Requírese rexistroNonYesYesYes
As cifras dos competidores reflicten os niveis libres listados publicamente a partir de 2026. Comprobe cada provedor para os plans actuais.
Opcións avanzadas
Resultado
A faltar fichas. Get More Tokens
Want better results? Modelos Premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Amas Free.ai?

Regístrese para obter unha ligazón de referencia e gañar 25.000 tokens por amigo.

Queres máis? Inscríbete gratis para 5K tokens/día + 10K de bonificación
Inscríbete gratis

A procesar o seu pedido...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Como usar Speech to Text

1
Introduza a súa entrada

Escriba texto, envíe un ficheiro ou describa o que queira. Non se precisa conta.

2
Prema para xerar

A nosa IA procesa a túa solicitude en segundos empregando os mellores modelos de código aberto.

3
Obter e compartir

Obteña, copie ou comparta o seu resultado. Gratuito para uso persoal e comercial.

Empregar esta ferramenta mediante API

Automatice esta ferramenta a partir do seu propio código. Punto final REST compatíbel con OpenAI, autenticación por token de portador, non se require SDK adicional. Os custos dos tokens son iguais aos da interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai ofrece voz a texto con Whisper con excelente precisión, 99 idiomas, exportación de subtítulos, detección de falantes e captura de micrófono en directo - completamente gratis.

Envíe un ficheiro de son ou vídeo (MP3, WAV, MP4, M4A), prema en Transcribir e obterá unha transcrición precisa en segundos. Ou grave en directo co seu micrófono.

Si. Apegue calquera URL de YouTube na pestana URL e a ferramenta de voz a texto extraerá o son e converterao. Funciona con Instagram, TikTok, Spotify e máis de 1.300 plataformas.

Si. Detectar ou escoller automaticamente entre 99 linguas. O noso conversor de voz a texto xestiona ben os acentos, o ruído de fondo e o son de linguas mesturadas.

Si. Escolla varios ficheiros de son á vez. Cada un envíase mediante voz a texto con seguimento do progreso e os resultados poden descargarse por separado ou combinados.

Si. A API de voz a texto en / api / é compatíbel con OpenAI. Envíe o son por programación e reciba JSON coa transcrición, linguaxe e marcas de data/ hora.

Si. Conmute a Detección de falantes antes de enviar e a saída de voz a texto será etiquetada por falante (Falante 1, Falante 2...). Engade un 50% ao custo do token.

A conversión de voz a texto acepta ficheiros de ata 500 MB por envío. Para contidos de varias horas, divida primeiro o son en anacos.

Moi preciso para un son claro, normalmente máis do 95% de precisión de palabras en inglés coa nosa infraestrutura Whisper large- v3. A calidade depende da claridade do son, do acento e do ruído de fondo.

Si. A transcrición é totalmente editábel no lugar. Corrixa erros, reformate e copie/ descargue como TXT, SRT ou VTT.

Si. O son é procesado nas nosas propias GPU e borrado despois de que remate a conversión de voz a texto. Non se garda nada a longo prazo, non se comparte nada nin se usa para adestramento.

Si. Envíe un ficheiro de son ou vídeo a / chat / e pídalle á IA que o transcriba - combine a voz co texto con preguntas de seguimento e resumo nun só fluxo de traballo.

Inscríbete gratis para obter 10.000 tokens

Crear unha conta libre

Non se require tarxeta de crédito

Como valora esta ferramenta?

Amas Free.ai?