Discurso al texto

Uso comercial OK 380+ modelos Sin marca de agua No es necesario inscribirse
Modelo:
+ GPT-5, Claude, Gemini
Cargue un archivo de audio o vídeo —o pegue una URL— y obtenga una transcripción limpia con marcas de tiempo. Diarización del altavoz, exportación de subtítulos SRT/VTT, más de 100 idiomas con autodetección. Escalas de costos exactamente con longitud de clip. Powered by Whisper large-v3 and Parakeet (auto-hosted), además de Wizper premium y ElevenLabs STT.

Arrastre y suelte audio/vídeo, o haga clic para navegar

MP3, WAV, MP4, WebM, M4A — hasta 500MB

Whisper large-v3 — 99 idiomas, la mejor precisión de su clase.
Estimación de token para este clip
YouTube, Instagram, TikTok, Spotify y más de 1.300 plataformas
El costo de transcripción de URL se basa en la duración real del clip — cotizamos después de la descarga. Espere ~500 tokens/minuto en Whisper.
Grabación: 0:00

Transcripción en tiempo real con el micrófono

Transcripción

Transcribir tu audio...

Esto puede tomar un momento para archivos más largos.

Lo que las personas transcriben con Free.ai

Interviews + podcasts

Diarización etiqueta cada altavoz. Exportar SRT directamente a su editor de vídeo, o texto plano para una redacción de artículo.

Auto captions + subtitles

Sube una carga de YouTube o TikTok, elige SRT o WebVTT y graba los subtítulos con /video/subtitle/. Flujo de trabajo de subtítulos único.

Notas para las reuniones

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcribe una conferencia de 90 minutos, luego usa /study/flashcards/ o /write/summarize/ para convertirlo en material de estudio.

Audio en idioma extranjero

Whisper auto-detecta 99 idiomas. Transcribir en el original, a continuación, enviar el texto a través de /translate/ para saltar idiomas.

Legal + medical

Marcas de tiempo, etiquetas de altavoz, exportación de JSON con el tiempo de inicio/final de cada palabra — reporter de corte preciso o preparación de notas clínicas.

Cómo se compara la transcripción Free.ai

Lo que consigues Free.ai Otter.ai Descript Rev.com
Uso diario gratuito5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Idiomas99English-focused2230+
Diarización del altavoz
Exportación SRT / VTTPaidPaid
API públicaLimitedLimited
Transmisión en vivo STT (gratuito) Paid
Se requiere inscripciónNoYesYesYes
Las cifras de los competidores reflejan los niveles libres enumerados públicamente a partir de 2026. Compruebe cada proveedor para los planes actuales.
Opciones avanzadas
Resultado
Los tokens se están agotando. Get More Tokens
Want better results? Modelos premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Regístrate para obtener un enlace de referencia y ganar 25.000 tokens por amigo.

¿Quieres más? Regístrate gratis por 5K tokens/día + 10K bonus
Regístrate gratis

Procesando su solicitud...

Transcribe audio y vídeo al texto con IA. Sube archivos, pega URLs o usa tu micrófono.

Cómo usar Discurso al texto

1
Introduzca su entrada

Escriba texto, cargue un archivo o describa lo que desee. No necesita cuenta.

2
Haga clic en generar

Nuestra IA procesa su solicitud en segundos utilizando los mejores modelos de código abierto.

3
Descargar & compartir

Descarga, copia o comparte tu resultado. Gratis para uso personal y comercial.

Utilice esta herramienta a través de API

Automatice esta herramienta a partir de su propio código. Endpoint REST compatible con OpenAI, Auth Token de Portador, no requiere SDK adicional. Los costos de token coinciden con la interfaz web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Discurso al texto — FAQ

Free AI Transcription convierte archivos de audio y vídeo a texto usando Whisper, el modelo de reconocimiento de voz de última generación. Sube un archivo y obtén texto preciso en segundos.

¡Sí! La transcripción cuesta ~4 tokens por segundo de audio. Un archivo de 5 minutos cuesta ~1,200 tokens.

Whisper admite más de 99 idiomas con detección automática de idiomas. Sólo tiene que subir el audio y detecta el idioma automáticamente.

MP3, WAV, M4A, FLAC, OGG, MP4, WEBM y los formatos de audio/vídeo más comunes.

Whisper es uno de los modelos STT más precisos disponibles, comparable a los servicios comerciales. La precisión varía según la calidad del audio y el lenguaje.

¡Sí! Elija entre texto plano o salida timestamped (formato de subtítulo SRT).

Hasta 25MB para usuarios anónimos, 100MB para usuarios iniciados. Para archivos más grandes, dividirlos primero.

Transcribir archivos inmediatamente sin una cuenta.

No directamente, pero puedes descargar el audio de un vídeo de YouTube y subirlo aquí.

Nuestra transcripción utiliza el mismo modelo de Whisper y es completamente gratis. La nutria cobra $8-24/mes, Rev cargos por minuto.

El texto transcrito es completamente editable — copiar, modificar y descargar según sea necesario.

¡Sí! Acceda a nuestra API de transcripción en /api/ para el procesamiento por lotes.

Regístrate gratis por 10.000 tokens

Crear cuenta gratuita

No se requiere tarjeta de crédito

¿Cómo calificaría a esta herramienta?

Love this tool? Share it!