Speech to Text

Uso comercial OK 380+ modelos Sin marca de agua No es necesario inscribirse

Cargue un archivo de audio o vídeo —o pegue una URL— y obtenga una transcripción limpia con marcas de tiempo. Diarización del altavoz, exportación de subtítulos SRT/VTT, más de 100 idiomas con autodetección. Escalas de costos exactamente con longitud de clip. Powered by Whisper large-v3 and Parakeet (auto-hosted), además de Wizper premium y ElevenLabs STT.

Arrastre y suelte audio/vídeo, o haga clic para navegar

MP3, WAV, MP4, WebM, M4A — hasta 500MB

Idioma

Motor Whisper large-v3 — 99 idiomas, la mejor precisión de su clase.

Formato de salida

Detección de altavoces — etiqueta que está hablando cuando (+50% tokens)

Número de oradores

YouTube, Instagram, TikTok, Spotify y más de 1.300 plataformas

Motor

Formato de salida

Detección de altavoces — +50%

El costo de transcripción de URL se basa en la duración real del clip — cotizamos después de la descarga. Espere ~500 tokens/minuto en Whisper.

Transcripción en tiempo real con el micrófono

Lo que las personas transcriben con Free.ai

Entrevistas + podcasts

Diarización etiqueta cada altavoz. Exportar SRT directamente a su editor de vídeo, o texto plano para una redacción de artículo.

Títulos automáticos + subtítulos

Sube una carga de YouTube o TikTok, elige SRT o WebVTT y graba los subtítulos con /video/subtitle/. Flujo de trabajo de subtítulos único.

Notas para las reuniones

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Conferencias + lecciones

Transcribe una conferencia de 90 minutos, luego usa /study/flashcards/ o /write/summarize/ para convertirlo en material de estudio.

Audio en idioma extranjero

Whisper auto-detecta 99 idiomas. Transcribir en el original, a continuación, enviar el texto a través de /translate/ para saltar idiomas.

Legal + médico

Marcas de tiempo, etiquetas de altavoz, exportación de JSON con el tiempo de inicio/final de cada palabra — reporter de corte preciso o preparación de notas clínicas.

Cómo se compara la transcripción Free.ai

Lo que consigues	Free.ai	Otter.ai	Descript	Rev.com
Uso diario gratuito	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Motor	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Idiomas	99	English-focused	22	30+
Diarización del altavoz
Exportación SRT / VTT		Paid	Paid
API pública		Limited	Limited
Transmisión en vivo STT	(gratuito)	Paid	—	—
Se requiere inscripción	No	Yes	Yes	Yes

Las cifras de los competidores reflejan los niveles libres enumerados públicamente a partir de 2026. Compruebe cada proveedor para los planes actuales.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Cómo usar Speech to Text

Introduzca su entrada

Escriba texto, cargue un archivo o describa lo que desee. No necesita cuenta.

Haga clic en generar

Nuestra IA procesa su solicitud en segundos utilizando los mejores modelos de código abierto.

Descargar & compartir

Descarga, copia o comparte tu resultado. Gratis para uso personal y comercial.

Utilice esta herramienta a través de API

Automatice esta herramienta a partir de su propio código. Endpoint REST compatible con OpenAI, Auth Token de Portador, no requiere SDK adicional. Los costos de token coinciden con la interfaz web.

Documentación API Obtener clave de API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai ofrece un lenguaje con Whisper para texto con excelente precisión, 99 idiomas, exportación de subtítulos, detección de altavoces y captura de micrófonos en vivo, completamente gratis.

Cargue un archivo de audio o vídeo (MP3, WAV, MP4, M4A), haga clic en Transcribir y obtenga voz exacta al texto en segundos. O grabe en vivo desde su micrófono.

Sí. Pegue cualquier URL de YouTube en la pestaña URL y Speech To Text de voz a texto extrae el audio y lo convierte. Funciona con las plataformas Instagram, TikTok, Spotify y 1.300+.

Sí. Autodetectar o seleccionar entre 99 idiomas. Nuestro discurso al texto maneja bien los acentos, el ruido de fondo y el audio en lenguaje mixto.

Sí. Seleccione varios archivos de audio a la vez — cada uno se envía a través de voz a texto con seguimiento de progreso y los resultados se pueden descargar por separado o combinados.

Sí. El discurso a la API de texto en /api/ es compatible con OpenAI. Sube audio programáticamente y recibe JSON con la transcripción, el idioma y las marcas de tiempo.

Sí. Toggle Speaker Detection antes de subir y el discurso a la salida de texto está etiquetado por altavoz (Speaker 1, Speaker 2...). Añade 50% al costo token.

El discurso al texto acepta archivos de hasta 500 MB por carga. Para contenido de varias horas, divida primero el audio en trozos.

Muy precisa para el audio claro, normalmente 95% más precisión de palabra en inglés con nuestro motor Whisper large-v3. La calidad depende de la claridad del audio, el acento y el ruido de fondo.

Sí. La transcripción es completamente editable en el lugar. Corregir errores, formatear y copiar/descargar como TXT, SRT o VTT.

Sí. El audio se procesa en nuestras propias GPUs y se elimina después de completar el discurso al texto. Nada se almacena a largo plazo, se comparte o se utiliza para el entrenamiento.

Sí. Sube un archivo de audio o vídeo en /chat/ y pídele a la IA que lo transcriba: combina el discurso con el texto con preguntas de seguimiento y resumen en un flujo de trabajo.

Regístrate gratis por 30.000 tokens

Crear cuenta gratuita

No se requiere tarjeta de crédito

¿Cómo calificaría a esta herramienta?

Speech to Text

Lo que las personas transcriben con Free.ai

Entrevistas + podcasts

Títulos automáticos + subtítulos

Notas para las reuniones

Conferencias + lecciones

Audio en idioma extranjero

Legal + médico

Cómo se compara la transcripción Free.ai

Resultado

Cómo usar Speech to Text

Introduzca su entrada

Haga clic en generar

Descargar & compartir

Utilice esta herramienta a través de API

Speech to Text — FAQ

¿Cuál es la mejor herramienta de libre expresión al texto?

¿Cómo convierto el discurso a texto en línea?

¿Puede el discurso al texto manejar vídeos de YouTube?

¿El discurso al texto funciona en otros idiomas?

¿Puedo subir varios archivos de voz a texto?

¿Hay un discurso para texto API?

¿El discurso al texto apoya las etiquetas de los altavoces?

¿Qué tamaño de archivo de audio aceptan los mensajes de texto?

¿Qué tan preciso es el discurso a la salida de texto?

¿Puedo editar el discurso a la transcripción de texto?

¿El discurso a texto es privado y seguro?

¿Puedo usar el discurso para enviar mensajes de texto en IA Chat?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?