Transcripción gratuita persa

Transcribe persa audio y vídeo al texto con IA. Rápido, preciso y gratuito.

Cómo funciona

  1. Ir a la Free.ai Transcriptor
  2. Sube tu archivo de audio o vídeo persa
  3. Nuestra IA detecta automáticamente persa y la transcribe
  4. Descargue su transcripción como texto o subtítulos SRT

persa Características de la transcripción

  • Propulsado por un supresor más rápido (con licencia del MIT)
  • Detección automática de lenguaje persa
  • Soporta MP3, WAV, MP4, M4A, FLAC y más
  • Marcas temporales y exportación de subtítulos (SRT)
  • No hay límites de tamaño de archivo en los planes de pago
  • Privado y seguro -- los archivos se eliminan después del procesamiento

Detalles del idioma

Idiomapersa
Código ISOfa
Modelo IASusurra más rápido.
PrecioLibre

Más idiomas

Ver todos los idiomas

Preguntas más frecuentes

persa es un lenguaje de recursos medios para Whisper — gran-v3-turbo tierras en la banda de error de la palabra 15-25%. La esencia de la transcripción es confiable; espere errores de nombre-entidad, errores ocasionales de cambio de código, y fallas de corto alcance. Planee un pase humano para la salida de calidad de publicación.(Más C, 15-25% word error rate en conjuntos de referencia — publicamos niveles honestos de WER en lugar de reclamaciones de marketing.)

Sí — persa transcripción dibuja de su piscina token libre diario primero. El audio cuesta alrededor de 50 tokens por minuto, por lo que la piscina diaria anónima cubre unas horas de audio por día. Las cuentas firmadas obtienen una piscina más grande más 10.000 tokens de registro. Más allá de eso, $ 1 compra 750.000 tokens (~250 horas de audio).

Las transcripciones persa se devuelven en su script nativo de derecha a izquierda y se renderizan correctamente en cualquier visor RTL (navegadores, Word, Google Docs).

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM are accepted directly. For video (MP4, MOV, MKV) we extract the audio track server-side before sending it to Whisper — you do not need to convert anything yourself. Same pipeline regardless of source language, including persa.

El límite de carga anónimo es de aproximadamente 500 MB por archivo. Las cuentas firmadas llegan a 2 GB. La duración no es un límite difícil: los archivos largos se trocean automáticamente (ventanas de 30 segundos con superposición) y se suturan en una sola transcripción con marcas de tiempo continuas. Las grabaciones multihora persa (podcasts, conferencias completas, reuniones) funcionan bien.

Sí — diarización del altavoz está encendido por defecto para cada transcripción persa. La salida se segmenta como Altavoz 1 / Altavoz 2 / Altavoz 3 con marcas de tiempo, por lo que las entrevistas, debates de panel y reuniones multipartitas vuelven etiquetadas. Diarización se ejecuta en un modelo separado y funciona igual en todos los idiomas que soportamos.

Sí — pega la URL en /transcribe/youtube/ para YouTube o /transcribe/podcast/ para las fuentes de podcast (Apple, Spotify, RSS). Descargamos el audio, lo ejecutamos a través de Whisper con lenguaje=fa, y devolvemos la transcripción con marcas de tiempo y etiquetas de altavoz. Típico persa content: clips de noticias, sermones, conferencias y entrevistas políticas en persa son las cargas de trabajo más comunes; pega una URL de YouTube en /transcribir/youtube/ o sube el archivo.

Whisper cuesta alrededor de 50 tokens por minuto de audio, por lo que una grabación de una hora es de ~ 3,000 tokens. $1 compra 750.000 tokens, lo que equivale a aproximadamente 250 horas de audio por dólar. La mayoría de los usuarios nunca gastan nada — la piscina diaria gratuita cubre clips cortos, notas de voz y podcasts únicos.

Sí — tanto el nivel de segmento (cada ~10-30 segundos) como las marcas de tiempo de nivel de palabra están disponibles. El nivel de palabra es el valor predeterminado para la exportación de subtítulos VTT/SRT para que los subtítulos sincronicen línea por línea. En la API set timestamps="word" en el cuerpo de la solicitud. Las transcripciones persa se devuelven en su script nativo de derecha a izquierda y se renderizan correctamente en cualquier visor RTL (navegadores, Word, Google Docs).

Sí. Audio POST (multipart/form-data, nombre de campo "file") a /v1/transcribir/ con language=fa — u omitir el parámetro de lenguaje para permitir que Whisper autodetecte. Devuelve JSON con la transcripción, segmentos, marcas de tiempo y etiquetas de altavoz.

Sí — una vez que la transcripción termina, haga clic en Traducir o pegar el texto en /translate/. persa pares con cada otro idioma que soportamos (200+). Para los minutos de reunión pipe la transcripción a través de /summarize/; para doblaje enviarlo a /voice/tts/ para renderizar audio en el idioma de destino.

La robustez del ruido de Whisper todavía se aplica en persa, pero en este nivel de precisión cualquier ruido adicional compone la tasa de error de referencia.Si una transcripción vuelve inutilizable, envíe un correo electrónico a contact@free.ai con el archivo — reembolsaremos los tokens y veremos si un motor diferente maneja mejor su audio.

Love this tool? Share it!

Calificar esta página