Question 1

¿Cuán exacta es la transcripción de Whisper para vietnamita?

Accepted Answer

Whisper large-v3-turbo manijas vietnamita sólidamente — 7-15% tasa de error de palabra en audio de referencia. Espere sustituciones ocasionales en entidades nombradas, números, y vocabulario técnico denso; la mayor parte de la transcripción será correcta.(Más B, 7-15% word error rate en conjuntos de referencia — publicamos niveles honestos de WER en lugar de reclamaciones de marketing.)

Question 2

¿Está libre la transcripción de audio a texto vietnamita?

Accepted Answer

Sí — vietnamita transcripción dibuja de su piscina token libre diario primero. El audio cuesta alrededor de 50 tokens por minuto, por lo que la piscina diaria anónima cubre unas horas de audio por día. Las cuentas firmadas obtienen una piscina más grande más 10.000 tokens de registro. Más allá de eso, $ 1 compra 750.000 tokens (~250 horas de audio).

Question 3

¿Qué script y ortografía usa la transcripción vietnamita?

Accepted Answer

Las transcripciones vietnamita se devuelven en UTF-8 estándar con la ortografía normal del idioma.

Question 4

¿Qué formatos de audio son compatibles para la transcripción vietnamita?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM are accepted directly. For video (MP4, MOV, MKV) we extract the audio track server-side before sending it to Whisper — you do not need to convert anything yourself. Same pipeline regardless of source language, including vietnamita.

Question 5

¿Cuánto tiempo puede ser un archivo de audio vietnamita?

Accepted Answer

El límite de carga anónimo es de aproximadamente 500 MB por archivo. Las cuentas firmadas llegan a 2 GB. La duración no es un límite difícil: los archivos largos se trocean automáticamente (ventanas de 30 segundos con superposición) y se suturan en una sola transcripción con marcas de tiempo continuas. Las grabaciones multihora vietnamita (podcasts, conferencias completas, reuniones) funcionan bien.

Question 6

¿La transcripción vietnamita identifica diferentes altavoces?

Accepted Answer

Sí — diarización del altavoz está encendido por defecto para cada transcripción vietnamita. La salida se segmenta como Altavoz 1 / Altavoz 2 / Altavoz 3 con marcas de tiempo, por lo que las entrevistas, debates de panel y reuniones multipartitas vuelven etiquetadas. Diarización se ejecuta en un modelo separado y funciona igual en todos los idiomas que soportamos.

Question 7

¿Puedo transcribir un vídeo o podcast de vietnamita de YouTube?

Accepted Answer

Sí — pega la URL en /transcribe/youtube/ para YouTube o /transcribe/podcast/ para las fuentes de podcast (Apple, Spotify, RSS). Descargamos el audio, lo ejecutamos a través de Whisper con lenguaje=vi, y devolvemos la transcripción con marcas de tiempo y etiquetas de altavoz. Típico vietnamita content: Las notas de voz de WhatsApp, los vlogs de YouTube y el vídeo de forma corta son las cargas de trabajo más comunes vietnamita — pegar una URL en /transcribir/youtube/ o subir el audio directamente.

Question 8

¿Cuánto cuesta una hora de audio vietnamita en tokens?

Accepted Answer

Whisper cuesta alrededor de 50 tokens por minuto de audio, por lo que una grabación de una hora es de ~ 3,000 tokens. $1 compra 750.000 tokens, lo que equivale a aproximadamente 250 horas de audio por dólar. La mayoría de los usuarios nunca gastan nada — la piscina diaria gratuita cubre clips cortos, notas de voz y podcasts únicos.

Question 9

¿Puedo obtener marcas de tiempo a nivel de palabra para audio vietnamita?

Accepted Answer

Sí — tanto el nivel de segmento (cada ~10-30 segundos) como las marcas de tiempo de nivel de palabra están disponibles. El nivel de palabra es el valor predeterminado para la exportación de subtítulos VTT/SRT para que los subtítulos sincronicen línea por línea. En la API set timestamps="word" en el cuerpo de la solicitud. Las transcripciones vietnamita se devuelven en UTF-8 estándar con la ortografía normal del idioma.

Question 10

¿Existe una API para la transcripción vietnamita?

Accepted Answer

Sí. Audio POST (multipart/form-data, nombre de campo "file") a /v1/transcribir/ con language=vi — u omitir el parámetro de lenguaje para permitir que Whisper autodetecte. Devuelve JSON con la transcripción, segmentos, marcas de tiempo y etiquetas de altavoz.

Question 11

¿Puedo traducir la transcripción vietnamita a otro idioma?

Accepted Answer

Sí — una vez que la transcripción termina, haga clic en Traducir o pegar el texto en /translate/. vietnamita pares con cada otro idioma que soportamos (200+). Para los minutos de reunión pipe la transcripción a través de /summarize/; para doblaje enviarlo a /voice/tts/ para renderizar audio en el idioma de destino.

Question 12

¿Qué pasa si el audio vietnamita es ruidoso o de baja calidad?

Accepted Answer

Whisper está entrenado en cientos de miles de horas de audio del mundo real, por lo que tolera el ruido de fondo y grabaciones de calidad de teléfono en vietnamita. Para obtener los mejores resultados, suministrar audio limpio (mic headset, no music bed) — a este nivel de ruido compone la tasa de error de referencia.Si una transcripción vuelve inutilizable, envíe un correo electrónico a contact@free.ai con el archivo — reembolsaremos los tokens y veremos si un motor diferente maneja mejor su audio.

Idioma	vietnamita
Código ISO	`vi`
Modelo IA	Susurra más rápido.
Precio	Libre

Transcripción gratuita vietnamita

Cómo funciona

vietnamita Características de la transcripción

Detalles del idioma

Más idiomas

Preguntas más frecuentes