Question 1

Que tan precisa é a transcrición de Whisper para latín?

Accepted Answer

latín é unha linguaxe con menos recursos para Whisper — large- v3- turbo ten unha taxa de erro de palabra superior ao 25%, ás veces moito máis. A transcrición é útil para procurar e facer un resumo, pero non debe ser tratada como lista para publicación. Se hai un motor de maior precisión dispoñíbel para latín, introducimos automaticamente a transcrición.(Tier D, over 25% word error rate en conxuntos de referencia — publicamos niveis WER honestos en lugar de reclamacións de mercadotecnia.)

Question 2

É libre a transcrición de audio a texto de latín?

Accepted Answer

Si — A transcrición de latín obtén primeiro o seu conxunto diario de tokens libres. O son custa uns 50 tokens por minuto, polo que o conxunto diario anónimo cobre unhas horas de son por día. As contas que iniciaron sesión obteñen un conxunto maior máis 10. 000 tokens de rexistro. Despois diso, 1 $ compra 750. 000 tokens (~250 horas de son).

Question 3

Que escritura e ortografía usa a transcrición de latín?

Accepted Answer

As transcricións de latín devólvense en UTF-8 estándar coa ortografía normal da lingua.

Question 4

Que formatos de son están soportados para a transcrición de latín?

Accepted Answer

Acéptanse directamente MP3, WAV, M4A, FLAC, OGG, OPUS e WEBM. Para os vídeos (MP4, MOV, MKV) extraemos a pista de son do lado do servidor antes de enviala a Whisper — non precisa converter nada vostede mesmo. O mesmo conduto independentemente da lingua de orixe, incluíndo latín __.

Question 5

Canto pode durar un ficheiro de son latín?

Accepted Answer

O límite de envío anónimo é de aproximadamente 500 MB por ficheiro. As contas con sesión chegan a 2 GB. A duración non é un límite ríxido: os ficheiros longos son divididos automaticamente (fendas de 30 segundos con superposición) e unidos nunha única transcrición con marcas de tempo continuas. As gravacións de latín de varias horas (podcasts, conferencias completas, reunións) funcionan ben.

Question 6

A transcrición latín identifica diferentes falantes?

Accepted Answer

Si, a diarización do orador está activada por omisión para cada transcrición de latín. A saída está segmentada como Orador 1 / Orador 2 / Orador 3 con marcas de tempo, polo que as entrevistas, discusións de panel e reunións de varias partes regresan etiquetadas. A diarización funciona nun modelo separado e funciona da mesma maneira en todas as linguas que soportamos.

Question 7

Podo transcreber un vídeo ou podcast de latín en YouTube?

Accepted Answer

Si, apega o URL en / transcribe/ youtube/ para YouTube ou / transcribe/ podcast/ para fontes de podcast (Apple, Spotify, RSS). Obtemos o son, executámolo en Whisper con language=la e devolvemos a transcrición con marcas de data e hora e etiquetas do orador. Contido típico de latín: conferencias, entrevistas, notas de voz e contido de YouTube en latín funcionan todos — apegue un URL en /transcribe/youtube/ ou envíe o ficheiro directamente.

Question 8

Canto custa unha hora de son de latín en tokens?

Accepted Answer

Whisper custa uns 50 tokens por minuto de son, polo que unha gravación dunha hora custa ~3. 000 tokens. 1 $compra 750. 000 tokens, o que equivale a aproximadamente 250 horas de son por dólar. A maioría dos usuarios nunca gastan nada: o fondo diario gratuíto cobre clips curtos, notas de voz e podcasts únicos.

Question 9

Podo obter marcas de tempo a nivel de palabra para o son latín?

Accepted Answer

Si, están dispoñíbeis marcas de tempo tanto a nivel de segmento (cada ~10-30 segundos) como a nivel de palabra. O nivel de palabra é o predeterminado para a exportación de subtítulos VTT/SRT, polo que os subtítulos sincronízanse liña por liña. Na API, estabeleza timestamps="word" no corpo da solicitude. As transcricións de latín devólvense en UTF-8 estándar coa ortografía normal da lingua.

Question 10

Existe unha API para a transcrición de latín?

Accepted Answer

Si. Enviar audio (multipart/form-data, nome do campo «ficheiro») a /v1/transcribe/ con language=la — ou omitir o parámetro de lingua para permitir que Whisper o detecte automaticamente. Devolve JSON coa transcrición, segmentos, marcas de data e hora e etiquetas de falante. Referencia completa e fragmentos do SDK en /api/.

Question 11

Podo traducir a transcrición de latín a outra lingua?

Accepted Answer

Si — unha vez rematada a transcrición, prema Traducir ou apegue o texto en /translate/. latín emparéllase con todas as outras linguas que admitimos (máis de 200). Para as actas das reunións, envíe a transcrición a través de /summarize/; para a dobraxe, envíea a /voice/tts/ para reproducir o son na lingua de destino.

Question 12

E se o son de latín é ruidoso ou de baixa calidade?

Accepted Answer

O adestramento de ruído de Whisper axuda menos neste nivel — o cuello de botella é a cantidade de son que latín Whisper viu durante o adestramento, non o ruído. O son limpo de estudio aínda é mellor que o ruído, pero ningún dos dous alcanzará a precisión que se obtería nunha linguaxe de altos recursos.Se unha transcrición non se pode usar, envíe un correo electrónico a contact@free.ai co ficheiro — reembolsaremos os tokens e veremos se un motor diferente xestiona mellor o seu audio.

Lingua	latín
Código ISO	`la`
Modelo de IA	faster- whisper
Prezo	Libre

latín transcripción libre

Como funciona

latín Características da transcrición

Detalles da lingua

Máis idiomas

FAQ