latín transcripción libre
Transcríbe latín son e vídeo a texto con IA. Rápido, preciso e gratuíto.
Como funciona
- Ir ao Transcritor Free.ai
- Envíe o seu ficheiro de son ou vídeo latín
- A nosa IA detecta automaticamente latín e transcríbea
- Obteña a súa transcrición como texto ou subtítulos SRT
latín Características da transcrición
- ✓Desenvolvido por faster- whisper (con licenza MIT)
- ✓Detección automática da lingua latín
- ✓Soporta MP3, WAV, MP4, M4A, FLAC e máis
- ✓Exportación de selos de data e hora e subtítulos (SRT)
- ✓Non hai límites de tamaño de ficheiro nos plans de pago
- ✓Privado e seguro -- os ficheiros son borrados despois do procesamento
Detalles da lingua
| Lingua | latín |
| Código ISO | la |
| Modelo de IA | faster- whisper |
| Prezo | Libre |
Máis idiomas
Ver todas as linguasFAQ
latín é unha linguaxe con menos recursos para Whisper — large- v3- turbo ten unha taxa de erro de palabra superior ao 25%, ás veces moito máis. A transcrición é útil para procurar e facer un resumo, pero non debe ser tratada como lista para publicación. Se hai un motor de maior precisión dispoñíbel para latín, introducimos automaticamente a transcrición.(Tier D, over 25% word error rate en conxuntos de referencia — publicamos niveis WER honestos en lugar de reclamacións de mercadotecnia.)
Si — A transcrición de latín obtén primeiro o seu conxunto diario de tokens libres. O son custa uns 50 tokens por minuto, polo que o conxunto diario anónimo cobre unhas horas de son por día. As contas que iniciaron sesión obteñen un conxunto maior máis 10. 000 tokens de rexistro. Despois diso, 1 $ compra 750. 000 tokens (~250 horas de son).
As transcricións de latín devólvense en UTF-8 estándar coa ortografía normal da lingua.
Acéptanse directamente MP3, WAV, M4A, FLAC, OGG, OPUS e WEBM. Para os vídeos (MP4, MOV, MKV) extraemos a pista de son do lado do servidor antes de enviala a Whisper — non precisa converter nada vostede mesmo. O mesmo conduto independentemente da lingua de orixe, incluíndo latín __.
O límite de envío anónimo é de aproximadamente 500 MB por ficheiro. As contas con sesión chegan a 2 GB. A duración non é un límite ríxido: os ficheiros longos son divididos automaticamente (fendas de 30 segundos con superposición) e unidos nunha única transcrición con marcas de tempo continuas. As gravacións de latín de varias horas (podcasts, conferencias completas, reunións) funcionan ben.
Si, a diarización do orador está activada por omisión para cada transcrición de latín. A saída está segmentada como Orador 1 / Orador 2 / Orador 3 con marcas de tempo, polo que as entrevistas, discusións de panel e reunións de varias partes regresan etiquetadas. A diarización funciona nun modelo separado e funciona da mesma maneira en todas as linguas que soportamos.
Si, apega o URL en / transcribe/ youtube/ para YouTube ou / transcribe/ podcast/ para fontes de podcast (Apple, Spotify, RSS). Obtemos o son, executámolo en Whisper con language=la e devolvemos a transcrición con marcas de data e hora e etiquetas do orador. Contido típico de latín: conferencias, entrevistas, notas de voz e contido de YouTube en latín funcionan todos — apegue un URL en /transcribe/youtube/ ou envíe o ficheiro directamente.
Whisper custa uns 50 tokens por minuto de son, polo que unha gravación dunha hora custa ~3. 000 tokens. 1 $compra 750. 000 tokens, o que equivale a aproximadamente 250 horas de son por dólar. A maioría dos usuarios nunca gastan nada: o fondo diario gratuíto cobre clips curtos, notas de voz e podcasts únicos.
Si, están dispoñíbeis marcas de tempo tanto a nivel de segmento (cada ~10-30 segundos) como a nivel de palabra. O nivel de palabra é o predeterminado para a exportación de subtítulos VTT/SRT, polo que os subtítulos sincronízanse liña por liña. Na API, estabeleza timestamps="word" no corpo da solicitude. As transcricións de latín devólvense en UTF-8 estándar coa ortografía normal da lingua.
Si. Enviar audio (multipart/form-data, nome do campo «ficheiro») a /v1/transcribe/ con language=la — ou omitir o parámetro de lingua para permitir que Whisper o detecte automaticamente. Devolve JSON coa transcrición, segmentos, marcas de data e hora e etiquetas de falante. Referencia completa e fragmentos do SDK en /api/.
Si — unha vez rematada a transcrición, prema Traducir ou apegue o texto en /translate/. latín emparéllase con todas as outras linguas que admitimos (máis de 200). Para as actas das reunións, envíe a transcrición a través de /summarize/; para a dobraxe, envíea a /voice/tts/ para reproducir o son na lingua de destino.
O adestramento de ruído de Whisper axuda menos neste nivel — o cuello de botella é a cantidade de son que latín Whisper viu durante o adestramento, non o ruído. O son limpo de estudio aínda é mellor que o ruído, pero ningún dos dous alcanzará a precisión que se obtería nunha linguaxe de altos recursos.Se unha transcrición non se pode usar, envíe un correo electrónico a contact@free.ai co ficheiro — reembolsaremos os tokens e veremos se un motor diferente xestiona mellor o seu audio.