chinés transcripción libre

Transcríbe chinés son e vídeo a texto con IA. Rápido, preciso e gratuíto.

Como funciona

  1. Ir ao Transcritor Free.ai
  2. Envíe o seu ficheiro de son ou vídeo chinés
  3. A nosa IA detecta automaticamente chinés e transcríbea
  4. Obteña a súa transcrición como texto ou subtítulos SRT

chinés Características da transcrición

  • Desenvolvido por faster- whisper (con licenza MIT)
  • Detección automática da lingua chinés
  • Soporta MP3, WAV, MP4, M4A, FLAC e máis
  • Exportación de selos de data e hora e subtítulos (SRT)
  • Non hai límites de tamaño de ficheiro nos plans de pago
  • Privado e seguro -- os ficheiros son borrados despois do procesamento

Detalles da lingua

Linguachinés
Código ISOzh
Modelo de IAfaster- whisper
PrezoLibre

Máis idiomas

Ver todas as linguas

FAQ

Whisper large- v3- turbo atópase no seu nivel de precisión máis alto en chinés — baixo o 7% de taxa de erro de palabras nas probas estándar. Na práctica isto significa que o son limpo do estudio volve case perfecto, e o son de conversación é usable cunha limpeza mínima.(Tier A, under 7% word error rate en conxuntos de referencia — publicamos niveis WER honestos en lugar de reclamacións de mercadotecnia.)

Si — A transcrición de chinés obtén primeiro o seu conxunto diario de tokens libres. O son custa uns 50 tokens por minuto, polo que o conxunto diario anónimo cobre unhas horas de son por día. As contas que iniciaron sesión obteñen un conxunto maior máis 10. 000 tokens de rexistro. Despois diso, 1 $ compra 750. 000 tokens (~250 horas de son).

Pasa language=zh para mandarín (o predeterminado — saída simplificada ou tradicional dependendo da fonte). Para cantonés usa language=yue se o son é fala de Hong Kong / Guangzhou; o cantonés transcrito como zh producirá unha aproximación da ortografía mandarí que perde os tons e a xerga.

Acéptanse directamente MP3, WAV, M4A, FLAC, OGG, OPUS e WEBM. Para os vídeos (MP4, MOV, MKV) extraemos a pista de son do lado do servidor antes de enviala a Whisper — non precisa converter nada vostede mesmo. O mesmo conduto independentemente da lingua de orixe, incluíndo chinés __.

O límite de envío anónimo é de aproximadamente 500 MB por ficheiro. As contas con sesión chegan a 2 GB. A duración non é un límite ríxido: os ficheiros longos son divididos automaticamente (fendas de 30 segundos con superposición) e unidos nunha única transcrición con marcas de tempo continuas. As gravacións de chinés de varias horas (podcasts, conferencias completas, reunións) funcionan ben.

Si, a diarización do orador está activada por omisión para cada transcrición de chinés. A saída está segmentada como Orador 1 / Orador 2 / Orador 3 con marcas de tempo, polo que as entrevistas, discusións de panel e reunións de varias partes regresan etiquetadas. A diarización funciona nun modelo separado e funciona da mesma maneira en todas as linguas que soportamos.

Si, apega o URL en / transcribe/ youtube/ para YouTube ou / transcribe/ podcast/ para fontes de podcast (Apple, Spotify, RSS). Obtemos o son, executámolo en Whisper con language=zh e devolvemos a transcrición con marcas de data e hora e etiquetas do orador. Contido típico de chinés: podcasts, conferencias, entrevistas e contidos de YouTube de forma longa en chinés son as cargas de traballo máis comúns que vemos.

Whisper custa uns 50 tokens por minuto de son, polo que unha gravación dunha hora custa ~3. 000 tokens. 1 $compra 750. 000 tokens, o que equivale a aproximadamente 250 horas de son por dólar. A maioría dos usuarios nunca gastan nada: o fondo diario gratuíto cobre clips curtos, notas de voz e podcasts únicos.

Si, están dispoñíbeis marcas de tempo tanto a nivel de segmento (cada ~10-30 segundos) como a nivel de palabra. O nivel de palabra é o predeterminado para a exportación de subtítulos VTT/SRT, polo que os subtítulos sincronízanse liña por liña. Na API, estabeleza timestamps="word" no corpo da solicitude. As transcricións chinés devólvense en caracteres nativos Han (UTF-8), simplificados ou tradicionais, dependendo do son de orixe e do código ISO.

Si. Enviar audio (multipart/form-data, nome do campo «ficheiro») a /v1/transcribe/ con language=zh — ou omitir o parámetro de lingua para permitir que Whisper o detecte automaticamente. Devolve JSON coa transcrición, segmentos, marcas de data e hora e etiquetas de falante. Referencia completa e fragmentos do SDK en /api/.

Si — unha vez rematada a transcrición, prema Traducir ou apegue o texto en /translate/. chinés emparéllase con todas as outras linguas que admitimos (máis de 200). Para as actas das reunións, envíe a transcrición a través de /summarize/; para a dobraxe, envíea a /voice/tts/ para reproducir o son na lingua de destino.

Whisper está adestrado con 680K horas de son ruidoso do mundo real, polo que a transcrición de chinés é robusta para o ruído de fondo, camas de música e gravacións de calidade telefónica. O recorte severo ou a superposición de varios altofalantes aínda afectará á precisión.Se unha transcrición non se pode usar, envíe un correo electrónico a contact@free.ai co ficheiro — reembolsaremos os tokens e veremos se un motor diferente xestiona mellor o seu audio.

Amas Free.ai?

Cualificar esta páxina