Question 1

Que tan precisa é a transcrición de Whisper para chinés?

Accepted Answer

Whisper large- v3- turbo atópase no seu nivel de precisión máis alto en chinés — baixo o 7% de taxa de erro de palabras nas probas estándar. Na práctica isto significa que o son limpo do estudio volve case perfecto, e o son de conversación é usable cunha limpeza mínima.(Tier A, under 7% word error rate en conxuntos de referencia — publicamos niveis WER honestos en lugar de reclamacións de mercadotecnia.)

Question 2

É libre a transcrición de audio a texto de chinés?

Accepted Answer

Si — A transcrición de chinés obtén primeiro o seu conxunto diario de tokens libres. O son custa uns 50 tokens por minuto, polo que o conxunto diario anónimo cobre unhas horas de son por día. As contas que iniciaron sesión obteñen un conxunto maior máis 10. 000 tokens de rexistro. Despois diso, 1 $ compra 750. 000 tokens (~250 horas de son).

Question 3

O transcritor xestiona os dialectos de chinés?

Accepted Answer

Pasa language=zh para mandarín (o predeterminado — saída simplificada ou tradicional dependendo da fonte). Para cantonés usa language=yue se o son é fala de Hong Kong / Guangzhou; o cantonés transcrito como zh producirá unha aproximación da ortografía mandarí que perde os tons e a xerga.

Question 4

Que formatos de son están soportados para a transcrición de chinés?

Accepted Answer

Acéptanse directamente MP3, WAV, M4A, FLAC, OGG, OPUS e WEBM. Para os vídeos (MP4, MOV, MKV) extraemos a pista de son do lado do servidor antes de enviala a Whisper — non precisa converter nada vostede mesmo. O mesmo conduto independentemente da lingua de orixe, incluíndo chinés __.

Question 5

Canto pode durar un ficheiro de son chinés?

Accepted Answer

O límite de envío anónimo é de aproximadamente 500 MB por ficheiro. As contas con sesión chegan a 2 GB. A duración non é un límite ríxido: os ficheiros longos son divididos automaticamente (fendas de 30 segundos con superposición) e unidos nunha única transcrición con marcas de tempo continuas. As gravacións de chinés de varias horas (podcasts, conferencias completas, reunións) funcionan ben.

Question 6

A transcrición chinés identifica diferentes falantes?

Accepted Answer

Si, a diarización do orador está activada por omisión para cada transcrición de chinés. A saída está segmentada como Orador 1 / Orador 2 / Orador 3 con marcas de tempo, polo que as entrevistas, discusións de panel e reunións de varias partes regresan etiquetadas. A diarización funciona nun modelo separado e funciona da mesma maneira en todas as linguas que soportamos.

Question 7

Podo transcreber un vídeo ou podcast de chinés en YouTube?

Accepted Answer

Si, apega o URL en / transcribe/ youtube/ para YouTube ou / transcribe/ podcast/ para fontes de podcast (Apple, Spotify, RSS). Obtemos o son, executámolo en Whisper con language=zh e devolvemos a transcrición con marcas de data e hora e etiquetas do orador. Contido típico de chinés: podcasts, conferencias, entrevistas e contidos de YouTube de forma longa en chinés son as cargas de traballo máis comúns que vemos.

Question 8

Canto custa unha hora de son de chinés en tokens?

Accepted Answer

Whisper custa uns 50 tokens por minuto de son, polo que unha gravación dunha hora custa ~3. 000 tokens. 1 $compra 750. 000 tokens, o que equivale a aproximadamente 250 horas de son por dólar. A maioría dos usuarios nunca gastan nada: o fondo diario gratuíto cobre clips curtos, notas de voz e podcasts únicos.

Question 9

Podo obter marcas de tempo a nivel de palabra para o son chinés?

Accepted Answer

Si, están dispoñíbeis marcas de tempo tanto a nivel de segmento (cada ~10-30 segundos) como a nivel de palabra. O nivel de palabra é o predeterminado para a exportación de subtítulos VTT/SRT, polo que os subtítulos sincronízanse liña por liña. Na API, estabeleza timestamps="word" no corpo da solicitude. As transcricións chinés devólvense en caracteres nativos Han (UTF-8), simplificados ou tradicionais, dependendo do son de orixe e do código ISO.

Question 10

Existe unha API para a transcrición de chinés?

Accepted Answer

Si. Enviar audio (multipart/form-data, nome do campo «ficheiro») a /v1/transcribe/ con language=zh — ou omitir o parámetro de lingua para permitir que Whisper o detecte automaticamente. Devolve JSON coa transcrición, segmentos, marcas de data e hora e etiquetas de falante. Referencia completa e fragmentos do SDK en /api/.

Question 11

Podo traducir a transcrición de chinés a outra lingua?

Accepted Answer

Si — unha vez rematada a transcrición, prema Traducir ou apegue o texto en /translate/. chinés emparéllase con todas as outras linguas que admitimos (máis de 200). Para as actas das reunións, envíe a transcrición a través de /summarize/; para a dobraxe, envíea a /voice/tts/ para reproducir o son na lingua de destino.

Question 12

E se o son de chinés é ruidoso ou de baixa calidade?

Accepted Answer

Whisper está adestrado con 680K horas de son ruidoso do mundo real, polo que a transcrición de chinés é robusta para o ruído de fondo, camas de música e gravacións de calidade telefónica. O recorte severo ou a superposición de varios altofalantes aínda afectará á precisión.Se unha transcrición non se pode usar, envíe un correo electrónico a contact@free.ai co ficheiro — reembolsaremos os tokens e veremos se un motor diferente xestiona mellor o seu audio.

Lingua	chinés
Código ISO	`zh`
Modelo de IA	faster- whisper
Prezo	Libre

chinés transcripción libre

Como funciona

chinés Características da transcrición

Detalles da lingua

Máis idiomas

FAQ