Question 1

Quina precisió és Whisper la transcripció per a xinès?

Accepted Answer

Whisper Les terres d' alta resolució de 3 en la seva precisió més alta corbador a xinès teut sota el 7% de velocitat d' error de paraula en punts de referència estàndard. En la pràctica això significa que l' estudi net torna a prop de l' afect, i l' àudio conversal es pot utilitzar amb una neteja mínima.(Tier A, under 7% word error rate en els conjunts de referència 61, publiquem els corbatas honests WEP en comptes de les reclamacions de màrqueting.)

Question 2

Is xinès audio-to-text transcription free?

Accepted Answer

Sí, "2002 xinès dibuixa una transcripció de la vostra piscina diària. Els costos d' àudio són uns 50 fitxes per minut, de manera que la piscina anònima cobreix unes poques hores d' àudio per dia. Els comptes amb signe tenen una piscina més de 10.000 fitxes de signes. Pass, 11, compra 750.000 fitxes (~2 hores d' àudio).

Question 3

El transcrividor gestiona xinès dialectes?

Accepted Answer

Passa l' idioma=zh per mandar (el valor per omissió simplificat o la sortida tradicional depenent de la font). Per a l' ús del llenguatge cantonès=yue si el vostre so és Hong Kong / Guangzhou discurs; transcrita a mesura que zh produirà una aproximació en mandarí que perd el to i l' argot.

Question 4

Quins formats d' àudio estan permesos per a la transcripció xinès?

Accepted Answer

MP3, WAV, M4A, FLAC, OGGG, OPUS i WBM s' accepten directament. Per a vídeo (MP4, MOV, MKV) que extractes el servidor de seguiment d' àudio abans d' enviar- lo a Whisper RODUL no necessitareu convertir- vos res. El mateix canonades independentment del llenguatge font, incloent xinès.

Question 5

Quant de temps pot ser un fitxer d' àudio xinès?

Accepted Answer

Les pujades anònima a més de 500 MB per fitxer. Els comptes signats van a 2 GB. La durada no és un límit dur, el fitxer s' excloguen automàticament (30 segons les finestres amb sobreposen) i s' han tornat a cosir en una sola transcripció amb marques de temps continues. Multi- hora xinès gravadores (podes, lliçons completes, treball).

Question 6

La transcripció xinès identifica els parlants diferents?

Accepted Answer

Per omissió, l' altaveu de l' altaveu de l' altaveu de l' altaveu està en qüestió per a cada transcripció xinès. La sortida està segmentada com a ponent 1 / Presidenta 2 / Presidenta 3 amb segells de temps, així que entrevistes, debats del plafó i reunions multi- partit tornen a ser etiquetades. Diarització s' executa en un model separat i treballa el mateix en totes les llengües que donem suport.

Question 7

Puc transcribir un vídeo xinès de YouTube o podcast?

Accepted Answer

Sí, bibliography enganxa l' URL a / trancrib/tube/ per YouTube o / trancrisc/ a través de fonts de podcasts (Apple, bookmarkify, RSS). El baixem a través de l' àudio Whisper amb el llenguatge=zh, i retornem la transcripció amb marques de temps i etiquetes Orador. Típic xinès contingut: Els podcasts, les lliçons, entrevistes i continguts de YouTube a xinès són els carregadors de treball més comuns que veiem.

Question 8

Quant val una hora de cost d'àudio xinès en fitxes?

Accepted Answer

Whisper costa unes 50 fitxes per minut d' àudio, així que una gravació d' una hora és ~0. 000 fitxes. 11 dòlars compren 750.000 fitxes, que funciona aproximadament 250 hores d' àudio per dòlar. La majoria d' usuaris mai gasten res que la piscina pugui cobrir fragments curts, notes i podcasts d' una sola veu.

Question 9

Puc aconseguir marques de temps de nivell de paraula per a l'àudio xinès?

Accepted Answer

Sí, "2002 tant el nivell de segment (cada ~10- 30 segons) i estan disponibles marques de temps de paraula. El nivell de paraula és el valor per omissió per a l' exportació als subtítols VT/ SRT de manera que els títols sincronitzaen la línia de línia. En el conjunt de marques de l' API set=" word" en el cos de sol· licitud. Les transcripcions xinès es retornen en caràcters natius Han (UTF- 8) simplificades o tradicionals depenent del codi d' àudio i ISO del codi font.

Question 10

Hi ha una API per a la transcripció xinès?

Accepted Answer

Sí. POST d' àudio (multipart/form- data, nom de camp "fitxer") a / v1/ trancrib / amb el llenguatge=zh o ometre el paràmetre de l' idioma per a permetre la detecció automàtica Whisper. Retorna JSON amb els segments de transcripcions, marques de temps i etiquetes d' altaveu complet i retalls SDK a / a / api/.

Question 11

Puc traduir la transcripció xinès en un altre idioma?

Accepted Answer

Sí, la transcripció una vegada ha acabat, feu clic a la traducció o enganxant el text a / traduir /. xinès parells amb qualsevol altre idioma que recol· acceptem (200+). Per a una reunió, introduïu la transcripció a través de / summarize /; per a dubbing- la enviar a /voice/ tts/ per a renderitzar l' àudio en el llenguatge de destí.

Question 12

I si l'àudio xinès és sorollós o baixa qualitat?

Accepted Answer

Whisper està entrenat a 680K hores d' àudio real del món, de manera que xinès la transcripció és robusta al so de fons, llits de música i gravacions de qualitat per telèfon. Les retallats o múltiples parlants sobreposades encara faran mal a la precisió.Si una transcripció torna inusable, el contacte de correu@ free.ai amb el fitxer MrYZIGER reem les fitxes i veurem si un motor diferent gestiona millor l' àudio.

Idioma	xinès
Codi ISO	`zh`
Model IA	Llong-whisperCity name (optional, probably does not need a translation)
Preu	Lliure

Free xinès Transcripció

Com funciona

Característiques xinès Transcripció

Detalls de l' idioma

Més idiomes

PMF