Free xinès Transcripció

Grava l' àudio xinès i el vídeo al text amb IA. Ràpid, precís i lliure.

Com funciona

  1. Vés a la Free.ai Transcriber
  2. Puja el fitxer xinès d' àudio o vídeo
  3. La nostra IA detecta automàticament xinès i la transcrivi automàticament
  4. Descarrega la vostra transcripció com a text o subtítols de l' SRT

Característiques xinès Transcripció

  • Powered by whisper més ràpid (Jussed MIT)
  • Detecció automàtica de l' idioma xinès
  • Suport MP3, WAV, MP4, M4A, FLAC, i més
  • Marques de temps i exportació de subtítols (RT)
  • No hi ha límits de mida de fitxer en els plans pagats
  • Els fitxers privats i assegurats s' esborraran després de processar- los

Detalls de l' idioma

Idiomaxinès
Codi ISOzh
Model IALlong-whisperCity name (optional, probably does not need a translation)
PreuLliure

PMF

Whisper Les terres d' alta resolució de 3 en la seva precisió més alta corbador a xinès teut sota el 7% de velocitat d' error de paraula en punts de referència estàndard. En la pràctica això significa que l' estudi net torna a prop de l' afect, i l' àudio conversal es pot utilitzar amb una neteja mínima.(Tier A, under 7% word error rate en els conjunts de referència 61, publiquem els corbatas honests WEP en comptes de les reclamacions de màrqueting.)

Sí, "2002 xinès dibuixa una transcripció de la vostra piscina diària. Els costos d' àudio són uns 50 fitxes per minut, de manera que la piscina anònima cobreix unes poques hores d' àudio per dia. Els comptes amb signe tenen una piscina més de 10.000 fitxes de signes. Pass, 11, compra 750.000 fitxes (~2 hores d' àudio).

Passa l' idioma=zh per mandar (el valor per omissió simplificat o la sortida tradicional depenent de la font). Per a l' ús del llenguatge cantonès=yue si el vostre so és Hong Kong / Guangzhou discurs; transcrita a mesura que zh produirà una aproximació en mandarí que perd el to i l' argot.

MP3, WAV, M4A, FLAC, OGGG, OPUS i WBM s' accepten directament. Per a vídeo (MP4, MOV, MKV) que extractes el servidor de seguiment d' àudio abans d' enviar- lo a Whisper RODUL no necessitareu convertir- vos res. El mateix canonades independentment del llenguatge font, incloent xinès.

Les pujades anònima a més de 500 MB per fitxer. Els comptes signats van a 2 GB. La durada no és un límit dur, el fitxer s' excloguen automàticament (30 segons les finestres amb sobreposen) i s' han tornat a cosir en una sola transcripció amb marques de temps continues. Multi- hora xinès gravadores (podes, lliçons completes, treball).

Per omissió, l' altaveu de l' altaveu de l' altaveu de l' altaveu està en qüestió per a cada transcripció xinès. La sortida està segmentada com a ponent 1 / Presidenta 2 / Presidenta 3 amb segells de temps, així que entrevistes, debats del plafó i reunions multi- partit tornen a ser etiquetades. Diarització s' executa en un model separat i treballa el mateix en totes les llengües que donem suport.

Sí, bibliography enganxa l' URL a / trancrib/tube/ per YouTube o / trancrisc/ a través de fonts de podcasts (Apple, bookmarkify, RSS). El baixem a través de l' àudio Whisper amb el llenguatge=zh, i retornem la transcripció amb marques de temps i etiquetes Orador. Típic xinès contingut: Els podcasts, les lliçons, entrevistes i continguts de YouTube a xinès són els carregadors de treball més comuns que veiem.

Whisper costa unes 50 fitxes per minut d' àudio, així que una gravació d' una hora és ~0. 000 fitxes. 11 dòlars compren 750.000 fitxes, que funciona aproximadament 250 hores d' àudio per dòlar. La majoria d' usuaris mai gasten res que la piscina pugui cobrir fragments curts, notes i podcasts d' una sola veu.

Sí, "2002 tant el nivell de segment (cada ~10- 30 segons) i estan disponibles marques de temps de paraula. El nivell de paraula és el valor per omissió per a l' exportació als subtítols VT/ SRT de manera que els títols sincronitzaen la línia de línia. En el conjunt de marques de l' API set=" word" en el cos de sol· licitud. Les transcripcions xinès es retornen en caràcters natius Han (UTF- 8) simplificades o tradicionals depenent del codi d' àudio i ISO del codi font.

Sí. POST d' àudio (multipart/form- data, nom de camp "fitxer") a / v1/ trancrib / amb el llenguatge=zh o ometre el paràmetre de l' idioma per a permetre la detecció automàtica Whisper. Retorna JSON amb els segments de transcripcions, marques de temps i etiquetes d' altaveu complet i retalls SDK a / a / api/.

Sí, la transcripció una vegada ha acabat, feu clic a la traducció o enganxant el text a / traduir /. xinès parells amb qualsevol altre idioma que recol· acceptem (200+). Per a una reunió, introduïu la transcripció a través de / summarize /; per a dubbing- la enviar a /voice/ tts/ per a renderitzar l' àudio en el llenguatge de destí.

Whisper està entrenat a 680K hores d' àudio real del món, de manera que xinès la transcripció és robusta al so de fons, llits de música i gravacions de qualitat per telèfon. Les retallats o múltiples parlants sobreposades encara faran mal a la precisió.Si una transcripció torna inusable, el contacte de correu@ free.ai amb el fitxer MrYZIGER reem les fitxes i veurem si un motor diferent gestiona millor l' àudio.

Like this tool? Share it!

Valora aquesta pàgina