Question 1

Mennyire pontos a Whisper átírás kínai-re?

Accepted Answer

Whisper large-v3-turbo lands in its his top accurity level on kínai html in 7% word error rate on standard criteria. A gyakorlatban ez azt jelenti, hogy a tiszta stúdió audio jön vissza közel tökéletes, és társalgási audio használható minimális tisztítás.(Tier A, under 7% word error rate a referencia szettekben a tisztességes WER-szinteket adjuk ki, nem pedig a marketingköveteléseket.)

Question 2

Akínai audio-to-text átírás ingyenes?

Accepted Answer

Igen kínai transzkripció először a napi ingyenes token medencédből indul ki. A hang kb. 50 token per percbe kerül, így az anonim napi pool néhány óra audiót fed le naponta. A beiratkozott számlák nagyobb medencét és 10 000 regisztrációs zsetont kapnak. Ezt követően $1 750,000 tokent (~250 óra audió).

Question 3

A transzcriberis kezeli a kínai dialektusokat?

Accepted Answer

Pass language=zh for Mandarin (the default ~ egyszerűsített vagy hagyományos kimenet a forrástól függően). For Cantonese use language=yue if you audio is Hong Kong / Guangzhou speak; Cantonese transcribed as zh will produce a Mandarin-ortográfia approximation that lose tones and slang.

Question 4

Milyen audio formátumokat támogatunk a kínai transzkripcióhoz?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS és WEBM közvetlenül elfogadott. Videóhoz (MP4, MOV, MKV) kivonjuk az audio track szerver-oldalt, mielőtt elküldjük Whisper-nek. Nem kell átalakítani semmit magad. Ugyanaz a csővezeték, függetlenül a forrásnyelvtől, beleértve a kínai-t.

Question 5

Meddig lehet egy kínai audio fájl?

Accepted Answer

Névtelen feltöltési sapka körülbelül 500 MB egy fájlra. Beiratkozott számlák felmegy 2 GB. Időtartama nem egy kemény limit hosszú fájlokat darabolnak automatikusan (30 másodperces ablakok átfedéssel) és varrtak vissza egy átiratot folyamatos időbélyegek. Több órás kínai felvételek (podcasts, teljes előadások, találkozók) jól működnek.

Question 6

A kínai transzkripció különböző hangszórókat azonosít?

Accepted Answer

Igen, minden kínai transzkripciónál alapértelmezés szerint a hangszóró diarizációja be van jelölve. A kimenet Speaker 1 / Speaker 2 / Speaker 3 időbélyegekkel, így interjúk, panelbeszélgetések és többpárti találkozók visszajönnek. A diarization egy külön modellen fut, és ugyanazt a munkát végzi minden nyelven, amit támogatunk.

Question 7

Átírhatok egy kínai YouTube videót vagy podcastot?

Accepted Answer

Igen, beillesztjük az URL-t a /transcribe/youtube-ba vagy a /transcribe/podcast/ podcast-be (Apple, Spotify, RSS). Letöltjük az audiót, lefuttatjuk Whisperen keresztül a nyelvvel=zh, és visszaadjuk az átiratot időbélyegekkel és hangszóró címkékkel.Tipikus kínai tartalom: A kínai-ben található podcastok, előadások, interjúk és hosszú formátumú YouTube tartalmak a leggyakoribb munkaterhelések, amiket látunk.

Question 8

Mennyibe kerül egy óra kínai audio jegyben?

Accepted Answer

Whisper költségek körülbelül 50 token per perc audio, így egy egy órás felvétel ~3,000 token. $1 vesz 750,000 token, amely működik, hogy durván 250 óra audio dollár. A legtöbb felhasználó soha nem költ semmit a szabad napi medence magában foglalja a rövid klipek, hangjegyeket, és egyszeri podcasts.

Question 9

Kaphatnék szószintű időbélyegeket kínai audio-hoz?

Accepted Answer

Igen, mind a szegmensszint (minden ~10-30 másodpercben) mind a szószint időbélyegek rendelkezésre állnak. A Word-szint az alapértelmezett a VTT/SRT felirat exportálásnál, így a feliratok szinkronizálják a vonal-by-line-t. Az API időbélyegzetek="word" a kérési szervben. kínai transzkriptumok visszakerülnek natív Han karakterekben (UTF-8), egyszerűsített vagy hagyományos, a forrás audiótól és ISO kódtól függően.

Question 10

Van API a kínai transzkripcióhoz?

Accepted Answer

Igen. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=zh

Question 11

Le tudom fordítani a kínai átiratot egy másik nyelvre?

Accepted Answer

Igen, miután az átírás befejeződött, kattintson a fordításra vagy a szöveg beillesztésére a /translate/. kínai párok minden más nyelv támogatjuk (200+). Találkozó percek cső az átirat keresztül /összefoglaló /; a dubbing küldje el /voice/tts / hogy audio a célnyelven.

Question 12

Mi van, ha a kínai audio zajos vagy gyenge minőségű?

Accepted Answer

Suttogó 680K óra zajos valós világ audio, így kínai transzkripció robusztus háttérzaj, zenei ágyak és telefonminőség felvételek. Súlyos vágás vagy több átfedő hangszórók még mindig fáj a pontosság.Ha egy átirat használhatatlan, e-mail contact@free.ai with the file ~ visszatérítjük a tokeneket, és megnézzük, hogy egy másik motor jobban kezeli-e az audiót.

Nyelv	kínai
ISO-kód	`zh`
AI-modell	gyorsabb sípolókészülék
Ár	Ingyenes

Ingyenes kínai átirat

Hogyan működik?

kínai Átírási jellemzők

Nyelvi adatok

További nyelvek

GYIK