Ingyenes kínai átirat

Átírás kínai audio és videó szöveges MI. Gyors, pontos, és ingyenes.

Hogyan működik?

  1. Menj a... Free.ai transzcriber
  2. kínai hang- vagy videófájl feltöltése
  3. A MI automatikusan észleli kínai és leírja azt
  4. Töltse le az átiratát szövegként vagy SRT feliratként

kínai Átírási jellemzők

  • Gyorsabb suttogóval működtetve (MIT engedélyezve)
  • Automatikus kínai nyelvfelismerés
  • Támogatja az MP3, WAV, MP4, M4A, FLAC és több
  • Időbélyegzők és feliratexport (SRT)
  • A fizetett tervekre vonatkozó fájlméret-korlátozások hiánya
  • Privát és biztonságos -- fájlokat törölnek feldolgozás után

Nyelvi adatok

Nyelvkínai
ISO-kódzh
AI-modellgyorsabb sípolókészülék
ÁrIngyenes

További nyelvek

Minden nyelv megtekintése

GYIK

Whisper large-v3-turbo lands in its his top accurity level on kínai html in 7% word error rate on standard criteria. A gyakorlatban ez azt jelenti, hogy a tiszta stúdió audio jön vissza közel tökéletes, és társalgási audio használható minimális tisztítás.(Tier A, under 7% word error rate a referencia szettekben a tisztességes WER-szinteket adjuk ki, nem pedig a marketingköveteléseket.)

Igen kínai transzkripció először a napi ingyenes token medencédből indul ki. A hang kb. 50 token per percbe kerül, így az anonim napi pool néhány óra audiót fed le naponta. A beiratkozott számlák nagyobb medencét és 10 000 regisztrációs zsetont kapnak. Ezt követően $1 750,000 tokent (~250 óra audió).

Pass language=zh for Mandarin (the default ~ egyszerűsített vagy hagyományos kimenet a forrástól függően). For Cantonese use language=yue if you audio is Hong Kong / Guangzhou speak; Cantonese transcribed as zh will produce a Mandarin-ortográfia approximation that lose tones and slang.

MP3, WAV, M4A, FLAC, OGG, OPUS és WEBM közvetlenül elfogadott. Videóhoz (MP4, MOV, MKV) kivonjuk az audio track szerver-oldalt, mielőtt elküldjük Whisper-nek. Nem kell átalakítani semmit magad. Ugyanaz a csővezeték, függetlenül a forrásnyelvtől, beleértve a kínai-t.

Névtelen feltöltési sapka körülbelül 500 MB egy fájlra. Beiratkozott számlák felmegy 2 GB. Időtartama nem egy kemény limit hosszú fájlokat darabolnak automatikusan (30 másodperces ablakok átfedéssel) és varrtak vissza egy átiratot folyamatos időbélyegek. Több órás kínai felvételek (podcasts, teljes előadások, találkozók) jól működnek.

Igen, minden kínai transzkripciónál alapértelmezés szerint a hangszóró diarizációja be van jelölve. A kimenet Speaker 1 / Speaker 2 / Speaker 3 időbélyegekkel, így interjúk, panelbeszélgetések és többpárti találkozók visszajönnek. A diarization egy külön modellen fut, és ugyanazt a munkát végzi minden nyelven, amit támogatunk.

Igen, beillesztjük az URL-t a /transcribe/youtube-ba vagy a /transcribe/podcast/ podcast-be (Apple, Spotify, RSS). Letöltjük az audiót, lefuttatjuk Whisperen keresztül a nyelvvel=zh, és visszaadjuk az átiratot időbélyegekkel és hangszóró címkékkel.Tipikus kínai tartalom: A kínai-ben található podcastok, előadások, interjúk és hosszú formátumú YouTube tartalmak a leggyakoribb munkaterhelések, amiket látunk.

Whisper költségek körülbelül 50 token per perc audio, így egy egy órás felvétel ~3,000 token. $1 vesz 750,000 token, amely működik, hogy durván 250 óra audio dollár. A legtöbb felhasználó soha nem költ semmit a szabad napi medence magában foglalja a rövid klipek, hangjegyeket, és egyszeri podcasts.

Igen, mind a szegmensszint (minden ~10-30 másodpercben) mind a szószint időbélyegek rendelkezésre állnak. A Word-szint az alapértelmezett a VTT/SRT felirat exportálásnál, így a feliratok szinkronizálják a vonal-by-line-t. Az API időbélyegzetek="word" a kérési szervben. kínai transzkriptumok visszakerülnek natív Han karakterekben (UTF-8), egyszerűsített vagy hagyományos, a forrás audiótól és ISO kódtól függően.

Igen. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=zh

Igen, miután az átírás befejeződött, kattintson a fordításra vagy a szöveg beillesztésére a /translate/. kínai párok minden más nyelv támogatjuk (200+). Találkozó percek cső az átirat keresztül /összefoglaló /; a dubbing küldje el /voice/tts / hogy audio a célnyelven.

Suttogó 680K óra zajos valós világ audio, így kínai transzkripció robusztus háttérzaj, zenei ágyak és telefonminőség felvételek. Súlyos vágás vagy több átfedő hangszórók még mindig fáj a pontosság.Ha egy átirat használhatatlan, e-mail contact@free.ai with the file ~ visszatérítjük a tokeneket, és megnézzük, hogy egy másik motor jobban kezeli-e az audiót.

Love this tool? Share it!

Szavazz erre az oldalra