Cantonese ntụgharị

Kpọnye Cantonese ụda na vidio n'ime ngwe na AI. N'ụzọ nkịtị, n'ụzọ ziri ezi, nakwa n'efu.

Otú ọ dị

  1. Gaa n'ebe ahụ Free.ai Transcriber
  2. Upload your Cantonese audio or video file
  3. AI anyị na-ahụta Cantonese na-atụgharị ya
  4. Bubata transcript gị dịka ngwe mọọbụ SRT subtitle

Cantonese Njirimara ntụgharị

  • Émegharịrị site na fáịst-whisper (MIT licensed)
  • Ndesịta asụsụ Cantonese nkeonwe
  • MP3, WAV, MP4, M4A, FLAC, na ndị ọzọ
  • Ńkwádò ná saịbịtị́ (SRT)
  • Enweghị ụhara faịlụ na-akwụ ụgwọ
  • N'onwe gị nakwa n'ụzọ dị adị -- faịlụ ndị ahụ a ga-ehichapụ mgbe a ga-ewepụ ha

Ndesịta ozi asụsụ

AsụsụCantonese
ISO Codeyue
ModelFaịst-whisper
Nhazi_Nkebi

Asụsụ ndị ọzọ

Gosi asụsụ niile

Ajụjụ ndị na-emekarị

Cantonese bụ asụsụ nke na-enweghị isi maka Whisper - nnukwu-v3-turbo nọ n'elu 25% nke okwu nkebi ọnụọgụgụ, mgbe ụfọdụ n'elu. Ntụgharị ahụ bara uru maka ọchụchọ na gist ma ọ gaghị adị ka ọ dị ka mbipụta-n'oge. Ọ bụrụ na engine dị elu-n'oge na-adị maka Cantonese anyị na-eweta ya n'ụzọ nkịtị.(Tier D, over 25% word error rate na benchmark sets - anyị na-ebipụta WER tiers n'onwe ya kama ịzụ ahịa.)

Ya - Cantonese transcription na-akpụpụta site na token pool gị n'ụbọchị n'ụbọchị n'oge mbụ. Audio na-akwụ ụgwọ banyere 50 tokens kwa nkeji, yabụ na pool ụbọchị ọha na eze na-ekpuchi oge ole na ole nke audio kwa ụbọchị. Akaụntụ ndị ejiri akaụntụ nweta nnukwu pool nakwa 10,000 tokens. Past na, $1 na-azụta 750,000 tokens (~250 awa nke audio).

Cantonese transcripts a na-eziga n'ime UTF-8 nke ụkpụrụ na-asụgharị asụsụ.

MP3, WAV, M4A, FLAC, OGG, OPUS, na WEBM a na-anabata ha n'ụzọ ziri ezi. Maka vidiyo (MP4, MOV, MKV) anyị na-ewepụ ụda-ọnụ ụzọ-n'akụkụ tupu'ịziga ya na Whisper - ị gaghị enwe mkpa ịgbanwe ihe ọ bụla onwe gị. Pipeline dị iche iche n'agbanyeghị asụsụ isi, gụnyere Cantonese.

Nhazi agbakwunyere nke anọnimị na-eru 500 MB kwa faịlụ. Akaụntụ ndị ejirila akaụntụ rụọ ọrụ na-aga ruo 2 GB. Oge dị ogologo abụghị oke - faịlụ ndị dị ogologo na-echekwa onwe ha (30-sekọnd windo na-ekpuchi) nakwa a na-echekwa ha n'ime transcript ọbụla na oge n'ime oge. Ọtụtụ-ụbọchị Cantonese rekọsitị (podcasts, full lectures, meetings) na-arụ ọrụ nke ọma.

Ya - diarization nke onye na-ekwu okwu bụ na-arụ ọrụ site na difọ́ọ̀ltụ̀ maka transcript Cantonese ọbụla. Ọnụọgụgụ ahụ e mepụtara dịka Onye na-ekwu okwu 1 / Onye na-ekwu okwu 2 / Onye na-ekwu okwu 3 na oge, yabụ nnyocha, panel nchọgharị, na multi-party nchọgharị na-abịa azụ na-edepụtara. Diarization na-arụ ọrụ na módélụ dị iche iche nakwa na asụsụ niile anyị na-akwado.

Ya - pịa URL na /transcribe/youtube/ maka YouTube ma ọ bụ /transcribe/podcast/ maka podcast feeds (Apple, Spotify, RSS). Anyị na-ebudata ụda, na-agbagharị ya site na Whisper na asụsụ=yue, na-eziga ntụgharị ahụ na oge na ndị na-ekwu okwu. Cantonese njirimara: nkuzi, nnyocha, ozi olu, na YouTube ọdịnaya na Cantonese niile ọrụ — pịa a URL na /transcribe/youtube/ ma ọ bụ ibudata faịlụ n'ụzọ ziri ezi.

Whisper na-akwụ ụgwọ ihe dịka 50 tokens kwa nkeji nke ụda, yabụ na ọ bụ otu awa nke ịkọ ihe bụ ~ 3,000 tokens. $ 1 na-azụta 750,000 tokens, nke na-arụ ọrụ ruo awa 250 nke ụda kwa dollar. Ndị ọrụ ndị ọzọ anaghị akwụ ụgwọ ihe ọ bụla - ọ dịghị ihe ọ bụla n'ụbọchị n'ụbọchị n'ụbọchị, ụda na-ekwu okwu, na otu-off podcasts.

Ya - segment-level (ọbụla ~10-30 sekọnd) na oge-iheomume nke okwu dị n'okpuru dị. Okwu-iheomume bụ difọ́ọ̀ltụ̀ maka VTT/SRT subtitle mbubata ka isiokwu ndị ahụ synchronize laịnụ-site na-laịnụ. Na API họrọ oge-iheomume "okwu" na n'ime ahụ nke arịrịọ ahụ. Cantonese transcripts a na-eziga n'ime UTF-8 nke ụkpụrụ na-asụgharị asụsụ.

Ya. POST ụda (ọtụtụ akụkụ/fomu-data, aha mpaghara "faịlụ") na /v1/transcribe/ na asụsụ=yue - mọọbụ hapụ asụsụ parameters ka Whisper chọpụta onwe ya. Na-eziga JSON na transcript, segments, timestamps, na speaker labels. Nkọwa zuru ezu na SDK snippets na /api/.

Ya - mgbe ntụgharị ahụ gasịrị, pịa Gbanwee mọọbụ pịa ngwe ahụ na /translate/. Cantonese na-ejikọta na asụsụ ndị ọzọ niile anyị na-akwado (200+). Maka nhọpụta nkeji, pịa ntụgharị ahụ site na /summarize/; maka ịgụgharị, zipụ ya na /voice/tts/ ka ịmepụta ụda na asụsụ n'ihe nlereanya.

Nkụzi ụda Whisper na-enyere aka na nke a - nke a na-agaghị enyere aka bụ ọnụọgụgụ nke Cantonese ụda Whisper hụrụ n'oge nkụzi, ọ bụghị ụda. Ọnụọgụgụ studio dị ọcha na-abịakwute ụda ụda, mana ọ gaghị adị n'ụzọ ziri ezi ị ga-enweta na asụsụ dị elu.Ọ bụrụ na transcript na-abịa azụ na-enweghị ike iji, zitere ozi-e contact@free.ai na faịlụ ahụ — anyị ga-ewereghachi ego ndị ahụ ma hụ ma engine ọzọ na-ejikwa ụda gị ka mma.

Ị hụrụ Free.ai? Kpọtụrụ enyi gị!

Ihu ndị a