Khmer ntụgharị
Kpọnye Khmer ụda na vidio n'ime ngwe na AI. N'ụzọ nkịtị, n'ụzọ ziri ezi, nakwa n'efu.
Otú ọ dị
- Gaa n'ebe ahụ Free.ai Transcriber
- Upload your Khmer audio or video file
- AI anyị na-ahụta Khmer na-atụgharị ya
- Bubata transcript gị dịka ngwe mọọbụ SRT subtitle
Khmer Njirimara ntụgharị
- ✓Émegharịrị site na fáịst-whisper (MIT licensed)
- ✓Ndesịta asụsụ Khmer nkeonwe
- ✓MP3, WAV, MP4, M4A, FLAC, na ndị ọzọ
- ✓Ńkwádò ná saịbịtị́ (SRT)
- ✓Enweghị ụhara faịlụ na-akwụ ụgwọ
- ✓N'onwe gị nakwa n'ụzọ dị adị -- faịlụ ndị ahụ a ga-ehichapụ mgbe a ga-ewepụ ha
Ndesịta ozi asụsụ
| Asụsụ | Khmer |
| ISO Code | km |
| Model | Faịst-whisper |
| Nhazi | _Nkebi |
Asụsụ ndị ọzọ
Gosi asụsụ niileAjụjụ ndị na-emekarị
Khmer bụ asụsụ nke na-enweghị isi maka Whisper - nnukwu-v3-turbo nọ n'elu 25% nke okwu nkebi ọnụọgụgụ, mgbe ụfọdụ n'elu. Ntụgharị ahụ bara uru maka ọchụchọ na gist ma ọ gaghị adị ka ọ dị ka mbipụta-n'oge. Ọ bụrụ na engine dị elu-n'oge na-adị maka Khmer anyị na-eweta ya n'ụzọ nkịtị.(Tier D, over 25% word error rate na benchmark sets - anyị na-ebipụta WER tiers n'onwe ya kama ịzụ ahịa.)
Ya - Khmer transcription na-akpụpụta site na token pool gị n'ụbọchị n'ụbọchị n'oge mbụ. Audio na-akwụ ụgwọ banyere 50 tokens kwa nkeji, yabụ na pool ụbọchị ọha na eze na-ekpuchi oge ole na ole nke audio kwa ụbọchị. Akaụntụ ndị ejiri akaụntụ nweta nnukwu pool nakwa 10,000 tokens. Past na, $1 na-azụta 750,000 tokens (~250 awa nke audio).
Khmer transcripts a na-eziga n'ime UTF-8 nke ụkpụrụ na-asụgharị asụsụ.
MP3, WAV, M4A, FLAC, OGG, OPUS, na WEBM a na-anabata ha n'ụzọ ziri ezi. Maka vidiyo (MP4, MOV, MKV) anyị na-ewepụ ụda-ọnụ ụzọ-n'akụkụ tupu'ịziga ya na Whisper - ị gaghị enwe mkpa ịgbanwe ihe ọ bụla onwe gị. Pipeline dị iche iche n'agbanyeghị asụsụ isi, gụnyere Khmer.
Nhazi agbakwunyere nke anọnimị na-eru 500 MB kwa faịlụ. Akaụntụ ndị ejirila akaụntụ rụọ ọrụ na-aga ruo 2 GB. Oge dị ogologo abụghị oke - faịlụ ndị dị ogologo na-echekwa onwe ha (30-sekọnd windo na-ekpuchi) nakwa a na-echekwa ha n'ime transcript ọbụla na oge n'ime oge. Ọtụtụ-ụbọchị Khmer rekọsitị (podcasts, full lectures, meetings) na-arụ ọrụ nke ọma.
Ya - diarization nke onye na-ekwu okwu bụ na-arụ ọrụ site na difọ́ọ̀ltụ̀ maka transcript Khmer ọbụla. Ọnụọgụgụ ahụ e mepụtara dịka Onye na-ekwu okwu 1 / Onye na-ekwu okwu 2 / Onye na-ekwu okwu 3 na oge, yabụ nnyocha, panel nchọgharị, na multi-party nchọgharị na-abịa azụ na-edepụtara. Diarization na-arụ ọrụ na módélụ dị iche iche nakwa na asụsụ niile anyị na-akwado.
Ya - pịa URL na /transcribe/youtube/ maka YouTube ma ọ bụ /transcribe/podcast/ maka podcast feeds (Apple, Spotify, RSS). Anyị na-ebudata ụda, na-agbagharị ya site na Whisper na asụsụ=km, na-eziga ntụgharị ahụ na oge na ndị na-ekwu okwu. Khmer njirimara: nkuzi, nnyocha, ozi olu, na YouTube ọdịnaya na Khmer niile ọrụ — pịa a URL na /transcribe/youtube/ ma ọ bụ ibudata faịlụ n'ụzọ ziri ezi.
Whisper na-akwụ ụgwọ ihe dịka 50 tokens kwa nkeji nke ụda, yabụ na ọ bụ otu awa nke ịkọ ihe bụ ~ 3,000 tokens. $ 1 na-azụta 750,000 tokens, nke na-arụ ọrụ ruo awa 250 nke ụda kwa dollar. Ndị ọrụ ndị ọzọ anaghị akwụ ụgwọ ihe ọ bụla - ọ dịghị ihe ọ bụla n'ụbọchị n'ụbọchị n'ụbọchị, ụda na-ekwu okwu, na otu-off podcasts.
Ya - segment-level (ọbụla ~10-30 sekọnd) na oge-iheomume nke okwu dị n'okpuru dị. Okwu-iheomume bụ difọ́ọ̀ltụ̀ maka VTT/SRT subtitle mbubata ka isiokwu ndị ahụ synchronize laịnụ-site na-laịnụ. Na API họrọ oge-iheomume "okwu" na n'ime ahụ nke arịrịọ ahụ. Khmer transcripts a na-eziga n'ime UTF-8 nke ụkpụrụ na-asụgharị asụsụ.
Ya. POST ụda (ọtụtụ akụkụ/fomu-data, aha mpaghara "faịlụ") na /v1/transcribe/ na asụsụ=km - mọọbụ hapụ asụsụ parameters ka Whisper chọpụta onwe ya. Na-eziga JSON na transcript, segments, timestamps, na speaker labels. Nkọwa zuru ezu na SDK snippets na /api/.
Ya - mgbe ntụgharị ahụ gasịrị, pịa Gbanwee mọọbụ pịa ngwe ahụ na /translate/. Khmer na-ejikọta na asụsụ ndị ọzọ niile anyị na-akwado (200+). Maka nhọpụta nkeji, pịa ntụgharị ahụ site na /summarize/; maka ịgụgharị, zipụ ya na /voice/tts/ ka ịmepụta ụda na asụsụ n'ihe nlereanya.
Nkụzi ụda Whisper na-enyere aka na nke a - nke a na-agaghị enyere aka bụ ọnụọgụgụ nke Khmer ụda Whisper hụrụ n'oge nkụzi, ọ bụghị ụda. Ọnụọgụgụ studio dị ọcha na-abịakwute ụda ụda, mana ọ gaghị adị n'ụzọ ziri ezi ị ga-enweta na asụsụ dị elu.Ọ bụrụ na transcript na-abịa azụ na-enweghị ike iji, zitere ozi-e contact@free.ai na faịlụ ahụ — anyị ga-ewereghachi ego ndị ahụ ma hụ ma engine ọzọ na-ejikwa ụda gị ka mma.