Arabiikị ntụgharị

Kpọnye Arabiikị ụda na vidio n'ime ngwe na AI. N'ụzọ nkịtị, n'ụzọ ziri ezi, nakwa n'efu.

Otú ọ dị

  1. Gaa n'ebe ahụ Free.ai Transcriber
  2. Upload your Arabiikị audio or video file
  3. AI anyị na-ahụta Arabiikị na-atụgharị ya
  4. Bubata transcript gị dịka ngwe mọọbụ SRT subtitle

Arabiikị Njirimara ntụgharị

  • Émegharịrị site na fáịst-whisper (MIT licensed)
  • Ndesịta asụsụ Arabiikị nkeonwe
  • MP3, WAV, MP4, M4A, FLAC, na ndị ọzọ
  • Ńkwádò ná saịbịtị́ (SRT)
  • Enweghị ụhara faịlụ na-akwụ ụgwọ
  • N'onwe gị nakwa n'ụzọ dị adị -- faịlụ ndị ahụ a ga-ehichapụ mgbe a ga-ewepụ ha

Ndesịta ozi asụsụ

AsụsụArabiikị
ISO Codear
ModelFaịst-whisper
Nhazi_Nkebi

Asụsụ ndị ọzọ

Gosi asụsụ niile

Ajụjụ ndị na-emekarị

Whisper large-v3-turbo na-ejikwa Arabiikị n'ụzọ zuru ezu - 7-15% nke okwu nkebi na benchmark ụda. Nwere ike ịtụ anya mgbanwe oge ụfọdụ na aha entities, nọmba, na okwu ndị a na-asụgharị n'ụzọ zuru ezu; akụkụ nke transcript ga-adị n'ụzọ ziri ezi.(Tier B, 7-15% word error rate na benchmark sets - anyị na-ebipụta WER tiers n'onwe ya kama ịzụ ahịa.)

Ya - Arabiikị transcription na-akpụpụta site na token pool gị n'ụbọchị n'ụbọchị n'oge mbụ. Audio na-akwụ ụgwọ banyere 50 tokens kwa nkeji, yabụ na pool ụbọchị ọha na eze na-ekpuchi oge ole na ole nke audio kwa ụbọchị. Akaụntụ ndị ejiri akaụntụ nweta nnukwu pool nakwa 10,000 tokens. Past na, $1 na-azụta 750,000 tokens (~250 awa nke audio).

Arabic a na-ejikwa ya na Modern Standard Arabic (MSA) n'ụzọ difọ́ọ̀ltụ̀. A na-ahụta okwu Egyptian, Levantine, Gulf, nakwa Maghrebi na-asụgharị ya n'ụzọ na-asụgharị ya n'ụzọ MSA - Whisper anaghị egosi ya na Roman ma ọ bụ na-echekwa njirimara nke njirimara nke njirimara. Maka ozi/ọmụmụ ihe MSA zuru ezu, na-atụ anya nghọta nke tier-B; Maghrebi ma ọ bụ Arabic na-asụgharị ya n'ụzọ na-asụgharị ya n'ụzọ dị ala.

MP3, WAV, M4A, FLAC, OGG, OPUS, na WEBM a na-anabata ha n'ụzọ ziri ezi. Maka vidiyo (MP4, MOV, MKV) anyị na-ewepụ ụda-ọnụ ụzọ-n'akụkụ tupu'ịziga ya na Whisper - ị gaghị enwe mkpa ịgbanwe ihe ọ bụla onwe gị. Pipeline dị iche iche n'agbanyeghị asụsụ isi, gụnyere Arabiikị.

Nhazi agbakwunyere nke anọnimị na-eru 500 MB kwa faịlụ. Akaụntụ ndị ejirila akaụntụ rụọ ọrụ na-aga ruo 2 GB. Oge dị ogologo abụghị oke - faịlụ ndị dị ogologo na-echekwa onwe ha (30-sekọnd windo na-ekpuchi) nakwa a na-echekwa ha n'ime transcript ọbụla na oge n'ime oge. Ọtụtụ-ụbọchị Arabiikị rekọsitị (podcasts, full lectures, meetings) na-arụ ọrụ nke ọma.

Ya - diarization nke onye na-ekwu okwu bụ na-arụ ọrụ site na difọ́ọ̀ltụ̀ maka transcript Arabiikị ọbụla. Ọnụọgụgụ ahụ e mepụtara dịka Onye na-ekwu okwu 1 / Onye na-ekwu okwu 2 / Onye na-ekwu okwu 3 na oge, yabụ nnyocha, panel nchọgharị, na multi-party nchọgharị na-abịa azụ na-edepụtara. Diarization na-arụ ọrụ na módélụ dị iche iche nakwa na asụsụ niile anyị na-akwado.

Ya - pịa URL na /transcribe/youtube/ maka YouTube ma ọ bụ /transcribe/podcast/ maka podcast feeds (Apple, Spotify, RSS). Anyị na-ebudata ụda, na-agbagharị ya site na Whisper na asụsụ=ar, na-eziga ntụgharị ahụ na oge na ndị na-ekwu okwu. Arabiikị njirimara: nkiri akụkọ, ozi, nkuzi, na nnyocha n'ihe gbasara ọchịchị na Arabiikị bụ ihe ndị kasị a na-arụ ọrụ; pịa YouTube URL na /transcribe/youtube/ ma ọ bụ wụnye faịlụ ahụ.

Whisper na-akwụ ụgwọ ihe dịka 50 tokens kwa nkeji nke ụda, yabụ na ọ bụ otu awa nke ịkọ ihe bụ ~ 3,000 tokens. $ 1 na-azụta 750,000 tokens, nke na-arụ ọrụ ruo awa 250 nke ụda kwa dollar. Ndị ọrụ ndị ọzọ anaghị akwụ ụgwọ ihe ọ bụla - ọ dịghị ihe ọ bụla n'ụbọchị n'ụbọchị n'ụbọchị, ụda na-ekwu okwu, na otu-off podcasts.

Ya - segment-level (ọbụla ~10-30 sekọnd) na oge-iheomume nke okwu dị n'okpuru dị. Okwu-iheomume bụ difọ́ọ̀ltụ̀ maka VTT/SRT subtitle mbubata ka isiokwu ndị ahụ synchronize laịnụ-site na-laịnụ. Na API họrọ oge-iheomume "okwu" na n'ime ahụ nke arịrịọ ahụ. Arabiikị transcripts na-ebuli n'ime ha native-right-to-left script na-egosipụta nke ọma na ọbụla RTL-aware onyenlereanya (nchọgharị, Word, Google Docs).

Ya. POST ụda (ọtụtụ akụkụ/fomu-data, aha mpaghara "faịlụ") na /v1/transcribe/ na asụsụ=ar - mọọbụ hapụ asụsụ parameters ka Whisper chọpụta onwe ya. Na-eziga JSON na transcript, segments, timestamps, na speaker labels. Nkọwa zuru ezu na SDK snippets na /api/.

Ya - mgbe ntụgharị ahụ gasịrị, pịa Gbanwee mọọbụ pịa ngwe ahụ na /translate/. Arabiikị na-ejikọta na asụsụ ndị ọzọ niile anyị na-akwado (200+). Maka nhọpụta nkeji, pịa ntụgharị ahụ site na /summarize/; maka ịgụgharị, zipụ ya na /voice/tts/ ka ịmepụta ụda na asụsụ n'ihe nlereanya.

Whisper a na-akụzi ya n'ọtụtụ puku awa nke ụda nke ụwa, yabụ ọ na-ewere ụda nke n'okpuru nakwa ụda nke ekwentị na Arabiikị. Maka nsonaazụ kacha mma, nyefee ụda dị ọcha (mikrofòn nke ọdụdụ, enweghị ụda nke ụda) - na nke a ụda nke elu ahụ na-ejikọta ọnụọgụgụ njehie nke baseline.Ọ bụrụ na transcript na-abịa azụ na-enweghị ike iji, zitere ozi-e contact@free.ai na faịlụ ahụ — anyị ga-ewereghachi ego ndị ahụ ma hụ ma engine ọzọ na-ejikwa ụda gị ka mma.

Ị hụrụ Free.ai? Kpọtụrụ enyi gị!

Ihu ndị a