Question 1

Sa e saktë është transkriptimi i Whisper për arabisht?

Accepted Answer

Whisper large-v3-turbo trajton arabisht me sukses — 7-15% gabim fjalësh në audion e standartit. Prit zëvendësime të rralla në entitete me emër, numra dhe fjalor të dendur teknik; shumica e transkriptimit do të jetë korrekt.(Nivel B, 7-15% word error rate në setët e standarteve - ne publikojmë nivelet e ndershme WER në vend të pretendimeve të marketingut.)

Question 2

A është arabisht audio-në-tekst transkriptim i lirë?

Accepted Answer

Po — arabisht transkripton së pari nga pool-i juaj i përditshëm i token-ëve të lirë. Audio kushton rreth 50 token-ë për minutë, kështu që pool-i i përditshëm anonim mbulon disa orë audio në ditë. Llogaritë e regjistruara marrin një pool më të madh plus 10,000 token-ë të regjistrimit. Pas kësaj, $1 ble 750,000 token-ë (~250 orë audio).

Question 3

A mund të trajtojë transkriptori dialektet arabisht?

Accepted Answer

Arabishtja trajtohet në nivelin e Standardit Modern Arab (MSA) në mënyrë të prezgjedhur. Fjalimet e folura egjiptiane, levanteze, të Gjirit dhe Maghrebi njihen por transkribohen në ortografinë MSA - Whisper nuk romanizon apo ruan ortografinë e veçantë të dialektit. Për lajmet/leksionet e pastër MSA, prit saktësi të nivelit B; Maghrebi e rëndë ose fjalimet e folura egjiptiane shtyjnë atë më poshtë.

Question 4

Çfarë formatesh audio suportohen për transkriptimin arabisht?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS dhe WEBM pranohen direkt. Për video (MP4, MOV, MKV) nxjerrim audion në server para se ta dërgojmë tek Whisper — nuk duhet të konvertoni asgjë vetë. E njëjta procedurë pavarësisht nga gjuha e burimit, duke përfshirë arabisht.

Question 5

Sa i gjatë mund të jetë një file audio arabisht?

Accepted Answer

Maksimumi i ngarkimit anonim është rreth 500 MB për file. Llogaritë e regjistruara arrijnë deri në 2 GB. Kohëzgjatja nuk është një kufizim i fortë — file të gjatë ndahen automatikisht (dritare 30 sekonda me mbivendosje) dhe ripërmbledhen në një transkriptim të vetëm me shenja kohe të vazhdueshme. Regjistrimet arabisht me shumë orë (podcast, leksione të plota, takime) punojnë mirë.

Question 6

A e identifikon transkripta arabisht folës të ndryshëm?

Accepted Answer

Po — diarizimi i folësit është i aktivizuar në mënyrë të prezgjedhur për çdo transkriptim arabisht. Rezultati është i segmentuar si Folësi 1 / Folësi 2 / Folësi 3 me shenja kohore, kështu që intervistat, diskutimet e panelit dhe takimet me shumë pjesëmarrës kthehen të etiketuara. Diarizimi kryhet në një model të veçantë dhe punon në të njëjtën mënyrë në të gjitha gjuhët që ne suportojmë.

Question 7

A mund të transkriboj një video apo podcast të arabisht në YouTube?

Accepted Answer

Po — ngjite URL në /transcribe/youtube/ për YouTube ose /transcribe/podcast/ për podcast feeds (Apple, Spotify, RSS). Shkarkojmë audion, e ekzekutojmë nëpërmjet Whisper me language=ar, dhe kthehemi tek transkriptimi me shenjat e kohës dhe etiketat e folësit. Përmbajtja tipikisht arabisht: klipet e lajmeve, predikimet, leksionet dhe intervistat politike në arabisht janë më të zakonshmet; ngjite një URL të YouTube në /transcribe/youtube/ ose ngarko file.

Question 8

Sa kushton një orë audio arabisht në token?

Accepted Answer

Whisper kushton rreth 50 token për minutë të audios, kështu që një regjistrim një-orësh është ~3,000 token. $1 ble 750,000 token, që do të thotë rreth 250 orë audio për dollar. Shumica e përdoruesve nuk shpenzojnë asgjë — rezerva e përditshme falas mbulon klipe të shkurtra, shënime zëri dhe podcast të një-hershëm.

Question 9

A mund të marr një stampë kohore në nivel fjalësh për audion arabisht?

Accepted Answer

Po — janë në dispozicion si markat e kohës në nivel segmenti (çdo ~10-30 sekonda) ashtu edhe në nivel fjalëje. Niveli fjalë është i prezgjedhur për eksportimin e subtitrave VTT/SRT kështu që subtitrat sinkronizohen rresht pas rreshti. Në API vendos timestamps="word" në trupin e kërkesës. arabisht transcripts kthehen në skriptët e tyre native nga e djathta në të majtë dhe shfaqen siç duhet në çdo shikues RTL-aware (shfletues, Word, Google Docs).

Question 10

A ka një API për transkriptimin arabisht?

Accepted Answer

Po. POST audio (multipart/form-data, emri i fushës "file") tek /v1/transcribe/ me gjuhë=ar — ose hiqni parametrin e gjuhës për të lejuar Whisper të zbulojë automatikisht. Kthen JSON me transkriptimin, segmentet, shenjat e kohës dhe etiketat e folësit. Referenca e plotë dhe fragmentet e SDK në /api/.

Question 11

A mund ta përkthej transkriptën e arabisht në një gjuhë tjetër?

Accepted Answer

Po — sapo të përfundojë transkriptimi, kliko Përkthe ose ngjite tekstin në /translate/. arabisht është i lidhur me çdo gjuhë tjetër që suportojmë (200+). Për minutat e takimit, transkriptimi duhet të dërgohet nëpërmjet /summarize/; për dublimin dërgoje tek /voice/tts/ për të prodhuar audion në gjuhën e synuar.

Question 12

Çfarë nëse audio arabisht është me zhurmë apo cilësi të ulët?

Accepted Answer

Whisper është trajnuar me qindra mijëra orë të regjistrimit të zërit të botës reale, kështu që toleron zhurmën e sfondit dhe regjistrimet me cilësi të lartë telefonike në arabisht. Për rezultate më të mira, siguro audio të pastër (mikrofoni i kufjes, pa shtrat muzikor) — në këtë nivel zhurma përbën normën bazë të gabimit.Nëse një transkriptim kthehet i papërdorshëm, dërgo email në contact@free.ai me dosjen — ne do të kthejmë token-ët dhe do të shohim nëse një motor tjetër trajton audion tuaj më mirë.

Gjuha	arabisht
Kodi ISO	`ar`
Modeli	pëshpëritja-e-shpejtë
Çmimi	I lirë

arabisht e lirë Transkriptim

Si funksionon

arabisht Funksionet e transkriptimit

Detaje gjuhe

Më shumë gjuhë

FAQ