B'xejn Għarbi Traskrizzjoni
Ittraskrivi Għarbi awdjo u vidjow għal test b'AI. Mgħaġġel, preċiż u b'xejn.
Kif jaħdem
- Mur fil- Free.ai Traskritur
- Ittella' l-fajl awdjo jew vidjo Għarbi tiegħek
- L-AI tagħna awtomatikament jiskopri Għarbi u jittraskriviha
- Niżżel it-traskrizzjoni tiegħek bħala test jew sottotitli SRT
Għarbi Karatteristiċi tat-Traskrizzjoni
- ✓Powered by aktar mgħaġġel-whisper (MIT liċenzjati)
- ✓Sejbien awtomatiku tal-lingwa Għarbi
- ✓Jappoġġja MP3, WAV, MP4, M4A, FLAC, u aktar
- ✓Timbru tal-ħin u sottotitli esportazzjoni (SRT)
- ✓L-ebda limiti tad-daqs tal-fajl fuq il-pjanijiet imħallsa
- ✓Privat u sigur -- fajls huma mħassra wara l-ipproċessar
Dettalji tal-Lingwa
| Il-lingwa | Għarbi |
| Kodiċi ISO | ar |
| Mudell tal-AI | Whisper |
| Prezz | Ħieles |
Aktar Lingwi disponibbli
Ara l-Lingwi KollhaMistoqsijiet Frekwenti
Whisper kbar-v3-turbo jimmaniġġja Għarbi solidament — 7-15% rata żball kelma fuq il-punt ta' riferiment awdjo. tistenna sostituzzjonijiet okkażjonali fuq l-entitajiet imsemmija, in-numri, u vokabularju tekniku densi; il-biċċa l-kbira tal-traskrizzjoni se tkun korretta.(Livell B, 7-15% word error rate fuq settijiet ta' punti ta' riferiment — aħna nippubblikaw livelli WER onesti aktar milli dikjarazzjonijiet ta' kummerċjalizzazzjoni.)
Iva — Għarbi traskrizzjoni jiġbed mill-pool token kuljum ħielsa tiegħek l-ewwel. Awdjo jiswa madwar 50 tokens kull minuta, sabiex il-pool anonimu kuljum tkopri ftit sigħat ta awdjo kuljum. Signed-in kontijiet jiksbu pool akbar flimkien ma 10,000 sinjali reġistrazzjoni. Past li, $ 1 jixtri 750,000 tokens (~ 250 sigħat ta awdjo).
Għarbi huwa mmaniġġjat fil-livell tal-Għarbi Standard Modern (MSA) b'mod awtomatiku. Eġizzjan, Levantine, il-Golf, u l-Maghrebi diskors kollokali huma rikonoxxuti iżda traskritti fl-MSA ortografija — Whisper ma romanization jew jippreserva ortografija dialetto-speċifiċi. Għall-awdjo pura MSA aħbarijiet/lezzjoni jistenna eżattezza tier-B; Maghrebi tqila jew Eġizzjan kollokali timbotta li aktar baxx.
MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM are accepted directly. For video (MP4, MOV, MKV) we extract the audio track server-side before sending it to Whisper — you do not need to convert anything yourself. Same pipeline regardless of source language, including Għarbi.
Il-limitu ta' upload anonimu huwa ta' madwar 500 MB għal kull fajl. Kontijiet li jkunu rreġistrati jmorru sa 2 GB. It-tul mhuwiex limitu strett — fajls twal jiġu maqsuma awtomatikament (twieqi ta' 30 sekonda b'kopertura) u jingħaqdu flimkien f'tranżkript wieħed b'timestamps kontinwi. Reġistrazzjonijiet ta' Għarbi sigħat multipli (podcasts, lekċers sħaħ, laqgħat) jaħdmu tajjeb.
Iva — id-dijarizzazzjoni tal-kelliema hija attivata awtomatikament għal kull traskrizzjoni ta’ Għarbi. L-output huwa segmentat bħala Kelliem 1 / Kelliem 2 / Kelliem 3 b’timestamps, għalhekk intervisti, diskussjonijiet ta’ panel, u laqgħat ta’ diversi partijiet jiġu lura b’tikketta.
Iva — waħħal il-URL f'/transcribe/youtube/ għal YouTube jew /transcribe/podcast/ għal podcast feeds (Apple, Spotify, RSS). Inniżżlu l-awdjo, inħaddmuh permezz ta' Whisper b'lingwa=ar, u nirritornaw it-tranżmissjoni b'timestamps u tikketti tal-kelliema. Kontenut tipiku Għarbi: klipps ta’ aħbarijiet, sermons, lectures, u intervisti politiċi f’Għarbi huma l-aktar xogħol komuni; paste URL ta’ YouTube f’/transcribe/youtube/ jew ittella’ l-fajl.
Whisper jiswa madwar 50 tokens kull minuta tal-awdjo, sabiex reġistrazzjoni siegħa hija ~ 3,000 tokens. $ 1 jixtri 750,000 tokens, li taħdem out biex bejn wieħed u ieħor 250 siegħa tal-awdjo għal kull dollaru. ħafna utenti qatt jonfqu xejn - il-pool kuljum b'xejn tkopri klipps qosra, noti tal-vuċi, u podcasts one-off.
Iva — kemm it-timestamps fil-livell tas-segment (kull ~10-30 sekonda) kif ukoll fil-livell tal-kelma huma disponibbli. Il-livell tal-kelma huwa l-istandard għall-esportazzjoni tas-sottotitoli VTT/SRT sabiex it-titli jiġu sinkronizzati linja b'linja. Fuq l-API, issettja timestamps="word" fil-korp tat-talba. It-transkrizzjonijiet Għarbi jiġu rritornati fl-iskript nattiv tagħhom mil-lemin għax-xellug u jidher b'mod korrett fi kwalunkwe viewer RTL-aware (browsers, Word, Google Docs).
Iva. POST awdjo (multipart/form-data, l-isem tal-qasam "fajl") biex /v1/transcribe/ ma lingwa=ar — jew ommi l-parametru tal-lingwa biex tħalli Whisper awtomatikament jiskopri. Jirritorna JSON bit-transkrizzjoni, segmenti, timestamps, u tikketti kelliem.
Iva — ladarba t-traskrizzjoni tkun lesta, ikklikkja Traduċi jew waħħal it-test f’/translate/. Għarbi jaqbel ma’ kull lingwa oħra li nappoġġjaw (200+). Għal minuti ta’ laqgħat, it-traskrizzjoni għandha tintbagħat permezz ta’ /summarize/; għad-doppjaġġ ibgħatha lil /voice/tts/ biex tirrendi l-awdjo fil-lingwa fil-mira.
Whisper huwa mħarreġ fuq mijiet ta’ eluf ta’ sigħat ta’ awdjo tad-dinja reali, għalhekk jittollera ħsejjes fl-isfond u reġistrazzjonijiet ta’ kwalità tat-telefown fuq Għarbi.Għall-aħjar riżultati, ipprovdi awdjo nadif (mikrofonu tal-headphones, l-ebda sodda tal-mużika) — f’dan il-livell l-istorbju jikkomponi r-rata ta’ żball bażika.Jekk traskrizzjoni tiġi lura ma tistax tintuża, email contact@free.ai bil-fajl — aħna se tirrifondi l-tokens u ħarsa lejn jekk magna differenti jimmaniġġja awdjo tiegħek aħjar.