oksitanisht e lirë Transkriptim
Transkripto oksitanisht audio dhe video në tekst me AI. Shpejtë, saktë dhe falas.
Si funksionon
- Shko tek Transkriptuesi Free.ai
- Ngarko file audio apo video oksitanisht tënd
- AI jonë zbulon automatikisht oksitanisht dhe e transkripton atë
- Shkarko transkriptën si tekst apo subtitra SRT
oksitanisht Funksionet e transkriptimit
- ✓Me fuqi nga faster-whisper (liçensuar nga MIT)
- ✓Zbulimi automatik i gjuhës oksitanisht
- ✓Suporton MP3, WAV, MP4, M4A, FLAC dhe më shumë
- ✓Eksporto
- ✓Pa kufij të madhësisë së file në planet me pagesë
- ✓Privat dhe i sigurt -- files eleminohen pas përpunimit
Detaje gjuhe
| Gjuha | oksitanisht |
| Kodi ISO | oc |
| Modeli | pëshpëritja-e-shpejtë |
| Çmimi | I lirë |
Më shumë gjuhë
Shiko të gjitha gjuhëtFAQ
oksitanisht është një gjuhë me burime më të pakta për Whisper — large-v3-turbo ka mbi 25% gabime fjalësh, ndonjëherë edhe më shumë. Transkriptimi është i dobishëm për kërkimin dhe përmbledhjen, por nuk duhet trajtuar si i gatshëm për publikim. Nëse një motor me saktësi më të lartë bëhet i disponueshëm për oksitanisht, ne e lidhim atë automatikisht.(Nivel D, over 25% word error rate në setët e standarteve - ne publikojmë nivelet e ndershme WER në vend të pretendimeve të marketingut.)
Po — oksitanisht transkripton së pari nga pool-i juaj i përditshëm i token-ëve të lirë. Audio kushton rreth 50 token-ë për minutë, kështu që pool-i i përditshëm anonim mbulon disa orë audio në ditë. Llogaritë e regjistruara marrin një pool më të madh plus 10,000 token-ë të regjistrimit. Pas kësaj, $1 ble 750,000 token-ë (~250 orë audio).
oksitanisht transcripts janë kthyer në standardin UTF-8 me ortografinë normale të gjuhës.
MP3, WAV, M4A, FLAC, OGG, OPUS dhe WEBM pranohen direkt. Për video (MP4, MOV, MKV) nxjerrim audion në server para se ta dërgojmë tek Whisper — nuk duhet të konvertoni asgjë vetë. E njëjta procedurë pavarësisht nga gjuha e burimit, duke përfshirë oksitanisht.
Maksimumi i ngarkimit anonim është rreth 500 MB për file. Llogaritë e regjistruara arrijnë deri në 2 GB. Kohëzgjatja nuk është një kufizim i fortë — file të gjatë ndahen automatikisht (dritare 30 sekonda me mbivendosje) dhe ripërmbledhen në një transkriptim të vetëm me shenja kohe të vazhdueshme. Regjistrimet oksitanisht me shumë orë (podcast, leksione të plota, takime) punojnë mirë.
Po — diarizimi i folësit është i aktivizuar në mënyrë të prezgjedhur për çdo transkriptim oksitanisht. Rezultati është i segmentuar si Folësi 1 / Folësi 2 / Folësi 3 me shenja kohore, kështu që intervistat, diskutimet e panelit dhe takimet me shumë pjesëmarrës kthehen të etiketuara. Diarizimi kryhet në një model të veçantë dhe punon në të njëjtën mënyrë në të gjitha gjuhët që ne suportojmë.
Po — ngjite URL në /transcribe/youtube/ për YouTube ose /transcribe/podcast/ për podcast feeds (Apple, Spotify, RSS). Shkarkojmë audion, e ekzekutojmë nëpërmjet Whisper me language=oc, dhe kthehemi tek transkriptimi me shenjat e kohës dhe etiketat e folësit. Përmbajtja tipikisht oksitanisht: leksionet, intervistat, shënimet zërore dhe përmbajtja e YouTube në oksitanisht funksionojnë të gjitha — ngjite një URL në /transcribe/youtube/ ose ngarko file-n direkt.
Whisper kushton rreth 50 token për minutë të audios, kështu që një regjistrim një-orësh është ~3,000 token. $1 ble 750,000 token, që do të thotë rreth 250 orë audio për dollar. Shumica e përdoruesve nuk shpenzojnë asgjë — rezerva e përditshme falas mbulon klipe të shkurtra, shënime zëri dhe podcast të një-hershëm.
Po — janë në dispozicion si markat e kohës në nivel segmenti (çdo ~10-30 sekonda) ashtu edhe në nivel fjalëje. Niveli fjalë është i prezgjedhur për eksportimin e subtitrave VTT/SRT kështu që subtitrat sinkronizohen rresht pas rreshti. Në API vendos timestamps="word" në trupin e kërkesës. oksitanisht transcripts janë kthyer në standardin UTF-8 me ortografinë normale të gjuhës.
Po. POST audio (multipart/form-data, emri i fushës "file") tek /v1/transcribe/ me gjuhë=oc — ose hiqni parametrin e gjuhës për të lejuar Whisper të zbulojë automatikisht. Kthen JSON me transkriptimin, segmentet, shenjat e kohës dhe etiketat e folësit. Referenca e plotë dhe fragmentet e SDK në /api/.
Po — sapo të përfundojë transkriptimi, kliko Përkthe ose ngjite tekstin në /translate/. oksitanisht është i lidhur me çdo gjuhë tjetër që suportojmë (200+). Për minutat e takimit, transkriptimi duhet të dërgohet nëpërmjet /summarize/; për dublimin dërgoje tek /voice/tts/ për të prodhuar audion në gjuhën e synuar.
Trainimi i zhurmës i Whisper ndihmon më pak në këtë nivel — pengesa është sasia e oksitanisht audio që Whisper pa gjatë trainimit, jo zhurma. Një audio e pastër studioje ende mund një audio me zhurmë, por asnjëra nuk do të arrijë saktësinë që do të merrni në një gjuhë me burime të larta.Nëse një transkriptim kthehet i papërdorshëm, dërgo email në contact@free.ai me dosjen — ne do të kthejmë token-ët dhe do të shohim nëse një motor tjetër trajton audion tuaj më mirë.