Bebas Khmer Transkripsi
Tulis semula Khmer audio dan video ke teks dengan AI. Cepat, tepat, dan percuma.
Bagaimana ia berfungsi
- Pergi ke Free.ai Pentranskripsi
- Muat naik fail audio atau video Khmer anda
- AI kami secara automatik mengesan Khmer dan mentranskripsikannya
- Muat turun transkripsi anda sebagai teks atau subtajuk SRT
Khmer Ciri-ciri Transkripsi
- ✓Dikuasakan oleh faster-whisper (dilesenkan MIT)
- ✓Pengesanan bahasa Khmer automatik
- ✓Menyokong MP3, WAV, MP4, M4A, FLAC, dan lebih
- ✓Setem masa dan eksport subtajuk (SRT)
- ✓Tiada had saiz fail pada rancangan berbayar
- ✓Persendirian dan selamat -- fail dipadam selepas pemprosesan
Perincian Bahasa
| Bahasa | Khmer |
| Kod ISO | km |
| Model AI | faster-whisper |
| Harga | Bebas |
Bahasa
Lihat Semua BahasaFAQ
Khmer adalah bahasa kurang sumber untuk Whisper — besar-v3-turbo duduk di atas kadar ralat perkataan 25%, kadang-kadang lebih tinggi. Transkripsi berguna untuk carian dan gist tetapi tidak patut dilayan sebagai sedia untuk penerbitan. Jika enjin ketepatan yang lebih tinggi menjadi tersedia untuk Khmer kami sambungkannya secara automatik.(Tier D, over 25% word error rate pada set penanda aras — kami menerbitkan tier WER yang jujur bukannya tuntutan pemasaran.)
Ya — transkripsi Khmer menarik dari kolam token percuma harian anda terlebih dahulu. Audio kos kira-kira 50 token setiap minit, jadi kolam anonim harian meliputi beberapa jam audio setiap hari. Akaun yang dilog masuk mendapat kolam yang lebih besar ditambah 10,000 token pendaftaran. Selepas itu, $1 membeli 750,000 token (~250 jam audio).
Transkripsi Khmer dikembalikan dalam UTF-8 piawai dengan ejaan normal bahasa.
MP3, WAV, M4A, FLAC, OGG, OPUS, dan WEBM diterima secara langsung. Untuk video (MP4, MOV, MKV) kami mengekstrak trek audio sisi-pelayan sebelum menghantarnya ke Whisper — anda tidak perlu menukar apa-apa sendiri. Paip yang sama tanpa mengira bahasa sumber, termasuk Khmer.
Had muat naik anonim kira-kira 500 MB setiap fail. Akaun yang dilog masuk boleh sehingga 2 GB. Tempoh tidak terhad - fail panjang dipotong secara automatik (tetingkap 30 saat dengan tumpang tindih) dan dijahit semula ke dalam transkripsi tunggal dengan setem masa berterusan. Rekod Khmer berjam-jam (podcast, ceramah penuh, mesyuarat) berfungsi dengan baik.
Ya — diarisasi pembicara dihidupkan secara lalai untuk setiap transkripsi Khmer. Output dibahagikan sebagai Pembicara 1 / Pembicara 2 / Pembicara 3 dengan setem masa, jadi temubual, perbincangan panel, dan mesyuarat berbilang pihak akan kembali dengan label. Diarisasi berjalan pada model terpisah dan berfungsi sama di semua bahasa yang kami sokong.
Ya — tampal URL ke dalam /transcribe/youtube/ untuk YouTube atau /transcribe/podcast/ untuk suapan podcast (Apple, Spotify, RSS). Kami muat turun audio, jalankannya melalui Whisper dengan language=km, dan kembalikan transkripsi dengan setem masa dan label pengerusi. Kandungan Khmer tipikal: kuliah, temubual, nota suara, dan kandungan YouTube dalam Khmer semuanya berfungsi — tampal URL ke dalam /transcribe/youtube/ atau muat naik fail secara langsung.
Whisper berharga sekitar 50 token per minit audio, jadi rakaman satu jam adalah ~3,000 token. $1 membeli 750,000 token, yang bermakna kira-kira 250 jam audio per dolar. Kebanyakan pengguna tidak pernah belanja apa-apa — kolam percuma seharian meliputi klip pendek, nota suara, dan podcast satu-satu.
Ya — kedua-dua setem masa tahap-segmen (tiap ~10-30 saat) dan tahap-perkataan ada. Tahap-perkataan adalah piawai untuk eksport subtajuk VTT/SRT supaya captions disegerakkan baris-demi-baris. Pada API tetapkan setem masa="perkataan" dalam badan permintaan. Transkripsi Khmer dikembalikan dalam UTF-8 piawai dengan ejaan normal bahasa.
Ya. POST audio (multipart/form-data, nama medan "file") ke /v1/transcribe/ dengan bahasa=km — atau buang parameter bahasa untuk biarkan Whisper auto-kesan. Kembalikan JSON dengan transkripsi, segmen, setem masa, dan label pengerusi. Rujukan lengkap dan snippet SDK di /api/.
Ya — selepas transkripsi selesai, klik Translate atau tampal teks ke /translate/. Khmer sepadan dengan setiap bahasa lain yang kami sokong (200+). Untuk minit mesyuarat, hantar transkripsi melalui /summarize/; untuk duplikasi, hantar ke /voice/tts/ untuk menghasilkan audio dalam bahasa sasaran.
Latihan bunyi bising Whisper kurang membantu pada aras ini — kegagalan adalah jumlah audio Khmer yang Whisper lihat semasa latihan, bukan bunyi bising. Audio studio bersih masih mengalahkan audio bising, tetapi kedua-duanya tidak akan mencapai ketepatan yang anda akan dapat pada bahasa sumber tinggi.Jika transkripsi tidak boleh digunakan, hantar emel kepada contact@free.ai dengan fail itu — kami akan mengembalikan token dan melihat sama ada enjin lain boleh menangani audio anda dengan lebih baik.