Question 1

Berapa tepatkah transkripsi Whisper untuk Khmer?

Accepted Answer

Khmer adalah bahasa kurang sumber untuk Whisper — besar-v3-turbo duduk di atas kadar ralat perkataan 25%, kadang-kadang lebih tinggi. Transkripsi berguna untuk carian dan gist tetapi tidak patut dilayan sebagai sedia untuk penerbitan. Jika enjin ketepatan yang lebih tinggi menjadi tersedia untuk Khmer kami sambungkannya secara automatik.(Tier D, over 25% word error rate pada set penanda aras — kami menerbitkan tier WER yang jujur bukannya tuntutan pemasaran.)

Question 2

Adakah Khmer transkripsi audio-ke-teks percuma?

Accepted Answer

Ya — transkripsi Khmer menarik dari kolam token percuma harian anda terlebih dahulu. Audio kos kira-kira 50 token setiap minit, jadi kolam anonim harian meliputi beberapa jam audio setiap hari. Akaun yang dilog masuk mendapat kolam yang lebih besar ditambah 10,000 token pendaftaran. Selepas itu, $1 membeli 750,000 token (~250 jam audio).

Question 3

Skrip dan ejaan apa yang digunakan oleh transkripsi Khmer?

Accepted Answer

Transkripsi Khmer dikembalikan dalam UTF-8 piawai dengan ejaan normal bahasa.

Question 4

Format audio apa yang disokong untuk transkripsi Khmer?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, dan WEBM diterima secara langsung. Untuk video (MP4, MOV, MKV) kami mengekstrak trek audio sisi-pelayan sebelum menghantarnya ke Whisper — anda tidak perlu menukar apa-apa sendiri. Paip yang sama tanpa mengira bahasa sumber, termasuk Khmer.

Question 5

Berapa lama boleh fail audio Khmer?

Accepted Answer

Had muat naik anonim kira-kira 500 MB setiap fail. Akaun yang dilog masuk boleh sehingga 2 GB. Tempoh tidak terhad - fail panjang dipotong secara automatik (tetingkap 30 saat dengan tumpang tindih) dan dijahit semula ke dalam transkripsi tunggal dengan setem masa berterusan. Rekod Khmer berjam-jam (podcast, ceramah penuh, mesyuarat) berfungsi dengan baik.

Question 6

Adakah transkripsi Khmer mengenal pasti pembicara yang berbeza?

Accepted Answer

Ya — diarisasi pembicara dihidupkan secara lalai untuk setiap transkripsi Khmer. Output dibahagikan sebagai Pembicara 1 / Pembicara 2 / Pembicara 3 dengan setem masa, jadi temubual, perbincangan panel, dan mesyuarat berbilang pihak akan kembali dengan label. Diarisasi berjalan pada model terpisah dan berfungsi sama di semua bahasa yang kami sokong.

Question 7

Bolehkah saya transkripsikan video atau podcast Khmer YouTube?

Accepted Answer

Ya — tampal URL ke dalam /transcribe/youtube/ untuk YouTube atau /transcribe/podcast/ untuk suapan podcast (Apple, Spotify, RSS). Kami muat turun audio, jalankannya melalui Whisper dengan language=km, dan kembalikan transkripsi dengan setem masa dan label pengerusi. Kandungan Khmer tipikal: kuliah, temubual, nota suara, dan kandungan YouTube dalam Khmer semuanya berfungsi — tampal URL ke dalam /transcribe/youtube/ atau muat naik fail secara langsung.

Question 8

Berapakah harga satu jam audio Khmer dalam token?

Accepted Answer

Whisper berharga sekitar 50 token per minit audio, jadi rakaman satu jam adalah ~3,000 token. $1 membeli 750,000 token, yang bermakna kira-kira 250 jam audio per dolar. Kebanyakan pengguna tidak pernah belanja apa-apa — kolam percuma seharian meliputi klip pendek, nota suara, dan podcast satu-satu.

Question 9

Bolehkah saya mendapatkan setem masa tahap perkataan untuk audio Khmer?

Accepted Answer

Ya — kedua-dua setem masa tahap-segmen (tiap ~10-30 saat) dan tahap-perkataan ada. Tahap-perkataan adalah piawai untuk eksport subtajuk VTT/SRT supaya captions disegerakkan baris-demi-baris. Pada API tetapkan setem masa="perkataan" dalam badan permintaan. Transkripsi Khmer dikembalikan dalam UTF-8 piawai dengan ejaan normal bahasa.

Question 10

Adakah terdapat API untuk transkripsi Khmer?

Accepted Answer

Ya. POST audio (multipart/form-data, nama medan "file") ke /v1/transcribe/ dengan bahasa=km — atau buang parameter bahasa untuk biarkan Whisper auto-kesan. Kembalikan JSON dengan transkripsi, segmen, setem masa, dan label pengerusi. Rujukan lengkap dan snippet SDK di /api/.

Question 11

Bolehkah saya menterjemah transkripsi Khmer ke dalam bahasa lain?

Accepted Answer

Ya — selepas transkripsi selesai, klik Translate atau tampal teks ke /translate/. Khmer sepadan dengan setiap bahasa lain yang kami sokong (200+). Untuk minit mesyuarat, hantar transkripsi melalui /summarize/; untuk duplikasi, hantar ke /voice/tts/ untuk menghasilkan audio dalam bahasa sasaran.

Question 12

Bagaimana jika audio Khmer berbunyi atau kualiti rendah?

Accepted Answer

Latihan bunyi bising Whisper kurang membantu pada aras ini — kegagalan adalah jumlah audio Khmer yang Whisper lihat semasa latihan, bukan bunyi bising. Audio studio bersih masih mengalahkan audio bising, tetapi kedua-duanya tidak akan mencapai ketepatan yang anda akan dapat pada bahasa sumber tinggi.Jika transkripsi tidak boleh digunakan, hantar emel kepada contact@free.ai dengan fail itu — kami akan mengembalikan token dan melihat sama ada enjin lain boleh menangani audio anda dengan lebih baik.

Bahasa	Khmer
Kod ISO	`km`
Model AI	faster-whisper
Harga	Bebas

Bebas Khmer Transkripsi

Bagaimana ia berfungsi

Khmer Ciri-ciri Transkripsi

Perincian Bahasa

Bahasa

FAQ