Question 1

latış üçün Whisper transkripsiyası nə qədər dəqiqdir?

Accepted Answer

latış Whisper üçün orta resurs dilidir - böyük-v3-turbo 15-25% söz səhv dərəcəsi zolağına düşür. Transkriptin əsası etibarlıdır; adlanmış-entlik səhvləri, vaxtaşırı kod-əvəzləmə problemləri və qısa-söhbət səhvləri gözləyin. Yayım keyfiyyətli çıxıntı üçün insan keçişi planlaşdırın.(Tier C, 15-25% word error rate on benchmark sets — biz marketinq iddialarından daha çox doğru WER tierlərini yayımlayırıq.)

Question 2

latış audio-to-text transcription pulsuzdurmu?

Accepted Answer

Bəli — latış transkripsiya əvvəlcə günlük pulsuz tokenlərinizi alır. Audio bir dəqiqədə 50 tokenə başa gəlir, buna görə də anonim günlük pool gündəlik bir neçə saat audionu əhatə edir. Giriş etmiş hesablar daha böyük bir pool və 10,000 qeydiyyat tokenini alır. Bundan sonra, $1 750,000 token (~250 saat audio) alır.

Question 3

latış transkripti hansı skript və imlanı istifadə edir?

Accepted Answer

latış transkriptləri standart UTF-8 ilə və dilin normal orfoqrafikası ilə geri qaytarılır.

Question 4

latış transkripsiya üçün hansı səs formatları dəstəklənir?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS və WEBM formatları doğrudan qəbul edilir. Video üçün (MP4, MOV, MKV) səs-təkrarını Whisper-ə göndərmədən əvvəl server tərəfində çıxarırıq - siz heç nəyi öz əlinizlə çevirməyə ehtiyacınız yoxdur. Mənbə dili ilə bağlı olaraq eyni boru kəməri, latış də daxil olmaqla.

Question 5

latış səs faylı nə qədər uzun ola bilər?

Accepted Answer

Anonim yükləmələr hər fayl üçün təxminən 500 MB-a qədərdir. Giriş edilmiş hesablar 2 GB-a qədərdir. Uzunluğu məhdudlaşdırmaq mümkün deyil - uzun fayllar avtomatik olaraq parçalanır (30 saniyəlik pəncərələr üst-üstə düşür) və tək bir transkriptə davamlı vaxt damğaları ilə birləşdirilir. Bir neçə saatlıq latış qeydləri (podkastlar, tam dərslər, görüşlər) yaxşı işləyir.

Question 6

latış transkripti müxtəlif danışanları müəyyən edirmi?

Accepted Answer

Bəli — hər bir latış transkripti üçün səsləndiricinin diarizasiyası ön qurğulu olaraq işə salınıb. Çıxış 1-ci / 2-ci / 3-cü səsləndirici kimi vaxt damğaları ilə segmentləşdirilir, buna görə də müsahibələr, panel müzakirələri və çox tərəfli görüşlər etiketlənmiş olaraq geri gəlir. Diarizasiya ayrı bir model üzərində işləyir və bütün dəstəklədiyimiz dillərdə eyni şəkildə işləyir.

Question 7

latış YouTube video və ya podcast-i transkript edə bilərəmmi?

Accepted Answer

Bəli — URL-i YouTube üçün /transcribe/youtube/ və ya podcast axınları üçün /transcribe/podcast/-ə yapışdırın (Apple, Spotify, RSS). Audionu yükləyirik, language=lv ilə Whisper-dən keçiririk və vaxt işarə və səsləndirici etiketləri ilə transkripti geri qaytarırıq. Tipik latış məzmunu: latış-də dərslər, müsahibələr, səsli qeydlər və YouTube məzmunu bütün işləyir — URL-i /transcribe/youtube/-ə yapışdır və ya faylları doğrudan yüklə.

Question 8

latış səsinin saatlıq qiyməti tokenlərlə nə qədərdir?

Accepted Answer

Whisper-in audionun bir dəqiqəsi üçün 50 token dəyəri var, buna görə də bir saatlıq qeyd ~3,000 token dəyərindədir. $1 750,000 token satın alır, bu da dollar başına təxminən 250 saat audioya bərabərdir. Çox istifadəçi heç nə xərcləmir - günlük pulsuz pul qısa kliplər, səsli qeydlər və birdəfəlik podcastlar üçündür.

Question 9

latış səsi üçün söz səviyyəli vaxt damğaları əldə edə bilərəmmi?

Accepted Answer

Bəli — həm segment səviyyəli (hər ~10-30 saniyədə) həm də söz səviyyəli vaxt damğaları mövcuddur. Söz səviyyəsi VTT/SRT altyazıları ixrac etmək üçün ön qurğudur, buna görə də altyazılar sətir-sətir sinxronlaşdırılır. API-də tələbin bədənində timestamps="word"-u təyin et. latış transkriptləri standart UTF-8 ilə və dilin normal orfoqrafikası ilə geri qaytarılır.

Question 10

latış transkripsiya üçün bir API varmı?

Accepted Answer

Bəli. Audionu (multipart/form-data, sahənin adı "file") language=lv ilə /v1/transcribe/-ə POST et - ya da Whisper-in avtomatik aşkarlamasına imkan vermək üçün dil parametrini burax. Transkript, segmentlər, vaxt damğaları və səsləndirici etiketləri ilə JSON geri qaytarır. Tam istinad və SDK parçaları /api/-dədir.

Question 11

latış transkriptini başqa dillərə tərcümə edə bilərəmmi?

Accepted Answer

Bəli — transkripsiya bitdikdən sonra, Tərcümə düyməsini basın və ya mətni /translate/-ə yapışdırın. latış dəstəklədiyimiz hər hansı bir dillə uyğun gəlir (200+). Toplantı protokolları üçün transkripsiya /summarize/-ə göndərilir; dublaj üçün isə /voice/tts/-ə göndərilir ki, audio məqsəd dili ilə göstərilsin.

Question 12

latış səsi səsli və ya aşağı keyfiyyətli olsa nə olacaq?

Accepted Answer

Whisper-in səs-küy səmərəliliyi hələ də latış-ə tətbiq olunur, lakin bu dəqiqlik səviyyəsində hər hansı əlavə səs-küy əsas xəta dərəcəsini artırır. Təmiz qulaqlıq səsi telefon və ya noutbuk mikrofonu ilə qeydlərdən daha yaxşı nəticələr verir.Əgər transkript istifadə edilməmiş halda geri gəlsə, contact@free.ai ünvanına faylla birlikdə e-poçt göndərin — biz sizə tokenləri geri qaytaracağıq və başqa bir motorun sizin audionuzu daha yaxşı idarə edə biləcəyini görəcəyik.

Dil	latış
ISO kodu	`lv`
Model	daha sürətli pıçıldaşma
Qiymət	Pulsuz

latış pulsuz transkripsiya

İşə Gəlməsi

latış transkripsiya xüsusiyyəti

Dil Məlumatları

Daha çox dil

FAQ