Question 1

Quantu hè accurata a trascrizzione Whisper per cureanu?

Accepted Answer

Whisper large-v3-turbo atterra in u so livellu di precisione più altu in cureanu - sottu u 7% di u tassu di errore di parolla in i benchmarks standard. In pratica, chì significa chì l'audiu di studio pulitu torna quasi perfettu, è l'audiu di conversazione hè utilizzabile cù una pulizia minima.(Tier A, under 7% word error rate on benchmark sets — noi pubbrichimu tiers WER onesti piuttostu ca reclami di marketing.)

Question 2

A trascrizzioni audio-versu-testu di cureanu hè libara?

Accepted Answer

Sì — A trascrizzioni di cureanu si basa prima di tuttu nant'à u vostru pool di tokens gratuiti. L'audiu costa circa 50 tokens à u minutu, cusì u pool di tokens anonimi copre qualchì ora d'audiu ogni ghjornu. I conti cunnessi piglianu un pool più granni, più 10.000 tokens di iscrizzione. Dopu, $1 compra 750.000 tokens (~250 ore d'audiu).

Question 3

Quali scrittura è ortografia usa a trascrizzioni cureanu?

Accepted Answer

I trascrizzioni cureanu sò riturnati in scrittura nativa (UTF-8). U testu cureanu nun hà spazi tra li parolle nativamente; i timestamps di diarization agghiùncini pause naturali a li turni di l'oratori.

Question 4

Quali formati audio sò supportati per a trascrizzioni cureanu?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, e WEBM sò accettati direttamente. Per i video (MP4, MOV, MKV) estrichemu a pista audio di u latu di u servituri prima di inviallu à Whisper — ùn avete bisognu di cunvertisce nulla. Stessu pipeline indipendentementi da a lingua di u sorgenti, cumpresu cureanu.

Question 5

Quantu pò esse longu un fugliale audio cureanu?

Accepted Answer

U limitu di caricamentu anònimu hè di circa 500 MB per file. I cunti cunnessi ghjunghjenu à 2 GB. A durata ùn hè micca un limitu rigidu — i file lunghi sò spartuti automaticamente (finestre di 30 secondi cù sovrapposizione) è riuniti in una singula trascrizzioni cù marcatori di tempu continui. I registrazioni cureanu di più ore (podcast, cunferenze intere, riunioni) funzionanu bè.

Question 6

A trascrizzioni cureanu identifica diversi parlanti?

Accepted Answer

Sì — a diarizazione di l'oratori hè attivata per difettu per ogni trascrizzioni cureanu. L'output hè segmentatu comu Oratore 1 / Oratore 2 / Oratore 3 cù timestamps, cusì interviste, discussioni di pannelli, è riunioni multi-partiti tornanu etichettati. A diarizazione corre nantu à un mudellu separatu è funziona u listessu trà tutte e lingue chì supportemu.

Question 7

Possu trasscriviri un cureanu YouTube video o podcast?

Accepted Answer

Sì — incolla l'URL in /transcribe/youtube/ per YouTube o /transcribe/podcast/ per i podcast (Apple, Spotify, RSS). Scarichiamu l'audiu, lu lanciamu attraversu Whisper cù language=ko, è riturnemu a trascrizzioni cù timestamps è etichette di parlanti. Cuntinutu tipicu cureanu: podcasts, cunferenze, interviste è cuntenutu YouTube di forma longa in cureanu sò i carichi di travagliu più cumuni chì vedemu.

Question 8

Quantu costa un'ora di cureanu audio in gettoni?

Accepted Answer

Whisper costa circa 50 gettoni per minutu di audio, cusì una registrazione di un'ora hè ~ 3,000 gettoni. $ 1 compra 750,000 gettoni, chì si traduce in circa 250 ore di audio per dollaru. A maiò parte di l'utenti ùn spendenu mai nunda - u pool gratuitu di ogni ghjornu copre clip brevi, note vocali è podcast una tantum.

Question 9

Possu ottene timestamps a livellu di parolla per l'audiu cureanu?

Accepted Answer

Sì — sunnu dispunibbili sia i timestamps a livellu di segmentu (ogni ~10-30 siconni) ca a livellu di parola. U livellu di parola è u predefinitu pi l'esportazzioni di sottotituli VTT/SRT accussì li sottotituli si sincronizzanu riga pi riga. Ntâ API, imposta timestamps="word" ntô corpu dâ richiesta. I trascrizzioni cureanu sò riturnati in scrittura nativa (UTF-8). U testu cureanu nun hà spazi tra li parolle nativamente; i timestamps di diarization agghiùncini pause naturali a li turni di l'oratori.

Question 10

Ci hè un API per a trascrizzioni cureanu?

Accepted Answer

Sì. POST audio (multipart/form-data, nome di campu "file") à /v1/transcribe/ cù lingua=ko — o ommetti u parametru lingua pi lassari Whisper ritruvari automaticamenti. Ritorna JSON cu la trascrizzioni, segmenti, timestamps, è etichette di l'altoparlanti. Riferimenti cumpleti e snippet SDK à /api/.

Question 11

Possu tradurre a trascrizzioni di cureanu in un'altra lingua?

Accepted Answer

Sì — una volta finita a trascrizzioni, cliccate Traduci o incollate u testu in /translate/. cureanu si currispondi à ogni altra lingua chì supportemu (200+). Per i minuti di riunioni, inviate a trascrizzioni à /summarize/; per u doppiaggiu, mandate à /voice/tts/ per rende l'audiu in a lingua di destinazione.

Question 12

E si l'audiu di cureanu hè rumorosu o di qualità bassa?

Accepted Answer

Whisper hè addestratu cù 680K ore di sonu veru, cusì a trascrizzioni cureanu hè robusta contru u rumore di fondu, i letti musicali, e a registrazioni di qualità di u telefonu. Un tagliu severu o l'altoparlanti sovrapposti ponu puru danneghja a precisione.Se una trascrizzioni ùn pò esse usata, mandate un email à contact@free.ai cù u fugliale — vi rimborseremu i tokens è vedemu s'un altru motori pò gestisce megliu u vostru audio.

Lingua	cureanu
Codice ISO	`ko`
Modellu	faster-whisper
Prezzu	Libbiru

cureanu Trascrizzioni

Comu Funziona

cureanu Caratteristichi di trascrizzioni

Dettagli di lingua

Più lingue

FAQ