cureanu Trascrizzioni

Trascrivi cureanu audio e video in testu cù AI. Veloce, precisu è libaru.

Comu Funziona

  1. Vadu a Free.ai Transcriber
  2. Carica lu vostru cureanu figghiu audio o vidìu
  3. La nostra IA rileva cureanu e la trascrivi
  4. Scarica a trascrizzioni comu testu o suttatituli SRT

cureanu Caratteristichi di trascrizzioni

  • Funziona cu faster-whisper (cun licenza MIT)
  • Rilevamentu automaticu di la lingua cureanu
  • Supporta MP3, WAV, MP4, M4A, FLAC, e più
  • Esportazione di marcaturi di tempu e di sottotituli (SRT)
  • Nessun limiti di dimensione di u file in i piani pagati
  • Privatu e sicuru -- i fichji sunnu canciati dopu l'elaborazioni

Dettagli di lingua

Linguacureanu
Codice ISOko
Modellufaster-whisper
PrezzuLibbiru

Più lingue

Tutti li lingue

FAQ

Whisper large-v3-turbo atterra in u so livellu di precisione più altu in cureanu - sottu u 7% di u tassu di errore di parolla in i benchmarks standard. In pratica, chì significa chì l'audiu di studio pulitu torna quasi perfettu, è l'audiu di conversazione hè utilizzabile cù una pulizia minima.(Tier A, under 7% word error rate on benchmark sets — noi pubbrichimu tiers WER onesti piuttostu ca reclami di marketing.)

Sì — A trascrizzioni di cureanu si basa prima di tuttu nant'à u vostru pool di tokens gratuiti. L'audiu costa circa 50 tokens à u minutu, cusì u pool di tokens anonimi copre qualchì ora d'audiu ogni ghjornu. I conti cunnessi piglianu un pool più granni, più 10.000 tokens di iscrizzione. Dopu, $1 compra 750.000 tokens (~250 ore d'audiu).

I trascrizzioni cureanu sò riturnati in scrittura nativa (UTF-8). U testu cureanu nun hà spazi tra li parolle nativamente; i timestamps di diarization agghiùncini pause naturali a li turni di l'oratori.

MP3, WAV, M4A, FLAC, OGG, OPUS, e WEBM sò accettati direttamente. Per i video (MP4, MOV, MKV) estrichemu a pista audio di u latu di u servituri prima di inviallu à Whisper — ùn avete bisognu di cunvertisce nulla. Stessu pipeline indipendentementi da a lingua di u sorgenti, cumpresu cureanu.

U limitu di caricamentu anònimu hè di circa 500 MB per file. I cunti cunnessi ghjunghjenu à 2 GB. A durata ùn hè micca un limitu rigidu — i file lunghi sò spartuti automaticamente (finestre di 30 secondi cù sovrapposizione) è riuniti in una singula trascrizzioni cù marcatori di tempu continui. I registrazioni cureanu di più ore (podcast, cunferenze intere, riunioni) funzionanu bè.

Sì — a diarizazione di l'oratori hè attivata per difettu per ogni trascrizzioni cureanu. L'output hè segmentatu comu Oratore 1 / Oratore 2 / Oratore 3 cù timestamps, cusì interviste, discussioni di pannelli, è riunioni multi-partiti tornanu etichettati. A diarizazione corre nantu à un mudellu separatu è funziona u listessu trà tutte e lingue chì supportemu.

Sì — incolla l'URL in /transcribe/youtube/ per YouTube o /transcribe/podcast/ per i podcast (Apple, Spotify, RSS). Scarichiamu l'audiu, lu lanciamu attraversu Whisper cù language=ko, è riturnemu a trascrizzioni cù timestamps è etichette di parlanti. Cuntinutu tipicu cureanu: podcasts, cunferenze, interviste è cuntenutu YouTube di forma longa in cureanu sò i carichi di travagliu più cumuni chì vedemu.

Whisper costa circa 50 gettoni per minutu di audio, cusì una registrazione di un'ora hè ~ 3,000 gettoni. $ 1 compra 750,000 gettoni, chì si traduce in circa 250 ore di audio per dollaru. A maiò parte di l'utenti ùn spendenu mai nunda - u pool gratuitu di ogni ghjornu copre clip brevi, note vocali è podcast una tantum.

Sì — sunnu dispunibbili sia i timestamps a livellu di segmentu (ogni ~10-30 siconni) ca a livellu di parola. U livellu di parola è u predefinitu pi l'esportazzioni di sottotituli VTT/SRT accussì li sottotituli si sincronizzanu riga pi riga. Ntâ API, imposta timestamps="word" ntô corpu dâ richiesta. I trascrizzioni cureanu sò riturnati in scrittura nativa (UTF-8). U testu cureanu nun hà spazi tra li parolle nativamente; i timestamps di diarization agghiùncini pause naturali a li turni di l'oratori.

Sì. POST audio (multipart/form-data, nome di campu "file") à /v1/transcribe/ cù lingua=ko — o ommetti u parametru lingua pi lassari Whisper ritruvari automaticamenti. Ritorna JSON cu la trascrizzioni, segmenti, timestamps, è etichette di l'altoparlanti. Riferimenti cumpleti e snippet SDK à /api/.

Sì — una volta finita a trascrizzioni, cliccate Traduci o incollate u testu in /translate/. cureanu si currispondi à ogni altra lingua chì supportemu (200+). Per i minuti di riunioni, inviate a trascrizzioni à /summarize/; per u doppiaggiu, mandate à /voice/tts/ per rende l'audiu in a lingua di destinazione.

Whisper hè addestratu cù 680K ore di sonu veru, cusì a trascrizzioni cureanu hè robusta contru u rumore di fondu, i letti musicali, e a registrazioni di qualità di u telefonu. Un tagliu severu o l'altoparlanti sovrapposti ponu puru danneghja a precisione.Se una trascrizzioni ùn pò esse usata, mandate un email à contact@free.ai cù u fugliale — vi rimborseremu i tokens è vedemu s'un altru motori pò gestisce megliu u vostru audio.

Amuri Free.ai? Dì i vostri amichi!

Vota sta pàggina