faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 Μάρκες ανά minute

Ανεβάστε τον ήχο

Ρίξτε ένα αρχείο ήχου ή βίντεο, ή επικολλήστε ένα URL παρακάτω

~500 Μάρκες ανά minute

faster-whisper large-v3 is a μοντέλο ομιλίας προς κείμενο built by OpenAI / SYSTRAN. Πιο δυνατά στο Accurate transcription. Αυτό-φιλοξενούνται σε Free.ai GPUs ~ τρέχει δωρεάν ενάντια σας καθημερινή πισίνα μάρκα (500 μάρκες ανά λεπτό). Κυκλοφόρησε κάτω από MIT __] εμπορική χρήση επιτρέπεται στις Free.ai.

Χρήση μέσω API

OpenAI συμβατό REST API. Δημιουργήστε ένα κλειδί και καλέστε αυτό το μοντέλο σε δευτερόλεπτα.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

Τεκμηρίωση API Πάρτε το κλειδί API

Παρόμοια μοντέλα

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Περιήγηση σε όλα τα μοντέλα →

Συχνές Ερωτήσεις

Ανεβάστε ένα αρχείο MP3, WAV, M4A, ή βίντεο και faster-whisper large-v3 επιστρέφει το πλήρες αντίγραφο συν τους προαιρετικούς υπότιτλους SRT/VTT με χρονοσφραγίσεις.

faster-whisper large-v3 manages of languages Whisper- family models cover 90+, Parakeet covers ~25, others variable. Pick "auto-detection" or determinate the language for highest decision.

Word-error rate είναι 5 pay10% σε καθαρό αγγλικό ήχο, 10 ppl20% σε θορυβώδη ή τονισμένο ήχο. Μεγάλες παραλλαγές της ίδιας αρχιτεκτονικής κάνουν σημαντικά καλύτερα σε δύσκολες περιπτώσεις, επιλέξτε μεγαλύτερο όταν ο ήχος είναι τραχύς.

Κάθε τμήμα περιλαμβάνει χρονοσφραγίσεις έναρξης/τέλους. Εξαγωγή ως SRT ή VTT και τους χρόνους χάρτη κατ 'ευθείαν στο βίντεό σας.

faster-whisper large-v3 τρέχει με δικά μας GPUs ενάντια καθημερινά δωρεάν πισίνα σας πρώτα? $ 5 → 200.000 πληρωμένα μάρκες μετά από αυτό. Περίπου ~500 μάρκες ανά λεπτό.

MP3, WAV, M4A, FLAC, OGG, συν βίντεο (MP4, MOV, WebM)

Η διαγραφή ομιλητών είναι ένα ξεχωριστό πέρασμα που ενεργοποιεί το "Diarize" στο /trancribe/. faster-whisper large-v3 χειρίζεται τη μεταγραφή. Διαιρώντας ετικέτες κάθε τμήμα με τον Ηχείο 1 / Ηχείο 2 / κ.λπ.

Κάθε αντίγραφο προσγειώνεται στο /λογαριασμό/?tab=ιστορία με το αρχικό όνομα αρχείου. Για τη διατήρηση του φακέλου-δέντρου χρησιμοποιήστε το API.

Ναι ~ ΠΩΤΑ τον ήχο σας στο /v1/sttt/transcribe/ with model="faster-whisper large-v3". Επιστρέφει JSON με κείμενο + τμήματα + χρονοσφραγίδες σε επίπεδο λέξεων. /api/ έχει την πλήρη αναφορά.

Αυτο-φιλοξενούμενα μοντέλα διατηρούν τον ήχο στις GPUs μας; premium περάσει μέσα με ένα DPA. Ήχος διαγράφεται μετά το παράθυρο μετοχών (24h anon, 7d υπογεγραμμένο-in). Δεν εκπαιδεύονται στις εισόδους σας.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Ο παράγοντας σε πραγματικό χρόνο είναι περίπου 0.05.0.2× Ένα 60-λεπτά podcast transcripts σε 3 201212 λεπτά. Premium μοντέλα συχνά τελειώνουν γρηγορότερα. Χρησιμοποιήστε το κουμπί αναμονής για να κλείσετε την καρτέλα.

faster-whisper large-v3

Χρήση μέσω API

Παρόμοια μοντέλα

Συχνές Ερωτήσεις

Τι κάνει το faster-whisper large-v3?

Πόσες γλώσσες υποστηρίζει faster-whisper large-v3?

Πόσο ακριβής είναι faster-whisper large-v3?

Μήπως faster-whisper large-v3 περιλαμβάνει χρονοσφραγίσεις;

Πόσο κοστίζει το faster-whisper large-v3 ανά λεπτό;

Τι μορφές ήχου μπορώ να ανεβάσω σε faster-whisper large-v3?

Μπορεί faster-whisper large-v3 identify different speakers?

Μπορώ να μεταγράψω παρτίδα με το όνομα faster-whisper large-v3?

Υπάρχει API για faster-whisper large-v3?

Τι γίνεται με την ιδιωτικότητα όταν μεταγράφω με faster-whisper large-v3?

Είναι ασφαλής για εμπορική χρήση η έξοδος faster-whisper large-v3;

Πόσο χρόνο παίρνει faster-whisper large-v3?

Πάρτε 10,000 Free Tokens

Περιμένετε, πάρτε 10K δωρεάν Tokens!

Θέλεις κι άλλο;