Wizper (Whisper v3)

Free.ai · stt · ~500 Μάρκες ανά minute

Ρίξτε ένα αρχείο ήχου ή βίντεο, ή επικολλήστε ένα URL παρακάτω

~500 Μάρκες ανά minute
Τελειώνει με τα GPU μας. Αναβάθμιση για Wizper (Whisper v3) →

Wizper (Whisper v3) is a μοντέλο ομιλίας προς κείμενο. Διαδρομή μέσω εξωτερικών μοντέλων ~500 μάρκες ανά λεπτό (50% βαθμολογία σε σχέση με το ανάντη κόστος).

Χρήση μέσω API

OpenAI συμβατό REST API. Δημιουργήστε ένα κλειδί και καλέστε αυτό το μοντέλο σε δευτερόλεπτα.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'
Τεκμηρίωση API Πάρτε το κλειδί API

Συχνές Ερωτήσεις

Ανεβάστε ένα αρχείο MP3, WAV, M4A, ή βίντεο και Wizper (Whisper v3) επιστρέφει το πλήρες αντίγραφο συν τους προαιρετικούς υπότιτλους SRT/VTT με χρονοσφραγίσεις.

Wizper (Whisper v3) manages of languages Whisper- family models cover 90+, Parakeet covers ~25, others variable. Pick "auto-detection" or determinate the language for highest decision.

Word-error rate είναι 5 pay10% σε καθαρό αγγλικό ήχο, 10 ppl20% σε θορυβώδη ή τονισμένο ήχο. Μεγάλες παραλλαγές της ίδιας αρχιτεκτονικής κάνουν σημαντικά καλύτερα σε δύσκολες περιπτώσεις, επιλέξτε μεγαλύτερο όταν ο ήχος είναι τραχύς.

Κάθε τμήμα περιλαμβάνει χρονοσφραγίσεις έναρξης/τέλους. Εξαγωγή ως SRT ή VTT και τους χρόνους χάρτη κατ 'ευθείαν στο βίντεό σας.

Wizper (Whisper v3) is a premium transcription engine.

MP3, WAV, M4A, FLAC, OGG, συν βίντεο (MP4, MOV, WebM)

Η διαγραφή ομιλητών είναι ένα ξεχωριστό πέρασμα που ενεργοποιεί το "Diarize" στο /trancribe/. Wizper (Whisper v3) χειρίζεται τη μεταγραφή. Διαιρώντας ετικέτες κάθε τμήμα με τον Ηχείο 1 / Ηχείο 2 / κ.λπ.

Κάθε αντίγραφο προσγειώνεται στο /λογαριασμό/?tab=ιστορία με το αρχικό όνομα αρχείου. Για τη διατήρηση του φακέλου-δέντρου χρησιμοποιήστε το API.

Ναι ~ ΠΩΤΑ τον ήχο σας στο /v1/sttt/transcribe/ with model="Wizper (Whisper v3)". Επιστρέφει JSON με κείμενο + τμήματα + χρονοσφραγίδες σε επίπεδο λέξεων. /api/ έχει την πλήρη αναφορά.

Αυτο-φιλοξενούμενα μοντέλα διατηρούν τον ήχο στις GPUs μας; premium περάσει μέσα με ένα DPA. Ήχος διαγράφεται μετά το παράθυρο μετοχών (24h anon, 7d υπογεγραμμένο-in). Δεν εκπαιδεύονται στις εισόδους σας.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Ο παράγοντας σε πραγματικό χρόνο είναι περίπου 0.05.0.2× Ένα 60-λεπτά podcast transcripts σε 3 201212 λεπτά. Premium μοντέλα συχνά τελειώνουν γρηγορότερα. Χρησιμοποιήστε το κουμπί αναμονής για να κλείσετε την καρτέλα.

Love this tool? Share it!

Βαθμολογήστε αυτή τη σελίδα