Wizper (Whisper v3)

Free.ai · stt · ~500 Μάρκες ανά minute

Ανεβάστε τον ήχο

Ρίξτε ένα αρχείο ήχου ή βίντεο, ή επικολλήστε ένα URL παρακάτω

~500 Μάρκες ανά minute

Τελειώνει με τα GPU μας. Αναβάθμιση για Wizper (Whisper v3) →

Wizper (Whisper v3) is a μοντέλο ομιλίας προς κείμενο. Διαδρομή μέσω εξωτερικών μοντέλων ~500 μάρκες ανά λεπτό (50% βαθμολογία σε σχέση με το ανάντη κόστος).

Χρήση μέσω API

OpenAI συμβατό REST API. Δημιουργήστε ένα κλειδί και καλέστε αυτό το μοντέλο σε δευτερόλεπτα.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'

Τεκμηρίωση API Πάρτε το κλειδί API

Παρόμοια μοντέλα

ElevenLabs STT

Fal Speech-to-Text

Περιήγηση σε όλα τα μοντέλα →

Συχνές Ερωτήσεις

Ανεβάστε ένα αρχείο MP3, WAV, M4A, ή βίντεο και Wizper (Whisper v3) επιστρέφει το πλήρες αντίγραφο συν τους προαιρετικούς υπότιτλους SRT/VTT με χρονοσφραγίσεις.

Wizper (Whisper v3) manages of languages Whisper- family models cover 90+, Parakeet covers ~25, others variable. Pick "auto-detection" or determinate the language for highest decision.

Word-error rate είναι 5 pay10% σε καθαρό αγγλικό ήχο, 10 ppl20% σε θορυβώδη ή τονισμένο ήχο. Μεγάλες παραλλαγές της ίδιας αρχιτεκτονικής κάνουν σημαντικά καλύτερα σε δύσκολες περιπτώσεις, επιλέξτε μεγαλύτερο όταν ο ήχος είναι τραχύς.

Κάθε τμήμα περιλαμβάνει χρονοσφραγίσεις έναρξης/τέλους. Εξαγωγή ως SRT ή VTT και τους χρόνους χάρτη κατ 'ευθείαν στο βίντεό σας.

Wizper (Whisper v3) is a premium transcription engine.

MP3, WAV, M4A, FLAC, OGG, συν βίντεο (MP4, MOV, WebM)

Η διαγραφή ομιλητών είναι ένα ξεχωριστό πέρασμα που ενεργοποιεί το "Diarize" στο /trancribe/. Wizper (Whisper v3) χειρίζεται τη μεταγραφή. Διαιρώντας ετικέτες κάθε τμήμα με τον Ηχείο 1 / Ηχείο 2 / κ.λπ.

Κάθε αντίγραφο προσγειώνεται στο /λογαριασμό/?tab=ιστορία με το αρχικό όνομα αρχείου. Για τη διατήρηση του φακέλου-δέντρου χρησιμοποιήστε το API.

Ναι ~ ΠΩΤΑ τον ήχο σας στο /v1/sttt/transcribe/ with model="Wizper (Whisper v3)". Επιστρέφει JSON με κείμενο + τμήματα + χρονοσφραγίδες σε επίπεδο λέξεων. /api/ έχει την πλήρη αναφορά.

Αυτο-φιλοξενούμενα μοντέλα διατηρούν τον ήχο στις GPUs μας; premium περάσει μέσα με ένα DPA. Ήχος διαγράφεται μετά το παράθυρο μετοχών (24h anon, 7d υπογεγραμμένο-in). Δεν εκπαιδεύονται στις εισόδους σας.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Ο παράγοντας σε πραγματικό χρόνο είναι περίπου 0.05.0.2× Ένα 60-λεπτά podcast transcripts σε 3 201212 λεπτά. Premium μοντέλα συχνά τελειώνουν γρηγορότερα. Χρησιμοποιήστε το κουμπί αναμονής για να κλείσετε την καρτέλα.

Wizper (Whisper v3)

Χρήση μέσω API

Παρόμοια μοντέλα

Συχνές Ερωτήσεις

Τι κάνει το Wizper (Whisper v3)?

Πόσες γλώσσες υποστηρίζει Wizper (Whisper v3)?

Πόσο ακριβής είναι Wizper (Whisper v3)?

Μήπως Wizper (Whisper v3) περιλαμβάνει χρονοσφραγίσεις;

Πόσο κοστίζει το Wizper (Whisper v3) ανά λεπτό;

Τι μορφές ήχου μπορώ να ανεβάσω σε Wizper (Whisper v3)?

Μπορεί Wizper (Whisper v3) identify different speakers?

Μπορώ να μεταγράψω παρτίδα με το όνομα Wizper (Whisper v3)?

Υπάρχει API για Wizper (Whisper v3)?

Τι γίνεται με την ιδιωτικότητα όταν μεταγράφω με Wizper (Whisper v3)?

Είναι ασφαλής για εμπορική χρήση η έξοδος Wizper (Whisper v3);

Πόσο χρόνο παίρνει Wizper (Whisper v3)?

Πάρτε 10,000 Free Tokens

Περιμένετε, πάρτε 10K δωρεάν Tokens!

Θέλεις κι άλλο;