STT Online

Wykorzystanie handlowe OK Modele 380+ Brak znaku wodnego Nie ma potrzeby rejestracji
Wzór:
+ GPT-5, Claude, Gemini
Wyślij plik audio lub wideo — lub wklej URL — i otrzymaj czysty transkrypt z czasem. Dializacja głośnika, wywóz napisów SRT/VTT, 100+ języki z automatyczną wykryciem. Wagi kosztowe dokładnie z długością klipu. Zasilane przez Whisper big-v3 i Parakeet (samohosted), plus premium Wizper i 11Labs STT.

Przeciągnij i upuść audio/wideo, lub kliknij aby przeglądać

MP3, WAV, MP4, WebM, M4A — do 500MB

Whisper big-v3 – 99 języków, najlepsza w klasie dokładność.
Szacunek toku dla tego klipu
YouTube, Instagram, TikTok, Spotify i 1300+ platformy
Koszt transkrypcji URL opiera się na rzeczywistym czasie trwania klipu — cytujemy po pobraniu. Oczekuj ~500 tokena/minuta na Whisper.
Nagrywanie: 0:00

Transkrypcja w czasie rzeczywistym za pomocą mikrofonu

Transcript

Przepisywanie twojego audio...

To może zająć chwilę na dłuższe pliki.

Co ludzie przepisują z Free.ai

Interviews + podcasts

Etykiety diaryzacyjne dla każdego głośnika. Eksportuj SRT prosto do edytora wideo, lub zwykły tekst do zapisu artykułu.

Auto captions + subtitles

Wyślij napisy YouTube lub TikTok, wybierz SRT lub WebVTT i spal napisy /video/subtitle /. One-stop caption workflow.

Uwagi do posiedzeń

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Napisz 90-minutowy wykład, a następnie użyj /study/flashcards / lub /wpisz/summarize /, aby przekształcić go w materiały naukowe.

Audyo obcego języka

Whisper automatycznie wykrywa 99 języków. Transcribe w oryginału, następnie wyślij tekst przez /translate / aby skoczyć języki.

Legal + medical

Czasopisma, etykiety głośników, JSON eksportować z każdym słowem start/end time — dokładny sprawozdawca sądowy lub przygotowanie notatek klinicznych.

W jaki sposób Free.ai transkrypcji porównuje

Co dostaniesz? Free.ai Otter.ai Descript Rev.com
Darmowe codzienne stosowanie5K+ tokens/day300 minutes/mo1 hr/month
SilnikWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Języki99English-focused2230+
Dializacja głośnika
Eksport SRT / VTTPaidPaid
Publiczny APILimitedLimited
Live streaming STT (wolne) Paid
Wymagana rejestracjaNie.YesYesYes
Dane konkurentów odzwierciedlają publicznie wymienione wolne poziomy od 2026 r. Sprawdź każdy dostawca bieżących planów.
Zaawansowane opcje
Wynik
Tokiny się skończyły. Get More Tokens
Want better results? Modele premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Zaloguj się aby uzyskać link referencyjny i zarobić 25 000 żetonów na przyjaciela.

Chcesz więcej? Zarejestruj się za darmo na 5K tokeny/dzień + 10K bonus
Zarejestruj się za darmo

Przetwarzam twoją prośbę...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Jak stosować lek STT Online

1
Wprowadź swoje wpisy

Wpisz tekst, wyślij plik lub opisz, czego chcesz. Nie jest potrzebne konto.

2
Kliknij wygenerować

Nasz AI przetwarza Twoją prośbę w sekundach przy użyciu najlepszych modeli open-source.

3
Pobierz & dzielenie

Pobierz, kopiuj lub podziel się swoim wynikiem. Darmowe do użytku osobistego i komercyjnego.

Użyj tego narzędzia przez API

Automatyzuj to narzędzie z własnego kodu. Kompatybilny z OpenAI REST punkt końcowy, Authentic-Bearer-token, nie jest wymagany dodatkowy SDK. Koszty token pasują do interfejsu internetowego.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) konwertuje wypowiedziany dźwięk na tekst pisemny za pomocą AI. Free.ai uruchamia Whisper big-v3 — najdokładniejszy model rozpoznawania mowy otwartej – w naszym własnym GPU.

Tak. Wysyłka plików audio do 500MB. STT kosztuje ~500 tokenów za minutę audio. Dostajesz 2500–5000 bezpłatnych tokenów dziennie — wiele plików dziennie za darmo.

STT akceptuje MP3, WAV, MP4, WebM, M4A, OGG, FLAC — praktycznie dowolny format audio lub wideo — do 500MB na przesyłkę.

Tak. STT wywołuje eksport jako TXT, SRT (napisy) lub VTT (napisy internetowe). Idealnie dla napisów YouTube i podpisów wideo.

Nasz STT wykorzystuje Whisper big-v3 — zazwyczaj 95% + dokładność słów dla jasnego angielskiego i doskonałej jakości w 99 językach. Hałas tła i ciężki akcent niższa dokładność.

Tak. Włącz diaryzację głośnika w opcjach STT i segmentach etykiet AI jako głośnik 1, głośnik 2, itd. Kosztuje 50% więcej żetonów.

Tak. STT API jest kompatybilny z OpenAI — POST audio do /v1/audio/transcriptions i otrzymuje JSON. Pracuje z dowolnego języka, który może wysyłać żądania HTTP.

Tak. Zakładka Live przechwyca mikrofon i przepływa przez STT w czasie rzeczywistym z minimalną latencją.

Tak. Wklej YouTube, TikTok, Instagram, Spotify lub Vimeo URL i STT wyciąga dźwięk i przepisuje go. 1.300+ platformy obsługiwane.

Szybkie — 1 minutowy klip wykończa się w sekundach, 30 minut nagrania w około minuty, 1 godzina pliku w około 2 minuty. Szepta na naszym klastrze GPU.

Tak. Audio jest przetwarzany na własnych GPU i usuwany po zakończeniu STT. Nigdy nie jest przechowywany długotrwały, nigdy nie dzielony i nigdy nie używany do treningu modelowego.

Whisper big-v3 — największy, najprecyzniejszy model Whisper (1.55B parametrów). My samodzielnie go hostujemy na A100 GPU dla prędkości i prywatności.

Zarejestruj się bezpłatnie na 10 000 żetonów

Utwórz bezpłatne konto

Karta kredytowa nie jest wymagana

Jak mógłbyś ocenić to narzędzie?

Love this tool? Share it!