Speech to Text

Wykorzystanie handlowe OK Modele 380+ Brak znaku wodnego Nie ma potrzeby rejestracji

Wyślij plik audio lub wideo — lub wklej URL — i otrzymaj czysty transkrypt z czasem. Dializacja głośnika, wywóz napisów SRT/VTT, 100+ języki z automatyczną wykryciem. Wagi kosztowe dokładnie z długością klipu. Zasilane przez Whisper big-v3 i Parakeet (samohosted), plus premium Wizper i 11Labs STT.

Przeciągnij i upuść audio/wideo, lub kliknij aby przeglądać

MP3, WAV, MP4, WebM, M4A — do 500MB

Język

Silnik Whisper big-v3 – 99 języków, najlepsza w klasie dokładność.

Format wyjściowy

Wykrywanie głośnika — etykieta, która mówi kiedy (+50% żetonów)

Liczba mówców

YouTube, Instagram, TikTok, Spotify i 1300+ platformy

Silnik

Format wyjściowy

Wykrywanie głośnika — +50%

Koszt transkrypcji URL opiera się na rzeczywistym czasie trwania klipu — cytujemy po pobraniu. Oczekuj ~500 tokena/minuta na Whisper.

Transkrypcja w czasie rzeczywistym za pomocą mikrofonu

Co ludzie przepisują z Free.ai

Wywiady + podcast

Etykiety diaryzacyjne dla każdego głośnika. Eksportuj SRT prosto do edytora wideo, lub zwykły tekst do zapisu artykułu.

Automatyczne podpisy + napisy

Wyślij napisy YouTube lub TikTok, wybierz SRT lub WebVTT i spal napisy /video/subtitle /. One-stop caption workflow.

Uwagi do posiedzeń

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Wykłady + lekcje

Napisz 90-minutowy wykład, a następnie użyj /study/flashcards / lub /wpisz/summarize /, aby przekształcić go w materiały naukowe.

Audyo obcego języka

Whisper automatycznie wykrywa 99 języków. Transcribe w oryginału, następnie wyślij tekst przez /translate / aby skoczyć języki.

Prawne + medyczne

Czasopisma, etykiety głośników, JSON eksportować z każdym słowem start/end time — dokładny sprawozdawca sądowy lub przygotowanie notatek klinicznych.

W jaki sposób Free.ai transkrypcji porównuje

Co dostaniesz?	Free.ai	Otter.ai	Descript	Rev.com
Darmowe codzienne stosowanie	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Silnik	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Języki	99	English-focused	22	30+
Dializacja głośnika
Eksport SRT / VTT		Paid	Paid
Publiczny API		Limited	Limited
Live streaming STT	(wolne)	Paid	—	—
Wymagana rejestracja	Nie.	Yes	Yes	Yes

Dane konkurentów odzwierciedlają publicznie wymienione wolne poziomy od 2026 r. Sprawdź każdy dostawca bieżących planów.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Jak stosować lek Speech to Text

Wprowadź swoje wpisy

Wpisz tekst, wyślij plik lub opisz, czego chcesz. Nie jest potrzebne konto.

Kliknij wygenerować

Nasz SI przetwarza Twoją prośbę w sekundach przy użyciu najlepszych modeli open-source.

Pobierz & dzielenie

Pobierz, kopiuj lub podziel się swoim wynikiem. Darmowe do użytku osobistego i komercyjnego.

Użyj tego narzędzia przez API

Automatyzuj to narzędzie z własnego kodu. Kompatybilny z OpenAI REST punkt końcowy, Authentic-Bearer-token, nie jest wymagany dodatkowy SDK. Koszty token pasują do interfejsu internetowego.

Dokumentacja API Pobierz klucz API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai oferuje przemówienie napędowe do tekstu z doskonałą dokładnością, 99 języków, eksportu napisów, wykrywania głośnika i żywego zachwycenia mikrofonu — całkowicie za darmo.

Wyślij plik audio lub wideo (MP3, WAV, MP4, M4A), kliknij Transcribe i uzyskuj dokładne przemówienie do tekstu w sekundach. Albo nagrywaj na żywo z mikrofonu.

Tak. Wklej dowolny URL YouTube w zakładce URL i przemówienie do narzędzia tekstu wydobywa dźwięk i konwertuje go. Pracuje z Instagram, TikTok, Spotify i 1.300+ platformy.

Tak. Automatycznie wykrywać lub wybrać z 99 języków. Nasze przemówienie do tekstu obsługuje akcenty, hałas tła i mixed- language audio dobrze.

Tak. Wybierz wiele plików audio naraz — każdy jest wysyłany przez mówcę do tekstu z postępem śledzenia, a wyniki są pobierane oddzielnie lub połączone.

Tak. Przemówienie do tekstu API pod adresem /api / jest kompatybilne z OpenAI. Wyślij audio programemmaticycznie i przejmij JSON z transkrypcją, językiem i czasami.

Tak. Włączenie/wyłączenie wykrywania głośnika przed wysyłaniem i przemówienie do wyjścia tekstu jest oznaczone na głośnik (Głośnik 1, głośnik 2...). Dodaje 50% do kosztu tokena.

Przemówienie do tekstu akceptuje pliki do 500MB na wysłanie. Dla zawartości wielogodzinnej, najpierw podziel dźwięk na kawałki.

Bardzo dokładny do jasnego dźwięku — zazwyczaj 95% + dokładność słów w języku angielskim z naszym Whisper big-v3 backend. Jakość zależy od jasności dźwięku, akcentu i tła hałasu.

Tak. Transkrypt jest w pełni edytowany na miejscu. Naprawić błędy, przeformułować, i kopiować/download jako TXT, SRT lub VTT.

Tak. Audio jest przetwarzany na naszych własnych GPU i usuwa się po przemówieniu do tekstu. Nic nie jest przechowywane długotrwałie, dzielone lub używane do szkolenia.

Tak. Wyślij plik audio lub wideo w /chat / i poproś SI o transkrypcję — połącz mów do tekstu z pytaniami następującymi i summaryzacja w jednym przepływie roboczym.

Zarejestruj się bezpłatnie na 30 000 żetonów

Utwórz bezpłatne konto

Karta kredytowa nie jest wymagana

Jak mógłbyś ocenić to narzędzie?

Speech to Text

Co ludzie przepisują z Free.ai

Wywiady + podcast

Automatyczne podpisy + napisy

Uwagi do posiedzeń

Wykłady + lekcje

Audyo obcego języka

Prawne + medyczne

W jaki sposób Free.ai transkrypcji porównuje

Wynik

Jak stosować lek Speech to Text

Wprowadź swoje wpisy

Kliknij wygenerować

Pobierz & dzielenie

Użyj tego narzędzia przez API

Speech to Text — FAQ

Jaka jest najlepsza swoboda wypowiedzi do narzędzia tekstowego?

Jak przekształcić przemówienie do tekstu online?

Czy przemówienie do tekstu zajmuje się filmami z YouTube?

Czy przemówienie do tekstów działa w innych językach?

Czy mogę przesłać do tekstu wiele plików do przemówienia?

Czy jest przemówienie do SMS-u?

Czy przemówienie do tekstu obsługuje etykiety głośników?

Jaki rozmiar pliku audio akceptuje przemówienie do tekstu?

Jak dokładne jest przemówienie do wyjścia tekstu?

Mogę zmienić przemówienie do transkryptu?

Czy przemówienie do SMS-a jest prywatne i bezpieczne?

Czy mogę używać przemówienia do SMS-u w SI Chat?

Zdobądź 10 tysięcy darmowych tokenów

Poczekaj, zdobądź 10 tysięcy darmowych toków!

Chcesz więcej?