STT Online

상업적 사용 OK 380+ 모델 워터마크 없음 가입이 필요하지 않습니다
모델:
+ GPT-5, Claude, Gemini
오디오 또는 비디오 파일을 업로드하거나 URL을 붙여넣으면 타임스탬프가 있는 깨끗한 기록을 얻을 수 있습니다. 스피커 디아리제이션, SRT/VTT 자막 내보내기, 자동 감지 기능이 있는 100개 이상의 언어. 비용은 클립 길이에 따라 정확하게 조정됩니다. Whisper large-v3 및 Parakeet(자체 호스팅)을 기반으로 하며, 프리미엄 Wizper 및 ElevenLabs STT를 추가로 제공합니다.

오디오/비디오를 드래그 앤 드롭하거나 클릭하여 찾아보기

MP3, WAV, MP4, WebM, M4A — 최대 500MB

Whisper large-v3 — 99개 언어, 최고의 정확도.
이 클립의 토큰 추정치
YouTube, Instagram, TikTok, Spotify 및 1,300개 이상의 플랫폼
URL 변환 비용은 클립의 실제 기간을 기반으로 합니다. 다운로드 후 견적을 제공합니다. Whisper에서는 분당 500 토큰 정도가 예상됩니다.
녹음 중: 0:00

마이크를 사용한 실시간 번역

녹음

오디오를 녹음 중...

긴 파일의 경우 잠시 시간이 걸릴 수 있습니다.

Free.ai으로 쓰는 글

Interviews + podcasts

SRT를 비디오 편집기로 바로 내보내거나 기사 작성을 위해 일반 텍스트로 내보낼 수 있습니다.

Auto captions + subtitles

YouTube 업로드 또는 TikTok을 업로드하고 SRT 또는 WebVTT를 선택하고 /video/subtitle/로 자막을 레코딩하십시오. 원스톱 자막 워크플로우.

회의 메모

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

90분 강의를 녹음한 다음 /study/flashcards/ 또는 /write/summarize/ 를 사용하여 학습 자료로 변환합니다.

외국어 오디오

Whisper는 99개의 언어를 자동으로 감지합니다. 원본으로 번역한 다음 /translate/를 통해 언어를 점프시키는 텍스트를 보냅니다.

Legal + medical

타임스탬프, 스피커 레이블, 모든 단어의 시작/종료 시간이 포함된 JSON 내보내기 — 정확한 법정 기자 또는 임상 노트 준비.

Free.ai 전사 비교 방법

당신이 얻을 수 있는 Free.ai Otter.ai Descript Rev.com
무료 일일 사용5K+ tokens/day300 minutes/mo1 hr/month
엔진Whisper large-v3, ParakeetProprietaryProprietaryHuman + AI
언어99English-focused2230+
스피커 디아리제이션
SRT / VTT 내보내기PaidPaid
공개 APILimitedLimited
라이브 스트리밍 STT (무료) Paid
등록이 필요합니다아니요YesYesYes
경쟁사 수치는 2026년 기준으로 공개된 무료 계층을 반영합니다. 각 공급업체의 현재 플랜을 확인하십시오.
고급 옵션
결과
토큰이 부족해요 Get More Tokens
Want better results? 프리미엄 모델 (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

가입 추천 링크를 얻을 수 있으며 친구 당 25,000 토큰을 적립합니다.

더 먹고 싶어? 하루 5K 토큰 + 10K 보너스 무료 가입
무료로 가입하세요

귀하의 요청을 처리 중...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

사용 방법 STT Online

1
입력을 입력하십시오

텍스트를 입력하거나 파일을 업로드하거나 원하는 내용을 설명하세요. 계정이 필요하지 않습니다.

2
생성하기를 클릭하십시오

당사의 AI는 최고의 오픈 소스 모델을 사용하여 몇 초 만에 요청을 처리합니다.

3
다운로드 및 공유

다운로드, 복사 또는 결과를 공유. 개인 및 상업용 무료.

API를 통해 이 도구를 사용

이 도구를 자신의 코드로 자동화하세요. OpenAI 호환 REST 엔드포인트, 베어러 토큰 인증, 추가 SDK 필요 없음. 토큰 비용은 웹 인터페이스와 일치합니다.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT(Speech-to-Text)는 AI를 사용하여 말하는 오디오를 쓰는 텍스트로 변환합니다. Free.ai은 가장 정확한 오픈 소스 음성 인식 모델인 Whisper large-v3를 자체 GPU에서 실행합니다.

네, 최대 500MB의 오디오 파일을 업로드할 수 있습니다. STT는 오디오 분당 500 토큰의 비용이 듭니다. 하루에 2,500~5,000개의 무료 토큰을 받으실 수 있습니다.

STT는 MP3, WAV, MP4, WebM, M4A, OGG, FLAC — 거의 모든 오디오 또는 비디오 형식 — 업로드 당 최대 500MB를 수락합니다.

예. STT 결과는 TXT, SRT(자막), VTT(웹 자막)로 내보낼 수 있습니다. YouTube 자막 및 비디오 자막에 완벽합니다.

STT는 Whisper large-v3를 사용합니다. Whisper large-v3는 일반적으로 95% 이상의 단어 정확도를 제공하여 99개 언어에서 명확한 영어와 우수한 품질을 제공합니다.

예. STT 옵션에서 스피커 디아리제이션을 활성화하면 AI가 스피커 1, 스피커 2 등으로 세그먼트를 레이블링합니다.

STT API는 OpenAI와 호환됩니다. 오디오를 /v1/audio/transcriptions로 POST하고 JSON을 받습니다. HTTP 요청을 보낼 수 있는 모든 언어에서 작동합니다.

네. 라이브 탭은 마이크를 캡처하고 지연 시간을 최소화하여 STT를 통해 실시간으로 스트리밍합니다.

YouTube, TikTok, Instagram, Spotify 또는 Vimeo URL을 붙여넣으면 STT가 오디오를 추출하여 녹음합니다. 1,300개 이상의 플랫폼 지원.

빠르다 — 1분짜리 클립은 몇 초 만에 완성되고, 30분짜리 녹화는 약 1분, 1시간짜리 파일은 약 2분 만에 완성됩니다. Whisper는 GPU 클러스터에서 실행됩니다.

오디오는 당사의 GPU에서 처리되며 STT가 완료되면 삭제됩니다. 오디오는 장기간 저장되지 않으며 공유되지 않으며 모델 트레이닝에 사용되지 않습니다.

Whisper large-v3 — 가장 크고 정확한 Whisper 모델(1.55B 매개변수). 속도와 개인정보 보호를 위해 A100 GPU에서 셀프 호스팅합니다.

10,000 토큰을 무료로 등록하세요

무료 계정 만들기

신용카드 필요 없음

이 도구를 어떻게 평가하시겠습니까?

Love this tool? Share it!