Speech to Text

상업적 사용 OK 380+ 모델 워터마크 없음 가입이 필요하지 않습니다
모델:
+ GPT-5, Claude, Gemini
오디오 또는 비디오 파일을 업로드하거나 URL을 붙여넣으면 타임스탬프가 있는 깨끗한 기록을 얻을 수 있습니다. 스피커 디아리제이션, SRT/VTT 자막 내보내기, 자동 감지 기능이 있는 100개 이상의 언어. 비용은 클립 길이에 따라 정확하게 조정됩니다. Whisper large-v3 및 Parakeet(자체 호스팅)을 기반으로 하며, 프리미엄 Wizper 및 ElevenLabs STT를 추가로 제공합니다.

오디오/비디오를 드래그 앤 드롭하거나 클릭하여 찾아보기

MP3, WAV, MP4, WebM, M4A — 최대 500MB

Whisper large-v3 — 99개 언어, 최고의 정확도.
이 클립의 토큰 추정치
YouTube, Instagram, TikTok, Spotify 및 1,300개 이상의 플랫폼
URL 변환 비용은 클립의 실제 기간을 기반으로 합니다. 다운로드 후 견적을 제공합니다. Whisper에서는 분당 500 토큰 정도가 예상됩니다.
녹음 중: 0:00

마이크를 사용한 실시간 번역

녹음

오디오를 녹음 중...

긴 파일의 경우 잠시 시간이 걸릴 수 있습니다.

Free.ai으로 쓰는 글

Interviews + podcasts

SRT를 비디오 편집기로 바로 내보내거나 기사 작성을 위해 일반 텍스트로 내보낼 수 있습니다.

Auto captions + subtitles

YouTube 업로드 또는 TikTok을 업로드하고 SRT 또는 WebVTT를 선택하고 /video/subtitle/로 자막을 레코딩하십시오. 원스톱 자막 워크플로우.

회의 메모

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

90분 강의를 녹음한 다음 /study/flashcards/ 또는 /write/summarize/ 를 사용하여 학습 자료로 변환합니다.

외국어 오디오

Whisper는 99개의 언어를 자동으로 감지합니다. 원본으로 번역한 다음 /translate/를 통해 언어를 점프시키는 텍스트를 보냅니다.

Legal + medical

타임스탬프, 스피커 레이블, 모든 단어의 시작/종료 시간이 포함된 JSON 내보내기 — 정확한 법정 기자 또는 임상 노트 준비.

Free.ai 전사 비교 방법

당신이 얻을 수 있는 Free.ai Otter.ai Descript Rev.com
무료 일일 사용5K+ tokens/day300 minutes/mo1 hr/month
엔진Whisper large-v3, ParakeetProprietaryProprietaryHuman + AI
언어99English-focused2230+
스피커 디아리제이션
SRT / VTT 내보내기PaidPaid
공개 APILimitedLimited
라이브 스트리밍 STT (무료) Paid
등록이 필요합니다아니요YesYesYes
경쟁사 수치는 2026년 기준으로 공개된 무료 계층을 반영합니다. 각 공급업체의 현재 플랜을 확인하십시오.
고급 옵션
결과
토큰이 부족해요 Get More Tokens
Want better results? 프리미엄 모델 (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

가입 추천 링크를 얻을 수 있으며 친구 당 25,000 토큰을 적립합니다.

더 먹고 싶어? 하루 5K 토큰 + 10K 보너스 무료 가입
무료로 가입하세요

귀하의 요청을 처리 중...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

사용 방법 Speech to Text

1
입력을 입력하십시오

텍스트를 입력하거나 파일을 업로드하거나 원하는 내용을 설명하세요. 계정이 필요하지 않습니다.

2
생성하기를 클릭하십시오

당사의 AI는 최고의 오픈 소스 모델을 사용하여 몇 초 만에 요청을 처리합니다.

3
다운로드 및 공유

다운로드, 복사 또는 결과를 공유. 개인 및 상업용 무료.

API를 통해 이 도구를 사용

이 도구를 자신의 코드로 자동화하세요. OpenAI 호환 REST 엔드포인트, 베어러 토큰 인증, 추가 SDK 필요 없음. 토큰 비용은 웹 인터페이스와 일치합니다.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai은 Whisper 기반의 음성 텍스트 변환 기능을 뛰어난 정확도로 제공하며, 99개 언어, 자막 내보내기, 스피커 감지, 라이브 마이크 캡처 기능을 제공합니다.

오디오 또는 비디오 파일(MP3, WAV, MP4, M4A)을 업로드하고 번역을 클릭하면 몇 초 만에 정확한 음성을 텍스트로 변환할 수 있습니다. 또는 마이크로폰으로 라이브 녹음을 할 수도 있습니다.

예. URL 탭에 YouTube URL을 붙여넣으면 음성 텍스트 도구가 오디오를 추출하여 변환합니다. Instagram, TikTok, Spotify 및 1,300개 이상의 플랫폼에서 작동합니다.

99개 언어 중에서 자동으로 감지하거나 선택할 수 있습니다. 음성 텍스트 변환은 억양, 배경 소음 및 혼합 언어 오디오를 잘 처리합니다.

예. 한 번에 여러 오디오 파일을 선택할 수 있습니다. 각각의 파일은 진행 추적이 가능한 음성 텍스트로 전송되며 결과는 별도로 또는 결합하여 다운로드할 수 있습니다.

예. /api/의 음성 텍스트 API는 OpenAI와 호환됩니다. 프로그래밍 방식으로 오디오를 업로드하고 JSON을 녹음, 언어, 타임스탬프와 함께 받습니다.

네. 업로드하기 전에 스피커 감지를 토글하면 음성에서 텍스트로 출력되는 내용이 스피커별로 라벨링됩니다(스피커 1, 스피커 2 등). 토큰 비용에 50% 추가됩니다.

음성 텍스트 변환은 업로드당 최대 500MB의 파일을 허용합니다. 여러 시간의 콘텐츠를 처음에 덩어리로 나누십시오.

Whisper large-v3 백엔드를 사용하여 영어 단어의 정확도는 일반적으로 95% 이상입니다. 품질은 오디오의 선명도, 억양 및 배경 소음에 따라 달라집니다.

네, 녹음본은 완전히 편집 가능합니다. 오류를 수정하고, 다시 포맷하고, TXT, SRT 또는 VTT로 복사/다운로드할 수 있습니다.

오디오는 당사의 GPU에서 처리되며 음성 텍스트 변환이 완료되면 삭제됩니다. 아무 것도 장기간 저장되거나 공유되지 않으며 훈련에 사용되지 않습니다.

/chat/에 오디오 또는 비디오 파일을 업로드하고 AI에게 그것을 녹음하도록 요청하십시오. 한 워크플로우에서 음성을 텍스트로 변환하고 추가 질문과 요약을 결합할 수 있습니다.

10,000 토큰을 무료로 등록하세요

무료 계정 만들기

신용카드 필요 없음

이 도구를 어떻게 평가하시겠습니까?

Love this tool? Share it!