Speech to Text

상업적 사용 OK 380+ 모델 워터마크 없음 가입이 필요하지 않습니다

오디오 또는 비디오 파일을 업로드하거나 URL을 붙여넣으면 타임스탬프가 있는 깨끗한 기록을 얻을 수 있습니다. 스피커 디아리제이션, SRT/VTT 자막 내보내기, 자동 감지 기능이 있는 100개 이상의 언어. 비용은 클립 길이에 따라 정확하게 조정됩니다. Whisper large-v3 및 Parakeet(자체 호스팅)을 기반으로 하며, 프리미엄 Wizper 및 ElevenLabs STT를 추가로 제공합니다.

오디오/비디오를 드래그 앤 드롭하거나 클릭하여 찾아보기

MP3, WAV, MP4, WebM, M4A — 최대 500MB

언어

엔진 Whisper large-v3 — 99개 언어, 최고의 정확도.

출력 형식

스피커 감지 — 언제 누가 말하는지 표시 (+50% 토큰)

스피커 수

YouTube, Instagram, TikTok, Spotify 및 1,300개 이상의 플랫폼

엔진

출력 형식

스피커 감지 — +50%

URL 변환 비용은 클립의 실제 기간을 기반으로 합니다. 다운로드 후 견적을 제공합니다. Whisper에서는 분당 500 토큰 정도가 예상됩니다.

마이크를 사용한 실시간 번역

Free.ai으로 쓰는 글

인터뷰 + 팟캐스트

SRT를 비디오 편집기로 바로 내보내거나 기사 작성을 위해 일반 텍스트로 내보낼 수 있습니다.

자동 자막 + 자막

YouTube 업로드 또는 TikTok을 업로드하고 SRT 또는 WebVTT를 선택하고 /video/subtitle/로 자막을 레코딩하십시오. 원스톱 자막 워크플로우.

회의 메모

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

강의 + 수업

90분 강의를 녹음한 다음 /study/flashcards/ 또는 /write/summarize/ 를 사용하여 학습 자료로 변환합니다.

외국어 오디오

Whisper는 99개의 언어를 자동으로 감지합니다. 원본으로 번역한 다음 /translate/를 통해 언어를 점프시키는 텍스트를 보냅니다.

법률 + 의료

타임스탬프, 스피커 레이블, 모든 단어의 시작/종료 시간이 포함된 JSON 내보내기 — 정확한 법정 기자 또는 임상 노트 준비.

Free.ai 전사 비교 방법

당신이 얻을 수 있는	Free.ai	Otter.ai	Descript	Rev.com
무료 일일 사용	5K+ tokens/day	300 minutes/mo	1 hr/month	—
엔진	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
언어	99	English-focused	22	30+
스피커 디아리제이션
SRT / VTT 내보내기		Paid	Paid
공개 API		Limited	Limited
라이브 스트리밍 STT	(무료)	Paid	—	—
등록이 필요합니다	아니요	Yes	Yes	Yes

경쟁사 수치는 2026년 기준으로 공개된 무료 계층을 반영합니다. 각 공급업체의 현재 플랜을 확인하십시오.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

사용 방법 Speech to Text

입력을 입력하십시오

텍스트를 입력하거나 파일을 업로드하거나 원하는 내용을 설명하세요. 계정이 필요하지 않습니다.

생성하기를 클릭하십시오

당사의 AI는 최고의 오픈 소스 모델을 사용하여 몇 초 만에 요청을 처리합니다.

다운로드 및 공유

다운로드, 복사 또는 결과를 공유. 개인 및 상업용 무료.

API를 통해 이 도구를 사용

이 도구를 자신의 코드로 자동화하세요. OpenAI 호환 REST 엔드포인트, 베어러 토큰 인증, 추가 SDK 필요 없음. 토큰 비용은 웹 인터페이스와 일치합니다.

API 문서화 API 키 가져오기

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai은 Whisper 기반의 음성 텍스트 변환 기능을 뛰어난 정확도로 제공하며, 99개 언어, 자막 내보내기, 스피커 감지, 라이브 마이크 캡처 기능을 제공합니다.

오디오 또는 비디오 파일(MP3, WAV, MP4, M4A)을 업로드하고 번역을 클릭하면 몇 초 만에 정확한 음성을 텍스트로 변환할 수 있습니다. 또는 마이크로폰으로 라이브 녹음을 할 수도 있습니다.

예. URL 탭에 YouTube URL을 붙여넣으면 음성 텍스트 도구가 오디오를 추출하여 변환합니다. Instagram, TikTok, Spotify 및 1,300개 이상의 플랫폼에서 작동합니다.

99개 언어 중에서 자동으로 감지하거나 선택할 수 있습니다. 음성 텍스트 변환은 억양, 배경 소음 및 혼합 언어 오디오를 잘 처리합니다.

예. 한 번에 여러 오디오 파일을 선택할 수 있습니다. 각각의 파일은 진행 추적이 가능한 음성 텍스트로 전송되며 결과는 별도로 또는 결합하여 다운로드할 수 있습니다.

예. /api/의 음성 텍스트 API는 OpenAI와 호환됩니다. 프로그래밍 방식으로 오디오를 업로드하고 JSON을 녹음, 언어, 타임스탬프와 함께 받습니다.

네. 업로드하기 전에 스피커 감지를 토글하면 음성에서 텍스트로 출력되는 내용이 스피커별로 라벨링됩니다(스피커 1, 스피커 2 등). 토큰 비용에 50% 추가됩니다.

음성 텍스트 변환은 업로드당 최대 500MB의 파일을 허용합니다. 여러 시간의 콘텐츠를 처음에 덩어리로 나누십시오.

Whisper large-v3 백엔드를 사용하여 영어 단어의 정확도는 일반적으로 95% 이상입니다. 품질은 오디오의 선명도, 억양 및 배경 소음에 따라 달라집니다.

네, 녹음본은 완전히 편집 가능합니다. 오류를 수정하고, 다시 포맷하고, TXT, SRT 또는 VTT로 복사/다운로드할 수 있습니다.

오디오는 당사의 GPU에서 처리되며 음성 텍스트 변환이 완료되면 삭제됩니다. 아무 것도 장기간 저장되거나 공유되지 않으며 훈련에 사용되지 않습니다.

/chat/에 오디오 또는 비디오 파일을 업로드하고 AI에게 그것을 녹음하도록 요청하십시오. 한 워크플로우에서 음성을 텍스트로 변환하고 추가 질문과 요약을 결합할 수 있습니다.

30,000 토큰을 무료로 등록하세요

무료 계정 만들기

신용카드 필요 없음

이 도구를 어떻게 평가하시겠습니까?

Speech to Text

Free.ai으로 쓰는 글

인터뷰 + 팟캐스트

자동 자막 + 자막

회의 메모

강의 + 수업

외국어 오디오

법률 + 의료

Free.ai 전사 비교 방법

결과

사용 방법 Speech to Text

입력을 입력하십시오

생성하기를 클릭하십시오

다운로드 및 공유

API를 통해 이 도구를 사용

Speech to Text — FAQ

무료 텍스트 도구에 최고의 음성은 무엇입니까?

온라인으로 음성을 텍스트로 변환하려면 어떻게 합니까?

음성 텍스트로 YouTube 동영상을 처리할 수 있습니까?

음성 텍스트 변환은 다른 언어에서도 작동합니까?

음성 텍스트로 변환을 위해 여러 개의 파일을 업로드할 수 있습니까?

음성에서 텍스트로 API가 있습니까?

음성 텍스트로 변환은 발음기 레이블을 지원합니까?

음성 텍스트로 변환은 어떤 오디오 파일 크기를 지원합니까?

음성에서 텍스트로의 출력은 얼마나 정확합니까?

연설을 텍스트로 편집할 수 있습니까?

음성 텍스트로 변환은 개인적이고 안전합니까?

AI 채팅에서 음성을 텍스트로 변환할 수 있습니까?

10,000 무료 토큰 받기

기다려요 — 10K 무료 토큰 받기!

더 먹고 싶어?