STT Online

商业用途OK 380+模型 无水印 不需要注册
型号 :
+ GPT-5, Claude, Gemini
上传一个音频或视频文件(或粘贴一个 URL ), 并用时间戳获得一份干净的文字记录。 议长对称、 SRT/ VTT 字幕导出、 100+ 语言和自动检测。 成本比例与剪辑长度完全相同。 由 Whiseper large- v3 和 Parakeet (自托管) 提供动力, 加上 溢价 Wizper 和 11Labs STT 。

拖放音频/视频,或单击浏览

MP3、WAV、MP4、WebM、M4A-至多500MB

低语大V3——99种语言,最精准。
此剪辑的 Token 估计
免费签名 - 10K 符号 购买标牌
YouTube、Instagram、TikTok、Spotify和1 300+平台
URL 转录成本基于剪辑的实际持续时间——下载后我们引用。在Whisper上期待~500个标记/分钟。
录音: 0:00

使用麦克风实时抄录

脚本

正在写入您的音频...

较长的文件可能需要一点时间 。

人们用Free.ai的文字抄录什么?

Interviews + podcasts

diarization 标记每个扬声器 。 导出 SRT 直接进入您的视频编辑器, 或文章撰写的纯文本 。

Auto captions + subtitles

上传 YouTube 上传或 TikTok, 选择 SRT 或 WebVTT, 并用 / 视频/ 字幕/ 燃烧字幕。 一站式字幕工作流程 。

会议说明会议说明

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

撰写90分钟的演讲稿,然后使用/学习/剪切卡片/或/写/摘要/将其转化为学习材料。

外语音频

私语自动检测 99 种语言。 将文字写在原文中, 然后通过 / translate/ to jump languages 发送文本 。

Legal + medical

时间戳、演讲人标签、JSON出口,每个字的开始/结束时间——准确的法院报告人或临床注解前注。

How Free.ai transcription compares

你得到什么 Free.ai Otter.ai Descript Rev.com
每日免费免费使用5K+ tokens/day300 minutes/mo1 hr/month
引擎引擎Whisper large-v3, ParakeetProprietaryProprietaryHuman + AI
语言语言语言语言语言99English-focused2230+
议长对角
SRT / VTT 导出PaidPaid
APIP 公共公共LimitedLimited
实时流流 STT (自由) Paid
需要注册否 无YesYesYes
竞争者数字反映了截至2026年公开列出的免费分层。 请查看每个供应商当前的计划 。
高级选项
结果成果成果成果成果成果成果成果成果成果成果
声调越来越低 Get More Tokens
Want better results? 模型 (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

< a href=" "/ signup/" style=" "color:#16A34A" > 签名 以获得查询链接, 并获得每个朋友25,000个象征性的 。

还要吗? 每日5K象征性的免费签名 + 10K奖金
签署自由

处理您的请求...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

如何使用 STT Online

1
输入输入

键入文本、上传文件或描述您想要的东西。不需要账户 。

2
点击生成

我们的人工智能使用最佳的开放源码模型,在秒内处理你的请求。

3
下载共享( S)

下载、复制或分享您的结果。 免费个人和商业使用 。

通过 API 使用此工具

从您自己的代码中自动启用此工具。 OpenAI 兼容的 REST 端点、 Bearer-tok 异常点、 不需要额外的 SDK 。 Token 成本符合网络界面 。

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT(Speech-to-Text)使用AI.Free.ai将口头音频转换成书面文本,在我们自己的GPUs上运行Whisper large-V3(最准确的开放源语音识别模式)。

是的。 上传音频文件, 最多500MB。 STT每分钟音频费用为~ 500 个符号。 您每天免费获得2 500-5 000个免费符号 — — 每天多个文件。

STT接受MP3、WAV、MP4、WebM、M4A、OGG、FLAC——几乎是任何音频或视频格式——每次上传最多500MB。

是的。 STT 结果导出为 TXT、 SRT (字幕) 或 VTT (网站字幕) 。 适合YouTube 字幕和视频字幕 。

我们的STT使用Whiseper lar-v3, 通常用95字精度表示明确的英语,用99种语言表示质量优异,背景噪音和重口音的精确度较低。

是的,在STT选项和AI标签中,使演讲者对音量进行对称,将部分标为1号演讲者、2号演讲者等。

是的,STT API与OpenAI兼容——POST音频到/v1/audio/tranpations并接收JSON。 用任何能够发送HTTP请求的语文工作。

是的。 Live 标签捕捉到您的麦克风, 并实时通过STT, 并尽可能低的延迟 。

是的,粘贴一个YouTube、TikTok、Instagram、Spotify、或Vimeo URL和STT提取音频和抄录。 1 300+平台得到支持。

快速——一个1分钟的剪辑以秒计完成,一个30分钟的录制在大约一分钟内完成,一个1小时的文件在大约2分钟内完成。耳语运行在我们的 GPU 集群上。

是的。 音频通过我们自己的 GPU 处理, 并在STT 完成后删除。 它从未长期存储, 从未共享, 也从未用于示范培训 。

低音大V3是最大、最精确的低音模型(1.55B参数),我们自行在A100GPUs上安装,用于速度和隐私。

免费注册一万个符号

创建自由账户

无需信用卡

你会如何评分这个工具?

Love this tool? Share it!