对文本的语音

商业用途OK 380+模型 无水印 不需要注册
型号 :
+ GPT-5, Claude, Gemini
上传一个音频或视频文件(或粘贴一个 URL ), 并用时间戳获得一份干净的文字记录。 议长对称、 SRT/ VTT 字幕导出、 100+ 语言和自动检测。 成本比例与剪辑长度完全相同。 由 Whiseper large- v3 和 Parakeet (自托管) 提供动力, 加上 溢价 Wizper 和 11Labs STT 。

拖放音频/视频,或单击浏览

MP3、WAV、MP4、WebM、M4A-至多500MB

低语大V3——99种语言,最精准。
此剪辑的 Token 估计
免费签名 - 10K 符号 购买标牌
YouTube、Instagram、TikTok、Spotify和1 300+平台
URL 转录成本基于剪辑的实际持续时间——下载后我们引用。在Whisper上期待~500个标记/分钟。
录音: 0:00

使用麦克风实时抄录

脚本

正在写入您的音频...

较长的文件可能需要一点时间 。

人们用Free.ai的文字抄录什么?

Interviews + podcasts

diarization 标记每个扬声器 。 导出 SRT 直接进入您的视频编辑器, 或文章撰写的纯文本 。

Auto captions + subtitles

上传 YouTube 上传或 TikTok, 选择 SRT 或 WebVTT, 并用 / 视频/ 字幕/ 燃烧字幕。 一站式字幕工作流程 。

会议说明会议说明

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

撰写90分钟的演讲稿,然后使用/学习/剪切卡片/或/写/摘要/将其转化为学习材料。

外语音频

私语自动检测 99 种语言。 将文字写在原文中, 然后通过 / translate/ to jump languages 发送文本 。

Legal + medical

时间戳、演讲人标签、JSON出口,每个字的开始/结束时间——准确的法院报告人或临床注解前注。

How Free.ai transcription compares

你得到什么 Free.ai Otter.ai Descript Rev.com
每日免费免费使用5K+ tokens/day300 minutes/mo1 hr/month
引擎引擎Whisper large-v3, ParakeetProprietaryProprietaryHuman + AI
语言语言语言语言语言99English-focused2230+
议长对角
SRT / VTT 导出PaidPaid
APIP 公共公共LimitedLimited
实时流流 STT (自由) Paid
需要注册否 无YesYesYes
竞争者数字反映了截至2026年公开列出的免费分层。 请查看每个供应商当前的计划 。
高级选项
结果成果成果成果成果成果成果成果成果成果成果
声调越来越低 Get More Tokens
Want better results? 模型 (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

< a href=" "/ signup/" style=" "color:#16A34A" > 签名 以获得查询链接, 并获得每个朋友25,000个象征性的 。

还要吗? 每日5K象征性的免费签名 + 10K奖金
签署自由

处理您的请求...

将音频和视频发送到 AI. 上传文件、 粘贴 URL 或使用您的麦克风 。

如何使用 对文本的语音

1
输入输入

键入文本、上传文件或描述您想要的东西。不需要账户 。

2
点击生成

我们的人工智能使用最佳的开放源码模型,在秒内处理你的请求。

3
下载共享( S)

下载、复制或分享您的结果。 免费个人和商业使用 。

通过 API 使用此工具

从您自己的代码中自动启用此工具。 OpenAI 兼容的 REST 端点、 Bearer-tok 异常点、 不需要额外的 SDK 。 Token 成本符合网络界面 。

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

对文本的语音 — FAQ

Free AI Transption 将音频和视频文件转换为使用Wwhisper(最先进的语音识别模型)的文本。 上传文件并在秒内获得准确文本 。

是的! 传输成本 ~ 每秒音频 ~ 4 个符号。 5分钟的文件成本 ~ 1 200 个符号。 您每天免费获得 10,000 个符号 。

Whisper 支持99+语言, 使用自动语言检测。 只要上传您的音频, 自动检测语言 。

MP3、WAV、M4A、FLAC、OGG、MP4、WEBM和最常见的音频/视频格式。

耳语是现有最准确的STT模型之一,可与商业服务相比,准确性因音频质量和语言而异。

是! 选择纯文本或时间戳输出( SRT 字幕格式) 。

匿名用户最高为 25MB, 签名用户最高为 100MB。 对于较大的文件, 先分割它们 。

不! 没有账户, 立即将文件转录为文件 。

是的,使用我们的专用/记录/Youtube/工具——粘贴任何公开的YouTube URL,我们处理下载+抄录。

我们的笔录使用同一个耳语模型,完全免费。Otter每月收费8至24美元,每分钟收费8至24美元。

抄录的文本完全可以编辑——根据需要复制、修改和下载。

是的! 存取分批处理的 API 代码

免费注册一万个符号

创建自由账户

无需信用卡

你会如何评分这个工具?

Love this tool? Share it!