Fal Speech-to-Text

Free.ai · stt · ~500 жетони по minute

Слање звука

Испусти аудио или видео фајл, или налепи УРЛ испод

~500 жетони по minute

Слободно ради на нашим ГПУ-овима. Надоградња за Fal Speech-to-Text →

Fal Speech-to-Text is a модел говора‐ у‐ текст. Routed through external models — ~500 tokens по минуту (50% markup over upstream cost).

Користи преко АПИ‐ а

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'

АПИ документација Добављање АПИ кључа

Similar models

ElevenLabs STT

Wizper (Whisper v3)

Browse all models →

Често постављана питања

Fal Speech-to-Text transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and Fal Speech-to-Text returns the full transcript plus optional SRT/VTT subtitles with timestamps.

Fal Speech-to-Text handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.

Стапка речи- тероризма је 5–10% на чистом енглеском звуку, 10–20% на бучном или нагласљеном аудио. Велике варијанте исте архитектуре значајно боље раде на тешким случајевима — изаберите већи када је звук груб.

Да — сваки сегмент укључује датумске ознаке почетка и краја. Извези као СРТ или ВТТ и мапу пута директно на снимак.

Fal Speech-to-Text is a premium transcription engine. About ~500–1,500 tokens per minute of audio. $1 = 750,000 tokens.

MP3, WAV, M4A, FLAC, OGG, плус видео (MP4, MOV, WebM) — извлачимо аудио. Макс. 500 МБ по слању. Дужи фајлови? Поделите са / audio/cut/ или употребите / v1/stt/ batch /.

Дијаризација звучника је одвојен пролаз — укључите „ дијаризирај “ на /transcribed /. Fal Speech-to-Text управља транскрипцијом; дијаризационе ознаке сваког сегмента са спикером 1 / Speaker 2 / itd.

Да — /batch / прихвата фасциклу аудио фајлова. Сваки транскрипт слеће у / account /?tab=историју са изворним именом фајла. За одржавање фасцикле- дрвета користите АПИ.

Да — ВРАћа ЈСОН са текстом + сегмента + врх путања р› ијечи. /api / има пуну референцу.

Само- домаћински модели држе звук на нашим ГПУ‐ овима; премијум пролази са ДПА‐ ом. Аудио се обрише након прозора за д› ијељење (24х anon, 7d потписан). Ми не тренирамо на вашим улазима.

Да — Free.ai дозвољава комерцијалну коришћење транскрипта. Потребна су вам права на звук који сте убацили (власни снимак, лиценцирани материјал или садржај са пристанком).

Чинилац у реалном времену је отприлике 0,05–0,2× — 60-минутни транскриптор подемисије за 3‐ 12 минута. Премиум модели често завршавају брже. Користите дугме редоследа да затворите језичак.

Fal Speech-to-Text

Користи преко АПИ‐ а

Similar models

Често постављана питања

What does Fal Speech-to-Text do?

Колико језика подршка Fal Speech-to-Text?

How accurate is Fal Speech-to-Text?

Does Fal Speech-to-Text include timestamps?

How much does Fal Speech-to-Text cost per minute?

What audio formats can I upload to Fal Speech-to-Text?

Може ли _ФРЕИ_ИМЕ_ИМЕ_Идентификовати различите звучнике?

Can I batch transcribe with Fal Speech-to-Text?

Is there an API for Fal Speech-to-Text?

What about privacy when I transcribe with Fal Speech-to-Text?

Is Fal Speech-to-Text output safe for commercial use?

How long does Fal Speech-to-Text take?

Набавите 10.000 бесплатних токова

Чекајте, добијте 10К бесплатних токена!

Хоћеш још?