Fal Speech-to-Text
Free.ai
·
stt
·
~500 దీనికి సూచనలు minute
మాధ్యమం (_H)_ FACE_ FALE_CESYS_CALESYS_CESYS) Routed through external models — ~500 tokens నిమిషానికి (50% markup over upstream cost).
API ద్వారా వుపయోగించుము
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
APIపత్రరచన
API కీను పొందుము
తరచూ అడగబడే ప్రశ్నలు
ఆడియోలోనికి టైపుచేయబడిన MP3, WAV, M4A లేదా వీడియో ఫైల్ను మరియు _FEE_PE_PH ను పూర్తి స్లైసెన్స్ తో తిరిగివుంచబడుతుంది. (_F)
వివరంగా అనేక భాషలను నిర్వహించును (_F) — 90_ device_TREIA_ TRUE_ TRE_ CHATIM మోడల్ కవర్లను కవర్చేయుతుంది, మరికొన్నింటికి వర్తిస్తాయి, "స్వయం-నేడు-నేట్" ఎంచుకోండి లేదా భాషను అత్యంత ఖచ్చితంగా సూచించుము.
పవిత్ర ఇంగ్లీషు ఆడియోనందు, విస్తీర్ణతతో లేదా ఉచ్ఛారణతో 1020% పదాలు 510 శాతం. ఒకే భవనం యొక్క పెద్ద మాండలికాలు ఎంతో అర్థవంతంగా పనిచేస్తాయి, ఆడియో విరామం విరామకరంగా ఉన్నప్పుడు పెద్దగా ఎంచుకోండి.
అవును — ప్రతి భాగము ప్రారంభం/ సెకనులు కలిగివుంటుంది. ఎస్ ఆర్టిటి లేదా VTT లా ఎగుమతి మరియు టైమ్ పటాలు మీ వీడియో లోకి నేరుగా చేరుస్తాయి.
నిమిషానికి దాదాపు 1,500,500 చిహ్నాలు. $1 = 7,50,000 సూచనలు.
MP3, WAV, MAG, FLAC, ఓబ్రైడ్, మరియు వీడియో (MAG4, MOV, వెబ్M) - మేము ఆడియోను తీసివేస్తాము. మాక్స్ 500 ఎంబైలు. / iodo/ script/ state/ statch/ ఉపయోగించుము.
స్పీకర్ డిజైన్స్ అనేది ఒక ప్రత్యేక పాస్, అంటే /tranchation/ on. FREI_ PHI_ PHS_ PHITS ను సంభాలించేది; డైలాజేషన్ కాయింటు ఒక్కొక్క భాగాన్ని స్పీకర్ 1 / 2 / etc.
అవును, /Botch/socus ఆడియో ఫైళ్ళ యొక్క సంచయంను స్వీకరించుతుంది. /aclients/? Tab=tab map=tappoint application. folder- tription కొరకు API వుపయోగిస్తోంది.
— మీ ఆడియోను /v1/tranch ను మోడల్=FREI_ PHSE_BAR_fE_ PHSE_BAR_fE_ play_ PHOXY. text + లెమ్బార్స్తో తిరిగివుంచుతుంది. /aPi/ మొత్తం రిఫరెన్సును కలిగివుంది.
GPUS న ఆడియోను నిర్వహించే మోడల్లు మా GPUS; ఒక DPA ద్వారా దాటి పోతే. ఆడియో విక్రయింపబడుతుంది (24H, 7d సైన్సింగ్) తరువాత తొలగించబడింది. మేము మీ ఇన్పుట్లను ట్రెయిన్ కాదు.
Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).
రియల్- టైమ్ కారకం default 0.0.2× — 60-మిలియన్ పోడ్కాస్ట్ ట్రాన్స్ స్కాన్స్ 312 నిమిషాలలో. ప్రొపెండ్సు మోడల్ తరచుగా వేగవంతంగా ముగించుతుంది. NAME OF TRANSLATORS