Free · No signup · Runs in your browser

Free Speech to Text in 35+ Languages

Drop any audio or video file, pick a language, and get a full transcript with timestamps - all in your browser. The model is downloaded once (~75 MB) and cached locally, so subsequent runs are instant and work offline.

Private by default

Recognition runs locally. Your audio never leaves your device.

Instant after first load

The model is cached in your browser. Subsequent runs work offline.

Free, no signup

No account, no credits, no usage cap. Open and use.

Choose a language

English
English
Spanish
Español
French
Français
German
Deutsch
Italian
Italiano
Portuguese
Português
Dutch
Nederlands
Polish
Polski
Russian
Русский
Ukrainian
Українська
Turkish
Türkçe
Arabic
العربية
Hebrew
עברית
Farsi
فارسی
Urdu
اردو
Hindi
हिन्दी
Bengali
বাংলা
Tamil
தமிழ்
Mandarin
中文
Japanese
日本語
Korean
한국어
Vietnamese
Tiếng Việt
Thai
ไทย
Indonesian
Bahasa Indonesia
Malay
Bahasa Melayu
Swedish
Svenska
Danish
Dansk
Norwegian
Norsk
Finnish
Suomi
Czech
Čeština
Greek
Ελληνικά
Hungarian
Magyar
Romanian
Română
Bulgarian
Български
Catalan
Català

Need higher accuracy?

Cloud-quality transcription - Subtitles-only mode

The free in-browser tool runs a small open-source model - fine for clean audio, but it can struggle with heavy accents, noise, or overlapping speakers. For broadcast-grade accuracy and SRT/VTT you can drop straight into a video editor, run your file through Subformer's cloud transcription in Subtitles-only mode.

Open Subtitles-only mode