任意のオーディオまたはビデオファイルをドロップし、言語を選択すると、タイムスタンプ付きの完全な書き起こしが得られます - すべてブラウザ内で行われます。モデルは一度ダウンロードされ(~75 MB)ローカルにキャッシュされるため、その後の実行は即時かつオフラインで動作します。
認識はローカルで実行されます。あなたの音声は端末から外に出ることはありません。
モデルはブラウザにキャッシュされます。以降の実行はオフラインで動作します。
アカウント不要、クレジット不要、使用上限なし。開いてすぐに使えます。
ブラウザ内の無料ツールは小さなオープンソースモデルを実行します - クリーンな音声では問題ありませんが、強いアクセント、ノイズ、話者の重なりには苦戦することがあります。放送品質の精度とSRT/VTTを得たい場合は、直接動画編集ソフトに取り込み、Subformerのクラウド文字起こしをSubtitles-onlyモードで実行してください。
字幕のみモードを開く