语音转文字 Speech to Text

上传音频文件，浏览器端识别中文 / 粤语 / 英文。文件不上传，数据零泄露。

1. 选择音频支持 MP3 / WAV / M4A / FLAC / OGG / WEBM

🎙

把音频文件拖进来，或点击选择

最大 ~200MB · 也支持 Ctrl+V 粘贴音频

—

✕ 移除

中文 Mandarin

粤语 Cantonese

English

状态

—

首次加载需下载 ~40MB Whisper-tiny 模型（transformers.js / HuggingFace CDN）
模型缓存到浏览器 IndexedDB，之后离线可用。识别在浏览器本地完成，音频不离开你的设备。