1. 选择音频 支持 MP3 / WAV / M4A / FLAC / OGG / WEBM
🎙
把音频文件拖进来,或点击选择
最大 ~200MB · 也支持 Ctrl+V 粘贴音频
—
✕ 移除
2. 选择识别语言 必选
中文 Mandarin
粤语 Cantonese
English
上传音频文件,浏览器端识别中文 / 粤语 / 英文。文件不上传,数据零泄露。
首次加载需下载 ~40MB Whisper-tiny 模型(transformers.js / HuggingFace CDN)
模型缓存到浏览器 IndexedDB,之后离线可用。识别在浏览器本地完成,音频不离开你的设备。