媒体处理2024-02-01
Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具
https://github.com/Const-me/Whisper/
已高速(如有密码:3519)http://ct.ghpym.com/d/7369060-54955802-f48a55
已高速https://www.123pan.com/s/HQeA-fK4Sh.html
https://pan.quark.cn/s/22b64875ef15
显示全部