软件介绍
最近接到一个需求,需要把录音转换为文字,一看网上几款常用的工具,想不到都是收费的;找了找,发现基本上都需要云端 api,仅有的几个本地的都需要使用 GPU 中的 cuda 计算。因此,开发了这么一款语言转文字的小工具,基于 Faster Whisper 模型,在 cpu 上也能达到不错的效果。
软件截图
使用方法
双击文件打开,在左上角选择模型,左下角选择推理方式与精度(cpu 推荐 int8,速度更快)。
若没有支持 cuda 的 GPU 请不要选择 GPU,否则会崩溃(原本想导入 pytorch 库判断 cuda_is_available 的,但是这样打出来的包会把一整个 pytorch 一起打包进去,太大了,后来就没这么处理)
首次使用需要下载模型,进度在 console 中可见,请耐心等待。