CapsWriter Offline 是一款免费的开源语音输入和字幕转录工具,专为PC端用户设计。它不仅具备实时语音转文字的功能,还可以将音视频文件转录为字幕,极大地方便了用户的信息记录和处理需求。
核心功能
实时语音输入:用户只需按下键盘上的大写锁定键(Caps Lock)开始录音,松开后系统将自动识别并将语音转化为文字,实时显示在输入框中。这一功能与微信的语音转文字类似,使用简单方便。
音视频转录:用户可以将电脑中保存的音频或视频文件拖放到客户端,即可自动生成包括 .json、.merge.txt、.srt、.txt 在内的多个字幕文件,方便视频编辑及内容创建。
主要特性
完全离线:CapsWriter-Offline可以在无网络环境下使用,确保用户隐私与数据安全。
无限时长与低延迟:用户可以进行长时间的录音,且识别速度快,几乎没有延迟。
高准确率:支持中英文混合输入,并能自动识别阿拉伯数字。
热词功能:用户可以通过修改 hot-en.txt、hot-zh.txt 和 hot-rule.txt 文件来添加热词和替换规则。
日记功能:每次录音的识别结果将自动记录在以日期命名的Markdown文件中,便于后续查阅。
关键词日记:如果识别结果以特定关键词开头,将被记录在指定的Markdown文件中,便于快速检索。
系统与安装要求
Windows系统:确保安装了 Microsoft Visual C++ Redistributable 运行库,且在64位Windows 10或11上运行服务端。客户端可在Windows 7及以上版本使用。
模型文件:因模型文件较大,需单独下载并放入软件目录的 models
文件夹中。
使用说明
启动服务端:
服务端必须运行在64位的Win10或者是Win11系统上。
在Windows 10或Windows 11系统上,双击 start_server.exe
启动服务端,稍等片刻以加载模型。
启动客户端:
在同一台电脑上,直接双击 start_client.exe
启动客户端。
如果在不同电脑上运行,确保网络连接正常,并在 config.py
文件中在“addr =”那里填写填写服务端的IP地址。
使用功能:
实时转语音:在文本输入区中按住Caps键并讲话,松开后等待几秒钟,识别结果将自动上屏。
音视频转录:直接把视频或者是录音文件拖放到start_client.exe程序上,就会自动开始转文字。
转换效果
高级用法
热词功能:可以在热词文件中添加特定词汇,提升识别准确率,适用于行业术语或专有名词。
日记功能:每次录音的结果将保存在客户端指定的文件夹中,便于管理与查询。
转录功能:拖动音视频文件后,客户端会生成包括 .json
、.merge.txt
、.srt
、.txt
在内的多个文件,满足不同的使用需求。
