x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别
创始人
2024-12-06 10:37:34
0

介绍

Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。

INFO:
whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度学习模型实现音频转文字功能。

由于 whisper.cpp 目前只支持 16 khz 的 wav 文件格式的音频文件,因此该模块默认会先使用 ffmpeg 将音频文件转成语音识别所需的格式,生成的 wav 文件以 .whisper.tmp.x-cmd.16khz.wav 的格式命名,以便用户使用通配符批量删除。

首次用户

  1. 在终端运行 eval "$(curl https://get.x-cmd.com)" 即可完成 x 命令安装, 详情参考 x-cmd 官网

  2. x-cmd 提供 mod 教程,其中包含了 whisper 模块常用功能的 demo 示例,可以帮你快速上手 whisper 模块。

  3. 使用案例:

x whisper [OPTIONS] [SUB_COMMAND] 

whisper.cn.gif

# 交互式选择模型,并将音频文件识别成文字 x whisper 

选项

名称, 名称简写默认值描述
-f, --file [file dir]需要识别的音频文件路径
-m, --model [name]显式指定模型进行识别

子命令

名称描述
x whisper dictate音频识别成文字
x whisper model管理本地模型
x whisper merge将字幕嵌入到视频中

模型管理

whisper.cpp 提供了 5 种模型:tiny,base,small,medium,large,它们的识别效果和大小依次增加,x-cmd 建议用户使用 base 以上的模型。

  1. 用户可以使用 x whisper model 命令进入交互式 UI 来查看所有可用模型,并可以通过回车键将选中的模型设置为默认模型。
  2. 支持模型导入、导出、删除等功能。

此外,该模块还提供了将字幕嵌入到视频中的功能: 用户可以使用 --srt 参数生成字幕文件,再通过 merge 命令将字幕文件嵌入到视频中。

进一步阅读

关于 whisper.cpp,请访问 https://github.com/ggerganov/whisper.cpp

TIP :

第一次使用的用户会自动下载 whisper.cpp, 若想卸载可以使用 x env gc whispercpp 命令

我们的 whisper 模块是开箱即用的,有赖于 env 模块,它能在您需要的时候自动帮您下载安装好 whisper.cpp 和 ffmpeg

相关内容

热门资讯

智能辅助(WepoKe)外挂辅... 智能辅助(WepoKe)外挂辅助工具(智能ai代打)本来真的有挂(2021已更新)(哔哩哔哩);1、...
透明黑科技!aapoker透明... 透明黑科技!aapoker透明挂"wpk代理合作"其实真的有挂(有挂最新版)-抖音aapoker透明...
8分钟领会!wepoke有玄学... 8分钟领会!wepoke有玄学(透视辅助)外挂透明挂辅助挂(2025已更新)(知乎)wepoke有玄...
德州ai机器人(wEpOke)... 德州ai机器人(wEpOke)德州wpk有外 挂吗(透明黑科技)一般真的有挂(有挂工具)-抖音1、让...
黑科技辅助挂(德州app)软件... 黑科技辅助挂(德州app)软件透明挂辅助机制(透视辅助)总是真的有挂(2022已更新)(哔哩哔哩)1...
透视辅助挂!wepoke模拟器... 透视辅助挂!wepoke模拟器"pokenow有挂"其实真的有挂(有挂检测)-抖音1、用户打开应用后...
6分钟解密!pokerrrr2... 6分钟解密!pokerrrr2辅助神器(黑科技辅助挂)外挂透明挂辅助安装(2021已更新)(微博客户...
wepoke辅助插件(众合推扑... wepoke辅助插件(众合推扑克)wepoke辅助真的(透视辅助)果真真的有挂(有挂胜率)-抖音1....
德州辅助(鱼扑克app)软件透... 德州辅助(鱼扑克app)软件透明挂辅助APP(ai代打)一般真的有挂(2023已更新)(哔哩哔哩)1...
黑科技透视!WePoKe透视挂... 黑科技透视!WePoKe透视挂"wpk德州ai机器人"原来真的有挂(有挂大厅)-百度1、黑科技透视!...