whisper实时转录

introduce

这是一个本地的语音识别模型
强无敌

官网介绍:Introducing Whisper

openAI官方的python版本安装

github仓库链接:whisper

  1. 使用anaconda
  2. 在anaconda环境中安装cuda(请耐心等待解压)
    1
    2
    # 安装CUDA
    conda install cudatoolkit=11.6 # 指定版本
  3. pytorch
    请到它的官网选择下载对应的你的cuda的版本
  4. 安装ffmpeg
    1
    conda install ffmpeg
  5. 运行安装其他依赖库
    1
    pip install git+https://github.com/openai/whisper.git 
  6. enjoy it!(模型会在运行时下载)
    具体使用方法见github,下面是一个示例
    1
    whisper "3.3 Task 19 Gauss.mp3" --model base

cpp实现

TODO:


whisper实时转录
http://blog.1314171.xyz/post/221018whisper.html
作者
TT2TER
发布于
2022年10月18日
许可协议