PC     手机     TV     Android     游戏     Windows     系统

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0
  • 所属分类:
  • 下载大小:
    54.8 MB
  • 软件性质:
    免费开源
  • 推荐星级:
  • 下载热度:
  • 更新时间:
    2025-01-07
  • 运行环境:
    Windows/
黑域基地

哈喽,黑域小伙伴,现在很多人和 UP 主都会拍一些 Vlog 或转载各种各样的视频传到网上分享。然而工作量比较大且较为枯燥的就是给视频加字幕了,若依靠人工去听写制作字幕效率真的很慢...

剪映中最具特色的功能就是其免费的字幕识别,但去年起也变成收费功能了。不过现在已有不少AI自动化的视频加字幕工具可帮助创作者们快速生成字幕了,比如今天这款由吾爱大佬的制作字幕利器:卡卡字幕 LLM 智能视频字幕助手,支持生成、断句、优化、翻译、视频合成全流程。 

具体我们来安装体验下:

卡卡字幕助手是一款基于AI大模型开发的字幕识别工具,只要接入对应的大模型接口,或者下载本地模型,即可对视频或者音频中的字幕进行提取,并生成Srt等格式的字幕文件。

软件安装流程比较常规,这里就不过多赘述了。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

1、语言模型

支持本地模型 Whisper 和LLM(大语言模型)API接入识别两种方式,大家可以按需选择。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

2、本地Whisper模型

先来看看本地的Whisper模型,使用前需要先根据配置安装GPU+CPU使用或者CPU使用的模型底包,然后下载用于识别的模型。模型体积越大,识别效果也就越好,但对设备性能的要求也在提高。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

3、选择所需模型

我的为核显,这里就下载CPU版版本的Faster Whisper,然后下载Medium模型。

下载完成后,打开Faster Whisper设置,选择之前下载的模型、运行设备、音频的语言即可。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

4、开始使用

软件使用就比较简单了,把需要识别的视频或者音频文件拖进来,点击开始,就会对其进行自动处理,使用本地模型的情况下,速度快慢就看设备性能了。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

5、导出字幕文件

Faster Whisper模型转录完成后,会利用AI,对识别结果进行优化,确认字幕呜呜后,点击左上角的保存,即可导出srt、ass、vtt等格式的字幕文件。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

6、后期字幕修改

如果优化后仍旧存在错别字,可以手动点击,进行修改。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

在线大语言模型识别:

刚刚上面所述是本地模型的大概,咱们再看在线大语言模型识别。可以填入OPENAI官方的API接口或者使用第三方提供的接口,接入各种开放API接口的大语言模型。

填入API Key、Base URL后,点击检查连接,当弹出模型获取成功、LLM连接成功的提示时,就说明大模型接入成功!

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

  • 需注意的地方:

使用 LLM 模型时,需要在首页将转录模型设置为B接口。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

至于后面的操作,就和使用Faster Whisper模型一模一样,直接抄前面的作业即可。

LLM API的优势:

值得一提的是,得益于云端强大的计算能力,通过LLM API所进行的字幕识别,速度要远远高于本地识别(如果本地GPU算力比较强大,影响则可pass)。

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

  • 得益于大模型

大模型加持之下字幕翻译也变得轻松,简单几步,就能制作外文视频的中文版,拿来啃某些生肉,简直不要太爽!

[Windows] 吾爱大佬的字幕利器 卡卡字幕助手VideoCaptioner v1.2.0

软件的字幕识别功能不局限于视频创作,如果你是一位影视爱好者的老司机,它亦能帮你解决不少观影中存在的语言障碍。

VideoCaptioner 功能特点:

  1. 可使用强大的语音识别引擎,核显也可以使用,自动生成精准字幕
  2. 基于 LLM 的智能分割与断句,字幕阅读更自然流畅
  3. AI字幕多线程优化调整字幕格式;吴恩达三步反思法翻译,表达更地道专业
  4. 支持批量视频字幕合成,提升处理效率
  5. 直观的字幕编辑查看界面,支持实时预览和快捷编辑
  6. 消耗模型 Token 少,且内置基础 LLM 模型,保证开箱即用
提取码:HyHy