V2sub 是基于最新 ASR (自动语音识别)技术开发的一款 AI 智能字幕生成软件, 可将任意视频 转换为各种语言的字幕, 软件操作简单, 任何人可以轻松一键生成。 从此看剧不用愁 支持十几种语言, 支持 GPU 加速, 基于 OpenAI 技术构建
软件主要功能:
邮箱: [email protected] 微信:aizimuji QQ 群:157222123
1
Microi 2023-04-09 10:46:35 +08:00 1
优秀,支持。
|
2
dawe 2023-04-09 11:05:35 +08:00 via iPhone 11
这个是只是把 whisper 用 gui 包装了一下还是有什么改进?
|
3
closedevice 2023-04-09 11:10:05 +08:00
自己训练的模型?
|
4
sytao 2023-04-09 11:12:48 +08:00 via iPhone
下载试试!
|
5
renmu 2023-04-09 11:19:01 +08:00 via Android
盲猜 whisper 包装了一下,然后用 chatgpt 进行翻译😂
|
6
imicksoft 2023-04-09 11:23:59 +08:00
前几天用 subtitle-edit 生成字幕,6 分钟中文影片生成字幕用了半天时间
而同事用剪影就很快,可惜我的电脑 aero 效果不能开了,无法用剪影 |
9
Wenbobobo 2023-04-09 11:37:18 +08:00 via Android 1
不是,whipser.cpp 有 GPU 版本的 gui 吖
Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper…https://github.com/Const-me/Whisper |
11
CRipple 2023-04-09 11:59:33 +08:00
支持,下载试一试
|
12
xzheng 2023-04-09 12:01:38 +08:00
不支持 OSX ?
|
14
makelove 2023-04-09 12:06:40 +08:00
之前看过一个 whisper 评测 https://blog.lopp.net/openai-whisper-transcription-testing/
cpu 的性能几乎不能忍,gpu 的性能几十倍于 cpu |
15
xzheng 2023-04-09 12:06:48 +08:00
CPU 版能打包个 OSX 版本吗? V2EX 社区 OSX 用户可能比较主流。
|
16
vokins 2023-04-09 12:07:06 +08:00 via iPhone
很高级收藏了
|
17
iorilu OP |
18
shiqueb 2023-04-09 12:15:51 +08:00 via Android 7
https://github.com/abdeladim-s/subsai
同样的功能,GPL 开源 |
20
loli 2023-04-09 12:31:50 +08:00
用过 whisper,效果不错
但有个很严重的问题,时长较久的视频会产生大量重复的内容 甚至会从某个时间段完全重复到结尾 以下 issues 也提到了 https://github.com/Const-me/Whisper/issues/26 想了一些方法但都是用户侧的,最后还是决定等待更新 不知道 up 作为开发有什么解决方案没 |
21
yunyuyuan 2023-04-09 12:32:20 +08:00
闭源产品?那和字节的剪映相比有什么优势吗,剪映还不需要自己的 GPU
|
22
javaluo 2023-04-09 12:34:33 +08:00
可以设置为中英双语么
中英两行放在一起 |
23
guoyan 2023-04-09 12:57:02 +08:00
这么厉害。太棒了。
|
24
Wpaengd 2023-04-09 13:14:44 +08:00
优秀
|
26
iorilu OP |
27
iorilu OP @loli 是的,目前还有重复, 或者模型自己幻想出来都有,就是其实视频是杂音非人声,但模型有产出
我看了一些资料,目前据我所知没有很完善的方案 我最近想先发布一个初始版本 后面会关注这些问题,有合适方案会更新的 |
29
iorilu OP |
30
Death 2023-04-09 14:09:10 +08:00 1
|
31
KasonKwok 2023-04-09 14:41:47 +08:00 1
可以尝试下 [buzz]( https://github.com/chidiwilliams/buzz) 跨平台,支持在线 api 和离线模型转换,可以导出字幕,如果是影片的话可以用 ffmpeg 先取音频
|
33
luckyswag 2023-04-09 15:12:54 +08:00
感觉最近搭配 whisper + 翻译会有不少产品出现
|
34
JCZ2MkKb5S8ZX9pq 2023-04-09 15:51:37 +08:00
@loli #20
同遇到过这个问题,大段重复,发生原因不详。 |
35
XiaoBaiYa 2023-04-09 17:11:39 +08:00
大段重复解决了吗,这个解决了基本就可以商用了
|
37
iorilu OP |
38
hanguofu 2023-04-09 20:31:47 +08:00
有没有人试过用哪个 离线的 ASR (自动语音识别)技术对普通话 有比较高的识别率 ?
|
39
KousukeSakurako 2023-04-09 20:34:31 +08:00
居然不支持 mp3
|
41
ViolaH 2023-04-09 21:11:49 +08:00 via iPhone
个人目前做字幕(日-英&中)的方案是在 colab 上面跑 whisper ,然后将生成的日语字幕文件在本地进行内容和时间轴校对( whisper 的时间轴有时候会很错乱,以及上面提到的重复问题,但是内容识别准确度还是极其高的,基本不用改),校对后再用 ChatGPT 翻译
|
44
iorilu OP chatgpt 翻译字幕有个对齐得问题
我前段时间本来想把 chatgpt 翻译器加上, 后来发现没解决这个对齐问题 比如说我发十句话, 希望 chatgpt 返回十句话, 不要自行进行合并处理 找了下没看到好的方案, 后来暂时搁置了 除非一句一句发, 但效率太低 |
46
lemonda 2023-04-10 00:25:42 +08:00
可以转音频么?
因为我做视频时直接录音总是脑子有点转不过来,后期配音从容些。 能根据字幕生成 ffmpeg 裁剪命令么? 能的话可以一定程度替代 descript 了 |
47
mayq0422 2023-04-10 02:40:31 +08:00 via Android
|
48
EndDream 2023-04-10 08:05:54 +08:00
我试了一下,和 buzz 一样,识别出来的的时间轴有问题,有时候会强行连在一起,明明就一句话,中间还有一段时间不说话,但是时间轴却一直延伸到下一句话,我问了 buzz 那边的作者是说是模型问题
|
49
lylmydear 2023-04-10 08:51:33 +08:00
试了一下,后期可以考虑加入简英 繁英和 ass 效果这些, NAS 党是很需要的,很多片源都没有对应的字幕.
|
50
NeedforV2 2023-04-10 09:07:45 +08:00
先试试效果
|
51
witcherhope 2023-04-10 10:14:21 +08:00
你在 i2ex 论坛不支持 macOS ,推广有点困难哈哈
|
52
muchenlou 2023-04-10 10:39:15 +08:00
很酷
|
53
iorilu OP @witcherhope 暂没, 会尽快搞一个看看
有人试过如果用老 macbook ,intel 芯片的, 编译打包软件, 能在新 macbook m1 ,m2 用吗 我有个老 macbook ,intel 芯片的 |
54
snowish 2023-04-10 11:05:46 +08:00
不错不错,当年我学习英语的时候很想要一个这样的软件。后来我的英语听力上去了,就直接看美剧了,美其名曰啃生肉。
|
56
zcf0508 2023-04-10 11:49:13 +08:00 via Android
|
57
iorilu OP |
58
ColoThor 2023-04-10 12:31:50 +08:00
免费版只支持前 10 分钟。。
|
60
shaojz2005 2023-04-10 14:00:08 +08:00
如何收费呢
|
61
iorilu OP |
64
lamquan 2023-04-11 02:12:27 +08:00
已经文稿了,能实现自动打轴功能吗
|
65
fenglingyu 2023-04-11 09:07:05 +08:00
@mayq0422 这个也不行,试了下,30 行字幕,合并成 25 行,有时候加的限制多了,chatgpt 为了保证行数,直接变成复读机,重复输出几行。
|
66
zky001 2023-04-11 14:19:11 +08:00
我自己也做了一个自用 代码基本上是 gpt 生成的,我调试了一下 主要用在看岛国的爱情片上 效果挺不错的 也是 whisper+gpt api
|
69
iorilu OP |
70
iorilu OP V2sub - AI 字幕机 新版本 0.4.0 发布
文件已上传至网盘 该版本新增若干功能, 具体如下 - 增加音频处理 , 可处理 mp3 ,wav 等众多格式 (专业版独享) - 增加单独字幕翻译功能(专业版独享) - 增加双语字幕生成功能 - 增加双语字幕设置, 可控制源语言在上或在下 - 增加智能跳过已生成字幕功能, 避免重复劳动 网盘也有升级包下载, 请各位根据自己版本进行升级, 也有完整完整包 |
71
fengtalk 2023-04-18 15:50:25 +08:00
看了 B 站演示视频,效果不错。
|
72
iorilu OP V2sub - AI 字幕机 0.5.0 发布文档 发布时间:
### 发布时间:2023-04-21 ### 该版本新增若干功能, 具体如下 - 主窗口支持文件拖拽 - 翻译增加语言设置, 设定中文输出为简体中文或繁体中文 - 翻译器换为 google 翻译, 翻译更稳定, 速度大幅提高 - 语言支持增加印地语, 乌克兰语 |
73
iorilu OP V2sub - AI 字幕机 0.6.0 发布文档
发布时间:2023-05-13 AI 字幕机官网已上线 AI 字幕机产品网站 ( https://www.aizimuji.com) AI 字幕机注册码销售网站 ( https://buy.aizimuji.com) 该版本有重大更新, 具体如下 模型计算框架更换, 实现更快转录速度, 更少显存占用 CPU 版, GPU 版速度提升 30-50% GPU 版显存占用大幅降低, 中模型仅需不到 4G 显存, 大模型仅需不到 6G 显存 转录准确性也有相应提高, 但还有优化空间 修复部分 Bug 因该版本变化巨大, 和老版本不兼容, 故不提供升级包, 请大家下载完整包使 用, 注册码有效期内可在新版本重新注册, 不影响 重大提示 该版本模型也完全更新, 和旧模型不兼容, 请重新下载新模型使用, 安装方法也有部分变化 ## 软件下载 - 百度盘 ( https://pan.baidu.com/s/1Btn3shMcs_5Z-zYh7P4c9w?pwd=3ev6 提取码:3ev6 ) - 123 网盘 ( https://www.123pan.com/s/toZZVv-b7TGA) |
74
iorilu OP macOS 版开发完成, 已经上传了
- AI 字幕机产品网站 ([https://www.aizimuji.com]( https://www.aizimuji.com)) - AI 字幕机注册码销售网站 ([https://buy.aizimuji.com]( https://buy.aizimuji.com)) 软件下载 百度盘 ( https://pan.baidu.com/s/1Btn3shMcs_5Z-zYh7P4c9w?pwd=3ev6 提取码:3ev6 ) 123 网盘 ( https://www.123pan.com/s/toZZVv-b7TGA |
76
iorilu OP |
77
XiaoBaiYa 2023-06-07 16:09:52 +08:00
LZ 重复的问题解决了吗?
|
78
iorilu OP V2sub - AI 字幕机 0.7.0 发布文档
### 发布时间:2023-06-05 ### 该版本有重大更新, 具体如下 功能更新: - 增加 ChatGPT 翻译器, 以及翻译配置菜单功能 (仅供专业版) - 增加 cpu 全速模式开关, 使用 cpu 计算时可以提高 30%-50%性能, 主要针对没有 GPU 的用户(仅供专业版) - 翻译增加中途保存功能, 便于发生错误后继续上次进度 - 优化模型转录字幕方式, 很好提升了生成字幕的时间轴准确性, 可用程度大幅提高, 已基本接近人工做的字幕 - 使用新的打包方式, 体积大幅减小 - 合并 CPU 和 GPU 版, 以后 Windows 只发布一个版本, 方便用户使用, 软件自动判断系统是否支持 GPU , 会优先使用 GPU , 没有 GPU 自动使用 CPU - 增加注册码过期后, 可以继续使用免费版功能, 避免重新安装 Bug 修复: - 修复模型不支持中文路径 bug , 现在软件可以随便放置在中文或英文目录 |
83
jsshwqz 2023-07-04 00:05:13 +08:00
支持直接转中文发音不?网上有款,但收费太高,
|
85
Rrrrrr 2023-07-16 11:27:08 +08:00
我觉得卖给视频播放软件会好很多,这样使用太麻烦
|
86
qqjt 2023-07-17 15:13:58 +08:00
厉害,实践出真钱
|
87
mstephenses9531 2023-08-29 13:22:22 +08:00
没看懂
|