V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
eightdoor
V2EX  ›  分享创造

使用 whisper 制作音频转文字网站

  •  
  •   eightdoor · 2023-09-25 09:00:10 +08:00 · 2269 次点击
    这是一个创建于 461 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前实现

    • 使用 openai/whisper python+fastapi 实现音频、视频文件上传,后台通过 whisper 转换文字内容 存储数据库,通过定时任务,后台自动转换,目前只支持单个转换 不能并行转换

    计划

    其他

    • 目前服务器是通过 frp 内网直接代理出去的,配置 e5+amd580 (搭配 rocm ),运行的模型大小是 medium 。如果有盈利点,可以买点好的配置服务器
    • 目前只想到这样做,可以后续提供 api 接口直接调用,提供付费服务。
    • 不知道想法是否可行,能不能产生盈利点,大家有什么好想法或者建议吗
    21 条回复    2023-09-25 17:20:50 +08:00
    jayzau1973
        1
    jayzau1973  
       2023-09-25 09:15:15 +08:00
    你可以搜搜之前有个老哥做的 AI 字幕机,实现了盈利。
    不过他是打包成软件,用客户端资源进行计算,你这用自己的服务器成本会不会太高?
    z7356995
        2
    z7356995  
       2023-09-25 09:21:56 +08:00 via Android
    我是用 google colab 免费 gpu 计算,速度快
    UKnowMe
        3
    UKnowMe  
       2023-09-25 09:23:27 +08:00
    1. “目前只支持单个转换 不能并行转换” 这个指的是用户 A 每次只能转换 1 个,还是说用户 A 、用户 B 、用户 C 加起来只能转换 1 个,若 A 转换中,则 B 、C 阻塞?

    2. 你有什么比得过 https://freesubtitles.ai/ 的?无恶意,单纯觉得人家已经有了你所说的 “后续提供 api 接口直接调用,提供付费服务” ,那么是否意味着你比人家的功能还少?莫非你打算通过推广来赢得市场还是啥?

    3. 免费用户一直用脚本调用你的功能,你咋办?因为我正好有音频转文字的需求,未登录的用户,你该如何防止?还是说需要登录才能使用功能,通过登录用户来进行精准限制。
    molezznet
        4
    molezznet  
       2023-09-25 09:27:56 +08:00
    580 传家宝啊
    z7356995
        5
    z7356995  
       2023-09-25 09:31:19 +08:00 via Android
    其实赢利点不是音频转换,而是英语有声书网站,有很多有名的英语有声书,要嘛找得到 mp3, 要嘛找不到对应的逐句复读的材料,国外有一个 pt 有声书网站,可以下载各种有声书,然后提取转换 srt 字幕,就可以供英语学习者边看有趣的内容边听了,下什么内容转换可以按搜索量,或有偿加速,版权问题,,你看看每日英语听力,有几个音频字幕买了版权?
    z7356995
        6
    z7356995  
       2023-09-25 09:32:17 +08:00 via Android
    国外 pt 网站可以下载 mp3
    z7356995
        7
    z7356995  
       2023-09-25 09:32:59 +08:00 via Android
    一次转换可以多次贩卖
    eightdoor
        8
    eightdoor  
    OP
       2023-09-25 09:37:58 +08:00
    @jayzau1973 我找找看看,服务器成本很高,要是转换的话
    qW7bo2FbzbC0
        9
    qW7bo2FbzbC0  
       2023-09-25 09:39:27 +08:00
    如果 使用者传入涉政暴恐的录音,并且进行关联传播,你有做关键词屏蔽和错杀恢复逻辑吗?
    qW7bo2FbzbC0
        10
    qW7bo2FbzbC0  
       2023-09-25 09:40:41 +08:00
    如果你使用墙内的基础设施提供服务,如果不幸被关联到非法信息使用上,很快会被查水表吧
    eightdoor
        11
    eightdoor  
    OP
       2023-09-25 09:42:24 +08:00
    @UKnowMe 1 、同时只能转换 1 个。2 、freesub 做的已经比较好了,我的功能是比较少的,看看有没有小众的需求,做免费的也可以。3 、通过登录可以转换,但是还是免不了 接口恶意调用,加安全策略。
    eightdoor
        12
    eightdoor  
    OP
       2023-09-25 09:43:56 +08:00
    @z7356995 这个不错 有声书或者现在好多的免费视频 字幕也可以做
    zhch602
        13
    zhch602  
       2023-09-25 09:44:17 +08:00
    现在 whisper 的入门门槛太低了,免费的客户端软件也有很多,用服务器的话可以白嫖 google colab ,看不到什么盈利点
    eightdoor
        14
    eightdoor  
    OP
       2023-09-25 09:46:20 +08:00
    @qW7bo2FbzbC0 应该去筛选的 上传完成了,转换完成了 关键词屏蔽和错杀恢复逻辑。 其实最好的还是做个客户端工具 利用本地资源去转换 我看 whisper 有几个开源的是可以 window 或者 mac 端直接使用的
    tool2d
        15
    tool2d  
       2023-09-25 10:04:28 +08:00
    whisper 的模型英文识别度高,但是中文效果挺一般的。
    anmie
        16
    anmie  
       2023-09-25 10:31:34 +08:00
    会做实时转录吗?
    thinkm
        17
    thinkm  
       2023-09-25 10:44:23 +08:00
    门槛太低了,全是开源的,是几行命令的事情,就算能盈利,马上一大堆人来价格比你低 配置比你好
    z7356995
        18
    z7356995  
       2023-09-25 10:49:27 +08:00 via Android
    模式参考每日英语听力,但收集各种推荐书单,做好各种阅读量高的书的 seo ,然后流量的话,人家找书搜索书名的话就到你的网站下来了,,网站做好信息隔离,,万一有人告,要找不到人
    xyy003
        19
    xyy003  
       2023-09-25 10:52:04 +08:00
    基本没有盈利点
    eightdoor
        20
    eightdoor  
    OP
       2023-09-25 17:18:33 +08:00
    @anmie 会做
    eightdoor
        21
    eightdoor  
    OP
       2023-09-25 17:20:50 +08:00
    @z7356995 说的对,感觉做网站 不如直接做客户端实在啊,服务器数据做了存储 就有很多问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2051 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 01:04 · PVG 09:04 · LAX 17:04 · JFK 20:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.