V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
DTCPSS
V2EX  ›  FFmpeg

把歌曲压缩至 7 kbps, FFmpeg 之父发布音频压缩工具 TSAC

  •  6
     
  •   DTCPSS · 240 天前 · 8958 次点击
    这是一个创建于 240 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://bellard.org/tsac/
    FFmpeg 之父 Fabrice Bellard 发布音频压缩工具 TSAC 。
    对于 44.1 kHz 的音频,可压缩至 5.5 kb/s (单声道)或 7.5 kb/s (立体声)。
    可将一首 3.5 分钟的立体声乐曲压缩至 192 KiB 。

    讨论:
    https://hydrogenaud.io/index.php/topic,125765
    64 条回复    2024-04-11 14:02:45 +08:00
    LitterGopher
        1
    LitterGopher  
       240 天前
    An Nvidia GPU is necessary for fast operation. CPU only is also supported but slower.
    cleanery
        2
    cleanery  
       240 天前
    可以听到有明显的爆音, 但是总体内容还是比较清楚的,我不知道是什么场景下要用这种高压音频?
    windmoonwind
        3
    windmoonwind  
       240 天前   ❤️ 6
    倒是牛逼...有点生不逢时...要是当年 5 寸盘 3 寸盘流行的时候出来,能狠赚一笔....
    zed1018
        4
    zed1018  
       240 天前
    @cleanery 其实人声那个 example 听着基本听不大出来区别,感觉适合极端网络环境的网络语音。
    cat
        5
    cat  
       240 天前   ❤️ 9
    《硅谷》第一集?
    noahlias
        6
    noahlias  
       240 天前   ❤️ 1
    又是这个法国人, 这个人可以说是计算机科学的神了, 现在开始搞 AI 了是吧
    aquatichunter
        7
    aquatichunter  
       240 天前 via Android
    会不会往视频方向发展呢?我一直期待把 1080p 压缩到 1000kbps 以下
    HandSonic
        8
    HandSonic  
       240 天前   ❤️ 12
    @aquatichunter #7 在 B 站看新番你甚至能看到 900kbps 的 1080P 视频
    qiyilai
        9
    qiyilai  
       240 天前   ❤️ 2
    Pied Piper
    paopjian
        10
    paopjian  
       240 天前
    @aquatichunter 英伟达好像发布过一个视频会议用的技术,深度学习技术仿真人脸以后在恶劣网络环境保持高清头像
    pengzhile
        11
    pengzhile  
       239 天前
    @cleanery 卫星通话
    MRG0
        12
    MRG0  
       239 天前
    @noahlias #6 这个人有点太牛了
    lingeo
        13
    lingeo  
       239 天前
    第四个交响乐的影响没有第一个弹吉他的影响大,谈吉他的立体声嘶嘶嘶的杂音太明显了,估计后面就是质量与空间之间的取舍了。
    aloxaf
        14
    aloxaf  
       239 天前   ❤️ 30
    我觉得标题直接写名字就行了,如果要用头衔的话,全称应该是:
    ffmpeg 之父、qemu 之父、tinycc 之父、quickjs 之父、jslinux 之父……
    iqoo
        15
    iqoo  
       239 天前
    以后直接压缩成提示词,让 AI 自动脑补回来 🐶
    dji38838c
        16
    dji38838c  
       239 天前   ❤️ 4
    @windmoonwind
    " 5 寸盘 3 寸盘流行的时候",是没有那个算力做这样的压缩的
    xiaodongus
        17
    xiaodongus  
       239 天前
    这要是在 128MB 的 MP3 时代 真是个天大的好消息
    dnsdk
        18
    dnsdk  
       239 天前
    直接写曲和对应乐器让 AI 演唱🐶
    aquatichunter
        19
    aquatichunter  
       239 天前 via Android
    @HandSonic 动漫基本就是这样,对码率要求本来就不高,他们要是愿意还能用 720p 来冒充 1080p
    Andim
        20
    Andim  
       239 天前
    @aquatichunter VVC(H266)完全可以做到,用 H264 的 1/4 的容量实现相同的画质
    aquatichunter
        21
    aquatichunter  
       239 天前
    @Andim VVC 还是实验阶段吧,低码率状态下优势最强的还是 AV1
    Andim
        22
    Andim  
       239 天前
    @aquatichunter 前几天听说 intel 15 代 u 可能会支持 VVC 电视端的芯片已经技持了,
    如果 intel 支持,apple 跟近应该普及很快,日本那边要上 8K 电视频道,也是急需 VVC 编码
    crc8
        23
    crc8  
       239 天前
    @noahlias 我提个建议,应该让张小龙招募此哥加入微信团队,造福国人!
    akatale
        24
    akatale  
       239 天前
    nepnt
        25
    nepnt  
       239 天前
    @Andim h266 出来怕不是继续收费,那大家还是 av1 吧
    Andim
        26
    Andim  
       239 天前
    @nepnt 不是一个阶梯呀,H266 要对标 av2 的
    nepnt
        27
    nepnt  
       239 天前
    @Andim 关键不在技术指标,在是不是收费上,影响 B 端是不是上马。现在的网络、运算和存储环境,除非极限工况没那么大区别
    Dk2014
        28
    Dk2014  
       239 天前
    有的人还在 hifi🤣看到这码率不得跳脚
    cnbatch
        29
    cnbatch  
       239 天前
    仔细听了下,这套压缩很适合朗读声、说话声,用在电话通讯、视频会议就最合适。

    音乐算是比较清晰但爆音噪声比较重,然而码率都已经低于 8 kbps ,可以说已经做得相当好了,目前应用广泛的各种压缩格式压到这么低的码率都会严重失真
    billccn
        30
    billccn  
       239 天前
    @cnbatch 我试听的时候也是这么想的,但是电话和视频会议都是实时通信,这个算法的延迟估计是接受不了,同时对算力的要求也挺高的,要有人搞出 ASIC 来才行。

    真正好用的可能是老大哥储存监控录音?
    JensenQian
        31
    JensenQian  
       239 天前
    @HandSonic #8 陈叔叔家很多大会员也就一两千 Kbps
    隔壁 crunchyroll 番剧都是 8000 多的
    langhuishan
        32
    langhuishan  
       239 天前   ❤️ 1
    @cleanery 监听,存储,棱镜计划
    murmur
        33
    murmur  
       239 天前
    这玩意有什么意义,用软波表不就好了么,现在都是追求音质的年代
    jemyzhang
        34
    jemyzhang  
       239 天前 via Android
    歌词+乐谱+AI 引擎,0.1kbps 是不是也有可能😁
    kuanos
        35
    kuanos  
       239 天前
    《硅谷》无疑
    Cloutain
        36
    Cloutain  
       239 天前
    @noahlias 计算机工程中的神级,计算机科学中的神级是图灵奖那批人
    dhb233
        37
    dhb233  
       239 天前
    那个网站实在是太卡了,就下载来听。下载了 Waiting 的 4 个,看起来单声道的是 1.8MB ,其他的都是 3.6MB 啊。是编解码都需要这个软件来搞才能真正压缩文件尺寸?
    luozic
        38
    luozic  
       239 天前
    如果能缩小硬件占用,or 硬件加速,这明显就是现代网络会议。不需要高保真的语音存储备份的好东西。
    husinhu
        39
    husinhu  
       239 天前
    @windmoonwind 生不逢时? Fabric Bellard 了解一下
    winterbells
        40
    winterbells  
       239 天前
    @dhb233 1.63M 的 raw.wav 压缩成 raw.tsac 9.26kb
    再解压缩成 wav 还是 1.63M

    不知道是不是这个意思,因为 tsac 不能直接播放
    wxf666
        41
    wxf666  
       239 天前
    手机上的播放器,能播放吗?

    比如 PowerAMP 啥的?

    MP3 随身听之类的呢?
    windmoonwind
        42
    windmoonwind  
       239 天前
    @husinhu
    Sorry ,怎么敢讥讽大神。我是说这项压缩技术"生不逢时",而且只是调侃(手动狗头)
    lee88688
        43
    lee88688  
       239 天前
    @winterbells 我感觉是有损压缩,后面几个码率地的明显能听出来,压缩再解压应该和原来不一样了
    Remember
        44
    Remember  
       239 天前   ❤️ 1
    @windmoonwind 这技术在地球上确实是生不逢时。不过可以尝试卖给马斯克,毕竟地球到火星之间,链路带宽还是挺贵的,语音通话用这个压缩一下,可以省下带宽传别的东西。
    passive
        45
    passive  
       239 天前 via Android
    @murmur 航天通信,节省出来的数据带宽能转化为物理编码的信噪比
    tanranran
        46
    tanranran  
       239 天前
    太强了,这才是技术。可以节省大量带宽。大量电力。碳中和先锋
    windmoonwind
        47
    windmoonwind  
       239 天前
    @Remember 您这个思路好,果然是眼界限制了想象啊...😅
    murmur
        48
    murmur  
       239 天前
    @passive 打字不就完了,为啥要语音啊。。噪音太多了不是会影响指令
    GOVER
        49
    GOVER  
       239 天前
    @Andim #22
    2018 年日本 nhk 都已经开始放松推流了 用的还是 hevc
    https://www.nhk.or.jp/strl/publica/rd/155/4.html
    luxor
        50
    luxor  
       239 天前
    @tanranran 用它节省带宽的前提是需要先耗用大量的计算资源,带宽成本和计算成本不知道哪个更大?
    tanranran
        51
    tanranran  
       238 天前
    @luxor 计算资源只用一次,而传输可能会 N 多次
    wsbqdyhm
        52
    wsbqdyhm  
       238 天前
    @HandSonic 保证清晰度,把 8k 60 帧的视频,压缩成 1080p 的体质吧。
    ONEBOYS
        53
    ONEBOYS  
       238 天前
    @cat 肯定是用了某种奇奇怪怪的算法!
    cexll
        54
    cexll  
       238 天前
    还不是无损,stereo 还能听出来背景音乐,之后的直接背景音乐都被消除了
    tyrone2333
        55
    tyrone2333  
       238 天前
    以后的音乐软件不开会员只能听这种音质的歌了...
    akatale
        56
    akatale  
       238 天前
    试了一下,win 版本还有 bug ,不是 wav 的话自动调用 ffmpeg ,结果硬编码进 exe 的命令没空格,得手动先转 wav
    另外这玩意不能直接听的。。听也要解码,计算压力和编码相同,相当于压缩包
    不过还是很 nb 了,一般的 128kbps 歌曲压完大小 200k 左右
    asdgsdg98
        57
    asdgsdg98  
       238 天前
    aac 勉强算普及了,m4a 普及率不太行(视频除外),opus 普及度更,再出新的也没人用
    irobbin
        58
    irobbin  
       238 天前
    我知道一种压缩算法,可以将任意大小的数据压缩到 2 个 64 位字节。前提是你能遍历到π的合适位置。
    dianso
        59
    dianso  
       238 天前
    我自豪的说,我的电脑拥有一块 500G 的固态硬盘,能存你想象不到的数量的歌曲,根本不在意
    hanbing135
        60
    hanbing135  
       238 天前 via Android   ❤️ 1
    卫星电话可以用这个编码吧
    bczhc
        61
    bczhc  
       238 天前
    @HandSonic 动漫的话,用 aom-av1 比较好的 tune ,我估计码率还能再小,而且保持质量的情况下。主要是像流媒体平台,它们都不会用 aom 这么效率低的编码器
    junyee
        62
    junyee  
       238 天前
    @asdgsdg98

    m4a 容器 不就包括 aac 编码嘛,而且大部分就是 aac 编码。
    aac 格式音频常常用 m4a 文件后缀名的。

    opus 就算了,系统、设备 能直接解码一个格式 真的能推动音频格式推广。
    junyee
        63
    junyee  
       238 天前
    @dianso

    我有一块 3TB 硬盘,几乎全是音乐,现在不够用了。
    asdgsdg98
        64
    asdgsdg98  
       238 天前
    @junyee 我是想说 ALAC 和 AAC……
    opus 其实挺好用,我自己压片都用 opus ,可惜就是普及不了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5567 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 06:40 · PVG 14:40 · LAX 22:40 · JFK 01:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.