V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
DTCPSS
V2EX  ›  FFmpeg

把歌曲压缩至 7 kbps, FFmpeg 之父发布音频压缩工具 TSAC

  •  6
     
  •   DTCPSS · 2024-04-09 13:37:16 +08:00 · 9677 次点击
    这是一个创建于 378 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://bellard.org/tsac/
    FFmpeg 之父 Fabrice Bellard 发布音频压缩工具 TSAC 。
    对于 44.1 kHz 的音频,可压缩至 5.5 kb/s (单声道)或 7.5 kb/s (立体声)。
    可将一首 3.5 分钟的立体声乐曲压缩至 192 KiB 。

    讨论:
    https://hydrogenaud.io/index.php/topic,125765
    64 条回复    2024-04-11 14:02:45 +08:00
    LitterGopher
        1
    LitterGopher  
       2024-04-09 13:46:12 +08:00
    An Nvidia GPU is necessary for fast operation. CPU only is also supported but slower.
    cleanery
        2
    cleanery  
       2024-04-09 13:54:56 +08:00
    可以听到有明显的爆音, 但是总体内容还是比较清楚的,我不知道是什么场景下要用这种高压音频?
    windmoonwind
        3
    windmoonwind  
       2024-04-09 13:55:11 +08:00   ❤️ 6
    倒是牛逼...有点生不逢时...要是当年 5 寸盘 3 寸盘流行的时候出来,能狠赚一笔....
    zed1018
        4
    zed1018  
       2024-04-09 14:00:49 +08:00
    @cleanery 其实人声那个 example 听着基本听不大出来区别,感觉适合极端网络环境的网络语音。
    cat
        5
    cat  
       2024-04-09 14:05:25 +08:00   ❤️ 9
    《硅谷》第一集?
    noahlias
        6
    noahlias  
       2024-04-09 14:14:03 +08:00   ❤️ 1
    又是这个法国人, 这个人可以说是计算机科学的神了, 现在开始搞 AI 了是吧
    aquatichunter
        7
    aquatichunter  
       2024-04-09 14:16:03 +08:00 via Android
    会不会往视频方向发展呢?我一直期待把 1080p 压缩到 1000kbps 以下
    HandSonic
        8
    HandSonic  
       2024-04-09 14:24:39 +08:00   ❤️ 12
    @aquatichunter #7 在 B 站看新番你甚至能看到 900kbps 的 1080P 视频
    qiyilai
        9
    qiyilai  
       2024-04-09 14:24:56 +08:00   ❤️ 2
    Pied Piper
    paopjian
        10
    paopjian  
       2024-04-09 14:26:31 +08:00
    @aquatichunter 英伟达好像发布过一个视频会议用的技术,深度学习技术仿真人脸以后在恶劣网络环境保持高清头像
    pengzhile
        11
    pengzhile  
       2024-04-09 14:44:02 +08:00
    @cleanery 卫星通话
    MRG0
        12
    MRG0  
       2024-04-09 14:49:15 +08:00
    @noahlias #6 这个人有点太牛了
    lingeo
        13
    lingeo  
       2024-04-09 14:52:29 +08:00
    第四个交响乐的影响没有第一个弹吉他的影响大,谈吉他的立体声嘶嘶嘶的杂音太明显了,估计后面就是质量与空间之间的取舍了。
    aloxaf
        14
    aloxaf  
       2024-04-09 15:05:24 +08:00   ❤️ 30
    我觉得标题直接写名字就行了,如果要用头衔的话,全称应该是:
    ffmpeg 之父、qemu 之父、tinycc 之父、quickjs 之父、jslinux 之父……
    iqoo
        15
    iqoo  
       2024-04-09 15:17:52 +08:00
    以后直接压缩成提示词,让 AI 自动脑补回来 🐶
    dji38838c
        16
    dji38838c  
       2024-04-09 15:23:23 +08:00   ❤️ 4
    @windmoonwind
    " 5 寸盘 3 寸盘流行的时候",是没有那个算力做这样的压缩的
    xiaodongus
        17
    xiaodongus  
       2024-04-09 15:33:35 +08:00
    这要是在 128MB 的 MP3 时代 真是个天大的好消息
    dnsdk
        18
    dnsdk  
       2024-04-09 15:49:35 +08:00
    直接写曲和对应乐器让 AI 演唱🐶
    aquatichunter
        19
    aquatichunter  
       2024-04-09 16:21:48 +08:00 via Android
    @HandSonic 动漫基本就是这样,对码率要求本来就不高,他们要是愿意还能用 720p 来冒充 1080p
    Andim
        20
    Andim  
       2024-04-09 17:22:07 +08:00
    @aquatichunter VVC(H266)完全可以做到,用 H264 的 1/4 的容量实现相同的画质
    aquatichunter
        21
    aquatichunter  
       2024-04-09 17:52:58 +08:00
    @Andim VVC 还是实验阶段吧,低码率状态下优势最强的还是 AV1
    Andim
        22
    Andim  
       2024-04-09 19:04:09 +08:00
    @aquatichunter 前几天听说 intel 15 代 u 可能会支持 VVC 电视端的芯片已经技持了,
    如果 intel 支持,apple 跟近应该普及很快,日本那边要上 8K 电视频道,也是急需 VVC 编码
    crc8
        23
    crc8  
       2024-04-09 20:29:59 +08:00
    @noahlias 我提个建议,应该让张小龙招募此哥加入微信团队,造福国人!
    akatale
        24
    akatale  
       2024-04-09 21:12:41 +08:00
    nepnt
        25
    nepnt  
       2024-04-09 21:31:22 +08:00
    @Andim h266 出来怕不是继续收费,那大家还是 av1 吧
    Andim
        26
    Andim  
       2024-04-09 21:36:16 +08:00
    @nepnt 不是一个阶梯呀,H266 要对标 av2 的
    nepnt
        27
    nepnt  
       2024-04-09 21:39:16 +08:00
    @Andim 关键不在技术指标,在是不是收费上,影响 B 端是不是上马。现在的网络、运算和存储环境,除非极限工况没那么大区别
    Dk2014
        28
    Dk2014  
       2024-04-09 23:02:35 +08:00
    有的人还在 hifi🤣看到这码率不得跳脚
    cnbatch
        29
    cnbatch  
       2024-04-10 01:18:38 +08:00
    仔细听了下,这套压缩很适合朗读声、说话声,用在电话通讯、视频会议就最合适。

    音乐算是比较清晰但爆音噪声比较重,然而码率都已经低于 8 kbps ,可以说已经做得相当好了,目前应用广泛的各种压缩格式压到这么低的码率都会严重失真
    billccn
        30
    billccn  
       2024-04-10 05:53:39 +08:00
    @cnbatch 我试听的时候也是这么想的,但是电话和视频会议都是实时通信,这个算法的延迟估计是接受不了,同时对算力的要求也挺高的,要有人搞出 ASIC 来才行。

    真正好用的可能是老大哥储存监控录音?
    JensenQian
        31
    JensenQian  
       2024-04-10 08:17:07 +08:00
    @HandSonic #8 陈叔叔家很多大会员也就一两千 Kbps
    隔壁 crunchyroll 番剧都是 8000 多的
    langhuishan
        32
    langhuishan  
       2024-04-10 09:04:36 +08:00   ❤️ 1
    @cleanery 监听,存储,棱镜计划
    murmur
        33
    murmur  
       2024-04-10 09:12:17 +08:00
    这玩意有什么意义,用软波表不就好了么,现在都是追求音质的年代
    jemyzhang
        34
    jemyzhang  
       2024-04-10 09:14:56 +08:00 via Android
    歌词+乐谱+AI 引擎,0.1kbps 是不是也有可能😁
    kuanos
        35
    kuanos  
       2024-04-10 09:15:24 +08:00
    《硅谷》无疑
    Cloutain
        36
    Cloutain  
       2024-04-10 09:58:39 +08:00
    @noahlias 计算机工程中的神级,计算机科学中的神级是图灵奖那批人
    dhb233
        37
    dhb233  
       2024-04-10 10:28:15 +08:00
    那个网站实在是太卡了,就下载来听。下载了 Waiting 的 4 个,看起来单声道的是 1.8MB ,其他的都是 3.6MB 啊。是编解码都需要这个软件来搞才能真正压缩文件尺寸?
    luozic
        38
    luozic  
       2024-04-10 10:35:26 +08:00
    如果能缩小硬件占用,or 硬件加速,这明显就是现代网络会议。不需要高保真的语音存储备份的好东西。
    husinhu
        39
    husinhu  
       2024-04-10 10:50:27 +08:00
    @windmoonwind 生不逢时? Fabric Bellard 了解一下
    winterbells
        40
    winterbells  
       2024-04-10 11:59:29 +08:00
    @dhb233 1.63M 的 raw.wav 压缩成 raw.tsac 9.26kb
    再解压缩成 wav 还是 1.63M

    不知道是不是这个意思,因为 tsac 不能直接播放
    wxf666
        41
    wxf666  
       2024-04-10 12:32:06 +08:00
    手机上的播放器,能播放吗?

    比如 PowerAMP 啥的?

    MP3 随身听之类的呢?
    windmoonwind
        42
    windmoonwind  
       2024-04-10 12:32:10 +08:00
    @husinhu
    Sorry ,怎么敢讥讽大神。我是说这项压缩技术"生不逢时",而且只是调侃(手动狗头)
    lee88688
        43
    lee88688  
       2024-04-10 12:37:12 +08:00
    @winterbells 我感觉是有损压缩,后面几个码率地的明显能听出来,压缩再解压应该和原来不一样了
    Remember
        44
    Remember  
       2024-04-10 12:38:36 +08:00   ❤️ 1
    @windmoonwind 这技术在地球上确实是生不逢时。不过可以尝试卖给马斯克,毕竟地球到火星之间,链路带宽还是挺贵的,语音通话用这个压缩一下,可以省下带宽传别的东西。
    passive
        45
    passive  
       2024-04-10 12:40:36 +08:00 via Android
    @murmur 航天通信,节省出来的数据带宽能转化为物理编码的信噪比
    tanranran
        46
    tanranran  
       2024-04-10 12:41:18 +08:00
    太强了,这才是技术。可以节省大量带宽。大量电力。碳中和先锋
    windmoonwind
        47
    windmoonwind  
       2024-04-10 13:01:15 +08:00
    @Remember 您这个思路好,果然是眼界限制了想象啊...😅
    murmur
        48
    murmur  
       2024-04-10 14:10:07 +08:00
    @passive 打字不就完了,为啥要语音啊。。噪音太多了不是会影响指令
    GOVER
        49
    GOVER  
       2024-04-10 14:15:20 +08:00
    @Andim #22
    2018 年日本 nhk 都已经开始放松推流了 用的还是 hevc
    https://www.nhk.or.jp/strl/publica/rd/155/4.html
    luxor
        50
    luxor  
       2024-04-10 14:30:42 +08:00
    @tanranran 用它节省带宽的前提是需要先耗用大量的计算资源,带宽成本和计算成本不知道哪个更大?
    tanranran
        51
    tanranran  
       2024-04-10 16:03:36 +08:00
    @luxor 计算资源只用一次,而传输可能会 N 多次
    wsbqdyhm
        52
    wsbqdyhm  
       2024-04-10 16:15:25 +08:00
    @HandSonic 保证清晰度,把 8k 60 帧的视频,压缩成 1080p 的体质吧。
    ONEBOYS
        53
    ONEBOYS  
       2024-04-10 16:41:32 +08:00
    @cat 肯定是用了某种奇奇怪怪的算法!
    cexll
        54
    cexll  
       2024-04-10 17:01:10 +08:00
    还不是无损,stereo 还能听出来背景音乐,之后的直接背景音乐都被消除了
    tyrone2333
        55
    tyrone2333  
       2024-04-10 17:50:27 +08:00
    以后的音乐软件不开会员只能听这种音质的歌了...
    akatale
        56
    akatale  
       2024-04-10 21:35:11 +08:00
    试了一下,win 版本还有 bug ,不是 wav 的话自动调用 ffmpeg ,结果硬编码进 exe 的命令没空格,得手动先转 wav
    另外这玩意不能直接听的。。听也要解码,计算压力和编码相同,相当于压缩包
    不过还是很 nb 了,一般的 128kbps 歌曲压完大小 200k 左右
    asdgsdg98
        57
    asdgsdg98  
       2024-04-10 21:37:28 +08:00
    aac 勉强算普及了,m4a 普及率不太行(视频除外),opus 普及度更,再出新的也没人用
    irobbin
        58
    irobbin  
       2024-04-10 21:43:15 +08:00
    我知道一种压缩算法,可以将任意大小的数据压缩到 2 个 64 位字节。前提是你能遍历到π的合适位置。
    dianso
        59
    dianso  
       2024-04-10 21:45:53 +08:00
    我自豪的说,我的电脑拥有一块 500G 的固态硬盘,能存你想象不到的数量的歌曲,根本不在意
    hanbing135
        60
    hanbing135  
       2024-04-10 22:06:05 +08:00 via Android   ❤️ 1
    卫星电话可以用这个编码吧
    bczhc
        61
    bczhc  
       2024-04-11 11:11:26 +08:00
    @HandSonic 动漫的话,用 aom-av1 比较好的 tune ,我估计码率还能再小,而且保持质量的情况下。主要是像流媒体平台,它们都不会用 aom 这么效率低的编码器
    junyee
        62
    junyee  
       2024-04-11 11:55:23 +08:00
    @asdgsdg98

    m4a 容器 不就包括 aac 编码嘛,而且大部分就是 aac 编码。
    aac 格式音频常常用 m4a 文件后缀名的。

    opus 就算了,系统、设备 能直接解码一个格式 真的能推动音频格式推广。
    junyee
        63
    junyee  
       2024-04-11 11:56:35 +08:00
    @dianso

    我有一块 3TB 硬盘,几乎全是音乐,现在不够用了。
    asdgsdg98
        64
    asdgsdg98  
       2024-04-11 14:02:45 +08:00
    @junyee 我是想说 ALAC 和 AAC……
    opus 其实挺好用,我自己压片都用 opus ,可惜就是普及不了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2988 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:22 · PVG 22:22 · LAX 07:22 · JFK 10:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.