V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pagepan
V2EX  ›  程序员

为什么 AI 生成人物的手指大多都容易出问题呢?

  •  
  •   pagepan ·
    ifeiwu · 1 天前 · 2184 次点击

    这一个月来,我一直在使用腾讯的 Ima.Copilot 生成图片。虽然生成的场景大多都很出色,但人物的手指总是出问题,这让我很头疼。每次遇到手指变形的情况,我都不得不重新生成,但如果重新生成,又会失去原本很喜欢的场景。有没有人知道如何在生成人物时避免手指变形呢?谢啦!

    以下是三张手指出现问题的图片例子,看起来有些诡异。

    a2e926a0117562c65be3.png bbd61803f068922c9b81.png 7166a05f237aeec24aec.png

    29 条回复    2025-04-19 15:51:55 +08:00
    wsseo
        1
    wsseo  
       1 天前
    因为手指太复杂。不是建模
    django88888
        2
    django88888  
       1 天前 via iPhone
    有客户会看的这么仔细吗
    cheng6563
        3
    cheng6563  
       1 天前
    你先想办法给手指各个形态起个名字,方便标注,就能解决这问题了。
    crackidz
        4
    crackidz  
       1 天前
    请教一下你的 ima 怎么生成的图片...
    jadehare
        5
    jadehare  
       1 天前
    个人猜测是因为多个手指的问题,鼻子旁边是嘴巴,是脸颊是眼睛眉毛,ai 比较好判断怎么画。但是手指边上有好几手指,形态也很多,ai 判断不出来画的是食指还是小拇指,不知道还要再画几个手指。并且形态太多了,五官就是五官,但是手指可以说每张图的形态都不太一样。
    crackidz
        6
    crackidz  
       1 天前   ❤️ 1
    这个其实算莫拉维克悖论的范畴,有一个现象是人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理,但是无意识的技能和直觉却需要极大的运算能力。所以好不好实现,你看他是否在所谓你一般认知里的高阶智慧能力就可以了,越简单的事情,AI 越不太容易做好
    runningowl
        7
    runningowl  
       1 天前
    画画的 AI 以为那玩意儿跟羽毛一样,多一点少一点没差别
    runningowl
        8
    runningowl  
       1 天前
    画画的 AI 以为那玩意儿跟羽毛一样,多一点少一点没差别
    cubeWX
        9
    cubeWX  
       1 天前
    就是信息颗粒度的问题
    haimall
        10
    haimall  
       1 天前
    @crackidz #4 画一张 xxxx
    haimall
        11
    haimall  
       1 天前
    你让它 生成时注意手指数量为 5 个
    katwalk
        12
    katwalk  
       1 天前
    ChatGPT 4o 的手好像稳多了,没那么容易出问题
    sentinelK
        13
    sentinelK  
       1 天前
    1 、手指占整个画面的比例小。
    2 、手指的几何形状复杂,很容易遮挡。
    3 、手指非常灵活,手又是人类很重要的与其他物体互动的部位。

    以上就导致了手部形态的统计学最优更难以找到。和盲人摸象一个道理。
    rekulas
        14
    rekulas  
       1 天前   ❤️ 1
    换个模型,很多新模型已经处理的不错了
    基于重绘功能,你可以只重绘手部,这样不会破坏其他地方
    DOLLOR
        15
    DOLLOR  
       1 天前
    一方面手确实很复杂,不同的观测角度和姿势,千变万化。
    另一方面,人类语言对“手”的描述却很贫乏又模糊,让 AI 建立起语言和“手”的各种姿势的对应关系不容易。
    jackmod
        16
    jackmod  
       1 天前
    手的姿态很多,分类复杂,那么相似分类的数据就会变少。所以可能是因为训练不到位。
    zhmouV2
        17
    zhmouV2  
       1 天前 via Android
    楼上说得很清楚了,以人像来说 一般正面侧面背面几个姿态就完事了,标注的也很清晰。但是手的形态千变万化任意摆放,标注的不清晰 很难对手进行拟合
    pagepan
        18
    pagepan  
    OP
       1 天前
    @crackidz 这样提示:“在中国,有一对现代夫妻和他们的女儿,他们的家虽然简陋,但却充满了幸福的氛围。生成一张图片 1280*768px”
    gpt5
        19
    gpt5  
       1 天前 via iPad
    4o 画手没问题,找人工标的。
    wuzhewuyou
        20
    wuzhewuyou  
       1 天前 via Android
    @pagepan 我第一眼以为是支付宝生日图
    hehe5120
        21
    hehe5120  
       23 小时 9 分钟前
    第一张图里面墙上挂的照片好像也有问题,有 2 个妈妈?
    qfchannel
        22
    qfchannel  
       23 小时 6 分钟前
    人类画画多手指也是很正常的
    mumbler
        23
    mumbler  
       22 小时 46 分钟前
    模型能力太差,主流的画图模型早就解决这个问题了
    leo72638
        24
    leo72638  
       21 小时 23 分钟前 via iPhone
    生成文字多半也不行,AI 图上如果有文字尤其是中文的都是乱七八糟
    LaTero
        25
    LaTero  
       20 小时 47 分钟前
    latent space 的“分辨率”其实是很低的,尤其是你这种普通分辨率就已经偏低的图。最终图片里手指的宽度其实也就十几个像素,AI 眼里可能就是非常模糊的一坨。如果分辨率高并且手占画面比例非常大效果还是可以的。
    sNullp
        26
    sNullp  
       20 小时 37 分钟前   ❤️ 2
    https://c7.io/system/media_attachments/files/111/483/502/362/637/133/original/7d3d10cc72a1ba2c.jpg

    这位是 Friedrich Ernst Waldemar ,普鲁士的瓦尔德马王子。这副肖像画是他的母亲,Victoria, Princess Royal (维多利亚长公主,https://en.wikipedia.org/wiki/Victoria,_Princess_Royal )画的。这幅肖像里小 Waldemar 是揣着手的,这是因为 Victoria 虽然绘画技巧已经很高(但不是专业画家),但不会画手。这让我想起来现在 AI 绘画画不好手,意料之外的相似性。

    我是在德国 Burg Hohenzollern 看到的这幅画的真迹。上面的信息也是讲解员告诉我的。他还说辛普森一家的创作者也画不好手,所以小黄人们都只有 4 个手指。

    Source: https://c7.io/@snullp/111483540721178227
    pagepan
        27
    pagepan  
    OP
       6 小时 49 分钟前
    @leo72638 确实是这样
    pagepan
        28
    pagepan  
    OP
       6 小时 49 分钟前
    @wuzhewuyou 不理解什么意思
    LieEar
        29
    LieEar  
       5 小时 23 分钟前
    其实就是让人来画,手也是很难画好的部分。“画马难画走,画人难画手”
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2677 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 13:15 · PVG 21:15 · LAX 06:15 · JFK 09:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.