问题最终还是出在了所有人都预料到、却又都束手无策的地方——数据。釜底抽薪式的致命难题。
无论他们的渲染引擎如何优化,光照模型如何逼真,算法如何先进,屏幕上那个数字人,总显得僵硬、虚假,像一个制作精良、却没有注入灵魂的木偶。
皮肤缺乏在不同光线下微妙的色彩和光泽变化,肌肉在运动时缺乏真实的人体组织被牵引、拉伸和挤压的质感,表情更是空洞得像商店橱窗里的假人模特,无法传递任何细微的情绪。
那个令人毛骨悚然的“恐怖谷”效应,始终如影随形。
他们尝试了市面上能找到的所有公开或商业的人体数据集,结果都差强人意。
学术界公开的数据集,精度往往不够,且姿态单一,多为科研目的设计;商业公司售卖的高精度模型,价格昂贵不说,往往经过了过度“美化”和修饰,失去了原始的、带有瑕疵的真实感,而且大多是静态扫描数据,无法满足他们对动态捕捉和微表情模拟的需求。
他们甚至铤而走险,匿名购买了一些从灰色渠道流出的、据称是“高质量、未公开”的亚洲女性人体扫描数据,结果发现里面充斥着大量低质量、重复甚至伪造的数据。
他们还尝试过用AI技术从一些所谓的“爱情动作”影片中截取和学习动态数据,但那些经过精心表演、动作夸张、缺乏真实细节的片段,对于训练需要捕捉细微情感和真实质感的模型来说,几乎毫无用处,甚至会引入错误的偏见。
“我们需要……活的数据。真正活生生的、未经修饰的数据。”李博对着满屏幕令人沮丧的测试结果和渲染失败的图像,喃喃自语,声音里充满了前所未有的挫败感。
他感觉自己所有的技术积累和聪明才智,在这个根本性的数据难题面前,都显得如此苍白无力。
内容未完,下一页继续阅读