现在的人越来越不浪漫,就连一些字的感情都变了。一串“哈哈哈”可能是敷衍,说“爱你”也只是随口道谢……所以,有的人宁可孤独,也要等一个好好说话的人。—— “一禅小和尚”如是说。
这个圆脸、大眼睛的动画版小和尚和他的师傅身处世外桃源般的寺庙中,善于将人生哲理娓娓道来,意味深长而又不失风趣。18年初,虚拟形象“一禅小和尚”开始在各大短视频平台上崭露头角;截至目前,这位小和尚在各平台上的粉丝量已达到千万级,是名副其实的国民动漫IP。
近日,“一禅”在由虚拟向真实的道路上更进一步,首次尝试3D直播。小和尚在快手直播的49分钟时间里,共获得了64.9万个点赞,观看人数峰值超过25万人。值得注意的是,这次快手推出“虚拟形象3D直播”服务,是在2018年6月收购AcFun后再次涉足二次元。
一禅小和尚的直播间
自研AI技术 轻松驾驭“一禅”
与真人直播和视频录制不同,“一禅”的3D直播更为依赖技术。如果不能呈现生动的表情和流畅的肢体动作,就会让很多观众“粉丝转路人”;然而,专业的动作捕捉设备和复杂的脸部表情控制系统又让直播门槛过高。
然而,“一禅”在快手上的直播仅需要一部手机和一位工作人员。这得益于快手在自研AI技术上多年的积累:通过人脸检测、人脸关键点识别、面部表情识别和3D人脸重建技术,虚拟形象能跟随真人实时做出微笑、闭眼、张嘴、吐舌头等50多种细微表情。
借助多模态融合,快手将人脸识别技术与肢体识别技术结合,“一禅”能够同步做出真人般灵活的肢体动作。而渲染引擎则针对移动端进行了优化,让皮肤、服装等素材更显逼真。这让虚拟3D直播如同控制变形金刚“擎天柱”一样,轻松驾驭,且无懈可击。
基于快手自研的YCNN(Y-tech卷积神经网络)深度推理学习引擎和整体算法的优化,整个过程可以保证顺畅无卡顿,这一点对3D直播尤为重要。
YCNN深度推理学习引擎针对不同手机的硬件架构做了高度适配和性能优化,解决了AI技术运行受限于用户设备计算量的问题。相关测试显示,YCNN运行速度比已知引擎高出50%。预计到2019年6月,快手将完成3D直播的二期开发。
虚拟主播经济学
解决了技术的难题后,如何将虚拟主播推上商业化正轨?这里不得不提到虚拟歌手洛天依。
不了解二次元的人或许对这个名字十分陌生。洛天依是一个拥有电子声库的虚拟人物,声库以日本雅马哈公司的Vocaloid语音合成引擎软件为基础制作。自2012年7月“出道”开始,洛天依的曲库由广大PUGC参与创作,虚拟偶像的商业化冷启动以有条不紊的节奏进行着。