[我要投稿] [用户注册] [用户登录] [退出]

您现在的位置:返回首页

AI能降低直播带货天价坑位费?明星用数字人和粉丝互动?|封面直播

发布时间: 2023-12-15 20:06 文章来源: 互联网 作者:

  岁聿云暮, 周期轮回。凤凰网财经年会12月17日重磅来袭,戴相龙、龙永图、朱光耀等等近30位嘉宾参与此次盛会。放眼全球,如何提振发展信心,谁能跨越经济周期!在年会开幕前夕,凤凰网财经推出《封面直播》系列访谈。本期对话商汤智能产业研究院创始院长田丰。

  自ChatGPT爆火以来,人工智能(AI)赛道持续火热。对于当前大模型大战,田丰认为,分为上半场和下半场。上半场相当于一种知识工程的革命,或者叫媒介革命。下半场实际上是工业革命。

  他表示,大模型实际上是人类历史上所有知识的一种新的表达方式。用这种模型来高度压缩人类所有的知识,它会引起传媒产业、广告产业,包括所有跟知识有关的,如法律、历史、文化等领域的变革。

  当然,AIGC也面临一些挑战,尤其是成本的问题。田丰指出,AIGC技术每生成一张图、一段文字都需要消耗算力。它背后最大的两个成本项,一个是算力的成本、一个是能源的成本。比如GPT4训练一次,它的算力成本从6000万到1亿美金不等。这就是基模型在基础设施层面的一个非常重资产的投入,而且是长期投入。

  田丰表示,如果AIGC应用不能够覆盖能源和算力的成本,那它就无法长期盈利,最终也无法规模化。他认为,如何去持续地降低模型的成本、数据的成本、算力的成本包括能源的成本,会是数字经济3.0,人工智能时代应用大爆发的一个前提。

  谈到中国大模型的发展现状,田丰说,中国大模型已经形成了第一梯队、第二梯队、第三梯队。如果拿中国第一梯队大模型最好的成绩去和GPT相比,目前是处于GPT3.5和GPT4之间的水平。

  在《封面直播》中,田丰还分享了他对数字人的应用和前景的看法。田丰认为,数字人有很多应用场景,比如直播、广告、娱乐、教育等。他举了几个例子,比如,品牌商用数字人去做直播,其实可以带来用户流量和数据的回流,能够真正营造自己的品牌社区。

  此外,现在很多明星也逐渐在考虑用数字人的方式去和粉丝做互动、见面,甚至是一对一的聊天。这在国外已经非常普遍了。而这些数字人的仿真程度已经达到了以假乱真的水平。

  凤凰网财经《封面直播》:自ChatGPT今年年初爆火以来,围绕大模型又掀起了一轮创业热潮,互联网创业者好像久旱逢甘霖,终于又找到了一个大型的平台型机会。经过了近一年的角逐,您认为现在大模型大战进入了什么阶段?

  田丰:我认为大模型分为上半场和下半场。上半场相当于一种知识工程的革命,或者叫媒介革命。下半场实际上是工业革命。简单解读就是,大模型实际上是人类历史上所有知识的一种新的表达方式。用这种模型来高度压缩人类所有的知识,它会引起传媒产业、广告产业,包括所有跟知识有关的,如法律、历史、文化等领域的变革。

  大模型衍生到多模态以后,也会冲击游戏领域、互联网领域、直播领域等等。它会转化成一种以软件为主体的AI劳动力。当大模型在下半场与机器人相结合的时候,会引发真正的新一代的工业革命。这是我们对大模型的一个初步的认知。

  田丰:AIGC其实具有一个覆盖面很大,而且输入比较少的文字,就可以生成大量专业化的图片、视频、文本甚至多模态内容的机制。但是它本身也要先迈过它自己规模化应用的门槛。这个门槛我们认为是成本。因为大家都知道,AIGC每生成一张图、一段文字都需要消耗算力。它背后最大的两个成本项,一个是算力的成本、一个是能源的成本。

  我们数据分析也发现,能源的成本占到AIGC应用或算力成本的65%。就一个模型去训练一次,只是电力层面,就要花上百万人民币的能源成本。但在算力层面上花的会更多。GPT4训练一次,它的算力成本从6000万到1亿美金不等。这个就是基模型在基础设施层面的一个非常重资产的投入,而且是长期投入。

  如果AIGC应用不能够覆盖能源和算力的成本,那它就无法长期盈利,最终也无法规模化。如何去持续地降低模型的成本、数据的成本、算力的成本包括能源的成本,会是数字经济3.0,人工智能时代应用大爆发的一个前提。

  凤凰网财经《封面直播》:您刚刚提到AIGC时代的一些挑战,它其实还有可解释性等问题,现在行业内有没有哪些解决方案来应对这些问题呢?

  田丰:关于可解释性,人工智能其实很多层面很像中医。它本身是非常复杂的。可解释性分为两部分,一部分是我们如何给专业人员解释得更清楚,这实际上是整个业界都在努力去实现的。就是去想清楚人工智能每一步的机理和原理。但这并不是说我们在完全搞清楚它之前,就不用它。就像中医并没有预测我们的DNA,但是大家也用2000年的时间,解决了很多老百姓生病的问题。

  第二、可解释性对于大众来说,还有一个是它解释了,但是大家有没有听懂的问题。例如让中医大家去解释针灸,解释完了大众可能还是没有听懂。这种情况下其实是要做好科普,把人工智能的价值和它的原理,更好地讲给小朋友、青少年和其他老百姓,让他们形成一种正向的使用责任和价值观。这个是至关重要的。就算他们没有完全理解清楚深层神经网络的一些原理,但是也知道如何负责任地去使用它。

  凤凰网财经《封面直播》:在最底层的大模型方面,中国现在头部的大模型和ChatGPT相比,实际差距有多大呢?

  田丰:实际上,中国大模型已经形成了第一梯队、第二梯队、第三梯队,这个就不具体说公司的名字了。但如果拿中国第一梯队的大模型,最好的成绩去比的话,客观来讲,是处于GPT3.5和GPT4之间。

  当然我们觉得中国大模型的迭代速度和研发投入已经很快了。毕竟GPT4是在2022年初核心技术就已经形成。它之所以出其他的版本,在于做了很多人机对齐。

  从2022年开始,我们看到的是一个两年的时间差距。现在我们已经逐步地缩短了。到明年,我们预计中国最好的大模型有可能会追平GPT4。当然,美国也会出现GPT5发布的新的时间节点。

  这最重要的是双方加速度的比拼。就是我们模型的进步速度,要更快于国际上的其他研发机构。这样才能够更好地去推动普惠AI在全球的应用创新。

  凤凰网财经《封面直播》:从广义层面上来说,您认为人工智能对人类的就业和职业发展会带来哪些影响呢?对于普通人来说,大家应该如何适应和利用人工智能的发展?

  田丰:从当年的蒸汽机到后来的发电机,再到后来的计算机,每一代新的生产力工具或者超级生产力工具出现的时候,都会对原有社会的劳动力产生一些调整。这种新技能的培养是需要全社会的一个技能的启动周期的。

  在这个领域,我们认为职业教育、社会教育和K12的教育是非常关键的。短期和长期,我们只有通过不断地去提升大家的技能,才能更好地让大家接受新生产力工具。

  反过来说,在早期,一个新的生产工具出现的时候,会有一部分人受到影响。但从中长期来看,更多的人会加入进来,产生更大的生产力的供给。AIGC让我们原来创作的供给侧,得到一个巨大的创意的释放。从经济学上来讲,这个供给侧一旦大量释放,就会导致它的价格持续的降低。但是对于需求方来说,它的需求也会成千上万倍地增长。因为一个技术的成本下降,往往会带来需求在全社会的普及。这是一个爆发式的增长。所以供给创新之后,需求就会爆发,形成数字经济3.0。整个算力经济对GDP的影响都会产生。

  对学生来说,其实不用太担心。因为新一代的技术往往都是由大学生和中学生开始快速去使用的。就像去年的元宇宙,今年的大模型。学生往往比老师使用的更早、更快、更熟练。从这个角度来讲,学生是AI原生应用时代的原住民。反而在社会上已经工作很长时间、使用传统生产力工具的人,需要更快地去跟上生产力升级的节奏,更好地去使用大模型和AIGC的应用工具。

  田丰:坦率的讲,在内容时代,头部效应非常明显。其实网上有大量的主播在带货,但实际上流量往往会导入到头部里去。所以头部的成本越来越高,导致了线上直播,头部的流量比线下的流量还贵。

  原来我们都说电商会比线下便宜,但是直播带给我们的是,线上的带货非常贵,不光是坑位费贵,而且商品的价格也会压到全国最低价。这对品牌商来说,其实商业价值是不大的。因为大量客户是掌握在大V手里,而不是在品牌商的手里的。

  从这个角度讲,品牌商用数字人去做直播,其实带来的是自己用户流量和数据的回流,真正能够去营造自己的品牌社区。同时这个数字人永远不会离职,不会说今天不太开心,就离职,然后把粉丝都带走了。所以数字人它是一种AI的开箱即用的劳动力,这个是好的方面。

  从另外一个角度讲,数字人让生产的成本也在持续地降低。国内我们看到中关村直播港的数据,数字人和真人运营助手同步去做直播,一个线个直播间,那运营的成本、电商直播的成本会下降30%。

  当然对于很多现在的主播,他也可以探索新的合作方式。比如生成自己的数字人,然后一天比如自己播两个小时,其他22个小时都由数字人去做直播带货。甚至可以在多个品牌商家去做透出,形成一个数字人矩阵。那这就会带来自己身份型的、IP型的数字人的流量的增长。

  田丰:现在一些明星,因为他们的时间是最贵的,那他去做广告,拍广告片,都是消费他有限的时间的。所以现在明星也逐渐在考虑用数字人的方式去和粉丝做互动、见面,甚至是一对一的聊天。这在国外已经非常普遍了。

  在国内,也有一些头部的明星和经纪公司,采用数字人的方式,去做更多内容的阐述。当然,大家更多地会用自己的数字人,产生一个演员的形象。我是某某某明星,但我会让数字人饰演一个,比如二次元的形象,或者冬奥会来了,饰演一个运动员的形象。这背后往往带着不同的人设,不同数字人的技能,也给主播和明星带来更多技能的拓展。一个线个不同行业、不同领域背景的新的人设。同时数字人还具备这个明星自身的一些口语的梗,或者一些很有趣的观点,这就是我们现在看到的最新的一些发展方向。

  田丰:以假乱真了。当然了,要符合法规的要求,现在所有数字人的直播和短视频都要标上,这是由AI生成的。但是如果光看这个视频的形象和声音,包括举止、微表情、嘴型,都是和真人完美契合的。甚至我们会在数字人,比如直播的声音里加入更多情绪化的,很有激情的特点,或者在一些直播中,给它加入一些口语的错误,这就会更像真人。

  现在的数字人在直播中是能够带节奏,有情感,而且还能去做很多客户交互的。比如谁谁谁进了直播间,数字人马上说欢迎榜一大哥,或者是欢迎谁谁谁,你这个礼物非常好,这样就让大家感到一种非常好的交互,尤其适合现在多平台直播的一种AI对接的模式。

  凤凰网财经《封面直播》:现在AI已经不可避免地替代了一些工作岗位,那它在替代的同时有没有产生一些新的工作岗位的需求呢?

  田丰:坦率地讲,现在AI不能完全替代很多重要的工作岗位,因为人还是工作岗位的最终责任人。在法律效力上,不管是决策还是其他的执行责任,还是由人这个主体去承担的。

  从这个角度讲,AI更多的是一种辅助的工具,去辅助我们写文章、看病,辅助我们去分析一个法律的案例,或者分析一些数据,以及创造一些新的岗位,比如提示工程师等。

  今年提示工程师非常火热。很多广告公司、游戏公司和互联网的设计部门,都在大量招聘AI美术师、AI绘图师,而且薪水很高。所以现在可以看到一个很可喜的现象就是大量的大学生在使用AI的绘图工具、设计工具包括写作工具,然后再进入到互联网领域。这是一种捷径,因为效率确实很高。

  还有数据的标注员。以前需要大量的人工去做标注,现在AI能识别出万事万物。但是很多它拿不准的时候还需要做校准。所以在数据的半自动化标注层面,尤其是一些专业的数据标注层面,还需要人类的专家去形成知识库,并去确认相应的高质量的知识结果。

本文标签:

更多相关资讯

推荐内容

MORE