「核心提示」性能刷榜之外,产业大模型有了新考题。作者|陈法善
编辑|刘杨
在19世纪的一个雨声潺潺的夏日,诗人拜伦与雪莱在瑞士的湖畔边闲聊,他们聊到了一个大胆的想法:如果能够把一个生物的各个部分制造出来,再组装到一起,赋予它生命的温暖,那会怎样?
这次对话激发了雪莱夫人玛丽·雪莱的灵感,她后来写下了著名的《弗兰肯斯坦》,这部小说中的人造怪物,成为了人类对于创造人工生命的一个古老而深刻的想象。
时间快进到今天,人工智能技术的突飞猛进,尤其是大型语言模型的出现,如ChatGPT、Sora和Llama等,让我们看到了将这种想象变为现实的可能性。这些模型不仅在文本和视频创作中带来了革命性的变化,同时也带来了不少令人啼笑皆非的“胡言乱语”。
对于普通人来说,AI的小差错可能只是茶余饭后的笑料。但在工业生产和关键业务场景中,哪怕是一点点小失误,都可能引发连锁反应,造成严重的后果。
虽然我们可以通过购买硬件,比如提升计算能力和图形处理单元来增强AI的性能,但复杂的供应链管理和实际使用场景就没那么简单了。很多大模型并不具备产业供应链上的数据,自然没有处理实际产业问题的能力。一旦走出实验室,面对现实世界的复杂性,就变得力不从心。
去年7月,京东云发布了言犀大模型,专门为产业端提供服务。要让这些大模型真正发挥作用,不仅需要技术上的完善,更需要在实际应用场景中不断打磨和优化。
这成为大模型落地实际产业的宝贵实践。在大模型价值落地越来越急迫的今天,千行百业要用好大模型,都能从这些案例中汲取到养分。
1、虚拟源于现实
技术变革已成为决定公司兴衰的关键因素,随着人工智能大模型的兴起,任何有远见的企业都无法忽视其带来的颠覆性影响。在国内,“采销东哥”数字人直播带货、张一鸣熬夜读论文、李彦宏为内测产品睡在公司、王兴大手笔收购初创企业。互联网巨头们似乎很久没有像这样挤在同一个赛道竞争了。
不过,随着大模型热潮的持续,市场逐渐回归理性。人们开始更加关注技术的实际效果而非仅仅沉迷于技术背后的故事。尤其是在算力可以通过资金投入获得提升的当下,大模型领域的参与者自然分化成两大阵营:
部分企业致力于进一步提升基础模型的性能,如Meta发布的Llama3.1,其最大参数可达405B。
而不少国内企业则更关注模型的实际应用,比如京东宣布:已经让超35万京东自有配送员、超23万商家、超5万副主任级别以上的医生、超2万采销运营、超1万研发人员,大模型卷向「下半场」,产业场景成拼杀重地用上了大模型驱动的应用。
对这35万名物流小哥来说,他们关心的不是大模型的性能进步了几个小数点,而是能为工作提升多少效率。能解答他们的工作疑问、缩短工作流程的应用,才是最佳选择。
以物流行业为例,社会物流成本一直居高不下,提高货物周转效率成为降本增效的关键。过去,快递员在揽件时,需要手动输入包裹尺寸、报价等信息,如果戴手套的话,则需要频繁脱戴,再加上手持设备屏幕较小,这些因素都严重影响了工作效率。
京东将大模型集成到物流员工的手持设备中,把传统的触摸操作变成语音交互模式。大模型能够理解快递员的语音指令,自动创建订单,从而快速完成揽收任务。在这里,大模型所做的并非吟诗作画,或者让你的照片跳“科目三”,而是准确可靠地融入工作流程。
要做到这点,需要大模型拥有丰富的物流行业知识:诸如揽收、派送、站内、辅助、客户服务等环节,是如何环环相扣的。在快递员揽件时,大模型需要知道如何节省耗材、如何给包裹定价、哪些是违禁品不能邮寄。再妙口生花的大模型,都不如一条准确的建议。
也正因此,京东云在云峰会上提出:“通用大模型靠算力堆出来,产业大模型靠业务跑出来。”一个没有物流知识、没下过配送仓的大模型,只靠参数和权重无法胜任这些工作。
京东云峰会现场
对企业而言,实用性是衡量大模型好坏的核心标准。源自真实产业需求驱动的大模型,最终还需在产业应用中验证其价值。企业应该以实用性为出发点,选择或开发那些能够真正解决实际问题、提高工作效率的大模型,而不是单纯追求大模型的规模或性能。
2、产业端是主战场
在大模型百花齐放的当下,各家也纷纷找到了擅长的赛道。字节跳动的大模型擅长图像生成与视频制作,百度的大模型精于搜索,而京东的大模型则更贴近于各种真实的产业应用场景。
在国内大模型的主要玩家中,京东可能是实体业务根基最为深厚的企业。京东的供应链体系涉及长链条、复杂的协同运作,覆盖零售、物流、金融、健康等多个领域,这为产业级大模型提供了丰富的训练数据,并能将其成果反哺于产业。
这些数据源于京东服务的千万自营商品SKU、5000万工业品SKU、超800万家活跃企业客户、全国超2000个产业带的真实需求。分散在各个角落的企业、员工与合作伙伴每天都在产生大量的沟通协作、产品研发等需求。
伴随大模型基础设施的进步,人们渐渐发现:智能体比只用通用大模型能更敏捷灵活地满足人们的需求。企业内部的许多岗位,积累了关于行业的宝贵Know-How。如果业务人员能够自己建立应用,用于工作提效,势必会把自己的行业和岗位知识提炼出来,融入大模型。这样,宝贵的行业知识也就被固化下来,成为可复用的应用。
京东正将构建大模型应用的能力赋予一线员工。目前,京东员工已自主开发了3300多个智能体、100多个行业解决方案模板,涵盖办公、营销、知识问答等传统场景,以及企业搜索、低代码平台、长视频学习助手等创新场景。
今年4月,言犀智能体平台Autobots在京东内部上线。在过去,一个人力资源部门的员工,要制作内部培训课程视频,因为涉及专业知识、需要反复沟通,所以每周只能制作2个。但凭借智能体平台,员工在2天内就能搭建起一个AI视频剪辑应用,在几分钟内逐帧评估、智能剪辑,制作完一个视频课程。
3、拥抱产业等于拥抱未来
每一次技术革命都深刻重塑着人类的生活方式。最早卖货可能要沿街叫卖,地理限制了受众的范围。电商的出现使得商品来自天南海北,缩短了卖家与顾客的距离。直播电商的出现,则让原本冰冷的文字和图片变成面对面的沟通,成为商家招徕顾客的有效方法。
但直播电商仍然有诸多限制:即使背后有一整个选品、脚本、运营团队支持,带货主播一天也只能直播4小时左右。在剩下的时间,观众就只能看到空荡荡的直播间,极大浪费了直播资源。遇到复杂的产品功能,真人主播也无法短时间内摸索清楚,在直播中往往含混带过、屡屡翻车。
而大模型驱动的数字人主播,就成为真人带货主播的有力补充。在各大平台中,京东可以说是数字人直播的先行者。今年4月16日,刘强东的数字人分身“采销东哥”开启直播首秀,不到一小时,直播间观看人数超2000万,整场直播累计成交额超5000万元,标志着数字人直播实现了大规模商业化“撞线”。
在过去,数字人往往只是简单的商品推销者,通过文本驱动,机械地介绍商品。而京东将特定的行业知识、品类内容、商品信息融合进算法模型中,使得数字人主播在形象、声音、直播节奏等方面更加接近真实的个性化主播,甚至在喊“3、2、1,上链接”时也更自然。
实战结果显示,在美容仪器、医疗器械等高价位、使用门槛较高的商品直播中,这种具有“灵魂”的数字人主播能够更清晰地介绍产品,其转化率甚至高于真人主播,打破了人们对于数字人只能用于销售低价商品的认知。
此外,美妆、服装等产品由于需要真人在现场试妆、试用来展示效果,之前一直被认为是数字人直播的禁区。而京东云全新发布的言犀数字人3.0平台,多模态交互的能力继续进化,让双人直播、试妆直播、换装直播、实景直播、多语种直播等创新玩法成为可能。
言犀数字人3.0平台正式发布
尽管数字人主播的表现不如顶级真人主播或企业高管直播,但对于众多品牌而言,它们提供了更具性价比的直播解决方案,表现超越了行业80%的主播。
在实操层面,过去创建数字人主播需要高昂的成本和技术支持,复杂的操作流程让许多新手望而却步。京东言犀数字人3.0平台简化了这一过程,把创造数字人的难度降到了“自助”级别,上线了100多个个性化角色,50多个特色行业属性场景,新手也可以自由搭配,零配置即可覆盖90%的常见问询,商品推荐应答准确率超过90%。
此外,直播间的商品详情页也是大模型应用的重点区域。言犀AIGC营销工具“京点点”可以自动生产高质量的产品图片。
过去,这项工作需要摄影师、设计师和运营人员共同完成,两个设计师处理一个店铺20多个SKU已经是极限,而现在通过京点点一键生成图片,一名设计师可以同时管理六家店铺,80%的产品图片由AI生成,将单张图片的制作成本从200元降至约10元,大大缩短了制作周期。
目前,京点点AIGC营销生成的图片采纳率达到了65%,生成的营销文案准确率超过95%,帮助京东商城的20多万商家显著提高了经营效率。
除了电商零售和物流,大模型的应用还扩展到了金融、医疗、文化旅游、政务服务和个人助理等领域。例如,医疗领域的“京医千询”大模型可以支持病情收集、诊断建议、治疗方案制定和病情解释等功能,帮助医生提高诊疗效率。目前,京东健康皮肤医院基于该模型的AI辅助诊疗准确率超过95%。
在金融领域,50%的客户服务场景已经由数字人处理,服务用户超过500万,24小时问题解决率达到85%,客户满意度超过90%。
大模型的竞赛进入下半场,从“卷参数”过渡到“卷应用”。最让外界关注的指标,不再是大模型刷榜中小数点后多少位的进步,而是在多少岗位提升了效率、创造出多少应用价值。从产业中来,到产业中去,这才是大模型的真正价值所在。