每个人都拥有一个独属于自己的AI助理,它能了解你的需求,理解你的情绪,清楚你的所有工作、生活内容……这些看似只出现在科幻剧集中的内容,在今天已经逐步照进了现实。
过去不到两年时间里,生成式AI更多的发展是发生在数据中心和云端,但是随着端侧用户对于能效、数据隐私,以及个性化的需求的增加,AI技术在端侧的发展得到了进一步的释放,Gartner预测,到2025年,50%以上由企业管理的数据,将在数据中心或云之外进行创建和处理。生成式AI步入了端侧发展的时代。
今年起,PC厂商纷纷积极布局AIPC市场,Canalys预测,兼容AI的PC有望在2027年渗透率达到60%。
而作为端侧生成式AI落地的重要载体——PC,在AI火爆的当下,PC行业也进入了全新的时代,继图形界面革命与互联网革命之后,PC行业开启了第三次革命——生成式AI革命时代。
PC步入AI革命时代,CPU成焦点据英特尔方面统计,截止目前,英特尔AIPC处理器已经出货超过800万片,到年底将达到4000万片,预计到2028年,全球80%的PC都将是AIPC,前景非常广阔,用户能够有丰富的产品和应用选择。
在这个过程中,能效、安全、成本,以及个性化需求已经成为当下AI大模型在端侧,尤其是PC端释放价值所要面临的关键问题。
而作为一台PC的大脑——CPU,如何跟上AI的脚步,有能力支撑起庞大的AI算力需求,已经是整个行业共同的“考题”。
在AI的影响下,CPU行业也正在经历历史变革,由传统的CPU转变为支持AI算力的AICPU。在此芯科技CEO孙文剑看来,在这个变革的时代,对于CPU行业来说,能效与生态架构的构建最为关键。
与传统CPU不同的是,AICPU可以为包括PC在内的诸多个人智能设备提供有竞争力的解决方案,用于人与数字的交互,图形图像数字的渲染,多媒体数据的处理,更重要的是高能效算力的输出。“端侧智能设备非常丰富,包括IoT、手机、电脑、车和元宇宙,还有未来的机器人。”孙文剑指出,“这些领域的设备都是AICPU可以发光发热的方向。”
不过要想打造全新的AICPU,对原有生态的“挑战”,是不可避免的话题,孙文剑进一步告诉钛媒体APP,CPU行业本身的“壁垒”很高,步入第三次革命时代,探索应用落地打破壁垒的难题极大,“打破这个壁垒一方面需要具备较高经验的人才进行高难度的芯片设计;另一方面,需要大量的资金支持。”孙文剑如是说。
AICPU大有不同与传统PC不同,AI算力的需求对AIPC提出了更高的要求,在孙文剑看来,一款合格的AIPC算力底座需要具备五大特征。
首先是异构。AIPC从硬件方面来说,需要具备CPU GPU NPU的架构,集成专门用于AI计算的硬件,并对AI相关软件进行优化,从而使AI算力得到针对性的提升。“在这个过程中,如何充分利用不同算力引擎的优势,为算力底座打造高性能的基础设施中心成为AIPC的关键所在。”孙文剑如是说。而在AI时代,专门进行端侧推理的NPU处理单元的地位也是有目共睹的逐渐提升。
其次是能效。如前文所述对于CPU的要求一样,AIPC对于能效的要求也很重要。作为端侧产品,AIPC不同于数据中心,对于能效,甚至算效的要求更高,“用户对于产品的便携性和待机时长、工作时长有更高的要求,所以算力底座(AIPC)需要借助一切低功耗设计手段,让算力底座变得更加高效。”针对能效的问题,孙文剑对钛媒体APP表示。
第三是生态。在孙文剑看来,AIPC不仅是硬件层面的改变,需要结合操作系统、大模型等软件层面进行适配,构建丰富的软硬件开放系统,在硬件上面也要结合电源管理芯片、存储芯片,最终形成一个完整的生态,赋能开发者。
第四是混合。人工智能最终会走向混合的形态,如何让云边端混合协同发展,让用户基于端云一体的算力解决方案,解决切实场景中问题是关键。
第五是安全。安全是一个“老生常谈”的话题,尤其是对于企业侧应用而言,无论是硬件层面,还是软件层面都需要确保企业数据的安全。
而正是基于上述几点考虑,历时一年有余,此芯科技推出了企业自主研发的首款芯片——此芯P1。据悉,该款芯片基于6nm设计工艺,采用了Arm架构多核CPU,全新架构的高性能桌面级GPU,在AI算力方面可达45TOPS,并可以运行10b参数以内的端侧大模型,运行大语言模型可达30tokens/s。
在能效方面,孙文剑告诉钛媒体APP,此芯P1有高效的功耗管理设计,包含精准的动态调频调压、多电源域和动态的电源门控,支持标准的PC电源工作模式,通过综合设计来做到功耗和性能的调配与平衡。
安全方面,此芯P1支持完善的CPU内核级别安全特性;满足认证需求的商密、国密算法;灵活的TPM/TCM安全方案。除此之外,此芯P1还采用统一的固件来支持多桌面操作系统,并对内核及框架层做了全栈优化。
而对于AIPC而言,一颗好用的CPU仅是开始,在联想集团首席研究员颜毅强看来,如何构建上下游较为完善的生态是一个关键。“如何实现从硬件、架构、模型,到最后应用的解耦是关键,”颜毅强指出。
解耦是一个打破原有生态壁垒,构建新生态的过程,虽然打破原有生态壁垒的难度较大,且在技术方面,国内厂商与国际领先水平仍有差距,不过对于国内芯片厂商而言,在布局AIPC方面也有着诸多优势。
首先,中国作为全球PC行业市场占有量最大的市场之一,占据了全球市场近三分之一的市场,庞大的市场需求,对于AIPC大脑的CPU自然有着更强大的需求。
其次,在需求的引导下,中国拥有着完善的AIPC产业链,“在整机制造、软件设计、大模型开发与应用等领域,中国都能处于国际领先水平。”孙文剑指出。
通过与产业链上下游企业的联合研发,可以进一步缩小与国际的差距。对此,孙文剑告诉钛媒体APP,“我们有我们的优势,对大模型的适配、应用的适配、操作系统的适配,中国CPU制造商和企业有更多的机会进行适配和优化。”孙文剑强调。
以主机方面为例,从目前的市场趋势上来看,主机厂商收到的CPU芯片大多是在两年前被芯片供应商定义的(一款芯片生产需要几个月,测试需要7~8个月),主机厂商根据自身当下需求定制化的能力较弱。而对于国内的企业而言,芯片企业可以与他们的用户共同研发,“早在定义芯片的阶段,就可以让操作系统厂商、主机厂商等下游企业参与进来,共同努力,这样设计出来的芯片会更契合他们的需求,更好用。”孙文剑指出。
个人助理是首个场景,成熟落地仍有挑战芯片对于一款AIPC而言固然很重要,但应用场景才是“硬通货”。
从目前应用场景上看,个人助理是AIPC首个应用场景,众多厂商的布局也围绕此展开,原因自然离不开电脑的办公工具属性。
英特尔的资深专家与钛媒体APP分享了几个已经落地的案例。首先,在AIChatbot场景中,基于英特尔酷睿Ultra的AIPC上能够快速部署大模型,用户能够流畅地使用大模型强大的文本创作、编程、数学计算和逻辑推理能力,享受便捷、安全的本地化智能交互体验。
在处理文档方面,用户可以利用AIPC高效处理邮件、表格数据、自动生成工作文档,提高工作效率,还可以快速起草合同文书、以及利用AI智能分析诉讼案例,提供专业文档撰写能力。
针对知识密集型领域,利用AI构建金融本地知识库,让庞大知识库为用户所轻松调用。
在AI多媒体处理方面,商业用户可以利用AI生成高清视频慢动作,并利用慢动作实现生产线缺陷检测,高效查找故障问题。
在AIPC管理方面,企业可以基于AI大模型对企业各种资产进行智能化管理,快速盘点、分析,生成数据报表,助力企业降本增效。