在各个厂商推出自己的AI搜索产品,并且迫不及待卷起来的时候,有人在把搜索往「小」了做。
亚马逊给自家两个有声内容业务,都装上了内置的AI搜索,播客和有声书。其中,播客是亚马逊音乐的一部分。
周二时,亚马逊音乐推出了基于AI的「主题」检索功能,由人工智能分析播客内容,来确定所属的主题。不过这个功能还需要搭配人工推荐,在主题确定后,再由人工编辑到播客的主页面。
另外一项AI功能则是在旗下有声书产品Audible的「推荐管家Maven」,该功能正在内测阶段,用户可以跟Maven用自然语言对话,从而获得针对性的推荐。Audible收录了近百万部的有声书,超过4万部由AI配音的有声读物。
除了亚马逊,Reddit也表示自己在计划推出AI搜索,能够从自身丰富的论坛内容中,为用户做更准确的推荐,提高用户活跃度。
亚马逊不仅旗下有内容,也有强大的技术底子——这些新功能的技术支持都是AWS亚马逊网络服务。为了训练生成式AI模型,亚马逊建设了低延迟、大规模的网络,最新的UltraCluster2.0支持超过20,000个GPU,延迟降低了25%。
除此之外,亚马逊还有自己的芯片,包括AWSTrainium和AWSInferentia,与其他同类训练优化型AmazonEC2实例相比,AWSTrainium旨在加快ML模型的训练速度并降低高达50%的成本。
LLM模型厂商争先恐后地开发着自己的AI搜索,扩大搜索引擎的半径,覆盖更多内容,不惜和花钱外部内容平台建立合作。而这些已经有丰富资源的内容平台、社区,正在用大模型,做集成在自家平台的「小」搜索。
播客、有声书这样的内容有两个特点:结构化,但耗时
。
声音不直观,用户在确定听之前,总是揣着一颗心不放:万一点开了我不喜欢呢?虽然可以安慰自己,就算不喜欢也算杀时间了,但人总是想既要又要的,消磨时间也最好是玩了个开心,不然又没了时间,又没了心情,两手空空。
这样的场景,AI就成了很好的帮手。虽然声音本身不直观,但可以通过转换为文字,转换为NLP问题,让大语言模型发挥自己的长处,全世界都在做搜索,亚马逊这个新功能卷向了不同的方向了解内容、总结要点,直观地呈现当中的内容,帮助用户筛选和判断。
实际上,只要是符合「结构化」 「耗时」
的条件,就可以让AI进来发挥一下。比如微信读书也上线了AI问书功能,集成到平台当中。当用户对某个概念或问题感兴趣时,AI问书可以链接到微信读书内,相关书籍的具体内容页,方便用户深入阅读和学习。这也是一种基于微信读书自身生态的小搜索。
左:默认结果,右:AI问书
不过,在亚马逊的尝试里,是进一步调用大模型的对话能力,做精准推荐。类似的做法,国内的播客平台小宇宙也在尝试,推出了问问小宇宙beta版。
这个功能暂时没有集成在小宇宙端侧,而是一个单独的网页,且设计风格很独特,模仿了古早浏览器网页,起到了一种「虽然获得了AI的帮助,但还是快打开播客听吧不要再继续上网了」的效果。
相比于结构化内容,AI在碎片内容的挖掘和整合上会更有意义,当然也面对更多挑战。这也是各个内容平台,先后把AI搜索集成到平台里的意义。
最有代表性的是小红书,连着推出了两项功能。有专门的AI助手「达芬奇」和针对搜索的「搜搜薯」。
我们曾经做过,两项功能都各有长短板,目前都还比较初步,推荐的内容不能完全采用,需要用户跳转到被引用的笔记,确认核实内容。共同的特点是都在盘活小红书上丰富的笔记内容。
对于扎根于特定环境的内容生态,是传统搜索的棘手地带。一方面是由于生态保护,搜索引擎的「手」够不着。另一方面,内置的搜索功能普遍不好用。例如,微博的高级搜索功能依然是基于时间、地点等基础信息,精确程度非常有限。
这是由于社交媒体在带来大量的内容,却非常碎片化
。这既给AI搜索带去了更多发挥空间,同时也提出了更大的挑战。
和更规则的播客、有声书产品不同,以小红书为例,这类社媒平台的内容形态多样,图片、文字、视频、直播都有。而且这些内容本身来自于个人经验、感受,夹杂了大量网络梗,表情包等等——但凡上网网速速度不够快的用户,都未必跟得上。
达芬奇还不能理解网络用语
当用户在期待着更符合眼下趣味的推荐时,现有的推荐算法,通常基于长期的用户兴趣建模,需要慢慢搜集用户的偏好、行为数据来构建画像,更倾向于推荐用户已经展现出来的喜好。
相比之下,AI搜索是一个很好的着力点,通过用户的检索行为得到反馈。尤其是,常常上网冲浪的用户,通常也只是朦朦胧胧地捕捉到某些热点。
在当下,流行话语所挑起的用户兴趣,有一点,但不多,都需要进一步的了解来补足。这时候,当用户主动走出检索的一步,基于大语言模型的搜索就能更好地发挥作用。
搜索是一个查询-响应的过程,而推荐是一个持续动态的过程,二者的交叉在于都有以用户需求出发、更加个性化的目标。传统的推荐算法一直在背负的「制造信息茧房」的包袱,或许能通过集成式的AI搜索,得到改善。
文|Selina