看两个现象:
当时我没太在意。结果,昨天这种情况又出现了。
在微信上,聊到工作流,一个在医疗行业做培训的朋友说,他经常要查阅很多学术报告;报告大多从知网之类的平台下载,然后用豆包 AI帮他做本地化总结和提炼关键内容。
其实,我更想要其他维度的内容,类似于案例分析,数据解读之类的。但AI搜索只能给出总结性的结论,有些失望。
所以,这两次无意识聊天让我感受到,要让 AI 搜索真正满足用户的需求,要找到具体场景。
一、什么是具体场景?怎么理解AI使用场景呢?
得从用户任务下的行为方式看。我们每天从早到晚活动,都围绕完成特定任务展开,用户使用产品、服务时,根本目的也是为了完成任务。
昨天,有个朋友和我说到他使用AI搜索的方式。
他日常工作是监测品牌声誉,使用 AI 搜索工具会设定一些关于品牌名称、相关话题讨论情况的提示语,然后,用它们捕捉网上每天关于品牌的评价;最后,利用这些信息,制作成日报,反馈给领导。
也就是说,他把 AI 搜索当作一个信息聚合工具,利用它来索引、总结当天的重要反馈和评论。
还有人使用AI基于话题形式。比如说高考,众多家长在面对孩子高考后,不知道如何填报志愿、不知道怎么选专业。
这时,会用AI搜索获取帮助,AI 搜索像一个专业顾问,能够依据家长、学生提供的具体情况,(兴趣爱好、学科优势、未来职业规划等)进行综合分析,进而做出针对性选择。
从这个行为来看,用户主要关注两方面:一,功能性;二,实用性。
所谓功能性,即,AI 完成搜索任务后,能基于结果进一步生成思维导图,制作图标,提供多维度数据对比工具,甚至能做中英文互译等等。
而实用性,是把知识答案作为起点,去解决具体问题。实际上,每个问题都是一个场景,问题的聚合代表着大量资源的挖掘。
我前段时间看徐峥导演的《逆袭人生》,想写篇文章。
最近各家公司都在发布财报,我如果能对 AI 搜索说,帮我找一下瑞幸 2024 年中期报告,比较一下和 2023 年的数据,并把毛利、净利做成表格,那该多好。
显然,目前 AI 搜索产品还做不到这一点。
或者说,大家都在卷AI搜索、把AI总结前置化思维方式,限制了产品经理的思考,他们没能从任务角度出发,用问题、话题索引信息源后,再总结,再用工具串联起来。
Perplexity标语叫做 “Where Knowledge Begins”(知识从这里开始),我觉得,用这句话来形容 AI 产品的用途很合适。这意味着,AI 帮助我们从知识的起点开始,解决实际的问题。
二
把用户任务前置化的思维方式很重要。不信,冷静下来想一想,不论是什么样的 AI 搜索产品,它们主要目的是什么?
说白了,只有一个:用 AI 力量,帮用户找到他们真正需要的内容,让他们能拿到更准确的信息。
过去用传统搜索引擎时,很多用户需求都没被好好满足。如果我们要找个答案,可能得先把问题分成 A、B、C 三部分,然后一个个地输到搜索框里。
搜索引擎用爬虫技术在网上抓信息,然后,按自己的逻辑排个序,列出结果。我们拿着这些信息,自己再分析、总结一番,最后才能用来支持决策。
但问题是,单单列出 A、B、C 还不够。我们希望在信息被列出后,还能用工具进一步深入分析,然后再总结,最后生成报告。这才是关键。
这个过程像建筑师设计房子:
先画出草图(提出问题并进行拆解),然后,找合适的材料(收集和分析信息),最后,精心挑选材料,确保每一步都非常精准,这样才能建造并完成精装,保证房子既坚固又好看。
可问题是:现在 AI 帮我们收集和分析了信息,但选择材料的权利没给用户,也没提供足够的工具,就直接总结了。这跟以前有什么区别呢?
因此,在创造新需求之前,AI 搜索要先满足传统搜索没解决好的需求;也就是说,过程中被忽视的需求。
虽然现在看起来 AI 降低了搜索产品的门槛,实际上很多产品很相似,都像 AI 版知乎直答,它们主要任务是简化搜索流程,把来自不同渠道的信息集中起来。
所以,我说 AI 搜索卷错了方向,那么,自然也就出现,很多人经过一段时间尝试之后,又回到传统搜索引擎行为上,因为传统搜索引擎提供的信息更全面。
显然,如果想让用户把 AI 搜索变成一个真正提高效率的工具,必须深挖并满足传统搜索技术没满足的需求,这才是刚需。
三
因为所有AI搜索,本质上,都在解决三种题型:
第一种,填空题。这种时候,用户其实已经心里有个问题:“这是什么?”
比如:他们想查查最新的新闻,或者想知道某个名人最近怎么样了,又或者想知道一家公司去年挣了多少钱。这些问题,传统互联网搜索已经能解决得很好了。
第二种,证明题。这时,用户已经有了自己的想法,可能会说:“我觉得是这样,因为……”,他们需要的是一大堆事实来支撑这个看法。
这种情况就像老板给你个想法,你得去找证据来证明它是对的。这种任务,听起来简单,其实挺费劲的,要花不少人力、物力和时间。
比如说:
如果要证明某家公司的某个看法,我得去翻这家公司过去几年的各种数据和信息。就像我想写徐峥导演的《逆袭人生》,本质上也是个证明题,要通过数据来证明我的观点,那就得找准确的数据。
实际上,AI搜索产品都在尝试解决填空题、和基础证明题,所谓的基础证明题,是有明确标准答案的问题,但它们处理复杂证明题的能力还需要提高。
我觉得最难的是论述题(discussion question)。
什么是论述题呢?这种题像:“我也不太清楚,帮我在网上找找看?”这种问题和前两种的区别在于更像语文和数学。
数学有明确对错,语文没有。高级证明、论述,就像写作文一样,没有固定对错,分数更多是老师主观给的。
搜论述题挺复杂,你找的是关于一个问题的各种观点,本来就没有绝对的正确或错误。搜完后,还得自己头脑风暴一番,最后才能总结出个答案。
可以看出来,这三种题型,难度一级比一级高。要回答好“高级证明题”和论述题,不光需要工具,还得人工参与一下。
这是啥意思呢?
现实世界里,复杂问题很常见,因为无论是在工作还是生活中,很多问题都没有绝对的对错,常常是因为不同人的价值观、看法不同。
我们人类又有点懒,总希望AI能一步到位帮我们搞定这些复杂的问题。但用过几次后,发现AI没那么给力,用的次数就少了。
还有,要回答这些问题,比如我找了好多论据,到底哪个最靠谱,哪个最有力,你得一个个筛选;如同写论文一样,为了支持一个观点,得查很多资料,还得想清楚怎么表达得简洁明了。
现在,ChatGPT都解决不了高级证明题和论述问题。比如,你问它一个问题,它回答后,你说不对,它会马上改,改成你想要的答案,尤其是文科类。
四
那为什么大语言模型搞不定这类问题呢?因为大语言模型是根据前一个词来推理下一个词,它是在猜高频词。
但问题是,出现最多的词,不一定是最好的答案,有些词或句子出现的次数很少,但可能就是关键的见解。
比如:
还有一点,AI不太会拆解复杂问题,我们得把问题拆得特细,一步步来,才能找到答案。所以,要解决证明题、复杂论述题,就得让用户参与进来。
这个过程就是:AI搜索后,用户可以选择优质语料、剔除不太准确的信息,然后扔进工具里,自己再总结一下,最后才能得到满意的答案。
举个通俗的例子:
你想研究全球变暖,对北极熊生存环境的影响。一般AI搜索,只能给你一些基本的信息和新闻报道。
但作为研究者,你要找到相关的学术论文、和详尽的环境研究报告。可是,第一次搜索结果里,你会发现很多过时的或者不相关的内容。
这时,为了拿到真正有用的数据,你就不得不一个个地筛选包含严格科学研究和具体数据分析的文章;这一步做完后,你就可以把精选的资料扔进一个分析工具里,或利用某些功能,做成图表、PPT,插入一个页面中,最终制作出自己需要的报告。
所以,想要AI搜索产品脱颖而出,最关键条件是什么?
一方面,是数据,尤其是垂直细分的数据。垂直细分的数据要通过具体的场景、话题、主题来引导用户分享,并参与提问。
另一方面,想应对低门槛挑战,要努力打造自己产品特色,AI 搜索产品是由用户需求驱动的,不是单纯的技术驱动。
用户价值可以通过这样的公式来表达:用户价值 = 新体验 – 旧体验 – 迁移成本。想想看,如果一个AI搜索工具能提供明显优于传统搜索的结果,但,同时使用起来又非常简单,那么,用户自然更愿意转向使用这种新工具。
我最近老看大模型的文章,文章都在哪找的呢?
主要是两个地方:一个是技术社区,另一个是知乎直答上的一些专门写这方面的博主。每次我搜索这些内容时,它们几乎总能给我找到需要的东西,所以,我现在挺依赖它的。
这就是用户价值。
因此,从这个角度看,国内AI搜索产品的发展路径,不能完全模仿国外Perplexity。外媒平台Decoder一周前发表了一篇文章,介绍了Perplexity的现状。
文章中提到,Perplexity首席业务官Dmitry Shevelenko表示,Perplexity每个月要处理2.5亿个问题,增长速度令人惊讶。虽然谷歌仍然是搜索市场的主导者,每天处理85亿次查询,但Perplexity的增长速度也非常迅速。
Perplexity是希望打造知识平台,成为生态入口,它的定位是LLM+搜索引擎的中间态,将二者优点结合,侧重搜索体验的产品力而非基模型。
对比国内的搜索环境,传统搜索引擎已经占据通用搜索场景。如果新的AI搜索产品知识库规模不够大,使用效率不够高的情况下,还在努力处理填空题、基础证明题,那么,很难在市场脱颖而出。
所以,国内AI搜索产品,每家要找到自己独特的发展路径,或许,在特定垂直领域深耕,利用AI优势来提供更精准、更垂直细分的内容,才能有机会瓜分市场。
总结
到场景任务中去。