cbd logo

SGE测试总结:生成式AI引领搜索新趋势

自从开放测试访问以来,我们花费无数小时对Google的新AI式搜索体验SGE(生成式搜索体验)进行了压力测试。在此过程中,我对如何对AI搜索结果实施逆向工程、针对SGE进行优化以及估算影响,有了11个认识。

虽然SGE仍处于测试版,并且存在许多缺陷,但我在《SEO的未来》一文中写到的许多假设都是成立的:搜索环境发生重大变化,促使我们面对新问题,学习新技能。

01
谷歌如何利用SGE节省成本

第一个认识是,谷歌并不默认显示AI结果,至少在SGE测试版中是这样的。相反,用户在大多数时候需要点击generate以获取AI搜索结果(见如下截图)。

谷歌并不总是默认显示AI结果

设置点击“generate”这个小细节,大有用处。通过默认不显示AI搜索结果,谷歌可以测试用户参与度(即用户是否真的想要AI搜索结果)并节省成本。

虽然我个人坚信,从中长期来看,AI回答是不可避免的,但短期内,用户是否更喜欢AI回答而非传统网络搜索结果,我们并不清楚。生成键使得谷歌可以衡量用户对AI搜索结果的兴趣如何,并测试其参与度(我注意到点击生成键会令我接下来的搜索默认扩展AI快照)。

生成式AI搜索结果比传统网络搜索结果贵得多。在路透社的一次采访中,Alphabet董事长John Hennessy预计每次搜索查询的潜在成本增加可能达到10倍。

例如,分析师预计,如果类似ChatGPT的AI能处理其接收到的一半查询,并给出50字的答案,那么到了2024年,谷歌可能会面临60亿美元的支出增长。

(https://www.reuters.com/technology/tech-giants-ai-like-bing-bard-poses-billion-dollar-search-problem-2023-02-22/?ref=kevin-indig.com

然而,我并不认为成本问题像许多人想象的那么严重。这是我的第二个认识。

首先,2022年,Alphabet的总成本和支出为2080亿美元,利润为600亿美元。额外60亿美元只会增加2.8%的支出--对于一家互联网巨头来说,这只是小菜一碟!

其次,并非每个问题都需要AI回答。导航性查询仅仅需要一个链接,即使SGE会弹出一些品牌名称。现如今,简单搜索就能得到直接的答案,不需要AI。正如你所注意到的那样,在某些情况下,AI快照提供的内容远远超出了用户所需。

Google Bard给我提供了

作为回答的网页结果

这是另一种节省成本的方式

第三,谷歌可能会缓存大量的AI回答以节省成本。Arda Capital的一篇文章阐述了谷歌如何缓存30-60%的提问。生成式AI回答可能比网络搜索结果更难缓存,但即使只是缓存10-20%,也能大大降低成本。

Arda Capital认为,"大多数分析都忽略了缓存的影响。当有人在谷歌搜索 ‘Youtube’(最受欢迎的搜索内容之一)时,谷歌不会重新处理该搜索问题。而是显示已有的缓存结果,这有助于降低延迟和减少计算成本。谷歌的历史缓存命中率在30-60%之间,并且,谷歌没有提供很多有关其搜索查询的公开数据,但对美国在线(AOL)所做的搜索问题分析发现,缓存搜索频率排名前100万次的查询可以应对约60%的所有查询。"

(Google I/O, Bard, and Implications for Search (tidalwaveresearch.com)

第四,计算、可再生能源和AI模型的成本都在下降。事实上,最近泄露的一份文件已经表明开放源代码模型是如何对Alphabet、微软和OpenAI构成威胁的。因为这类模型足够便宜,可以在分布式环境中发展。

SemiAnalysis的首席分析师Dylan Patel和Afzal Ahmad称:“虽然我们的模型在质量上仍然略占优势,但差距正在以惊人的速度缩小。开源模型更快、更可定制、更私密,并且性价比更高。他们用100美元和130亿参数做到了我们拥有1000万美元和5400亿参数时依旧觉得有挑战的事情。而且只花费了数周,而不是数月。

(Google "We Have No Moat, And Neither Does OpenAI" (semianalysis.com)

我认为生成键只是暂时的,当成本充足、AI回答的质量足够好时,谷歌最终会对有意义的问题默认显示AI回答。

02
网页结果如何在搜索中创建生成式AI回答

我的第三个认识是,我们可以逆向设计AI结果。

谷歌在AI回答(标题为AI快照)旁提供带有网页的链接轮播图,这样做可以获得大部分剩余的自然点击率,并继续增加点击率。我们必须了解如何在轮播图中提高排名,这点至关重要。

谷歌通过一个叫做检索增强生成(RAG)的过程,将大语言模型(LLMs)在搜索结果中落地,生成AI回答。谷歌的合作特性让我们可以分解AI回答,看看哪些网络结果促成了哪一部分。通俗来讲,验证功能让我们能够对谷歌生成AI回答实施逆向工程。

在测试SGE时,我了解到,AI快照轮播图中显示的网站与传统搜索结果中显示的链接不一样。你可能认为谷歌从最常搜索结果中形成AI回答,但事实并非如此。如果AI快照轮播图获得了大多数自然点击,但谷歌并没有挑选出排名最好的网站,那么我们就需要重新评估谷歌使用了哪些指标将轮播图整合在一起。

以下是我的观点:

以关键词“Corporate credit card“为例,AI快照轮播图中的第一个结果是ExpenseAnywhere,它在传统搜索结果中排名第26位。同样的,在传统网络搜索中排名靠前并不代表在AI快照轮播图中的排名。

ExpenseAnywhere成为第一张轮播图的原因在于其独特之处:它是唯一一个强调企业信用卡风险的搜素结果。

并非所有AI快照轮播结果

都在传统搜索结果中排名第一

SGE围绕风险和利益(或者说利与弊)构建了AI回答。谷歌验证功能表明热点从不同的网站上搜集不同的信息。

验证功能表明不同网站

是如何为最终的AI回答提供信息的

只有ExpenseAnywhere强调

企业信用卡的风险

我不清楚为什么SGE要强调利益和风险而非其他方面,如选择企业信用卡时的重要标准。

点击轮播图中的一个链接时,谷歌利用其与精选摘要(Featured Snippets)相同的功能将用户引导到一篇特定的文章。我的第四个认识是,通过明确突出AI快照的某个角度,网站可以增加在轮播图中的排名机会。

谷歌在AI轮播中高亮标出了链接通道

就像精选摘要那样

在AI回答中得到排名需要:a)了解SGE涵盖的不同角度;b)在内容中明确地回答问题。我们可以看看谷歌在验证中使用的文章,了解SGE在寻找什么,并相应地调整我们自己的内容。

讽刺的是,当AI快照出现时,精选摘要可能不会再获得流量。

当用户得到以上AI回答时

他们为什么还要阅读精选摘要

如果AI快照问世后谷歌就不再显示精选摘要,我也不会对此感到惊讶。

03
电商

我的第五个认识是,电商中的AI回答是最多的。对于像“summer shirts for men”这样的产品问题(交易意图),谷歌在电脑端显示了两排内容,包含7个产品,在移动端显示了2个产品。

电商关键词显示出类似线上商场的结果

我现在还不清楚谷歌如何决定显示哪些产品。这些产品与页面上自然搜索结果中的购物轮播图中的产品也并不重叠。

对于其他问题,如“standing desk”,谷歌则根据“适合家庭办公”、“适合高个子”或“适合游戏”等属性来显示具体的产品推荐。

产品描述或是AI产品轮播点击率的

一个重要驱动因素

谷歌似乎从网站上的评论中提取这些产品属性,这点相当令人震惊,因为谷歌将非结构化数据变成了结构化数据。我在BGR和Insider的评论中发现了“最适合高个子”,谷歌在右侧边栏的“常见用途”部分也提到了这一点。我的第六个认识是,产品、地点以及品牌评论对AI搜索结果的重要性正在显著增加。

点击产品,打开右侧边栏

可以看到评论、零售商、价格等信息

点击AI快照轮播图中的产品时,右侧边栏会弹出。它的特色是同一产品有不同的零售商,这意味着提供较低价格的零售商可以击败拥有更好评价或更精美产品图的零售商。接下来,我希望谷歌能在这个列表中提供赞助时段,并使产品搜索进一步货币化。

谷歌通过将零售商商品化来增加产品

基于这些观察,我们可以优化关于交易意图提问的以下方面:

  • 第三方评论
  • 谷歌评论
  • 价格
  • 缩略图
  • 描述
  • 属性
  • 标题

我的第七个认识是,谷歌可能会在搜索结果中加入更多广告以抵消生成性AI提问的高成本。

一如既往,自然搜索结果受到广告的巨大影响。AI回答中的产品轮播目前还没有广告,可能是因为SGE仍处于测试阶段。但谷歌已经介绍过AI回答中的广告可能会是什么样子。我希望它们能与自然搜索结果分享宝贵的版面。

(https://blog.google/products/ads-commerce/ai-powered-ads-google-marketing-live/?ref=kevin-indig.com)

除了谷歌的I/O演示,在SGE测试版中,购物广告出现在AI快照下面,由此可以看出,谷歌正在大力测试广告位置。

04
本地搜索

对于像“best sushi in chicago”这样的本地搜索,谷歌将所有本地数据收集到AI结果中--虽然我不知道为什么要这样做。这也令我惊讶,为什么谷歌显示AI快照而非传统搜索结果。

AI结果关于本地搜索基本上包含更多的文字和评论网站链接。

AI快照中的本地搜索结果与传统的本地搜索结果有两个区别。首先,它们试图为问题提供更有针对性的答案。AI快照中显示的企业与传统搜索结果中的不一样。相反,SGE试图根据你搜索的内容从Yelp、Eater或谷歌等网站的评论来定制列表(见如下截图)。

谷歌在自己的平台上显示评论。

SGE提供一些有用的信息,如(1)商家营业时间、(2)来自谷歌地图的图片、(3)有用的链接、(4)评论。

关于本地企业的品牌搜索比以前多了很多内容。

✔我的第八个认识是,根据SGE测试版,提供本地评论的网站实际上可能从谷歌获得更多流量,但谷歌有可能只能链接到自己的评论。

05
YMYL

谷歌并不是每次都会对YMYL问题(与你的金钱与生活相关的垂直领域,如金融、健康或法律)显示SGE。

例如,像“should you get a personal loan to pay off credit debt”这样的问题就不会触发AI快照。

有些问题似乎与建议太接近了,因此谷歌无法给出AI回答。

然而,“symptonms for diaper rash”这一查询却触发了AI快照。

尿布疹相关查询给出的SGE答案--也许是因为尿布疹不构成生命威胁?

我认为谷歌是在避免对诸如贷款或严重疾病这类敏感话题给出具体建议,这些敏感话题在许多国家都受到监管。你不能简单地提供建议,谷歌也不能。

我还没弄清楚YMYL查询的底线在哪里。像“can essential oils cure cancer”这样的问题会反馈正确的答案,甚至会提供相关科研论文。

一些YMYL问题在引用研究甚至是论文方面做得很好。

但是像“diaper rash”这样的关键词并没有触发SGE。我估计谷歌在监管行业提供建议时非常谨慎,这对传统的有机搜索结果来说是个好消息。

谷歌不想提供 "diaper rash "的AI回答,而是从可靠来源提供了其医学特征。

✔我的第九个认识是,YMYL主题的AI回答是非常不确定的。可以看到谷歌避免AI回答,而是依靠其内容合作关系--除非是关于治疗和药物,毕竟这样的查询无论如何是赚不到钱的。

谷歌可能会区分YMYL中可盈利和不可盈利的查询。

06
其他不引人注目的设计变化

除了AI快照,谷歌还在SGE测试版中推出了一些可能不引人注目的设计变化:

第一,标题是黑色而不是蓝色。我不确定二者是否有很大区别,但这一变化很明显。

第二,查询细化和垂直搜索标签似乎在同一地方。搜索栏下方的小气泡将用户更快地推到特定的搜索中,但这些搜索似乎没有以特定的顺序出现,除了Converse这一标签总是显示在第一位。

我对“Add to Sheets”这一功能非常满意,它允许用户将搜索中的元素添加到电子表格中。但令我失望的是无法将Google Bard的输出添加到电子表格中,只能添加网站。为什么会这样?

结论:SGE无疑为搜索带来变革,但AI回答可能会迎来更大的机遇

SGE尚有一些不足之处,并非所有设计都有意义,有些功能感觉很笨拙。但它目前只是测试版本,功能未完善表明是为了快速问世,在我看来,这点对谷歌来说至关重要。

✔我的第10个认识是,对谷歌来说,对AI回答进行微调要比调整传统搜索结果难得多。在AI之前,谷歌能够重新安排摘要,有时能调整搜索结果页面。现在,谷歌需要改进回答的角度、表述、准确性和多样性,这比原先要复杂得多。

我更担心长尾搜索。由于AI快照在回答长尾搜索方面做得更好,用户可能会向谷歌提出很多更长的问题。同时,谷歌搜索控制台出于“隐私原因”已经隐藏了很多长尾搜索的数据。如果不改变这种现状,我们从谷歌看到的的数据可能会更少。

✔我的第11个认识是,SGE最大的机遇不在于谷歌搜索,而在于成为整个谷歌生态系统的助手。

微软在其开发者大会Build上推出了Windows Copilot,它结合了Chat GPT(+插件)和必应的力量。用户可以在操作系统中直接执行操作、提出问题和进行搜索。如果谷歌的搜索质量和速度都足够好,用户为什么要访问其他网站进行搜索呢?

Windows Copilot允许用户直接从搜索栏访问Chat GPT和插件。搜索将转移到操作系统上。因此不仅会威胁到谷歌搜索,也会使传统的SEO数据聚合,如使得SERP抓取成为可能。对谷歌来说,更大的机遇是将SGE从谷歌网站中分离出来,并将其与Chrome、Gmail、Youtube、Android、Pixel手机以及所有其他产品整合起来。如果用户可以在他们使用的每个应用程序中使用谷歌搜索,为什么还要访问谷歌网站呢?更好的一点是,SGE可以根据各产品属性数据进行训练和改进,如Gmail中的电子邮件或Youtube视频的特定部分。

在用户数据上训练生成式AI模型将为两个可能已经领先于时代的趋势打开新的大门:个性化和语音搜索。

像Siri、Alexa、Cortana或谷歌助理这样的助手可以通过生成式AI优化10倍甚至是100倍。过去,语音搜索收效甚微,但在不久的将来可能变得实用。网站和产品个性化在10年前曾被大肆炒作,但从未达到足够好的水平。生成式AI能收集足够的数据以了解真正个性化用户体验所需--尤其是像微软Fabric这样的连接数据湖。

谷歌一直以来面临的挑战是避免扼杀其广告市场。个人助理更适合订阅而非广告,这就是为什么微软在建立综合SGE助理方面处于有利地位,他们已经在搜索方面输给了谷歌,我也相信AI不会改变这一局面。但谷歌的弱点在于其对广告收入的依赖,微软在这一领域的创新速度则快得多,因为他们的搜索引擎不需要通过广告盈利。AI助手正是这场战争的实际前沿阵地。

然而,实现这一愿景还需要时间。在那之前,我们会对AI回答有更多认识。

| 原文链接:

https://www.kevin-indig.com/x-realizations-from-testing-search-generative-experience/

Cross Border Digital

全部文章

Copyright © 2025  深圳市环创网络技术有限公司版权所有
粤ICP备17073372号

Scroll to Top