归档 2025

【GEO优化】企业品牌主权构建:如何防抄袭、防误读、防错引?

企业语义主权构建:如何防抄袭、防误读、防错引?

在生成式AI时代,品牌最大的风险不是“没人提你”,而是“AI说错了你”。

向量匹配技术带来了精准内容推荐,但也带来了一个全新问题——AI在引用品牌内容时,可能理解错、拼接错,甚至归属错。这不再是SEO时代的“关键词错配”,而是大模型时代的**“语义主权危机”**。

本节将帮你建立“企业语义防御力”,从底层机制到操作步骤,教你如何守住品牌在AI语境下的真实表达。


(1)大模型引用内容的逻辑不是“复述”,而是“重组表达”

GEO语境下,AI模型(如DS、Kimi、豆包等)通常通过以下流程进行引用:

① 检索到相关内容(来自网页、论坛、问答等)

② 理解原文意思(转化成语义向量)

③ 按问题或上下文生成一段“原创表达”

问题在于:这三步中,任何一环出错,都会造成误引用。

(2)常见三类误判机制:

场景表现原因
误读产品特性把别家功能套到你头上产品内容描述过于模糊/缺乏对比
错归属品牌事件竞品活动“记到你身上”语义锚点不清晰 / 没有品牌注记
错链接出处你的观点链接到他人文章缺乏知识图谱 / 结构化信息太弱

GEO优化中的“语义错引用”应对机制

如何让AI准确引用你、准确理解你、准确归属你

下面是三大核心机制,每个都可以落地执行。

(1)构建页面级语义清晰度(Content Clarity)

① 一页一主题:避免一个页面讲多个产品或品牌

② 明确写出品牌名、时间、地点、人物、数据等锚点

③ 使用结构化表达,如标题、小标题、列表、引用块

实操提示

  • 每个页面都至少出现2次品牌名
  • 页面底部加“内容原创声明”或版权标识

(2)激活知识图谱绑定机制(Entity Linking)

AI引用的“源头感知”很多时候来自知识图谱。你不在图谱里,模型引用就靠“猜”。

① 在官网部署结构化数据(Schema.org JSON-LD)

② 向主流平台提交品牌图谱(如DS、百度文心、腾讯元宝)

③ 在品牌词条中标注代表链接(企业官网、内容出处页)

实操推荐(附后)

(3)锚点强化表达机制(Anchor Amplification)

不是所有内容都能进入AI语义识别器,但“重复+显性”的锚点能提升被引用率。

① 关键句重复出现2~3次,尤其在开头和结尾

② 所有图文内容添加ALT文本,嵌入品牌名或功能词

③ 视频内容加字幕,并附带品牌水印+功能口播


总结来看,企业的语义主权防线可以分为三层:

层级名称功能
第一层页面语义清晰度防“读错”
第二层品牌图谱绑定防“引错”
第三层多模锚点强化防“归属错”

每一层都是向量世界里的“品牌边界”。你守住了这些,才守住了品牌的“语义阵地”。

✅ 内容营销人员该做什么?

  • 内容结构标准化(有小标题、数据、引用)
  • 品牌锚点多重复(品牌名+官网+出处链接)
  • 与技术协作,完成品牌知识图谱提交与验证

你不需要懂向量怎么训练,但你要会让AI“认得你是谁”。

目前 DeepSeek 并未提供面向普通企业或内容人员的“一键图形界面”提交入口,他们更倾向通过技术对接方式接入企业数据,如:

  • 通过 DeepSeek API / RAG 接口:技术团队可以上传品牌相关文档、PDF 和结构化页面。

📌 给内容营销人员的建议:

  1. 协调技术合作:与技术团队或服务商对接 DeepSeek 的 API 接入。
  2. 准备结构化内容包:包括品牌介绍、企业官宣文档、图表、权威资料。
  3. 提交形式为 JSON / PDF / 网页 HTML 的结构化数据

目前 DeepSeek 平台中没有“知识绑定”按钮可见;这是后端服务层对内容进行识别的过程。


腾讯元宝当前主要面向“智能体”生态,对个人或品牌的信息录入集中在**“智能体创建”“组织/品牌智能体”**流程中:

  • 企业可以创建自己的智能体(如“品牌智能体”),并在其中填写品牌信息:
    • 官方网址、业务范围
    • 品牌故事、联系方式、媒体账号

📌 给内容营销人员的建议:

  1. 登录元宝开放平台,进入“智能体管理”模块。
  2. 点击“创建智能体”,填写品牌信息并上传资料、图文件等。
  3. 完成后,内容即被系统归档为企业语义内容的一部分。
  • DeepSeek 和元宝更多采用 技术对接方式,内容需要以结构化数据形式被“嵌入”到系统。
  • 目前的实际路径是 —— 准备好结构化内容包 → 与平台技术入口对接 → 上传到系统知识库

🧩 总结建议

作为内容营销/市场团队:

  1. 不必深入技术细节,但要组建“品牌结构化资料库”:官网内容、权威文档、产品手册等。
  2. 对接技术团队或服务商,资料通过 API 方式提交到DeepSeek、元宝后台。

感谢大家阅读这篇文章!如果您对内容感兴趣,或者希望进一步合作或咨询,欢迎通过微信与我联系。为了更好地了解您的需求,请在添加我微信时,务必告知您的公司名称以及个人信息。这样我可以为您提供更有针对性的帮助。期待与您的交流与合作!


合作请咨询

【GEO】多模态内容发布 Checklist:五大平台适配落地清单

很多企业已经知道要做“图文视频音频”多模态内容,也懂得内容要结构化、场景化、标签化。但真正能在 DeepSeek、文心一言、豆包、元宝和 Kimi 等平台获得推荐流量的,却少之又少。问题往往不是“内容不好”,而是——内容“投放得不对”

GEO 不是简单的“发内容”,而是“发布到AI能识别、能提取、能判断你专业性和价值的位置”。如果说内容创作是“攻”,那么内容发布就是“守”,守住了内容结构、语义价值与平台适配度的统一,才是真正“生成式引擎优化”的落地闭环。

本节我们将逐平台拆解发布适配策略,最后附上通用的实操Checklist,让你发布的每一条内容都成为 AI 平台的“推荐素材”。


平台适配一:DeepSeek——结构化 + 知识图谱优先

平台特点

  • 70%内容源于公开网页,主打“权威性”、“结构清晰”、“逻辑性强”的内容。
  • 对结构化语义、专业标签、知识图谱嵌入极度敏感。
  • 多模态支持强,尤其是图文组合、图表数据嵌入。

发布建议

  • 优先使用清晰层级结构(如H1、H2、H3),并将关键词靠前
  • 图文内容需带描述性Alt文字,图表加上解释段落。
  • 如果使用结构化数据(如FAQ、产品信息、组织介绍等),建议嵌入Schema.org格式。
  • 内容中嵌入品牌自身的知识图谱标记词(如“公司名+产品名+核心功能”)。

示例

某B2B企业将产品介绍页转为结构化内容,使用“问题-解决方案-专家观点”三段式写法,并配上团队照片、应用流程图,被 DeepSeek 收录并持续出现在搜索前3条,流量提升约65%。


平台特点

  • 语义理解偏“语境式”,擅长识别“行业-问题-解决”结构。
  • 更偏好中文逻辑清晰、具备场景感的描述。
  • 强调权威来源原创溯源能力,会追踪内容源头可信度。

发布建议

  • 用“使用者视角”写内容,如“企业如何用XXX提升转化”。
  • 保证内容有明显的“来源路径”,引用时标明出处,便于其构建“内容信任”机制。
  • 避免空洞的“营销词”,多用动词+场景(如“在门店使用”“通过表格分析”)。

注意
若发布在自有官网或公众号,务必绑定企业认证,提升可信度标签。


平台特点

  • 以“对话+问答式”生成搜索结果,对内容中的提问结构极为敏感。
  • 喜欢FAQ式内容结构,问题导入+简洁回答。
  • 图像识别能力尚可,但对“问题上下文”识别更敏锐。

发布建议

  • 将内容切成“问答块”:如“用户常问什么?”→“如何操作?”→“出现问题怎么办?”
  • 视频建议嵌入文字描述(可放在页面底部,豆包对页面整体语义提取能力较强)。
  • 利用“关键词变体”:如“怎么做”“如何实现”“技巧有哪些”增加收录几率。

实操建议
撰写一篇内容前,先列出该主题下用户最常问的10个问题,再反向创作内容结构。


平台特点

  • 腾讯体系内容倾向私域推荐(公众号、视频号、小程序)优先。
  • 强调“作者/品牌的人设”+“内容的可验证性”。
  • 多模态能力强,尤其在图文混合与社交图卡内容识别上表现优异。

发布建议

  • 发布平台首选公众号/视频号,并绑定企业认证账号。
  • 内容可适当加入“人物元素”,如创始人语录、员工采访、用户推荐等。
  • 视频要素中加入字幕、场景标签、背景信息,辅助AI识别。

平台特点

  • 中文长文本阅读理解能力强,适合写深度内容。
  • 支持图文混排,阅读链条需逻辑严谨。
  • 擅长“任务指令类内容”,如清单、指南、教程等。

发布建议

  • 优先采用“总—分—结”的结构方式,段落之间要有因果/转折。
  • 多使用结构提示词:例如“第一步”“接下来”“注意事项”等。
  • 多模态内容建议用“任务式引导”:如“请参考下图步骤,完成XXX操作”。

实例提示
发布内容时,如果是图文教程,务必在每张图前加一句“图解如下”,或“请见下图”,可显著提升收录率。

项目检查项说明
✅ 内容结构是否分段清晰,有标题、子标题?H2/H3标签、短段落
✅ 多模态搭配图文/视频是否配套?是否有Alt文本/字幕?图要有描述,视频要有文字引导
✅ 关键词分布核心关键词是否出现在前100字内?特别重要对 DeepSeek、Kimi
✅ 发布平台适配是否根据平台推荐结构进行格式排布?如豆包适合问答结构
✅ 溯源信息是否有引用、出处、企业官网链接?尤其对文心一言、元宝重要
✅ 地域信息是否加入地名/区域标签(如需)?本地服务类尤其关键
✅ Schema结构(选配)是否支持结构化数据(产品、FAQ等)?SEO/GEO通用最佳实践

很多人以为内容发布完就完成了GEO的一切。但其实,发布才是整个生成式引擎优化的“闭环起点”——它决定了AI平台是否“看得懂你、信得过你、愿意推你”。

未来内容战的胜负,将不在“谁写得多”,而在于“谁发布得对”。


一、标题(Title)

  • 格式:主关键词 + 明确价值点 / 场景应用
  • 示例
    • “如何用结构化内容让AI平台提升品牌曝光?”
    • “小红书爆款图文的7个必备要素(附模板)”

二、引言(Introduction)

  • 简要阐明该内容的目标或意义
  • 明确受众是谁,能解决什么问题

示例段落

在AI驱动的内容分发时代,仅靠“内容好看”已远远不够。你需要的是让AI看得懂、信得过、愿意推荐的内容结构。本指南将手把手教你如何构建平台偏好的多模态内容,适配DeepSeek、Kimi、文心一言等平台,提升搜索收录与推荐权重。


三、正文结构(支持图文/视频混排)

3.1 场景引入(Why)

  • 引导问题出现的业务背景或用户困境
  • 使用问句、真实案例开场

示例

你是否遇到过:发布了图文内容却无人问津?明明有价值却无法被AI识别推荐?

3.2 解决方案结构化(How)

  • 用“步骤清单”“方法总结”“模型框架”呈现
  • 适配平台推荐习惯,结构清晰

推荐写法格式

复制编辑第一步:内容结构统一(用H2/H3分段)
第二步:关键词靠前、语义标签明晰
第三步:图片加描述、视频加字幕
第四步:引用可信内容 + 标注来源

📌 附图建议:每一步配一张图示,标注重点信息(DeepSeek、Kimi收录率明显更高)

3.3 平台发布技巧(Where)

  • 针对5个平台的发布建议,段落结尾可附具体发布截图或格式示例

3.4 常见错误提醒(What Not To Do)

  • 用对比方式列出错误 vs 正确做法
  • 加入“AI无法理解”的信号举例

四、结语(Takeaway)

  • 总结关键点
  • 引导读者行动,例如下载模板、测试发布

示例

记住,发布是生成式优化的起点,而不是终点。让AI“愿意”推荐你,先从“结构化、可理解、多模态”的内容底盘开始。你也可以使用下方模板直接撰写并适配五大平台。


五、附加模块(可选)

✅ FAQ快问快答区(特别适配豆包)

Q1:图片怎么命名才能被AI识别?
A1:使用简洁中文+关键词,如“AI生成优化图示1”。

✅ 平台适配表格(适配DeepSeek/Kimi)

步骤内容要求是否完成(✅/❌)
结构分层使用H2/H3格式段落
图文描述所有图片有Alt文字
视频字幕字幕完整、同步
溯源链接引用内容加链接
关键词前置核心词位于前100字

合作请咨询

GEO的技术地基:让AI真正“懂”你的内容(向量技术篇)

 生成式引擎优化(GEO)的核心目标是让AI模型更精准地理解、推荐并传播企业内容。本篇文章将深入解析支撑GEO的四大技术支柱:知识图谱、多模态技术、向量数据库与结构化数据,揭示它们如何协同作用,构建AI时代的“内容霸权”。

      在AI内容生成时代,懂内容、懂用户、懂语境才是赢得内容战的根本。GEO不仅仅是为了“优化搜索”,它是一个面向AI大模型时代的语义协同框架。而支撑这个框架的关键,就是这里要讲的四大技术底座:

  • 知识图谱:语义结构的搭建器
  • 多模态技术:统一认知的优化器
  • 结构化Schema:机器理解的语言

在传统搜索引擎优化(SEO)中,我们最熟悉的是基于关键词的“精确匹配”逻辑。搜索引擎通过词与词的相似程度来检索信息,这种方式虽然简单直接,但存在明显的局限性——它无法真正理解内容的语义含义。而在 GEO 体系中,这种以“词面”为核心的检索方式已经不再适用。AI 大模型真正“看懂”内容,是通过高维语义空间中的向量距离来判断信息的相关性。这背后依赖的关键技术,便是向量数据库。

向量数据库是一种专门用于存储和检索高维向量的数据库系统。它通过将文本、图像、音频等非结构化数据转换为向量表示,并基于相似性度量(如余弦相似度、欧几里得距离)实现高效检索。向量数据库的核心组件包括:

  • 向量编码器:将数据转换为向量,例如使用 BERT、CLIP 等模型。
  • 索引结构:加速搜索,如 HNSW、IVF 等。
  • 相似度计算:通过距离度量算法衡量向量间的相似性。

向量数据库能够将非结构化数据转化为高维向量,并通过计算向量间的相似度来实现语义检索。这使得系统能够理解数据的语义含义,而不仅仅是基于关键词的匹配。

在 GEO 体系中,语义检索的核心在于理解内容的语义含义,而不仅仅是基于关键词的匹配。向量数据库通过将内容转化为高维向量,并通过计算向量间的相似度来实现语义检索。这种方式能够识别出“汽车”和“车辆”在语义上的相似性,即使它们的字面形式不同。这种语义理解能力是传统数据库无法实现的,因此语义检索离不开向量数据库。

在 GEO 内容链条中,向量数据库扮演了从“内容资产”到“语义匹配”的桥梁作用。以下是向量数据库在 GEO 体系中的具体实施步骤:

(1)内容向量化处理器

将企业现有的文本、图片、结构化数据通过嵌入模型(如 OpenAI 的 text-embedding-ada-002、Cohere、BGE 等)转化为统一的向量形式,并存入数据库。

(2)语义检索引擎

当 AI 需要调用素材生成内容时,不再基于关键词筛选,而是通过向量比对,找出与当前任务语境最匹配的内容。例如,在撰写新品推广文案时,系统可自动检索出过去所有成功案例中的高点击素材作为参考。

(3)内容适配参考源

在多模态场景下,图文、语音、视频等素材也能统一转化为向量。系统可以据此自动生成语义一致、风格匹配的内容推荐、脚本文案或产品描述。

① 百度

百度的向量数据库(VectorDB)支持多种索引类型和相似度算法,能够处理百亿级向量规模。百度文库等业务通过向量数据库实现了多模态检索和推荐系统。

② 搜狐

搜狐新闻客户端使用 Milvus 向量数据库,通过提取用户历史浏览新闻的关键词,生成用户和新闻的语义向量,实现个性化新闻推荐。

③ 腾讯

腾讯云的向量数据库服务于腾讯内部多个业务,日请求量达 1600 亿次。腾讯云的向量数据库支持多种索引类型和相似度计算方法,单索引支持 10 亿级向量规模。

④ 企业官网与第三方平台
  • 企业官网:企业可以构建自己的向量数据库,将官网内容(如产品文案、新闻稿、客服对话等)向量化存储。通过语义检索,为用户提供更精准的内容推荐。
  • 第三方平台:对于已经布局向量数据库的第三方平台(如百度、搜狐、腾讯等),企业可以通过优化内容的语义表达,使其更容易被平台的向量数据库检索到。例如,通过使用更贴近用户需求的语义词汇,提高内容的推荐概率。

      向量数据库是 GEO 体系中的“语义燃料库”,它使企业内容具备了“被理解、被调度、被创作”的基础能力。通过向量数据库,企业可以实现精准的内容推荐、多模态内容整合以及智能客服与用户反馈分析。在内容营销领域,向量数据库不仅提升了技术效率,更是认知方式的彻底革新。我们不再基于“关键词热度”,而是要思考“什么语义结构对用户有意义”,从而为用户提供更有价值的内容。


合作请咨询

GEO的技术地基:让AI真正“懂”你的内容(多模态技术篇)

生成式引擎优化(GEO)的核心目标是让AI模型更精准地理解、推荐并传播企业内容。本篇文章将深入解析支撑GEO的四大技术支柱:知识图谱、多模态技术、向量数据库与结构化数据,揭示它们如何协同作用,构建AI时代的“内容霸权”。

      在AI内容生成时代,懂内容、懂用户、懂语境才是赢得内容战的根本。GEO不仅仅是为了“优化搜索”,它是一个面向AI大模型时代的语义协同框架。而支撑这个框架的关键,就是这里要讲的四大技术底座:

  • 知识图谱:语义结构的搭建器
  • 向量数据库:语义召回的引擎
  • 结构化Schema:机器理解的语言

多模态技术:统一认知的优化器

在生成式引擎优化(GEO)体系中,内容对AI的“可理解性”远不止语句通顺或结构清晰。真正决定AI是否“看懂”“听懂”“用对”内容的,是它是否能构建起一个统一、清晰、上下文一致的语义认知图谱。而在这个过程中,多模态技术正逐步成为内容语义建模的优化核心。

生成式模型的认知边界不再局限于文字。图像中的构图、视频中的动作节奏、语音中的情感、产品页面中的排布布局,都是AI理解你内容语境的重要输入。在GEO中,多模态技术不是一个额外的“技术加分项”,而是一种不可或缺的语义整合机制。它帮助AI跨越模态隔阂,从而构建“统一语义体”,实现更准确的内容推荐、更自然的内容生成、更高效的用户响应。


传统搜索优化(SEO)时代,内容的主要处理对象是“文本”:关键词、标签、meta结构等。这一套逻辑建立在“人类读网页”的模型上。

但生成式模型读取信息的方式完全不同。它并不是基于关键词匹配,而是从内容本身的整体语义表现出发进行建模与预测。它不只“读懂”内容,它还要“想象”内容、“重构”内容,甚至“主动生成”内容。

例如:

  • 在一个产品详情页中,图像和文案所传达的情绪基调是否一致?
  • 视频短片的前3秒是否能与语音脚本形成语义呼应?
  • 页面排版中的强调色块,是否对应了文案中主打卖点?

对于AI而言,若缺乏对图像、视频、语音等模态的理解,它看到的只是“内容碎片”;而当多模态能力到位后,它看到的是一个融合表达、内在统一的语义结构体

这正是多模态技术在GEO中的核心价值:帮助AI还原人类用户所能感知到的完整语境,从而构建真正意义上的内容认知统一体


在GEO体系中,多模态技术的作用机制大致可以归结为以下三类:

1. 多模态感知:提升内容的语义覆盖率

多模态感知使AI得以识别文本之外的信息维度。例如:

  • 一张图像中呈现了“海边日落+人物侧脸+蓝色连衣裙”的组合,其背后可能蕴含“情绪放松”“度假场景”“夏日氛围”等隐性语义。
  • 一段视频中出现“快节奏转场+BGM节拍+人物高能对白”,意味着这是一个“高冲击力短时引爆型”内容。

在GEO中,这些非文本信号一旦被感知,即可参与内容的分类、定位、推荐等逻辑,成为优化模型的重要变量。

2. 多模态编码:建立统一语义空间

内容中不同模态的表达必须被统一投射到一个共享语义空间中,才能进行跨模态推理与生成。这一阶段通常依赖视觉语言对齐(如CLIP)、跨模态嵌入模型(如BLIP、Flamingo)等技术,将图文、视频、语音等内容统一向量化。

在GEO系统中,这意味着——无论是结构化产品信息、图像风格标签,还是用户的语音反馈,都可以共同参与AI生成链条,成为“内容驱动模型”的有机组成。

3. 多模态生成:驱动跨模态内容重构

当AI拥有了统一语义视角,它便可以根据上下文语义,自主生成新的图文组合、短视频脚本、营销语音等内容形态。这正是GEO中“从内容理解到内容资产”的关键一步:

  • 电商平台可以基于主图和标题,生成更贴近平台语气的视频脚本;
  • 客服系统可基于用户语音语调和问题语义,生成风格匹配的语音回复;
  • 内容平台可以根据图文组合的语义表现,生成投放算法更偏好的内容布局方案。

为了系统化地发挥多模态技术在GEO中的价值,我们将其划分为四大落地场景:

GEO阶段多模态任务样例应用
内容理解图像/视频识别,语音情绪识别,布局结构分析视频开头节奏识别,图像情绪分类,网页视觉焦点提取
语义建模跨模态嵌入向量生成,模态对齐建模商品详情页图文统一语义体建模
内容生成多模态辅助生成,多模态驱动重写图文转视频脚本,图像驱动语音推荐语生成
内容分发与优化基于模态特征的推荐增强“图+文”风格识别驱动视频内容排序

在实际应用中,多模态能力还需与知识图谱、向量数据库等其他技术模块协同工作。例如:
知识图谱提供内容的语义标签框架,向量数据库提供高维检索与匹配支持,而多模态模块负责将内容素材转化为这些语义资产。


尽管多模态技术带来诸多价值,其实施仍面临一些技术与实践挑战:

  1. 语义一致性困难:图像风格、文案语气、页面排布常常来源不同团队,导致语义冲突。解决路径是引入“语义对齐检测”机制,在发布前做一致性审查。
  2. 模态质量不均衡:某些品牌重图轻文,或重结构轻设计,造成AI训练偏差。建议建立“模态质量评分体系”,对内容做整体打分反馈。
  3. 生成适配难题:不同平台对图像尺寸、语言风格、结构节奏要求各异。企业可考虑建设“模态切片器”,按平台模板生成多版本内容。

在GEO体系中,多模态技术是打通内容理解、生成、分发全链条的“压舱石”。它不仅提升了AI对内容的识别能力,更重塑了品牌内容的表达结构,使其更具语义一致性与生成适配性。

     未来的内容世界将是一个“语义为纲、模态协同”的世界。图文视频不是彼此割裂的内容形态,而是AI理解品牌语境的协奏体。而多模态技术,正是指挥这场协奏的中枢系统。


合作请咨询

GEO 与 AIGC 的闭环关系:内容生成与优化的双向赋能

 在生成式 AI 时代,内容创作与分发正在经历深刻变革。GEO 与 AIGC 构成了一套“内容生成—优化—反馈”的智能闭环系统。这种闭环不仅推动了内容创作的智能化,也大幅提升了优化效率和品牌可见性,实现了从算法适配到用户体验的全面升级。 

      GEO 与生成式 AI(AIGC)之间是如何相互作用的?它们之间的关系是怎样的?答案在于 GEO 与 AIGC 之间的闭环关系:内容生成与优化的双向赋能。这种关系不仅推动了内容创作的智能化,也提升了内容优化的效率和效果。

       AIGC(Artificial Intelligence Generated Content):内容生成的智能化。AIGC,即人工智能生成内容(Artificial Intelligence Generated Content),是一种利用人工智能技术生成内容的方法。它能够根据用户的输入(如问题、指令或提示)动态生成高质量、个性化的文本、图像、音频或视频内容。AIGC 的核心优势在于其强大的语义理解能力和内容生成能力,这使得它能够根据用户的实时需求生成精准匹配的内容。 

      例如,当用户询问 “如何在家中种植多肉植物” 时,AIGC 不仅能够理解问题的语义,还能结合用户的地理位置、季节和气候条件,生成个性化的种植建议。这种能力使得 AIGC 在内容生成方面具有巨大的优势。

 传统 SEO 内容创作与 AIGC 内容创作的对比

传统 SEO 内容创作 vs. AIGC 内容创作对比:

指标传统 SEO 内容AIGC 内容
创作效率依赖人工撰写,效率低批量生成,实时响应
个性化难以实时个性化基于语义和行为精准推荐
内容形式以文本为主多模态(文本+图像+视频等)
迭代速度需要人工干预可通过数据反馈自动调整

 在传统 SEO 时代,内容创作主要依赖人工撰写,创作者需要围绕关键词进行优化,以提高内容在搜索引擎中的排名。这种方法不仅耗时费力,而且难以满足用户多样化的需求。相比之下,AIGC 内容创作具有以下显著优势:

效率提升 :AIGC 能够在短时间内生成大量高质量的内容,大大提高了内容创作的效率。

个性化 :AIGC 能够根据用户的实时需求生成个性化的内容,提供更精准的信息匹配。

多样性 :AIGC 支持多模态内容生成,包括文本、图像、音频和视频等多种形式,满足用户在不同场景下的多样化需求。

 GEO:内容优化的智能化

GEO(生成式引擎优化)是一种针对生成式 AI 平台的优化策略,旨在通过适配 AI 算法对内容的理解、抓取和引用逻辑,提升品牌或内容在 AI 生成答案中的可见性、权威性和精准触达能力。GEO 的核心是通过自然语言语义优化、结构化数据适配、权威知识库构建等技术手段,使内容成为 AI 工具的 “首选信源”。

例如,通过 GEO 优化后的内容,不仅能够更好地被 AIGC 理解和引用,还能够在对话式搜索、智能问答等场景中抢占流量入口,驱动用户对品牌的认知。

 双向赋能:内容生成与优化的闭环

GEO 与 AIGC 之间的关系不仅仅是单向的,而是双向的。AIGC 生成的内容需要 GEO 的优化,才能更好地被用户发现和使用;而 GEO 的优化策略也需要基于 AIGC 的生成能力,才能实现精准的内容推荐和优化。这种双向赋能的关系形成了一个闭环,推动了内容创作和优化的智能化发展。

AIGC 为 GEO 提供内容基础 :AIGC 生成的高质量、多样化的内容为 GEO 提供了丰富的素材。这些内容不仅包括文本,还可能包括图像、视频、音频等多种形式,为 GEO 的优化提供了坚实的基础。

GEO 为 AIGC 提供优化策略 :GEO 通过优化内容的语义结构、知识图谱和向量数据库,使 AIGC 生成的内容能够更好地被用户发现和使用。GEO 的优化策略不仅提高了内容的可见性和权威性,还提升了用户体验。

 在 AIGC 时代的内容创作与编辑工作

尽管 AIGC 能够生成高质量的内容,但原创内容仍然具有不可替代的价值。AIGC 生成的内容虽然高效,但缺乏人类创作者的独特视角和情感表达。因此,内容创作者和编辑人员在 AIGC 时代的工作重点将从单纯的文本撰写转向内容策划、创意构思和情感表达,同时注重内容的优化和质量把控。具体来说,他们需要注意以下几点:

 GEO 与 AIGC 的闭环关系示意图

为了更直观地展示 GEO 与 AIGC 之间的闭环关系,我们设计了以下示意图:

图 GEO 与 AIGC 的闭环关系示意图

图表说明

AIGC 内容生成 :AIGC 根据用户输入生成高质量、个性化的多模态内容。

GEO 内容优化 :GEO 对 AIGC 生成的内容进行优化,提升其可见性和权威性。

用户 :用户与优化后的内容交互,提供反馈。

数据反馈 :用户的反馈数据回流到 AIGC,用于进一步优化内容生成。

📊 行业实践案例:闭环价值的落地证明

案例:某大型家电品牌在AIGC基础上部署GEO策略,实现搜索突破

该品牌使用 AIGC 生成了数千条与产品相关的 Q&A 内容,覆盖智能问答和语义搜索平台。通过 GEO 优化内容结构、嵌入结构化 FAQ 数据和品牌背书链接,其在小红书搜索与百度文心一言中的曝光率提高了 45%。最终,该策略在半年内带来了 21%的站外转化增长。

🔧 实操建议:GEO+AIGC 落地的三步闭环模型

为实现内容智能闭环,企业与创作者可采用如下操作路径:

  1. 统一内容基底(AIGC):
    利用 AIGC 批量生成内容,确保语义一致性与品牌调性统一。
  2. 智能语义优化(GEO):
    对内容进行结构化处理,增加关键词标签、FAQ 分块、内链逻辑、知识图谱绑定等。
  3. 数据回流反馈(Loop):
    通过用户行为数据(点击率、停留时长、转化率)反哺内容选题和生成模型,形成自我进化。

🌐 战略升华:构建品牌语义资产的长远价值

在生成式 AI 搜索时代,品牌的竞争不再只是关键词优化的竞争,而是“语义信源”之间的博弈。谁能率先构建内容生成—优化—反馈的智能闭环,谁就能:

  • 提前占据 AI 搜索入口
  • 成为大模型训练与推荐的优质语料
  • 在用户注意力稀缺的生态中占据心智优势

GEO + AIGC,不只是内容技术的进化,更是品牌认知策略的升维。

小结

GEO 与 AIGC 之间的闭环关系是内容生成与优化的双向赋能。AIGC 生成高质量、多样化的内容,GEO 通过优化这些内容的语义结构、知识图谱和向量数据库,使其更易于用户发现和使用。这种双向赋能的关系不仅推动了内容创作的智能化,也提升了内容优化的效率和效果。通过 GEO 与 AIGC 的协同作用,企业和内容创作者能够在 AI 时代更好地优化内容,提升用户体验,赢得用户的信任和认可。尽管 AIGC 能够生成高质量的内容,但原创内容仍然具有不可替代的价值。内容创作者和编辑人员在 AIGC 时代的工作重点将从传统的文字校对转向内容策划、创意构思和情感表达,同时注重内容的优化和质量把控,确保内容的高质量和用户体验。


合作请咨询

GEO优化:AI时代内容可见性的新策略

    在人工智能迅速发展的今天,生成式引擎(如ChatGPT、Perplexity.ai等)已经成为我们获取信息的主要方式之一。这些引擎通过生成精准且个性化的回答,正在逐步取代传统搜索引擎的地位。然而,对于内容创作者来说,生成式引擎的黑盒性质和快速迭代使得他们难以控制内容的展示方式,可能导致网站流量下降和可见性降低。为了应对这一挑战,**生成式引擎优化(GEO)**应运而生,为内容创作者提供了一种新的解决方案。

  今天,我们将深入探讨GEO的核心概念、优化方法及其在实际应用中的效果,并分享一篇相关论文的翻译成果,帮助您更好地理解这一新兴领域。

1. 研究背景与动机

  • 生成式引擎(GE)的兴起:随着大型语言模型(LLMs)的发展,生成式引擎(如BingChat、Google的SGE等)逐渐成为主流。这些引擎通过检索和生成多模态响应来回答用户查询,与传统搜索引擎不同,它们直接提供答案而非链接列表。
  • 对内容创作者的影响:生成式引擎的普及对内容创作者构成了挑战。由于其黑盒性质和快速迭代,创作者难以控制内容的展示方式,可能导致网站流量下降和可见性降低。

2. GEO(生成式引擎优化)的提出

  • 定义与目标:GEO是一种新的优化框架,旨在帮助内容创作者提升其在生成式引擎响应中的可见性。它通过调整网页内容的呈现形式、文本风格及信息结构,使内容更适应生成式引擎。
  • 核心特性
    • 定制化可见性指标:GEO提供了一套灵活的指标定义框架,允许创作者根据需求优化内容。
    • 黑盒优化:无需了解生成式引擎的具体算法设计,即可通过文本修改提升可见性。

3. GEO方法与实验

  • 可见性指标
    • 位置调整词数(Position-Adjusted Word Count):结合词数占比与引用位置的权重。
    • 主观印象(Subjective Impression):综合多项主观因素的评分。
  • 优化方法:提出了9种GEO方法,包括引用来源、数据嵌入、关键词堆砌等。实验结果表明,这些方法在GEO-bench基准测试集中显著提升了内容的可见性。
  • 实验设置
    • 基准测试集:GEO-bench包含10,000条跨领域查询及其对应网络资源。
    • 评估指标:位置调整词数和主观印象。
  • 关键发现
    • 最佳方法:引用来源、引述添加和数据添加等方法效果显著。
    • 领域特异性:不同领域的优化策略效果不同,强调了领域特异性优化的必要性。
    • 组合策略:多种GEO方法的组合可以进一步提升性能。

4. 实际应用与验证

  • 商业生成式引擎验证:在Perplexity.ai上验证了GEO方法的有效性,结果表明这些方法在实际环境中同样有效。
  • 对小创作者的益处:GEO方法可以帮助排名较低的网站提升可见性,为小内容创作者提供了与大企业竞争的机会。

5. 结论与展望

  • GEO的重要性:GEO为内容创作者提供了一种新的工具,以应对生成式引擎带来的挑战。
  • 未来工作:随着生成式引擎的不断发展,GEO方法可能需要进一步调整和优化。

关键结论

  1. GEO的有效性:通过实验验证,GEO方法可以显著提升内容在生成式引擎响应中的可见性,最高可达40%。
  2. 领域特异性:不同领域的优化策略效果不同,需要针对具体领域进行优化。
  3. 组合策略的优势:多种GEO方法的组合可以进一步提升性能。
  4. 对小创作者的支持:GEO方法可以帮助排名较低的网站提升可见性,为小内容创作者提供了公平竞争的机会。
  5. 实际应用价值:在商业部署的生成式引擎(如Perplexity.ai)上验证了GEO方法的有效性,证明其具有实际应用价值。

这篇文章为生成式引擎优化提供了系统的理论框架和实践方法,对内容创作者和生成式引擎开发者都具有重要的参考价值。


       在AI驱动的信息时代,生成式引擎已经成为主流的信息获取方式。对于内容创作者来说,理解和应用**生成式引擎优化(GEO)**变得尤为重要。通过GEO方法,创作者可以显著提升其内容在生成式引擎响应中的可见性,最高可达40%。这些方法不仅适用于各种领域,还能通过组合策略进一步提升效果。

      此外,GEO方法特别有助于排名较低的网站和小内容创作者,为他们提供了与大企业竞争的公平机会。在实际应用中,这些方法已经在商业部署的生成式引擎(如Perplexity.ai)上得到了验证,证明其具有显著的实际价值。

      总之,GEO不仅是一个技术上的创新,更是内容创作者在AI时代保持竞争力的关键工具。希望本文的介绍和分析能帮助您更好地理解和应用GEO,提升您的内容可见性,赢得更多流量和关注。

GEO优化:如何在AI时代提升内容可见性

姓名所属机构所在地邮箱
普兰贾尔・阿加瓦尔*印度德里印度理工学院印度新德里pranjal2041@gmail.com
维什瓦克・穆拉哈里*普林斯顿大学美国普林斯顿murahari@cs.princeton.edu
坦梅伊・拉杰普罗希特独立学者美国西雅图tanmay.rajpurohit@gmail.com
阿什温・卡利安独立学者美国西雅图asaavashwin@gmail.com
卡西克・纳拉辛汉普林斯顿大学美国普林斯顿karthikkn@princeton.edu
阿米特・德什潘德普林斯顿大学美国普林斯顿asd@princeton.edu

大型语言模型(LLMs)的兴起开创了搜索引擎的新范式——生成式引擎(Generative Engines, GEs)。此类引擎通过生成模型整合并总结多源信息以响应用户查询,能够生成精准且个性化的回答,正快速取代传统搜索引擎(如Google和Bing)。生成式引擎通常通过综合多源信息并利用LLMs进行总结来满足用户需求。尽管这一转变显著提升了用户体验与生成式引擎的流量,但其对第三方利益相关者(如网站和内容创作者)构成了巨大挑战。由于生成式引擎的黑盒性与快速迭代特性,内容创作者几乎无法控制其内容何时、以何种形式被展示。随着生成式引擎的普及,我们必须确保创作者经济不受损害。

为此,我们提出了生成式引擎优化(Generative Engine Optimization, GEO)——首个通过灵活的黑盒优化框架帮助内容创作者提升其在生成式引擎响应中可见性的新范式。我们构建了GEO-bench这一覆盖多领域用户查询的大规模基准测试集,并提供相关网络资源以验证优化效果。通过严格评估,我们证明GEO可将生成式引擎响应中的内容可见性提升高达40%。此外,研究表明这些策略的效果因领域而异,凸显了领域特异性优化方法的必要性。

本工作为信息发现系统开辟了新的方向,对生成式引擎开发者与内容创作者均具有深远意义。

附属信息

  • 贡献声明:作者贡献均等。
  • 代码与数据:GEO: Generative Engine Optimization
  • 版权声明
      本文允许个人或课堂非商业用途使用,引用需标明完整来源。全文版权归作者及ACM所有,商业用途需额外授权。
  • 会议信息
      发表于 第30届ACM知识发现与数据挖掘会议(KDD ’24),2024年8月25–29日,西班牙巴塞罗那。
      DOI: https://doi.org/10.1145/3637528.3671900

CCS概念(计算机系统分类概念)

    计算方法论 → 自然语言处理;机器学习

     信息系统 → 网络搜索与信息发现。

关键词

生成模型,搜索引擎,数据集与基准测试

ACM参考文献格式

普兰贾尔·阿加瓦尔(Pranjal Aggarwal)、维什瓦克·穆拉哈里(Vishvak Murahari)、坦梅·拉杰普罗希特(Tanmay Rajpurohit)、阿什温·卡尔扬(Ashwin Kalyan)、卡蒂克·纳拉辛汉(Karthik Narasimhan)和阿米特·德什潘德(Ameet Deshpande)。2024。GEO:生成式引擎优化。收录于《第30届ACM SIGKDD知识发现与数据挖掘会议(KDD ’24)论文集》,2024年8月25–29日,西班牙巴塞罗那。ACM,美国纽约,共12页。

DOI链接:https://doi.org/10.1145/3637528.3671900

       三十年前传统搜索引擎的发明彻底改变了全球信息获取与传播的方式[4]。尽管传统搜索引擎功能强大并催生了学术研究、电子商务等众多应用,但其局限性在于仅能为用户查询提供相关网站列表。然而,近年来大型语言模型[5, 21]的成功为新一代系统(如BingChat、Google的SGE、perplexity.ai)铺平了道路——这些系统将传统搜索引擎与生成式模型相结合。我们将其统称为生成式引擎(Generative Engines, GE),因为它们能够通过检索(Search)信息并基于多源内容生成(Generate)多模态响应。从技术上看,生成式引擎(图2)会从数据库(如互联网)中检索相关文档,并利用大型神经模型生成基于这些来源的响应,确保信息可溯源且用户可验证。

       生成式引擎对开发者和用户的价值显而易见:用户能更快速、精准地获取信息,开发者则能设计精确且个性化的响应,从而提升用户满意度与商业收益。然而,生成式引擎对第三方利益相关者(即网站与内容创作者)却存在不利影响。与传统搜索引擎不同,生成式引擎通过直接提供完整答案,减少了用户访问原始网站的需求,可能导致网站自然流量下降并削弱其可见性[16]。当前,数百万中小企业和个人依赖在线流量与可见性维持生计,生成式引擎的普及或将严重冲击创作者经济。此外,生成式引擎的黑箱和专有性质使得内容创作者难以掌控并理解他们的内容是如何被摄入和呈现的。

图1:生成式引擎优化(GEO)方法示意图
我们提出的生成式引擎优化(GEO)方法通过优化网站内容,提升其在生成式引擎响应中的可见性。例如,图中某披萨网站原本在生成式引擎中缺乏可见性,通过GEO的黑盒优化框架,网站所有者可调整内容策略,显著提升其可见性。此外,GEO的通用框架允许内容创作者自定义可见性指标(如引用频率、内容相关性等),使其在这一新兴范式中掌握更大主动权。

在本研究中,我们提出了首个以创作者为中心的通用框架——生成式引擎优化(Generative Engine Optimization, GEO),旨在帮助内容创作者适应这一新型搜索范式。GEO 是一种灵活的黑盒优化框架,专为闭源生成式引擎设计(图1),其通过调整网页内容的呈现形式、文本风格及信息结构,将原始网站优化为更适应生成式引擎的版本,从而提升内容可见性。

核心特性

  1. 定制化可见性指标
    由于生成式引擎的可见性概念比传统搜索引擎更复杂且多维(图3),GEO 提供了一套灵活的指标定义框架。传统搜索引擎通过网站在结果页的平均排名衡量可见性(线性列表形式),而生成式引擎的响应内容通常为结构化文本,并将来源网站以内联引用形式嵌入其中。这些引用的长度、位置及风格各异,因此需要从多维度评估可见性,例如:
    • 引用相关性:引用内容与用户查询的匹配程度(客观评估)。
    • 引用影响力:引用对用户决策的实际影响(主观评估)。
  2. GEO-bench 基准测试
    为全面验证 GEO 方法的有效性,我们构建了 GEO-bench,一个包含 10,000 条跨领域查询及其对应网络资源的基准测试集,专门适配生成式引擎的特性。

成效与贡献

通过系统性评估,我们证明所提出的生成式引擎优化(GEO)方法可在多样化查询中将内容可见性提升高达40%。关键策略包括:

  • 引用权威内容(如学术论文、行业报告)。
  • 嵌入统计数据(如市场调研、用户行为分析)。
    上述策略在各类查询中平均提升可见性超过40%。此外,在实际生成式引擎 Perplexity.ai 上的验证结果显示,可见性提升最高达37%

主要贡献总结

  1. 首创生成式引擎优化框架(GEO)
    首个帮助网站所有者针对生成式引擎优化内容的通用框架,可在多样化查询、多领域场景及实际黑盒生成式引擎中,将网站可见性提升高达40%
  2. 定义生成式引擎专用可见性指标
    提出一套专为生成式引擎设计的可见性指标体系,允许内容创作者通过定制化指标(如引用密度、内容深度)灵活优化内容。
  3. 构建GEO-bench基准测试集
    首个大规模基准测试集,涵盖跨领域搜索查询及适配生成式引擎特性的数据集,支持可靠评估与迭代优化。

 图2:生成式引擎概述

   生成式引擎主要由一组生成模型和一个用于检索相关文档的搜索引擎构成。生成式引擎以用户查询为输入,通过一系列步骤生成基于检索来源的最终响应,并在响应中嵌入内联引用以标明信息来源。

2 公式化与方法论

2.1 生成式引擎的公式化

尽管已有数百万用户使用各类生成式引擎,但目前尚未形成统一的标准框架。我们提出一个模块化设计框架,可兼容不同生成式引擎的组件。生成式引擎(Generative Engine, GE)包含多个后端生成模型和一个用于来源检索的搜索引擎。其定义为:

  • 输入:用户查询 qu和个性化用户信息 Pu;
  • 输出:自然语言响应 r。
    生成式引擎可表示为以下函数:
    • f{GE} := (qu, Pu) -r (1) 

生成式引擎包含两大核心组件:
a. 生成模型集合 G={G1,G2,…,Gn},每个模型负责特定任务(如查询重构、摘要生成);
b. 搜索引擎 SE,根据查询 q 返回一组来源 S={s1,s2,…,sm}。

工作流程示例(见图2)
给定一个查询,查询重构模型 G1=Gqr  生成一组子查询 Q1={q1,q2,…,qn}},随后传递给搜索引擎 SESE 以检索并排序来源 S={s1,s2,…,sm}。来源集 S 被传递给摘要模型 G2=Gsum,为每个来源生成摘要 Sumj,形成摘要集 Sum={Sum1,Sum2,…,Summ}。摘要集再传递给响应生成模型 G3=Gresp,生成基于来源 S 的累积响应 r。本文主要关注单轮生成式引擎,但该框架可扩展至多轮对话式引擎(附录A)。

响应结构与引用要求

响应 rr 通常为带有嵌入式引用的结构化文本。鉴于大型语言模型(LLMs)存在生成虚假信息的倾向[10],引用机制尤为重要。具体而言,假设一个响应 rr 由句子集合 {l1,l2,…lo}{l1,l2,…lo} 构成,每个句子可能由一组引用支持,这些引用属于检索到的文档集合 Ci⊂SCi⊂S 的一部分。理想的生成式引擎应满足以下要求:

  1. 高引用召回率:响应中所有声明均需有相关引用支持;
  2. 高引用精准率:所有引用需准确支持与其关联的声明[14]。我们建议读者参考图3以查看生成式引擎的典型响应示例。

2.2 生成式引擎优化(GEO)

搜索引擎的兴起催生了搜索引擎优化(SEO),这一过程帮助网站创作者优化内容以提升搜索引擎排名。更高的排名通常意味着更高的可见性和网站流量。然而,传统SEO方法并不直接适用于生成式引擎。原因在于:

  • 生成式引擎的生成模型不仅依赖关键词匹配,还通过语言模型消化来源文档并生成响应,从而对文本内容和用户查询产生更细致入微的理解
  • 生成式引擎的响应为结构化文本,直接提供答案,而非传统搜索引擎的链接列表(见图3)。

随着生成式引擎迅速成为主要的信息传递范式,传统SEO已无法满足需求,亟需新的技术。为此,我们提出生成式引擎优化(Generative Engine Optimization, GEO),这一新范式旨在帮助内容创作者提升其在生成式引擎响应中的可见性(或印象)

定义与目标

  • 可见性定义:网站(或引用)ci在响应 r中的可见性由函数 Imp(ci,r)衡量,内容创作者需最大化该值。
  • 生成式引擎目标:最大化与用户查询最相关的引用的可见性,即:最大化∑if(Imp(ci,r), Rel(ci,q,r))其中:
    • Rel(ci,q,r)衡Ci对查询 q和响应 r 的相关性
    • f由生成式引擎的算法设计决定,对终端用户而言是黑盒函数

目前,函数 Imp和 Rel 的定义仍具主观性且未完全明确。下文将进一步阐述其具体形式。

2.3 生成式引擎优化

传统搜索引擎催生了搜索引擎优化(SEO),但该方法不适用于生成式引擎。原因在于:

  • 生成式引擎不仅依赖关键词匹配,还通过语言模型理解文档内容和用户查询;
  • 响应以结构化文本呈现,并嵌入来源引用(见图3)。

为此,我们提出生成式引擎优化(GEO),旨在帮助内容创作者提升其在生成式引擎响应中的可见性(即“印象”)。

  • 可见性定义:网站 cici 在响应 rr 中的可见性由函数 Imp(ci,r)Imp(ci,r) 衡量,需最大化该值。
  • 生成式引擎目标:最大化与查询最相关的引用的可见性,即:最大化∑if(Imp(ci,r),Rel(ci,q,r))最大化i∑f(Imp(ci,r),Rel(ci,q,r))其中,Rel(ci,q,r)Rel(ci,q,r) 衡量引用 cici 对查询 qq 和响应 rr 的相关性,ff 为生成式引擎的黑盒函数。

2.3.1 生成式引擎的可见性指标

传统SEO通过网站在查询结果中的平均排名衡量可见性,但生成式引擎需重新定义指标(见图3对比)。我们提出以下设计原则:

  1. 指标需对内容创作者有意义;
  2. 指标需易于解释;
  3. 指标需能被广泛的内容创作者理解。

首项指标:词数占比(Word Count)
该指标衡量响应中引用某来源的句子词数占比:

Impwc(ci,r)=∑s∈Sci∣s / ∑s∈Sr∣s∣(2)

  • Sci:引用 ci的句子集合;
  • Sr:响应中所有句子集合;
  • ∣s∣:句子 s 的词数。
    若某句子被多个来源引用,词数均分至各来源。词数占比越高,表明来源在响应中越重要。

补充说明

  • 响应结构:响应 r通常为结构化文本,嵌入引用以对抗LLM的幻觉倾向[10]。理想生成式引擎应确保所有声明均有相关引用支持(高引用召回率),且所有引用准确支持其关联的声明(高引用精准率)[14]。
  • 图表参考:典型生成式引擎响应示例见图3。

图3:传统搜索引擎中的排名和可见性指标较为直接明确,会按排名顺序列出网站来源及原文内容。然而,生成式引擎会生成丰富、结构化的回答,常常将引用内容嵌入到一个与其它内容交错排列的区块中,这使得排名和可见性变得复杂且多面。此外,与已有诸多研究致力于提升可见性的传统搜索引擎不同,如何优化生成式引擎回答中的可见性仍不明确。为应对这些挑战,我们的黑箱优化框架提出了一系列精心设计的印象指标,创作者可借此评估和优化其网站表现,并且还能自定义印象指标。

生成式引擎的可见性指标(续)

然而,由于“词数占比”指标未考虑引用在响应中的位置(例如是否出现在首位),我们提出一种位置调整词数(Position-adjusted Word Count)指标,通过指数衰减函数降低后续位置的权重:

直观上,出现在响应顶部的句子更可能被用户阅读,因此指数项赋予这些位置的引用更高权重。例如,某网站即使词数较少,若其引用位于响应顶部,其可见性仍可能高于词数更多但位置靠后的引用。此外,选择指数衰减函数的依据是多项研究表明,点击率随排名呈现幂律分布(见图3)[7, 8]。

尽管上述指标客观且合理,但其忽略了引用对用户注意力的主观影响。为此,我们提出主观印象(Subjective Impression)指标,综合以下因素:

  1. 引用内容与用户查询的相关性
  2. 引用的影响力
  3. 引用内容的独特性
  4. 主观位置权重(如用户注意力分布);
  5. 主观词数占比(基于用户阅读习惯调整);
  6. 用户点击引用的概率
  7. 引用内容的多样性

我们采用当前最先进的LLM评估框架 G-Eval[15] 来量化这些子指标。

2.2.2 面向网站的生成式引擎优化方法(GEO)

为提升可见性指标,内容创作者需对其网站内容进行调整。我们提出一系列与生成式引擎无关的策略,统称为生成式引擎优化方法(Generative Engine Optimization, GEO)。数学上,每个GEO方法可表示为函数 f:W→Wi′f:W→Wi′,其中:

  • W表示原始网页内容;
  • W′表示应用GEO方法后的修改内容。

优化范围

  • 从简单的文本风格调整(如措辞优化、排版改进);
  • 到结构化格式的新内容嵌入(如添加数据图表、权威引述或案例研究)。

核心特性

  • GEO本质上是一种黑盒优化方法,无需知晓生成式引擎的具体算法设计,即可通过文本修改提升网站可见性;
  • 优化策略独立于具体查询,具有广泛适用性。

实验设计

       在实验中,我们利用大型语言模型对网站内容应用GEO方法,通过提示(prompting)执行特定的风格和内容修改。具体而言,基于GEO方法定义的目标特性集(如提高引用相关性、增强内容独特性),原始内容将被相应调整。我们提出并验证了以下优化方法:


生成式引擎优化(GEO)方法列表

  1. 权威性优化:调整文本风格,使其更具说服力与权威性;
  2. 数据嵌入:尽可能将定性讨论替换为定量统计数据;
  3. 关键词堆砌:按传统SEO优化策略,在内容中添加更多查询相关的关键词;
  4. 引用来源 & 5. 引述添加:分别添加来自可信来源的引用与直接引述;
  5. 通俗易懂:简化网站语言;
  6. 流畅性优化:提升文本流畅性;
  7. 独特词汇 & 9. 技术术语:在适用场景中添加独特词汇或技术术语。

方法特性与实施

  • 通用性:上述方法涵盖多样化通用策略,网站所有者可快速实施,且不受网站内容类型限制;
  • 内容需求
    • 除方法3、4、5外,其余方法通过优化现有内容呈现方式(如增强说服力或吸引力)提升可见性,无需额外内容;
    • 方法3、4、5可能需要添加额外内容(如关键词、引用或引述)。
  • 性能评估
    针对每个用户查询,随机选择一个待优化的来源网站,并单独应用每种GEO方法以分析其性能提升效果。更多方法细节详见附录B.4。

3.1 生成式引擎的评估配置

根据先前研究[14],我们采用两步式生成式引擎设计

  1. 检索相关来源:根据输入查询从搜索引擎获取相关来源;
  2. 生成响应:利用大型语言模型(LLM)基于检索到的来源生成响应。

实现细节

  • 为避免上下文长度限制及Transformer模型因上下文长度导致的二次计算成本,每个查询仅从Google搜索引擎检索前5个来源
  • 响应生成采用 gpt3.5-turbo 模型[20],使用与先前研究相同的提示模板[14];
  • 为减少统计偏差,每次生成采样5次不同响应(温度参数设为0.7)。

商业生成式引擎验证
在附录C.1中,我们进一步在商业部署的生成式引擎 Perplexity.ai 上验证所提出的GEO方法,以证明其泛化能力。

3.2 基准测试集:GEO-bench

由于目前缺乏公开的生成式引擎相关查询数据集,我们构建了 GEO-bench,一个包含 10,000条查询 的基准测试集,涵盖多源数据及合成生成的查询。其特点如下:

数据集构成

  1. MS Macro
  2. ORCAS-1
  3. Natural Questions[1, 6, 13]:
    • 包含来自Bing和Google搜索引擎的真实匿名用户查询;
    • 代表传统搜索引擎研究的常用数据集;
    • 生成式引擎需处理更复杂、需综合多源信息的查询。
  4. AllSouls
    • 源自牛津大学“万灵学院”的论文题目;
    • 要求生成式引擎通过多源信息推理生成答案。
  5. LIMA[25]:包含需推理能力的挑战性问题(如生成短诗、Python代码)。
  6. Davinci-Debate[14]:专为测试生成式引擎设计的辩论类问题。
  7. Perplexity.ai Discover:来自Perplexity.ai“探索”板块的真实用户查询。分类维度:所有查询按目标领域、难度、查询意图等多维度分类,确保测试集的多样性与挑战性
  8. ELI-533
    • 包含来自Reddit子论坛ELI5(“Explain Like I’m 5”)的复杂问题,用户期望以通俗易懂的语言获得答案。
  9. GPT-4 生成查询
    • 通过提示 GPT-4[21] 生成多样化查询,涵盖多领域(如科学、历史)、多查询意图(如导航类、事务类),以及不同难度和响应范围(如开放性问题、基于事实的问题),以补充查询分布的多样性。

数据集划分

  • 总量:10,000条查询;
  • 划分比例:8,000条训练集、1,000条验证集、1,000条测试集;
  • 查询类型分布
    • 80% 信息类查询(Informational);
    • 10% 事务类查询(Transactional);
    • 10% 导航类查询(Navigational)。

数据增强

标签系统

网站内容优化通常需针对特定任务领域进行调整。此外,生成式引擎优化(GEO)用户可能需要根据领域、用户意图及查询性质等多因素,为部分查询选择合适方法。为此,我们为每个查询标注以下七种类别之一:

  • 标注方法
    1. 使用 GPT-4 模型 自动分类;
    2. 人工验证测试集的标注召回率与精准率。

分类维度

  • 领域:覆盖25个领域(如艺术、健康、游戏等);
  • 难度:从简单到多层面复杂问题;
  • 查询类型:包含9种类型(如信息类、事务类);
  • 类别标签:7种标注分类。

基准特性与价值

GEO-bench 凭借其高多样性设计大规模真实数据多维度分类体系,成为评估生成式引擎的综合性基准测试集,并为当前及未来研究提供标准化测试平台。更多细节详见附录B.2。

3.3 GEO方法

我们评估了第2.2.2节中提出的9种GEO方法,并与未优化网站内容的基线进行对比。实验在 GEO-bench测试集 上执行,具体细节如下:

  • 实验配置
    • 为减少结果方差,使用5个不同随机种子运行实验,取平均值作为最终结果;
    • 基线指标为未修改网站来源的可见性指标。

3.4 评估指标

我们采用第2.2.1节定义的可见性指标,具体包括:

  1. 位置调整词数(Position-Adjusted Word Count)
    • 结合词数占比与引用位置的指数衰减权重;
    • 为分析各分项影响,同时单独报告词数占比(Word Count)和位置权重(Position Weight)的评分。
  2. 主观印象(Subjective Impression)
    • 包含以下七个子指标:
    1. 引用相关性:引用内容与用户查询的匹配程度;
    2. 引用影响力:生成响应对引用的依赖程度;
    3. 引用内容独特性:引用材料的不可替代性;
    4. 主观位置权重:用户视角下引用位置的显著程度;
    5. 主观词数占比:用户感知的引用内容量;
    6. 用户点击概率:用户点击引用的可能性;
    7. 内容多样性:引用材料的多样性。

评估方法

  • 使用 GPT-3.5 模型,遵循 G-Eval[15] 的评估框架:
    • 向模型提供结构化评估模板及带引用的生成响应;
    • 模型为每个引用输出评分(通过多次采样计算)。
  • 分数校准
    • 由于G-Eval分数未校准,我们将其归一化,使其与位置调整词数指标具有相同的均值和方差,以确保公平比较。

补充说明

  • 评估模板与具体实现细节详见附录B.3。

标准化与相对改进计算

所有可见性指标均通过乘以常数因子进行标准化,使得响应中所有引用的可见性总和为1。在分析中,我们通过计算可见性相对改进率来对比不同方法的优化效果。具体而言:

  • 初始响应 rr 的可见性基于来源集合 Si∈{s1,…,sm};
  • 修改后响应 r′r′ 的可见性通过应用GEO方法优化某一来源 sisi 生成。

每个来源 si的可见性相对改进率计算如下:

实验设计

  • 被优化的来源 si 随机选择,但针对同一查询的所有GEO方法保持恒定;
  • 确保结果对比的公平性与一致性。

我们评估了多种生成式引擎优化(GEO)方法,旨在优化网站内容以提升其在生成式引擎响应中的可见性,并与未优化的基线方法进行对比。实验基于GEO-bench基准测试集完成,该测试集涵盖多领域、多场景的用户查询。性能评估采用以下两个指标:

  • 位置调整词数(Position-Adjusted Word Count):综合考虑词数占比与引用位置的权重;
  • 主观印象(Subjective Impression):综合多项主观因素的总体评分。

关键发现

  1. GEO方法全面优于基线(表1):
    • 在位置调整词数指标上实现30%–40%的相对提升;
    • 在主观印象指标上实现15%–30%的相对提升。
    • 所有GEO方法在GEO-bench测试集上的各项指标均显著超越基线,表明这些方法对多样化查询具有强鲁棒性
    • 性能最优的方法为引用来源(Cite Sources)引述添加(Quotation Addition)数据添加(Statistics Addition)
  2. 内容优化策略的效益
    • 添加统计数据(Statistics Addition)、嵌入权威引述(Quotation Addition)或引用可靠来源(Cite Sources)等方法,仅需少量修改即可显著提升可见性,同时增强内容的可信度丰富性
    • 文本风格优化(如流畅性优化、语言简化)同样带来15%–30%的可见性提升,表明生成式引擎不仅关注内容本身,还重视信息呈现方式

表1:各方法绝对可见性指标对比

表1:GEO方法在GEO-BENCH上的绝对印象指标

       性能在两个指标及其子指标上进行测量。与基线相比,像关键词填充这样传统上在SEO中常用的方法表现不佳。然而,我们提出的方法(如统计添加和引用添加)在所有指标上都显示出显著的性能提升。最佳方法在位置调整的词数统计和主观印象上分别比基线提高了41%和28%。为了便于阅读,主观印象分数相对于位置调整的词数统计进行了归一化处理,从而得到了类似的基线分数。

结论
生成式引擎优化(GEO)方法通过内容增强风格优化,可有效提升网站在生成式引擎响应中的可见性,且策略适应多样化查询场景。

表2:各方法可见性相对改进率(%)对比

表2:不同排名的搜索引擎来源通过GEO方法后的可见性变化。对于排名较低的网站,GEO尤其有帮助。

此外,由于生成式模型通常被设计为遵循指令,人们可能会期望网站内容采用更具说服力和权威性的语气以提高可见性。然而,我们发现并无显著改善,这表明生成式引擎对这类变化已具有一定的鲁棒性。这凸显了网站所有者需要专注于提升内容呈现和可信度的重要性。

最后,我们评估了关键词填充,即向网站内容添加更多相关关键词的做法。尽管这种方法在搜索引擎优化中被广泛使用,但我们发现其对生成式引擎的响应几乎没有改善。这强调了网站所有者需要重新思考适用于生成式引擎的优化策略,因为在搜索引擎中有效的技术在这一新范式中可能不再成功。


5.1 特定领域的生成引擎优化

在第4节中,我们展示了GEO在整个GEO-BENCH基准测试中取得的改进。然而,在现实世界的SEO场景中,通常会应用特定领域的优化。考虑到这一点,并且考虑到我们在GEO-BENCH中为每个查询提供了类别,我们深入研究了各种GEO方法在这些类别中的性能。

表3提供了一个详细分类,其中我们的GEO方法被证明

是最有效的。仔细分析这些结果揭示了几个有趣的观察结果。例如,权威性在辩论风格的问题和与“历史”领域相关的问题中显著提高了性能。这与我们的直觉一致,因为更具说服力的写作形式在辩论中可能更有价值。

同样,通过引用来源添加引用对于事实性问题特别有益,可能是因为引用为所呈现的事实提供了验证来源,从而增强了回答的可信度。不同GEO方法的有效性因领域而异。例如,如表3的第5行所示,“法律与政府”等领域和“意见”类型的问题从网站内容中添加相关统计数据中显著受益,这是通过统计添加实现的。这表明数据驱动的证据可以在特定背景下增强网站的可见性。引用添加方法在“人物与社会”、“解释”和“历史”领域中最为有效。这可能是因为这些领域通常涉及个人叙述或历史事件,其中直接引用可以为内容增添真实性和深度。总体而言,我们的分析表明,网站所有者应努力进行特定领域的针对性调整,以提高其网站的可见性。

表3:每种GEO方法表现最佳的类别。网站所有者可以根据他们的目标领域选择相关的GEO策略。

图 4:使用 GEO 策略组合的相对改进情况。同时使用流畅性优化和添加统计数据可带来最佳性能。最右侧一列表明,将流畅性优化与其他策略结合使用最为有益。

5.2 多个网站的优化

        在生成引擎不断发展的背景下,GEO方法预计将被广泛采用,导致所有来源内容都使用GEO进行优化的场景。为了理解其影响,我们通过同时优化所有来源内容对GEO方法进行了评估,结果如表2所示。一个关键的观察结果是GEO对基于其搜索引擎结果页面(SERP)排名的网站的不同影响。值得注意的是,排名较低的网站通常在可见性方面挣扎,它们从GEO中获益更多。这是因为传统搜索引擎依赖于多个因素,如反向链接的数量和域名存在,这些因素对于小创作者来说很难实现。然而,由于生成引擎利用基于网站内容的条件生成模型,反向链接建设等因素不应使小创作者处于不利地位。这从表2中显示的可见性相对改进中可以看出。例如,引用来源方法使在SERP中排名第五的网站的可见性显著增加了115.1%,而排名靠前的网站的可见性平均下降了30.3%。

这一发现突显了GEO作为民主化数字空间的工具的潜力。许多排名较低的网站是由小内容创作者或独立企业创建的,他们传统上很难与大型企业在顶级搜索引擎结果中竞争。生成引擎的出现可能最初对这些较小实体不利。然而,应用GEO方法为这些内容创作者提供了显著提高其在生成引擎响应中的可见性的机会。通过使用GEO增强他们的内容,他们可以接触到更广泛的受众,使竞争环境更加公平,并使他们能够更有效地与大公司竞争。

5.3 GEO策略的组合

虽然单个GEO策略在各个领域都显示出显著的改进,但实际上,网站所有者预计将同时使用多种策略。为了研究通过组合GEO策略实现的性能改进,我们考虑了表现最佳的四种GEO方法(引用来源、流畅性优化、统计添加和引用添加)的所有组合。图4显示了通过组合不同GEO策略实现的位置调整词频可见性指标的相对改进热图。分析表明,生成引擎优化方法的组合可以提高性能,最佳组合(流畅性优化和统计添加)的性能比任何单一GEO策略高出5.5%以上。此外,引用来源在与其他方法结合使用时显著提高了性能(平均:31.4%),尽管单独使用时效果相对较差(比引用添加低8%)。这些发现强调了研究组合GEO方法的重要性,因为它们很可能被现实世界中的内容创作者使用。

5.4 定性分析

我们在表4中对GEO方法进行了定性分析,包含了GEO方法通过最小化更改提高来源可见性的代表性示例。每种方法通过适当的文本添加和删除来优化来源。在第一个示例中,我们看到简单地添加陈述的来源可以在最终答案中显著提高可见性,要求内容创作者付出最小的努力。第二个示例表明,尽可能添加相关统计数据可以确保在最终生成引擎响应中提高来源可见性。最后,第三行表明,仅仅强调文本的某些部分并使用有说服力的文本风格也可以提高可见性。

方法查询GEO 优化相对提升
引用来源瑞士巧克力的秘诀是什么人均年消费量平均在11至12公斤之间,根据国际巧克力消费研究小组[1]进行的一项调查,瑞士人位列世界顶级巧克力爱好者。132.4%
统计添加机器人应该取代劳动力中的人类吗?目前不是,也不是近期——直到最近。最大的不同在于,机器人的出现并不是为了破坏我们的生活,而是为了扰乱我们的工作,在过去十年中,机器人参与度惊人地增长了70%。65.5%
权威性杰克逊维尔美洲虎队是否曾进入过超级碗?需要注意的是,美洲虎队从未在超级碗中亮相。然而,他们通过赢得4次分区冠军取得了令人印象深刻的成就,这是他们实力和决心的证明。89.1%

表 4:GEO 方法优化源网站的代表性示例。添加内容用绿色标记,删除内容用红色标记。在不增加任何实质性新信息的情况下,GEO 方法显著提高了源内容的可见性。

表 5:在GEO-BENCH上使用Perplexity.ai作为生成引擎(GE)的GEO方法的绝对印象指标。尽管像关键词填充这样的SEO方法表现不佳,但我们提出的GEO方法在多个生成引擎上都能很好地通用,并显著提高内容可见性。

为了加强我们提出的生成引擎优化方法的有效性,我们在Perplexity.ai上进行了评估,这是一个拥有大量用户基础的真实部署的生成引擎。结果如下表所示。

方法位置调整后的词数主观印象
无优化24.124.7
关键词填充21.928.1
引用添加29.132.1
统计添加26.233.9

表 5:在GEO-BENCH上使用Perplexity.ai作为生成引擎(GE)的GEO方法的绝对印象指标。尽管SEO方法如关键词填充表现不佳,但我们提出的GEO方法在多个生成引擎上都能很好地通用,并显著提高内容可见性。

在表 5 中,类似于我们的生成引擎,引用添加在位置调整后的词数上表现最佳,比基线提高了22%。在我们生成引擎中表现良好的方法,如引用来源和统计添加,在两个指标上分别显示出高达9%和37%的提升。我们的观察结果,例如传统SEO方法(如关键词填充)的无效性,进一步强调了这一点,因为它的表现比基线低10%。这些结果对三个原因具有重要意义:1)它们强调了为内容创作者开发不同的生成引擎优化方法的重要性,2)它们突出了我们提出的GEO方法在不同生成引擎上的通用性,3)它们证明了内容创作者可以直接使用我们易于实施的GEO方法,从而产生高现实世界影响。我们建议读者参阅附录C.1以获取更多详细信息。

基于证据的答案生成:以前的研究使用多种技术来生成基于来源的答案。Nakano等人[19]训练了GPT-3来导航网络环境,以生成基于来源的答案。同样,其他方法[17, 23, 24]通过搜索引擎获取来源以生成答案。我们的工作统一了这些方法,并为未来改进这些系统提供了一个共同的基准。在最近的一篇工作草稿中,Kumar和Lakkaraju[11]表明,策略性文本序列可以操纵大型语言模型(LLM)的推荐,以增强生成引擎中产品的可见性。虽然他们的方法侧重于通过对抗性文本提高产品可见性,但我们的方法引入了非对抗性策略来优化任何网站内容,以提高生成引擎搜索结果中的可见性。

检索增强语言模型:最近的几项研究通过从知识库中获取相关来源来解决语言模型内存有限的问题,以完成任务[3, 9, 18]。然而,生成引擎需要生成答案并在整个答案中提供归属。此外,生成引擎不仅限于单一文本模态,无论是输入还是输出。此外,生成引擎的框架不仅限于获取相关来源,而是包括多项任务,如查询重构、来源选择以及决定如何和何时执行这些任务。

搜索引擎优化:在过去25年中,广泛的研究已经优化了搜索引擎的网页内容[2, 12, 22]。这些方法包括页面内SEO,通过改善内容和用户体验,以及页面外SEO,通过链接建设来提升网站权威。相比之下,GEO处理的是一个更复杂的环境,涉及多模态、对话设置。由于GEO是针对生成模型进行优化的,而不仅仅是简单的关键词匹配,传统的SEO策略不会适用于生成引擎设置,这突显了GEO的必要性。


在这项工作中,我们提出了增强了生成模型的搜索引擎,我们称之为生成引擎。我们提出了生成引擎优化(GEO)来赋能内容创作者,以优化他们在生成引擎下的内容。我们定义了生成引擎的印象度量,并提出并发布了GEO-BENCH:一个包含来自多个领域和设置的多样化用户查询的基准,以及回答这些查询所需的相关来源。我们提出了几种优化生成引擎内容的方法,并证明这些方法可以将生成引擎响应中的来源可见性提高多达40%。在其他发现中,我们表明包含引用、相关来源的引用和统计数据可以显著提高来源可见性。此外,我们发现GEO方法的有效性取决于查询领域,并且结合多种GEO策略的潜力。我们在一个拥有数百万活跃用户的商业部署的生成引擎上展示了有希望的结果,展示了我们工作的实际影响。总之,我们的工作是首次正式提出重要且及时的GEO范式,发布算法和基础设施(基准、数据集和度量),以促进社区在生成引擎方面的快速进展。这作为理解生成引擎对数字空间影响以及GEO在搜索引擎新范式中作用的第一步。


虽然我们在两个生成引擎上严格测试了我们提出的方法,包括一个公开可用的引擎,但随着生成引擎的演变,这些方法可能需要随着时间的推移进行调整,以反映SEO的演变。此外,尽管我们努力确保GEO-BENCH中的查询与现实世界的查询密切相关,但查询的性质可能会随着时间的推移而改变,需要持续更新。此外,由于搜索引擎算法的黑箱性质,我们没有评估GEO方法如何影响搜索排名。然而,我们注意到GEO方法所做的更改是针对文本内容的特定更改,与SEO方法有些相似,同时不影响其他元数据,如域名、反向链接等,因此不太可能影响搜索引擎排名。此外,随着语言模型中更大的上下文长度变得普遍,预计未来的生成模型将能够摄取更多来源,从而减少搜索排名的影响。最后,虽然我们提出的GEO-BENCH中的每个查询都经过标记和手动检查,但由于主观解释或标记错误,可能存在差异。


本材料基于国家科学基金会资助的工作,资助编号为2107048。本材料中表达的任何意见、发现和结论或建议仅代表作者的观点,不一定反映国家科学基金会的观点。

文献列表

(2023). 0

A 会话生成引擎

在第2.1节中,我们讨论了一个单轮生成引擎,它根据用户查询输出单个响应。然而,即将到来的生成引擎的优势之一将是它们能够进行积极的来回对话。对话允许用户对他们的查询或生成引擎响应进行澄清并提出后续问题。具体来说,在公式1中,输入不是单个查询 qu,而是建模为对话历史 H=(qut,rt) 对。然后定义响应 rt+1 为:

GE:=fLE(H,PU)→rt+1

其中 t 是轮次编号。

此外,为了在对话中吸引用户,一个单独的大型语言模型(LLM),Lfollow 或 Lresp,可能会基于 H、PU 和 rt+1 生成建议的后续查询。建议的后续查询通常旨在最大化用户参与的可能性。这不仅通过增加用户互动来使生成引擎提供者受益,而且还通过提高他们的可见性来使网站所有者受益。此外,这些后续查询可以通过获取更详细的信息来帮助用户。

B 实验设置

B.1 评估生成引擎

所使用的确切提示如列表1所示。

B.2 基准测试

GEO-BENCH包含来自九个数据集的查询。每个数据集的代表性查询如图2所示。此外,我们根据7个不同类别的池为每个查询打标签。对于标签,我们使用GPT-4模型,并手动确认高召回率和精确度。然而,由于这样一个自动化系统,标签可能会有噪音,不应被仔细考虑。有关这些查询的详细信息如下:

  • 难度等级:查询的复杂性,从简单到复杂。
  • 查询性质:查询所寻求的信息类型,如事实、意见或比较。
  • 类型:查询的类别或领域,如艺术和娱乐、金融或科学。
  • 具体主题:查询的具体主题,如物理、经济学或计算机科学。
  • 敏感性:查询是否涉及敏感话题。
  • 用户意图:用户查询背后的目的,如研究、购买或娱乐。
  • 答案类型:查询所寻求的答案格式,如事实、意见或列表。

B.3 评估指标

我们使用了7种不同的主观印象度量,其提示在我们的公共存储库中展示:https://github.com/GEO-optim/GEO。

B.4 GEO方法

我们提出了9种不同的生成引擎优化方法来优化生成引擎的网站内容。我们在完整的GEO-BENCH测试集上评估这些方法。此外,为了减少结果中的方差,我们在五个不同的随机种子上运行我们的实验,并报告平均值。

B.5 GEO方法的提示

我们在公共存储库中展示了所有提示:https://github.com/GEO-optim/GEO。所有实验均使用GPT-3.5 turbo。

C 结果

我们在五个随机种子上进行实验,并在表6中展示结果,带有统计偏差。

C.1 真实环境下的GEO:使用已部署的生成引擎进行实验

我们还在真实环境中部署的生成引擎Perplexity.ai上评估了我们提出的生成引擎优化(GEO)方法。由于Perplexity.ai不允许用户指定来源URL,我们改为将来源文本作为文件上传到Perplexity.ai,确保所有答案仅使用提供的文件来源生成。我们在测试集的一个子集上评估了我们所有的方法,即200个样本。使用Perplexity.ai的结果如表7所示。

表 6:GEO-BENCH上GEO方法的绝对印象指标。与传统SEO中表现不佳的简单方法(如关键词填充)相比,我们提出的方法(如统计添加和引用添加)在所有指标上都显示出显著的改进。最佳方法在位置调整后的词数和主观印象上分别比基线提高了41%和28%。

表 7:在GEO-BENCH上使用Perplexity.ai作为生成引擎的GEO方法的性能提升。与传统SEO中常用的简单方法(如关键词填充)相比,我们提出的方法(如统计添加和引用添加)在所有指标上都显示出显著的性能提升。最佳方法在位置调整后的词数和主观印象上分别比基线提高了22%和37%。


感谢大家阅读这篇文章!如果您对内容感兴趣,或者希望进一步合作或咨询,欢迎通过微信与我联系。为了更好地了解您的需求,请在添加我微信时,务必告知您的公司名称以及个人信息。这样我可以为您提供更有针对性的帮助。期待与您的交流与合作


合作请咨询