最近一年,從 LinkedIn 動態到 Facebook 投放廣告,「GEO(生成式引擎優化)」幾乎變成行銷圈最熱門的賣點。各種代理商搶著推套裝服務、講座一場接一場、Blog 上天天都有「+317% AI 引用率」這種讓人心癢的數字。但你有沒有停下來想過一件事——這些工程方法,到底是真的有效,還是只是包裝得很漂亮的廣告?
為了搞清楚這件事,我花了不少時間翻學術論文、讀 Google 官方文件、對照多家獨立第三方的實驗報告,把 GEO 行業中常見的主張一條一條拿出來檢驗。結果蠻意外的:絕大多數標榜「為 Google AI Overviews 量身打造」的特殊技術,要嘛被 Google 官方明確否認,要嘛根本拿不出可重現的對照實驗背書。
這篇文章會把廣告話術跟真正有實證支持的方法分開來,讓你不用再被那些代理商唬得團團轉。
一、GEO 到底是什麼?這個詞是怎麼冒出來的
GEO 全名是 Generative Engine Optimization,中文翻成「生成式引擎優化」。這個詞並不是行銷圈憑空捏造出來的,它出自 2023 年底一篇正式的學術論文,作者是 Aggarwal、Murahari 等人,後來被收錄進資料探勘領域的頂級會議 KDD 2024。問題就出在這裡——論文一發表,整個 SEO 行業立刻把它拿來當賣點,而且把論文裡的具體結論,泛化到完全不適用的範圍。
最常見的誤導是這句話:「GEO 可以讓你的內容在 AI 搜尋上提升 40% 引用率!」聽起來很厲害對吧?但你仔細追那個「40%」,會發現它是論文作者在自己搭的測試環境(用 GPT-4 加檢索組出來的生成引擎)以及 Perplexity.ai 上跑出來的數字。Google AI Overviews 在當時根本沒進論文的測試集——所以這個 40% 從來沒有在 Google 上被驗證過。把它套在 Google AI Overviews 身上,就跟拿香蕉的甜度去推論蘋果一樣,是嚴重的偷換概念。
二、學術論文的真相:Aggarwal 那篇 GEO 論文到底證明了什麼
論文的測試方法值得仔細拆解。研究團隊建了一個叫 GEO-Bench 的測試集,跨九個資料集、七個領域,總共 10,000 條查詢,然後測了九種「優化策略」。結果其實有點出乎意料——最有效的根本不是技術工程,而是「內容寫作層面」的調整。
具體來看:
- 加入具體統計數字:主觀印象提升約 37%、被引用文字比例提升約 41%
- 引用權威來源:在排名靠後(例如第 5 名)的頁面上,可見度提升高達 115.1%
- 加入專家引述:在「人物與社會」、「解釋類」、「歷史類」內容上效果顯著
- 流暢度優化加上統計數字:是論文中的最佳組合
- 傳統的關鍵字堆砌:在 Perplexity 上居然比沒優化還差約 10%
換句話說,這篇論文真正驗證的,是「會把文章寫好」這件事——把答案講清楚、用數字佐證、引用可靠來源。它從來沒驗證過 schema、llms.txt、特殊爬蟲設定這類「技術工程」對 Google AI Overviews 的效果。把論文當成 GEO 服務賣點的代理商,多半不會告訴你這個細節。

另外要注意的是,獨立評論者(例如 Sandbox SEO 在 2024 年的批判性檢視)指出這篇論文的「主觀印象」是讓 GPT-4 自己當評分員,存在 LLM-as-a-judge 的偏誤;而黑箱最佳化用到的提示工程,部分接近對抗性內容塞入,無法保證在實際生產環境裡可以泛化。論文自己也提醒「the efficacy of these strategies varies across domains」——效果隨領域而定,不是放諸四海皆準。
三、Google 官方對 AI Overviews 的明確立場
這部分最關鍵,因為 Google 自己講得超級直白,但 GEO 行業選擇性忽略。Google Search Central 的官方文件「AI Features and Your Website」白紙黑字寫著兩段話:
「There are no additional requirements to appear in AI Overviews or AI Mode, nor other special optimizations necessary.」
「You don't need to create new machine readable files, AI text files, or markup to appear in these features. There's also no special schema.org structured data that you need to add.」
翻成中文:你不需要為 AI Overviews 做任何特殊優化、不需要 llms.txt、不需要 AI 文字檔、不需要特殊 schema。Google 員工 Gary Illyes 在 2025 年的 Search Central Live 上講得更不留情面——他直接說「AI SEO is not necessary」。為什麼?因為 AI Overviews、AI Mode、傳統 Search 用的是同一支 Googlebot、同一個索引、同一套核心排名系統。標準 SEO 已經涵蓋了。
這意味著:所有把「為 Google AI Overviews 量身打造的優化」當成核心賣點的服務,多半是在賣空氣。
四、各項 GEO 工程主張的實證對照表
下面這張表是把行業常見的工程主張,逐條對照 Google 官方立場、學術論文、以及獨立第三方實驗結果之後的判定。看完這張表,你大概就能分辨哪些代理商是真的懂、哪些只是在唸行銷台詞。
| 工程方法 | 常見行銷話術 | Google 官方立場 | 獨立實證 | 判定 |
|---|---|---|---|---|
| 標準 SEO(內容、索引、可達性) | 不夠性感所以很少被當賣點 | 唯一推薦的方向 | 多項研究支持 | 有實證、必須做 |
| 結構化清楚段落、自包含答案 | 「passage-level optimization」 | 含蓄支持 | Aggarwal、Ahrefs 部分支持 | 有實證、應該做 |
| 加統計數字、引用權威來源 | 「+41%、+40% 引用率」 | 模糊支持 | Aggarwal 在 Perplexity 證實,AI Overviews 未證實 | 廣義有效、應該做 |
| 長尾與問題式查詢覆蓋 | 「為 query fan-out 撰寫子問題」 | 確認採用 fan-out | Ahrefs 證實 question 觸發率 57.9% | 有實證、應該做 |
| 實體一致性與 Knowledge Graph | 「每千字塞 15 個實體」 | Knowledge Graph 屬實 | 概念支持但具體數字無源 | 概念對、數字假 |
| YouTube、Wikipedia、Reddit 品牌存在 | 「PR 是新 SEO」 | 沒明說 | Ahrefs 75K 品牌研究:強相關 | 有實證、屬 PR 不是工程 |
| Article / Organization schema | 「+2.5x 引用率」 | 「不需要特殊 schema」 | 相關性研究、無因果 | 低成本可做、別期待神奇加分 |
| FAQPage / HowTo schema | 「+30%、+67% 引用」 | 不需要 | 數字無嚴謹方法 | 內容真為 FAQ 才用 |
| E-E-A-T 表面實作 | 「核心排名因子」 | 「不是 ranking signal」 | 反映於其他訊號 | Checklist 沒用、要真實權威 |
| Core Web Vitals 為 AI 加碼 | 「快站才能進 AI Overviews」 | 普通 page experience | 107K 頁分析:沒有正相關 | 維持基本即可 |
| 為 LLM 提供 Markdown 副本 | 「AI 友善版本」 | Mueller:「a stupid idea」、疑似 cloaking | — | 不要做 |
| llms.txt | 「AI 時代的 robots.txt」 | 「不背書、像 keywords meta tag」 | OtterlyAI:0.1% 命中率 | 不要做 |
| 封鎖 Google-Extended 影響 AIO 曝光 | — | 不影響 AI Overviews | BuzzStream:92.3% 仍被引用 | 此說法錯誤 |
| 「Cosine similarity 大於 0.88 引用 7.3 倍」 | 行銷話術 | 無公開支持 | 無方法揭露 | 純廣告 |
五、llms.txt:被吹爆但實際上幾乎沒人用
llms.txt 大概是 GEO 行業裡最被過度神化的東西。它的概念聽起來很合理——類似 robots.txt,但專門告訴 AI 應該抓取網站的哪些精華內容。問題是,它的實際表現慘到有點難堪。
第一,Google 的 John Mueller 在 Bluesky 跟 Reddit 上多次明白表示不採用、不背書,還把它比喻成早就被廢棄的 keywords meta tag——一個「站長自己宣稱什麼,搜尋引擎理應信任」的天真設計。Gary Illyes 在 2025 年 7 月的 Search Central Live 直接說:Google doesn't support LLMs.txt and isn't planning to。
第二,獨立實驗的數字看了會冒冷汗:
- OtterlyAI 的 90 天實驗:62,100 次 AI 機器人請求,只有 84 次命中 llms.txt,命中率 0.1%
- 一家管理 20,000 個網域的代管商報告:唯一抓取 llms.txt 的,只有 BuiltWith 這類技術盤點工具
- SE Ranking 對 39,000 個網域的分析結論:「llms.txt 似乎並未直接影響 AI 引用頻率」
翻譯一下就是:這個檔案目前對 SEO 跟 生成式引擎優化等於零效果。每花一個小時做 llms.txt,就是一個小時的機會成本被燒掉。如果你的代理商把這個當成 GEO 服務的賣點,是時候換一家了。
六、Schema markup 是不是 AI Overviews 的萬靈丹
Schema markup 是另一個常被嚴重誇大的項目。你應該看過這種廣告:「實作 FAQPage schema 讓 AI Overviews 引用率提升 67%」。這數字哪來的?多數情況是代理商自己的客戶資料,沒有對照組、沒有控制變數,純粹是相關性,根本不能宣稱因果。
Google 官方的立場很明確:沒有特殊 schema 是 AI Overviews 需要的。Schema 用於 rich results 的合格資格,不是直接的排名因子。但這也不是說 schema 沒用——正常的 Article、Organization、Person schema 仍然有助於機器消歧義(讓搜尋引擎知道頁面上的「Apple」是公司而不是水果)。實作起來成本不高,做就做,但別期待 30%、67% 那種神奇加分。
更要小心一些代理商會推銷「AI 專屬 schema」這種根本不存在於 schema.org 規範的東西,或者要你疊上一堆冗餘的標記讓頁面臃腫。這些都是過度工程,對 網頁設計本身的可維護性也是負擔——好的網頁設計強調語意清楚、結構合理,schema 應該是補充而不是用來灌水的。
七、E-E-A-T 究竟是不是排名訊號
這個觀念可能是被誤解最深的。Google SearchLiaison 也就是 Danny Sullivan 在 2024 年 2 月於 X 上講得清清楚楚:
「No, EEAT is not a ranking signal... It's not a ranking factor. It's not a thing that's going to factor into other factors」
E-E-A-T(Experience、Expertise、Authoritativeness、Trustworthiness)是 Google 給 Search Quality Rater 評估網頁時用的「框架」,不是直接的演算法訊號。所以那些賣「實作 EEAT」服務的——加作者照片、寫一段 bio、塞 Person schema、補 credentials——其實是把間接訊號當直接訊號做。
真正影響排名的,是長期累積出來的真實權威:外部連結、權威媒體提及、實際的專業度、品牌存在。Checklist 上的項目補滿了,但網站本身沒有真實權威,演算法看不出來,也不會給你加分。
所以下次如果有代理商開報價單,把「E-E-A-T 實作」列為 GEO 服務的核心項目,你可以直接問他:「請出示 Google 官方文件指出 E-E-A-T 是排名訊號的段落」。他多半找不出來,因為根本沒有。
八、真正值得投入資源的方向
把所有實證放在一起看,真正能影響 Google AI Overviews 表現的方法,幾乎全部等於做好「標準 SEO 加上把文章寫好」。具體列出來:
- 排上 top 10 到 20 名。雖然 Ahrefs 最新研究指出 AI Overviews 引用 top 10 的比例已從 2024 年的 76% 降到 2026 年的 38%,但這仍然是必要條件——不在候選池裡,後面什麼都別談。
- 寫可被獨立抽出來的段落。先給答案,再補上下文。AI Overviews 的 query fan-out 機制,會把一個查詢拆成多個子查詢去尋找答案——你的段落必須能脫離前後文,自己站得住腳。
- 加具體數字、引用權威來源。這是 Aggarwal 論文中最有實證的方向,雖然原始驗證不在 Google 上,但這個原則符合 Google 一貫的「helpful, people-first content」方向。
- 主題涵蓋多角度的子問題。比較、定義、案例、操作步驟——同一個主題的多個面向都要寫到。這對應 query fan-out 機制。
- 累積外部品牌存在。Ahrefs 對 75,000 個品牌的研究發現,YouTube 影片標題、字幕、描述中的品牌提及,是與 AI Overview 可見度相關性最強的單一因子。Wikipedia、Reddit、Quora 的真實討論也很重要。
- 確保技術基礎扎實。Googlebot 能爬、行動裝置可用、頁面能 render、HTML 語意化、合理的 網頁設計結構。這些都不是「AI 專屬優化」,而是傳統 SEO 該做的事——AI Overviews 不會給這些動作額外加分,但極端不友善的網頁會讓內容根本進不了候選池。
注意到了嗎?這份清單裡沒有 llms.txt、沒有特殊 AI schema、沒有 E-E-A-T 實作 checklist、沒有 Markdown 副本、也沒有為了 AI 而調整 Core Web Vitals。為什麼?因為這些都沒有可信實證能證明它們對 AI Overviews 有獨立效果。
九、給網站經營者的實務建議
寫到這裡,總結幾個可以直接帶走、用來判斷 GEO 服務真假的標準:
- 不要為 Google AI Overviews 建立 llms.txt 或 AI-only 副本檔案。Google、OpenAI、Anthropic 的主流 bots 都不採用,做了等於零,還可能被當成 cloaking。
- 不要相信「特定 schema 提升 X%」的具體數字。Google 公開講過不需要特殊 schema;正規的 Article、Organization、Person schema 為 rich results 仍可低成本實作,但別過度設計。
- 不要花預算做「實作 E-E-A-T」服務。它根本不是訊號。把錢拿去投入真實的作者專業度、外部權威背書、品牌長期累積。
- 不要為 AI Overviews 動 Core Web Vitals 預算。10.7 萬頁的分析顯示沒有正相關,維持基本水準就夠了。
- 應該投入:可獨立抽取的段落、具體統計、權威引用、子問題覆蓋、實體一致性、外部品牌存在於 YouTube 與 Wikipedia。這些既符合學術論文的實證方向,也跟 Google 官方建議一致。
- 應該知道:如果代理商把 llms.txt、特殊 AI schema、E-E-A-T checklist 當成 GEO 服務的核心賣點,那基本上就是行銷話術。實質上 80% 的內容是傳統 SEO 加上標準的內容寫作建議,再灌一些被 Google 否認或行業實證為無效的項目。
最後留一個冷靜的判斷標準給你:對任何聲稱「為 Google AI Overviews 加分」的特殊技術,預設保持懷疑。要求對方拿出可重現的對照實驗、引用 Google 官方文件、或是引用同行評議的論文。多數 GEO 行業的內容,會在這道門檻前露餡。
把預算花在做出真正對讀者有用的內容,會比花在那些聽起來很厲害的「AI 工程」上有用得多——這個結論很無聊,但這就是實證告訴我們的真相。