在前一篇文章"AI 能見度(AI Visibility,AI Search Visibility)?是一個能夠衡量的指標嗎?"中說過,AI 能見度目前還只是一個觀念,尚不是一個可以量化的標準指標。因此不要浪費錢去買工具測量網站的 AI 能見度,也不要聽信業者唬爛說「我幫你操作,AI 能見度已經提升了多少」。
但是在 AI 搜尋時代,如果不去瞭解自己網站的 AI 能見度,似乎也說不過去。所以本文就來探討:AI 能見度應該怎麼測量?以及應該有哪些事情需要特別注意。
先說結論,AI 能見度可以由「結果」跟「原因、條件」來測量。由「結果」測量並不準確,因為需要假設使用者用了哪些查詢詞彙,因此由能讓網站具有AI 能見度的「原因」或「條件」來測量,會是比較客觀的作法。
先搞清楚你的網站在 AI 搜尋中可能出現的情境
要測量 AI 能見度之前,我們先來模擬一下你的網站可能出現的一些情境。
情境一:使用者在 Google 或 Bing 的搜尋框輸入查詢字詞
使用者在 Google 或 Bing 搜尋引擎的搜尋框輸入查詢字詞,然後出現搜尋結果。這個搜尋結果,都會同時包含 AI 搜尋結果以及傳統的搜尋結果。
確定的是:傳統搜尋結果的曝光、點擊數據,都會進入 Google Search Console(GSC)、Bing Webmaster Tools,點擊數據也會進入你設定的 GA4(Google Analytics 4)記錄。
Bing 的情況:Bing 的 AI 搜尋結果中,如果你的網站有被引用(Citation),數據也會進入 Bing Webmaster Tools 的 AI Performance 中。但 Bing 的 AI Performance 只講「引用」,沒說是曝光還是點擊,這個分野目前仍不明確。
Google 的情況:在 Google 的 AI 搜尋結果中(AI 摘要或 AI 模式),點擊或曝光(引用)的數據,Google 目前仍然尚未提供。如果以 GA4 去追蹤點擊,可以在 GA4 中看到點擊數據由 Google 而來,但目前也無法得知是否由 AI 摘要或 AI 模式而來。Google 曾經公布說會在預設管道群組(Default Channel Group)中提供一個 AI Assistant 的媒介與頻道,但目前尚未看到這個功能正式上線。
情境二:使用者在 ChatGPT 或 Gemini 等生成式工具輸入查詢字詞或指令
使用者在 ChatGPT、Gemini、Perplexity、Claude 等生成式 AI(Generative AI)工具輸入查詢字詞或指令,然後出現結果。搜尋結果的點擊數據可以被 GA4 記錄,但是曝光(引用)的數據就完全無法得知,因此 AI 搜尋的曝光或引用數據還是一個謎。
在這個情況下,市面上的 AI 能見度量測工具,基本上就是瞎子摸象:先假設幾個 AI 查詢字詞或指令,然後看你的網站是否出現,如果全部出現,就稱 AI 能見度是 100%。問題是這些假設出來的查詢字詞或指令,誰知道跟實際使用者的真實查詢差多少?因此這些工具的結果,不準的機率相當高。
如果測量 AI 能見度是用「結果」來做,只能當成參考。因為查詢字詞或指令是想出來的,不是使用者的真實資料,而且還可能存在使用者背景資訊(User Context)的差異。
了解以上問題之後,你會認為 AI 能見度可以客觀測量嗎?答案很清楚:目前當然不能。
換個角度:從「能出現在 AI 搜尋結果的原因」來思考
既然不能從「AI 搜尋結果」來精準測量 AI 能見度,為何不從能夠出現在 AI 搜尋結果的「原因」來思考呢?
傳統 SEO(搜尋引擎優化)有一個概念叫做排名因素(Ranking Factors)。我們無法直接看到 Google 的演算法,但我們可以觀察哪些因素與排名結果高度相關,然後去優化這些因素。AI 能見度的測量邏輯應該也是如此:既然結果端的數據殘缺不全,就從原因端的訊號(Signal)去評估。
以下是目前可以觀察與追蹤的四個核心訊號維度。
訊號一
內容的可引用性(Citability)
什麼是可引用性?
AI 大型語言模型(LLM,Large Language Model)在生成回答時,並不是隨機抓取網路上的內容,而是傾向於引用具有特定結構與語意特徵的內容。這種「讓 AI 容易引用你的能力」,就是可引用性(Citability)。
AI 傾向引用的內容特徵
1. 明確的事實陳述
有具體數據、來源、作者署名的內容,比模糊的概括描述更容易被引用。例如「根據 2024 年 HubSpot 報告,61% 的行銷人員認為 AI 工具提升了內容產出效率」,比「AI 工具很有幫助」更具引用價值。
2. 結構化的語意標記
正確使用 Schema.org 的結構化資料(Structured Data),可以讓 AI 爬蟲更精準地理解你的內容是什麼類型、回答什麼問題。對 AI 能見度最有幫助的 Schema 類型包括:
- Article:標註文章作者、發布日期、主題。
- FAQPage:直接告訴 AI 這個頁面在回答哪些問題。
- HowTo:步驟型內容,AI 在回答「怎麼做」類型問題時特別容易引用。
- Organization / Person:建立品牌與作者的語意身份,強化 E-E-A-T 訊號。
3. 清晰的段落層級
H1 → H2 → H3 的語意層次分明,讓 AI 易於解析段落主題與內容範圍。每個段落只談一件事,段落開頭的第一句就說明這個段落的主題,這是 AI 解析文章結構的基本邏輯。
4. 直接回答問題的段落(Answer-Ready Content)
AI 生成回答時,最喜歡抓的是「段落開頭就直接給出答案」的內容結構。這種寫法在英文 SEO 圈被稱為「Answer-Ready Content」或「Direct Answer Format」。
- 錯誤示範:「關於這個問題,我們需要先理解背景脈絡,因為這個議題涉及多個面向……(三段後才給答案)」
- 正確示範:「AI 能見度目前無法精準量化,但可以透過四個訊號維度來追蹤趨勢:可引用性、權威訊號、AI 爬蟲可抓取性、語意存在感。」
5. 內容的時效性與更新頻率
AI 工具在引用來源時,會優先考慮內容的時效性。定期更新文章、在文章顯眼位置標示「最後更新日期」,可以提升 AI 引用的優先度。
可操作的測量方式
對照自己的文章,逐條檢查上述條件是否達標,給每個項目打分數,加總後即為「可引用性自評分(Citability Self-Assessment Score)」。這是一個主觀的自評量表,但只要每次使用相同標準,追蹤的相對變化就具有意義。建議評估維度如下,每項 0–5 分:
| 評估項目 | 說明 | 分數(0–5) |
|---|---|---|
| 事實密度 | 文章中具體數據、來源引用的豐富程度 | |
| 結構化資料 | Schema 標記是否正確且完整 | |
| 段落層級清晰度 | H1 / H2 / H3 層級是否語意分明 | |
| Answer-Ready 比例 | 段落開頭直接給答案的比例 | |
| 內容時效性 | 最後更新日期是否清楚標示且近期更新 | |
| 總分 | /25 |
滿分 25 分,建議每季針對核心頁面評估一次,追蹤分數變化趨勢。
訊號二
網站的權威性訊號(Authority Signals)
為什麼權威性對 AI 能見度重要?
AI 工具在訓練與生成過程中,並不是對所有網頁一視同仁。它們的訓練資料與引用偏好,都高度集中在網路上已被廣泛認可的來源。這個「被廣泛認可」的程度,就是權威性訊號。這個邏輯與 Google 的 E-E-A-T(Experience, Expertise, Authoritativeness, Trustworthiness)框架高度重疊,因為 AI 工具本質上也是在解決「哪個來源值得信賴」的問題。
主要的權威性訊號
1. 外部連結(Backlinks)的質與量
被高權威網站引用連結,代表你的內容已被同業、媒體或學術單位認可。這不只影響 Google 排名,也影響 AI 訓練資料的來源優先順序。重要的是「質」重於「量」:一個來自業界知名媒體的連結,勝過一百個來自低品質目錄網站的連結。
2. 品牌提及(Brand Mentions)
即使沒有超連結,純文字提及你的品牌名稱、網域或作者名稱,也是 AI 語料庫(Training Corpus)中的一種語意訊號。當 AI 在訓練資料中多次看到「某品牌」與某個主題同時出現,它就會建立兩者之間的語意關聯。這代表:在業界論壇、媒體報導、社群平台中讓你的品牌被提及,即使沒有連結,也有助於提升 AI 能見度。
3. 社群平台的討論存在感
Reddit、Quora、PTT、Dcard 等討論型平台,是 AI 訓練資料的重要來源之一(OpenAI 甚至與 Reddit 簽訂資料授權協議)。如果你的品牌或內容在這些平台上有真實的討論,被 AI 引用的機率會相對提高。
4. Wikipedia 或知識型網站的收錄
如果你的品牌、作者、或你所提出的概念出現在 Wikipedia 或類似的知識型網站,對 AI 能見度的幫助極大,因為 Wikipedia 幾乎是所有主流 AI 工具訓練資料的核心來源。
5. 作者的數位身份建立(Digital Author Identity)
Google 的 E-E-A-T 框架中,「作者的真實性」是重要的信任訊號。對 AI 能見度而言,作者在業界的可辨識度(透過 LinkedIn、個人網站、媒體採訪、演講記錄等)也會影響 AI 引用該作者內容的意願。建議為主要作者建立完整的 Person Schema,並在文章中標注作者頁面連結。
可操作的測量方式
| 追蹤項目 | 工具 | 更新頻率 |
|---|---|---|
| 外部連結數量與品質 | Ahrefs、Semrush、Google Search Console | 每月 |
| 品牌提及次數 | Google Alerts、Mention.com | 每週 |
| 討論平台提及 | 手動搜尋 PTT / Dcard / Reddit | 每月 |
| Wikipedia 收錄狀態 | 手動查詢 | 每季 |
| 作者 Schema 完整度 | Google Rich Results Test | 每季 |
訊號三
AI 爬蟲的可抓取性(AI Crawlability)
為什麼可抓取性是基礎中的基礎?
AI 工具要引用你的內容,前提是它們的爬蟲能夠抓取到你的內容。如果你的網站封鎖了 AI 爬蟲,或是因為技術問題導致 AI 爬蟲無法正確解析頁面,那麼前面所有的努力都是白費的。這是 AI 能見度的技術底層,沒有可抓取性,其他訊號都無從發揮。
目前已知的主要 AI 爬蟲
| AI 工具 | 爬蟲名稱(User-Agent) | 用途 |
|---|---|---|
| OpenAI / ChatGPT | GPTBot | 訓練資料抓取 |
| OpenAI / ChatGPT Search | OAI-SearchBot | 即時搜尋引用 |
| Google Gemini / AI Overview | Googlebot、Google-Extended | AI 功能資料抓取 |
| Anthropic Claude | ClaudeBot | 訓練資料抓取 |
| Perplexity AI | PerplexityBot | 即時搜尋引用 |
| Meta AI | Meta-ExternalAgent | 訓練資料抓取 |
| Apple | Applebot-Extended | Apple Intelligence 資料 |
值得注意的是,同一家公司可能有多個爬蟲,負責不同功能(訓練資料 vs. 即時搜尋引用)。封鎖訓練爬蟲不代表封鎖即時引用爬蟲,兩者要分開處理。
可操作的測量方式
1. 檢查 robots.txt
確認你的 robots.txt 沒有誤封鎖上述爬蟲。特別注意:有些 WordPress 外掛或主機設定,會在你不知情的情況下加入封鎖規則。
# 正確設定:允許 AI 爬蟲抓取
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
如果你希望允許即時引用但拒絕訓練資料抓取,可以分別設定不同的 User-Agent 規則。
2. 分析伺服器 Access Log
在伺服器的 Access Log 中,搜尋上述 User-Agent 的抓取記錄,可以確認:哪些 AI 爬蟲曾經來訪?它們抓取了哪些頁面?抓取頻率如何?哪些重要頁面從未被抓取?這是目前最直接、最可靠的 AI 爬蟲行為觀察方式。
3. 排除技術障礙
確認重要頁面沒有以下問題:
- noindex 標籤誤套用。
- JavaScript 渲染(Client-Side Rendering)導致 AI 爬蟲抓到空頁面。
- 需要登入才能存取的內容。
- 過慢的頁面載入速度(AI 爬蟲也有 Crawl Budget 限制)。
- Cloudflare 或其他 CDN 設定誤封鎖 AI 爬蟲 IP。
4. 使用 URL Inspection 工具驗證
Google Search Console 的 URL Inspection 工具可以讓你看到 Googlebot 看到的頁面樣貌。雖然這是 Google 的工具,但如果連 Googlebot 都無法正確解析你的頁面,其他 AI 爬蟲大概也好不到哪裡去。
訊號四
品牌的語意存在感(Semantic Presence)
什麼是語意存在感?
語意存在感指的是:當 AI 工具在回答與你的領域相關的問題時,你的品牌、網站或內容觀點,是否自然地出現在它的回答框架之中。這不只是「AI 有沒有引用我的網址」,而是更深層的問題:AI 是否已經將你的品牌與某個主題或概念建立了語意關聯?這個訊號無法自動化測量,但可以用人工抽樣測試(Manual Spot-Check)的方式定期追蹤。
如何設計人工抽樣測試
第一步:設計查詢指令集
針對你的網站核心主題,設計一組涵蓋不同查詢類型的問句:
| 查詢類型 | 範例 |
|---|---|
| 定義型 | 「什麼是 AI 能見度?」 |
| 比較型 | 「AI 搜尋引擎和傳統搜尋引擎有什麼差別?」 |
| 操作型 | 「如何提升網站在 AI 搜尋中的曝光?」 |
| 推薦型 | 「有哪些關於 AI SEO 的繁體中文資源?」 |
| 評估型 | 「AI 能見度測量工具值得購買嗎?」 |
建議每個核心主題設計 5–10 個查詢指令,總計約 20–30 個指令作為固定測試集。
第二步:跨平台測試
將同樣的指令,在以下平台分別測試:ChatGPT(GPT-4o)、Google Gemini、Perplexity AI、Claude(Anthropic)、Microsoft Copilot。觀察以下三個層次:
- 直接引用:你的網域或品牌名稱是否出現在回答中?
- 觀點採納:AI 的回答是否採用了你文章中的框架或觀點(即使沒有標注來源)?
- 延伸推薦:AI 是否將你的網站列為「延伸閱讀」或「參考來源」?
第三步:建立追蹤記錄
將每次測試結果記錄在追蹤表中:
| 查詢指令 | 平台 | 出現方式 | 測試日期 |
|---|---|---|---|
| 什麼是 AI 能見度? | ChatGPT | 直接引用 | 2026-06 |
| 什麼是 AI 能見度? | Perplexity | 延伸推薦 | 2026-06 |
| 如何提升 AI 搜尋曝光? | Gemini | 未出現 | 2026-06 |
重要注意事項:這個方法有幾個先天限制必須誠實面對。
- 查詢指令是假設出來的,不代表真實使用者的查詢行為。
- AI 回答具有隨機性,同樣的問句在不同時間可能得到不同結果。
- 使用者背景資訊(User Context)會影響 AI 回答,測試環境無法完全模擬真實情況。
- 不同地區、語言的 AI 回答可能不同,台灣繁體中文使用者的查詢環境與英文環境存在差異。
因此,這個測試追蹤的應該是每月的相對變化趨勢,而非絕對數字。如果你的品牌出現的次數從每月 3 次成長到 8 次,這個趨勢有意義;但「出現率 40%」這個數字本身意義不大,因為測試集是你自己設計的。
把四個訊號整合成「AI 能見度健康儀表板」
既然沒有單一的完美指標,那就用多個不完美的訊號組合出一個相對有意義的追蹤框架。以下是建議的追蹤架構,可以用 Google Sheets 或 Notion 資料庫建立,每月更新一次。
技術層:可抓取性(這是底線)
| 追蹤項目 | 工具 | 頻率 | 健康標準 |
|---|---|---|---|
| robots.txt AI 爬蟲設定 | 手動檢查 | 每季 | 主要 AI 爬蟲均未被封鎖 |
| AI Bot 抓取頁面數 | Server Access Log | 每月 | 核心頁面均有被抓取記錄 |
| JavaScript 渲染問題 | GSC URL Inspection | 每月 | 無內容缺失問題 |
| 頁面載入速度 | PageSpeed Insights | 每月 | Core Web Vitals 達標 |
內容層:可引用性
| 追蹤項目 | 工具 | 頻率 | 健康標準 |
|---|---|---|---|
| Citability 自評分 | 自評量表(25 分制) | 每季 | 核心頁面平均 ≥ 18 分 |
| 結構化資料正確性 | Google Rich Results Test | 每季 | 無錯誤警告 |
| Answer-Ready 段落比例 | 人工審查 | 每季 | 主要段落 ≥ 70% 採用直接回答結構 |
| 內容更新頻率 | 手動記錄 | 每月 | 核心頁面每季至少更新一次 |
權威層:Authority Signals
| 追蹤項目 | 工具 | 頻率 | 健康標準 |
|---|---|---|---|
| 外部連結總數 | Ahrefs / Semrush | 每月 | 月增長為正值 |
| 高品質連結域名數 | Ahrefs | 每月 | 持續成長 |
| 品牌提及次數 | Google Alerts | 每月 | 月增長為正值 |
| 討論平台存在感 | 手動搜尋 | 每月 | 至少有持續討論 |
結果層:可觀測的 AI 流量數據
| 追蹤項目 | 工具 | 頻率 | 說明 |
|---|---|---|---|
| Bing AI Performance 引用數 | Bing Webmaster Tools | 每月 | 目前最可靠的平台數據 |
| GA4 AI 工具 Referral 流量 | GA4 | 每月 | ChatGPT、Perplexity 等來源的點擊 |
| GA4 Google AI Assistant 頻道 | GA4 | 待上線 | Google 承諾但尚未提供 |
| 人工抽樣測試出現次數 | 手動記錄 | 每月 | 追蹤相對趨勢,非絕對數字 |
特別注意事項
1. 不要把「AI 能見度工具的分數」當成 KPI
市面上的 AI 能見度工具(例如 Semrush 的 AI Toolkit、各種 LLMO 工具)提供的分數,本質上是「用假設的查詢字詞去測試,然後給你一個看起來很精確的數字」。
這個數字的問題在於:查詢字詞是工具商設計的,不是真實使用者的資料。如果他們選的查詢字詞剛好都是你的強項,你的分數就會很高;反之亦然。這個分數無法告訴你真實的 AI 搜尋市占。把這些工具的分數當成大方向的參考可以,但絕對不要當成考核指標或向客戶報告的數據依據。
2. AI 能見度的區域差異
不同地區、不同語言的 AI 工具回答行為可能不同。台灣繁體中文的 AI 搜尋生態,與英文市場存在明顯差異:
- 繁體中文的高品質內容來源相對稀少,反而是一個機會。
- Perplexity 在台灣的使用率相較英文市場低,但 ChatGPT 與 Gemini 使用率高。
- 本土討論平台(PTT、Dcard)在台灣 AI 訓練資料的代表性,目前尚不明確。
因此,針對台灣繁體中文市場進行 AI 能見度追蹤時,測試平台的選擇應以 ChatGPT 與 Gemini 為主。
3. AI 搜尋生態仍在快速演變
Google 的 AI 模式(AI Mode)、ChatGPT Search、Perplexity 的引用邏輯,都還在持續調整中。今天有效的策略,六個月後可能需要重新評估。現階段最務實的態度是:建立追蹤習慣、累積基準數據(Baseline Data),等到官方數據工具成熟時,你已經有了足夠的歷史脈絡可以對照。
結論:AI 能見度的測量,是一種「觀察框架」而非「精準數字」
目前還不能精準量化 AI 能見度,但可以建立一套可重複執行的觀察框架,追蹤相對變化與趨勢。這個框架的核心精神是:
- 不依賴單一指標,而是多訊號交叉觀察。
- 不追求絕對數字,而是追蹤每月的相對變化。
- 不相信付費工具的「AI 能見度分數」,因為那些分數的查詢基礎是假設出來的。
- 從可控的原因端下手:可引用性、權威訊號、AI 爬蟲可抓取性,這三件事做好,AI 搜尋結果自然會跟上。
這比花錢買一個「AI 能見度 87%」的虛假數字,要有意義得多了。
0 留言