AI 검색 가시성(SOV)이란 무엇인가

AI 검색 가시성(AI Share of Voice, AI SOV)은 정의된 쿼리 집합에 대해 ChatGPT Search·Perplexity·Google AI Overviews 같은 생성형 AI 시스템의 답변 내에서 자사 도메인·콘텐츠·브랜드가 인용되는 비율이다. 전통 SOV가 SERP 클릭 점유율을 측정하는 것과 달리, AI SOV는 LLM의 RAG(Retrieval-Augmented Generation) 파이프라인이 후보 청크를 선별·재랭킹하는 과정에서 결정된다. SERP 1위를 유지하면서도 AI 답변에서 완전히 누락되는 현상이 실제로 발생하고 있다. 이 글은 AI SOV가 기술적으로 어떻게 결정되는지, 어떻게 측정하는지, 구현 수준에서 어떻게 높일 수 있는지를 순서대로 다룬다.

AI SOV와 전통 SEO SOV의 구조적 차이

두 지표는 측정 단위, 데이터 소스, 최적화 신호가 모두 다르다. 같은 KPI 버킷에 넣으면 진단 오류가 발생한다.

항목	전통 SEO SOV	AI SOV
측정 단위	SERP 노출·클릭 점유율(%)	AI 답변 내 인용 빈도·위치
데이터 소스	Google Search Console API	AI API 샘플링, 수동 쿼리 반복
핵심 랭킹 신호	PageRank, 클릭 신호, Core Web Vitals	임베딩 유사도, 사실 밀도, 청크 가독성
인덱스 주기	Googlebot 크롤 주기	모델 훈련 컷오프 + 실시간 RAG 인덱스
크롤러 허용 설정	Googlebot Allow/Disallow	GPTBot, PerplexityBot, Google-Extended 개별 제어

AI 인용을 결정하는 기술적 메커니즘

Perplexity와 ChatGPT Search는 쿼리 수신 → 웹 검색 → 청크 임베딩 → 코사인 유사도 재랭킹 → LLM 컨텍스트 주입 → 답변 생성 순서로 동작한다. 각 단계에서 인용 후보가 탈락할 수 있다.

청크 분할 경계: 크롤러가 HTML을 파싱할 때 H1~H3 경계, 단락, 리스트 항목 단위로 청크를 자른다. 왜: 긴 청크는 임베딩 유사도가 희석되어 관련 쿼리에서 낮은 점수를 받는다. 어떻게: 단락 길이를 150~300토큰(영문 기준, 한국어는 약 100~200자) 범위로 유지하고 핵심 정보를 단락 첫 문장에 배치한다.
임베딩 유사도: 쿼리 벡터와 청크 벡터의 코사인 유사도가 1차 필터링 기준이다. 왜: 쿼리 의도와 의미적으로 겹치지 않으면 PageRank가 높아도 후보에서 탈락한다. 어떻게: 콘텐츠 내 전문 용어를 실제 검색 쿼리 언어와 매핑하고, FAQ 구조로 쿼리 형태를 본문에 직접 반영한다.
사실 밀도(Factual Density): LLM 재랭킹 단계에서 구체적 수치·날짜·고유명사 밀도가 높은 청크가 선호된다. 왜: AI 시스템은 검증 가능한 클레임이 포함된 텍스트를 신뢰성 신호로 처리한다. 어떻게: "효과적인 전략" 같은 추상 표현 대신 "2024년 Q3 기준 전환율 3.2% 증가"처럼 구체적 수치를 본문에 삽입한다.
크롤러 허용 범위: robots.txt에서 GPTBot을 Disallow하면 ChatGPT Search 실시간 인용에서 완전히 제외된다. 왜: 일부 CDN WAF 규칙이 알 수 없는 User-Agent를 자동 차단해 의도치 않게 AI 크롤러를 막을 수 있다. 어떻게: 아래 설정처럼 AI 크롤러를 명시적으로 허용하고, /llms.txt로 핵심 콘텐츠 맵을 제공한다.

# robots.txt — AI 크롤러 명시적 허용 예시
User-agent: GPTBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

# 얇은 콘텐츠·관리자 경로는 모든 봇 제외
User-agent: *
Disallow: /admin/
Disallow: /account/
Disallow: /search?

Sitemap: https://example.com/sitemap.xml

# /llms.txt — LLM이 참조할 핵심 콘텐츠 맵 (Anthropic 제안 형식)
# https://llmstxt.org 사양 기준

# Example Corp — AI 검색 최적화 솔루션

## 제품 문서
- [GEO 가이드](https://example.com/docs/geo-guide): 생성형 AI 최적화 전체 절차
- [AEO 체크리스트](https://example.com/docs/aeo-checklist): 추출형 답변 엔진 최적화
- [측정 API 레퍼런스](https://example.com/docs/api): AI SOV 측정 엔드포인트 명세

## 기술 블로그 (실무 중심)
- [AI SOV란 무엇인가](https://example.com/blog/ai-sov)
- [SEO 1위가 AI 답변 1위가 아닌 이유](https://example.com/blog/seo-vs-geo)

AI SOV 측정 방법론

AI SOV를 정확히 측정하려면 샘플 쿼리 집합을 정의하고 AI API에 반복 질의하여 인용 여부와 위치를 수집해야 한다. 현재 표준화된 도구가 없으므로 API 기반 스크립트로 직접 구현하는 것이 방법론 통제에 유리하다.

쿼리 집합 설계: 브랜드 키워드, 비브랜드 카테고리 키워드, 경쟁사 비교 쿼리를 혼합하여 50~200개 쿼리를 구성한다. 왜: 브랜드 쿼리만으로는 신규 방문자 관점의 발견가능성(discoverability)을 측정하지 못한다. 어떻게: Google Search Console의 상위 50개 non-brand 쿼리를 기준점으로 삼아 AI용 쿼리 집합을 확장한다.
인용 파싱: AI 답변 텍스트에서 자사 도메인 URL 또는 브랜드명 언급을 정규식으로 추출하고, 답변 내 위치(첫 문단, 중간, 미인용)를 함께 기록한다. 왜: 인용 위치는 클릭 전환율과 상관관계가 있으며(첫 인용 > 중간 인용), 콘텐츠 개선 우선순위 결정에 사용된다.
점유율 계산: (자사 인용 쿼리 수 / 전체 쿼리 수) × 100. 경쟁사 도메인을 동시에 추적하여 상대 SOV를 산출한다. 어떻게: 주 1회 동일 쿼리를 재실행하여 구조화 데이터 변경·콘텐츠 업데이트의 효과를 추이로 확인한다.

import re, time
from openai import OpenAI  # Perplexity는 OpenAI 호환 API를 제공

client = OpenAI(
    api_key="pplx-XXXX",
    base_url="https://api.perplexity.ai",
)

QUERIES = [
    "GEO 최적화 전략",
    "AI 검색 가시성 높이는 방법",
    "생성형 AI 답변 최적화",
]
TARGET_DOMAIN = "example.com"
results = []

for query in QUERIES:
    resp = client.chat.completions.create(
        model="sonar",
        messages=[{"role": "user", "content": query}],
    )
    answer = resp.choices[0].message.content
    # sonar 모델은 citations 배열에 인용 URL을 포함해 반환
    citations = getattr(resp, "citations", []) or []
    cited = any(TARGET_DOMAIN in c for c in citations)
    results.append({
        "query": query,
        "cited": cited,
        "citation_position": next(
            (i + 1 for i, c in enumerate(citations) if TARGET_DOMAIN in c), None
        ),
    })
    time.sleep(1)  # rate limit 준수

sov = sum(1 for r in results if r["cited"]) / len(results) * 100
print(f"AI SOV: {sov:.1f}%  (n={len(QUERIES)})")
for r in results:
    print(r)

흔한 오해: 오가닉 트래픽 1위 = AI SOV 1위

구글 오가닉 트래픽 1위 페이지가 AI 답변에서 한 번도 인용되지 않는 사례가 실제로 발생한다. 기술적 원인은 다음 세 가지다.

PageRank는 링크 그래프 기반, AI 인용은 임베딩 유사도 기반이다. 두 신호는 서로 다른 벡터 공간에서 독립적으로 계산된다.
GPTBot, PerplexityBot이 CDN WAF 또는 robots.txt에 의해 차단되어 있으면 콘텐츠 자체가 RAG 실시간 인덱스에 존재하지 않는다.
트래픽 1위 페이지가 마케팅 랜딩 페이지처럼 사실 밀도가 낮은 형태라면 LLM 재랭킹 단계에서 탈락한다.

올바른 처리법: SEO 순위와 AI SOV를 별도 KPI 트래킹 테이블로 분리 관리한다. 월 1회 측정 스크립트를 실행하여 두 지표의 괴리를 수치로 확인하고, AI SOV가 낮은 핵심 쿼리에 대해서는 크롤러 허용 점검 → 사실 밀도 강화 → FAQ 구조 추가 순서로 우선 적용한다.

Q. Perplexity에서는 인용되는데 ChatGPT Search에서는 인용되지 않습니다. 원인이 무엇인가요?

두 시스템의 실시간 웹 인덱스와 임베딩 모델이 다르기 때문이다. Perplexity는 자체 PerplexityBot이 실시간 인덱스를 구성하고, ChatGPT Search는 Bing 인덱스와 GPTBot 직접 크롤을 혼합 사용한다. 동일 URL이라도 각 시스템의 크롤 주기·청크 분할 방식·임베딩 모델 차이로 인용 결과가 달라진다. 해결책: robots.txt에서 두 크롤러를 모두 명시적으로 허용하고, sitemap.xml에 핵심 페이지를 포함하여 크롤 우선순위를 높인다. ChatGPT Search의 경우 Bing Webmaster Tools에 사이트맵을 등록하면 Bing 인덱스 커버리지에 직접 영향을 준다.

Q. AI SOV 측정을 외부 SaaS로 구매해야 할까요, 자체 구현해야 할까요?

현재(2025년 기준) BrightEdge, Semrush, Authoritas 등이 AI SOV 측정 기능을 제공하지만, 쿼리 집합·파싱 로직을 블랙박스로 처리하여 방법론 재현성 검증이 어렵다. 자체 구현의 장점은 쿼리 집합 완전 통제, 경쟁사 도메인 커스텀 추적, 원시 응답 데이터 보존이다. 권장 접근: 초기에는 위 스크립트처럼 자체 구현으로 측정 방법론을 먼저 확립하고, 운영 부담이 커질 때 SaaS와 병행하되 쿼리 집합 정의와 점유율 집계 방식은 자체 표준을 유지한다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.