Citeon
기초 개념

AI 검색 가시성(SOV)이란 무엇인가

이서연
이서연 · GEO 전략 리드

AI 검색 가시성(AI Share of Voice, AI SOV)은 정의된 쿼리 집합에 대해 ChatGPT Search·Perplexity·Google AI Overviews 같은 생성형 AI 시스템의 답변 내에서 자사 도메인·콘텐츠·브랜드가 인용되는 비율이다. 전통 SOV가 SERP 클릭 점유율을 측정하는 것과 달리, AI SOV는 LLM의 RAG(Retrieval-Augmented Generation) 파이프라인이 후보 청크를 선별·재랭킹하는 과정에서 결정된다. SERP 1위를 유지하면서도 AI 답변에서 완전히 누락되는 현상이 실제로 발생하고 있다. 이 글은 AI SOV가 기술적으로 어떻게 결정되는지, 어떻게 측정하는지, 구현 수준에서 어떻게 높일 수 있는지를 순서대로 다룬다.

AI SOV와 전통 SEO SOV의 구조적 차이

두 지표는 측정 단위, 데이터 소스, 최적화 신호가 모두 다르다. 같은 KPI 버킷에 넣으면 진단 오류가 발생한다.

항목 전통 SEO SOV AI SOV
측정 단위 SERP 노출·클릭 점유율(%) AI 답변 내 인용 빈도·위치
데이터 소스 Google Search Console API AI API 샘플링, 수동 쿼리 반복
핵심 랭킹 신호 PageRank, 클릭 신호, Core Web Vitals 임베딩 유사도, 사실 밀도, 청크 가독성
인덱스 주기 Googlebot 크롤 주기 모델 훈련 컷오프 + 실시간 RAG 인덱스
크롤러 허용 설정 Googlebot Allow/Disallow GPTBot, PerplexityBot, Google-Extended 개별 제어

AI 인용을 결정하는 기술적 메커니즘

Perplexity와 ChatGPT Search는 쿼리 수신 → 웹 검색 → 청크 임베딩 → 코사인 유사도 재랭킹 → LLM 컨텍스트 주입 → 답변 생성 순서로 동작한다. 각 단계에서 인용 후보가 탈락할 수 있다.

# robots.txt — AI 크롤러 명시적 허용 예시
User-agent: GPTBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

# 얇은 콘텐츠·관리자 경로는 모든 봇 제외
User-agent: *
Disallow: /admin/
Disallow: /account/
Disallow: /search?

Sitemap: https://example.com/sitemap.xml
# /llms.txt — LLM이 참조할 핵심 콘텐츠 맵 (Anthropic 제안 형식)
# https://llmstxt.org 사양 기준

# Example Corp — AI 검색 최적화 솔루션

## 제품 문서
- [GEO 가이드](https://example.com/docs/geo-guide): 생성형 AI 최적화 전체 절차
- [AEO 체크리스트](https://example.com/docs/aeo-checklist): 추출형 답변 엔진 최적화
- [측정 API 레퍼런스](https://example.com/docs/api): AI SOV 측정 엔드포인트 명세

## 기술 블로그 (실무 중심)
- [AI SOV란 무엇인가](https://example.com/blog/ai-sov)
- [SEO 1위가 AI 답변 1위가 아닌 이유](https://example.com/blog/seo-vs-geo)

AI SOV 측정 방법론

AI SOV를 정확히 측정하려면 샘플 쿼리 집합을 정의하고 AI API에 반복 질의하여 인용 여부와 위치를 수집해야 한다. 현재 표준화된 도구가 없으므로 API 기반 스크립트로 직접 구현하는 것이 방법론 통제에 유리하다.

  1. 쿼리 집합 설계: 브랜드 키워드, 비브랜드 카테고리 키워드, 경쟁사 비교 쿼리를 혼합하여 50~200개 쿼리를 구성한다. : 브랜드 쿼리만으로는 신규 방문자 관점의 발견가능성(discoverability)을 측정하지 못한다. 어떻게: Google Search Console의 상위 50개 non-brand 쿼리를 기준점으로 삼아 AI용 쿼리 집합을 확장한다.
  2. 인용 파싱: AI 답변 텍스트에서 자사 도메인 URL 또는 브랜드명 언급을 정규식으로 추출하고, 답변 내 위치(첫 문단, 중간, 미인용)를 함께 기록한다. : 인용 위치는 클릭 전환율과 상관관계가 있으며(첫 인용 > 중간 인용), 콘텐츠 개선 우선순위 결정에 사용된다.
  3. 점유율 계산: (자사 인용 쿼리 수 / 전체 쿼리 수) × 100. 경쟁사 도메인을 동시에 추적하여 상대 SOV를 산출한다. 어떻게: 주 1회 동일 쿼리를 재실행하여 구조화 데이터 변경·콘텐츠 업데이트의 효과를 추이로 확인한다.
import re, time
from openai import OpenAI  # Perplexity는 OpenAI 호환 API를 제공

client = OpenAI(
    api_key="pplx-XXXX",
    base_url="https://api.perplexity.ai",
)

QUERIES = [
    "GEO 최적화 전략",
    "AI 검색 가시성 높이는 방법",
    "생성형 AI 답변 최적화",
]
TARGET_DOMAIN = "example.com"
results = []

for query in QUERIES:
    resp = client.chat.completions.create(
        model="sonar",
        messages=[{"role": "user", "content": query}],
    )
    answer = resp.choices[0].message.content
    # sonar 모델은 citations 배열에 인용 URL을 포함해 반환
    citations = getattr(resp, "citations", []) or []
    cited = any(TARGET_DOMAIN in c for c in citations)
    results.append({
        "query": query,
        "cited": cited,
        "citation_position": next(
            (i + 1 for i, c in enumerate(citations) if TARGET_DOMAIN in c), None
        ),
    })
    time.sleep(1)  # rate limit 준수

sov = sum(1 for r in results if r["cited"]) / len(results) * 100
print(f"AI SOV: {sov:.1f}%  (n={len(QUERIES)})")
for r in results:
    print(r)

흔한 오해: 오가닉 트래픽 1위 = AI SOV 1위

구글 오가닉 트래픽 1위 페이지가 AI 답변에서 한 번도 인용되지 않는 사례가 실제로 발생한다. 기술적 원인은 다음 세 가지다.

올바른 처리법: SEO 순위와 AI SOV를 별도 KPI 트래킹 테이블로 분리 관리한다. 월 1회 측정 스크립트를 실행하여 두 지표의 괴리를 수치로 확인하고, AI SOV가 낮은 핵심 쿼리에 대해서는 크롤러 허용 점검 → 사실 밀도 강화 → FAQ 구조 추가 순서로 우선 적용한다.

Q. Perplexity에서는 인용되는데 ChatGPT Search에서는 인용되지 않습니다. 원인이 무엇인가요?

두 시스템의 실시간 웹 인덱스와 임베딩 모델이 다르기 때문이다. Perplexity는 자체 PerplexityBot이 실시간 인덱스를 구성하고, ChatGPT Search는 Bing 인덱스와 GPTBot 직접 크롤을 혼합 사용한다. 동일 URL이라도 각 시스템의 크롤 주기·청크 분할 방식·임베딩 모델 차이로 인용 결과가 달라진다. 해결책: robots.txt에서 두 크롤러를 모두 명시적으로 허용하고, sitemap.xml에 핵심 페이지를 포함하여 크롤 우선순위를 높인다. ChatGPT Search의 경우 Bing Webmaster Tools에 사이트맵을 등록하면 Bing 인덱스 커버리지에 직접 영향을 준다.

Q. AI SOV 측정을 외부 SaaS로 구매해야 할까요, 자체 구현해야 할까요?

현재(2025년 기준) BrightEdge, Semrush, Authoritas 등이 AI SOV 측정 기능을 제공하지만, 쿼리 집합·파싱 로직을 블랙박스로 처리하여 방법론 재현성 검증이 어렵다. 자체 구현의 장점은 쿼리 집합 완전 통제, 경쟁사 도메인 커스텀 추적, 원시 응답 데이터 보존이다. 권장 접근: 초기에는 위 스크립트처럼 자체 구현으로 측정 방법론을 먼저 확립하고, 운영 부담이 커질 때 SaaS와 병행하되 쿼리 집합 정의와 점유율 집계 방식은 자체 표준을 유지한다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.

이서연
이서연 · GEO 전략 리드

AI 검색(AEO·GEO) 전략과 구글·네이버 공식 가이드 해석을 담당합니다. 측정에서 매출까지 잇는 풀퍼널 관점으로 글을 씁니다.

내 사이트의 AI 검색 점수가 궁금하다면

30초 무료 진단으로 SEO·AEO·GEO 점수와 처방을 받아보세요.

무료 진단 시작
← 블로그 목록으로