ChatGPT Search, Perplexity, Google AIO가 구매 의사결정 경로에 편입되면서, 브랜드가 LLM 답변에 인용되는 빈도를 높이는 GEO(Generative Engine Optimization)·AEO(Answer Engine Optimization) 서비스 수요가 2024년 하반기부터 급증했다. 문제는 공급 측이다. "AI 마케팅 전문 대행사"를 내세우는 업체 대다수가 기존 SEO 콘텐츠 패키지를 리브랜딩한 수준에 머물며, LLM 인용 메커니즘(크롤러 접근성·구조화 데이터·권위 신호)을 실제로 다룰 기술 스택을 갖추지 못한 경우가 많다. 아래 7가지 체크포인트는 대행사의 기술 기반과 측정 역량을 계약 전 빠르게 가를 수 있는 검증 기준이다.
체크포인트 1–3: 기술 인프라 구현 역량
1. AI 크롤러 접근성 설정
- 왜 중요한가: GPTBot(OpenAI), PerplexityBot, ClaudeBot, Google-Extended는 기본적으로 robots.txt의 User-agent 규칙을 준수한다. 블록된 경로는 LLM 학습 데이터 및 실시간 검색 풀에서 제외될 수 있다.
- 검증 방법: 포트폴리오 도메인의
/robots.txt를 직접 조회. GPTBot 명시 허용이 없으면 기초 설정 자체를 모르는 것으로 간주한다. - 확인 질문: "클라이언트 도메인에서 AI 크롤러를 어떻게 설정하나요?"라고 물었을 때 구체적인 User-agent 목록을 즉시 제시하지 못하면 탈락 신호다.
# AI 크롤러 선택적 허용 robots.txt 예시
User-agent: GPTBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Google-Extended
Allow: /blog/
Allow: /docs/
Disallow: /admin/
Disallow: /internal/
# 전통 SEO 크롤러는 별도 제어
User-agent: Googlebot
Allow: /
Crawl-delay: 1
2. 구조화 데이터(JSON-LD) 구현 능력
- 왜 중요한가: schema.org FAQPage, HowTo, Article 마크업이 적용된 페이지는 LLM이 구조화된 사실 단위로 파싱할 수 있어 인용 선택 우선도가 높아진다(Google AIO 실측 기준, 추정치).
- 검증 방법: Google의 리치 검색결과 테스트(
https://search.google.com/test/rich-results)로 포트폴리오 URL을 대입. FAQPage·HowTo 구현 건수와 오류율을 공개할 수 있어야 한다. - 주의: JSON-LD를 "삽입했다"는 것으로 충분하지 않다. 실제 콘텐츠와 마크업이 일치(Content-Schema consistency)해야 Google이 리치 결과로 렌더링한다.
// FAQPage JSON-LD — LLM 인용 최적화 예시
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [
{
"@type": "Question",
"name": "GEO와 SEO의 핵심 차이점은 무엇인가요?",
"acceptedAnswer": {
"@type": "Answer",
"text": "SEO는 검색 엔진 결과 페이지(SERP) 순위를 목표로 하며 클릭 유도가 성과 지표다. GEO는 ChatGPT Search·Perplexity·Google AIO 등 생성형 AI 엔진이 답변을 조합할 때 브랜드 콘텐츠를 인용 출처로 선택하도록 최적화하는 전략이다. 측정 단위도 순위·CTR 대신 인용 점유율(brand mention rate)과 AI 유입 트래픽 비중을 사용한다."
}
}
]
}
3. llms.txt 설계 경험
- 왜 중요한가: llms.txt는 LLM 크롤러에게 사이트 구조·핵심 콘텐츠·인용 우선순위를 기계 가독 형식으로 전달하는 비공식 표준(2024년 커뮤니티 제안, W3C 공식 표준 아님)이다.
- 검증 방법:
https://{domain}/llms.txt를 직접 요청. 섹션 헤더(# Title,## Section), 마크다운 링크, 콘텐츠 우선순위 구분이 있으면 실무 적용 경험이 있는 것이다. - 추가 확인:
/llms-full.txt(확장 버전)의 존재 여부와 갱신 주기(콘텐츠 발행 시 자동 재생성 여부) 까지 확인한다.
체크포인트 4–5: AI 인용 측정과 보고 체계
4. AI 인용 추적 방법론
- 왜 중요한가: ChatGPT·Perplexity·Gemini는 인용 근거를 외부에 공개하지 않는다. 인용 추적은 간접 방법(GA4 referrer 분석, server-side log의 user-agent 파싱, dark traffic 보정)으로만 가능하다.
- 검증 방법: "AI 인용 기여 전환을 어떻게 측정하나요?"라는 질문에 GA4 탐색 보고서 설정, referrer 패턴(
perplexity.ai,chat.openai.com), direct/(none) 보정 방법론을 즉시 제시해야 한다. 하지 못하면 실측 경험 없음이다. - 도구 기준: Profound, Otterly, BrightEdge의 AI Overviews 모니터링 등 GEO 전용 추적 도구 활용 여부를 확인한다.
5. 보고 지표 체계
- 왜 중요한가: GEO 성과는 전통 SEO 지표(순위 1위, CTR)로 측정되지 않는다. 인용 점유율, AI 답변 내 위치(first-cited vs secondary-cited), 인용 유도 트래픽 비중이 핵심 KPI다.
- 검증 방법: 샘플 보고서 제출을 요청한다. "순위 상승" 수치만 있고 AI 인용 추적 데이터가 없으면 SEO 보고서를 GEO라고 포장한 것이다.
체크포인트 6–7: 콘텐츠 전략과 레퍼런스 검증
6. E-E-A-T 기반 권위 신호 구축 전략
- 왜 중요한가: LLM은 Wikipedia·학술 논문·공신력 있는 미디어의 인용 패턴을 학습 데이터로 내면화한다. 저자 정보(byline), 외부 인용(citation), 최신성(dateModified)은 인용 가중치에 영향을 준다(사례에 따라 다름, 확정 메커니즘 미공개).
- 검증 방법: "저자 권위 신호를 어떻게 구축하나요?"라는 질문에 Article 스키마의
author.sameAs(LinkedIn·Google Scholar URL), 외부 언급(PR·기고) 전략, 인용 가능한 통계·데이터 생산 계획을 구체적으로 제시해야 한다.
7. 레퍼런스와 성과 사례 검증 가능성
- 왜 중요한가: GEO는 성과 발현까지 3–9개월 이상 소요된다(콘텐츠 크롤링 → LLM 재학습 또는 실시간 검색 반영 사이클 의존). "단기 성과 보장"을 주장하는 사례는 기술적으로 신뢰하기 어렵다.
- 검증 방법: 레퍼런스 기업 도메인을 직접 확인(robots.txt·JSON-LD·Search Console 공개 데이터). 6개월 이상 지속된 AI 인용 증가 데이터를 제시하는지 확인한다.
- 계약 조건 확인: KPI를 "순위"가 아닌 "브랜드 인용 빈도"·"AI 유입 트래픽 비중" 등 GEO 고유 지표로 정의하는 조항이 계약서에 명시되어 있는지 반드시 확인한다.
SEO 전용 대행사 vs GEO 전문 대행사 비교
| 항목 | SEO 전용 대행사 | GEO 전문 대행사 |
|---|---|---|
| 핵심 KPI | 검색 순위, 오가닉 클릭수(CTR) | AI 인용 빈도, AI 유입 트래픽 비중 |
| robots.txt 설정 범위 | Googlebot 중심 | GPTBot·ClaudeBot·PerplexityBot 명시 포함 |
| 구조화 데이터 목적 | 리치 결과(SERP 표시) 획득 | LLM 파싱 최적화 + Content-Schema 일치 검증 |
| llms.txt 제공 | 대부분 미제공 | 사이트별 커스텀 설계 및 자동 갱신 |
| AI 인용 추적 도구 | 불가(전통 SEO 도구 미지원) | GA4 referrer + Profound·Otterly 등 GEO 전용 도구 |
| 성과 발현 기간 | 3–6개월(순위 기준) | 3–9개월(LLM 인덱싱·재학습 사이클 의존) |
| E-E-A-T 접근 | 백링크·도메인 권위(DA) 중심 | 저자 sameAs·외부 인용·인용 가능 데이터 생산 |
흔한 오해: "콘텐츠 생산량을 늘리면 GEO 성과가 오른다"
콘텐츠 볼륨을 GEO 전략의 핵심으로 제시하는 대행사는 SEO 방법론을 그대로 적용하고 있을 가능성이 높다. LLM 인용은 콘텐츠 수량이 아닌 인용 가능성(citability)에 달려 있다. 구체적으로는 단일 질의에 답변 완결성을 갖춘 페이지 구조(정의 → 예시 → 수치 → FAQ), 외부에서 인용된 적 있는 신뢰 신호, 정확하게 구현된 schema.org 마크업이 결정 요인이다. 짧더라도 FAQPage 스키마와 정확한 저자 정보가 있는 페이지가 2,000자 분량의 일반 블로그 글보다 AI 인용 확률이 높은 경우가 실제로 존재한다(사례에 따라 다름). 따라서 "월 N건 발행"을 단독 KPI로 제시하는 계약 구조는 GEO 성과와 직결되지 않는다. 올바른 처리법은 발행 건수 대신 인용 가능성 점수(FAQPage 구현율, 저자 마크업 적용률, 외부 언급 수)를 KPI 계약서에 명시하는 것이다.
GA4만으로 AI 유입 트래픽을 추적하는 것이 실제로 가능한가?
부분적으로 가능하다. Perplexity는 referrer로 perplexity.ai를 전달하는 경우가 있어 GA4의 소스/매체 분류에서 식별된다. 반면 ChatGPT Search는 Referrer-Policy 설정과 WebView 경로에 따라 referrer가 소실되어 direct/(none)으로 집계된다. 보완 방법은 두 가지다. 첫째, server-side 로그에서 User-Agent를 파싱해 ChatGPT-User, PerplexityBot 등을 식별하고 별도 집계한다. 둘째, AI 답변에 포함될 가능성이 높은 콘텐츠 페이지에 UTM 파라미터(utm_source=ai-citation)를 구조화 데이터 내 URL에 포함하여 클릭 발생 시 태그가 전달되도록 구성한다. 단, 후자는 LLM이 URL을 그대로 인용하는 경우에만 작동하며 100% 커버리지는 현재 기술적으로 불가능하다(추정치 기반 운영).
llms.txt가 실제로 LLM 인용에 영향을 주는 것이 검증되었는가?
2026년 6월 기준, llms.txt가 LLM 인용 확률에 통계적으로 유의한 영향을 준다는 공개 peer-review 연구는 없다. 이 파일이 Anthropic·OpenAI·Perplexity의 크롤러에 의해 실제로 파싱되는지 여부도 공식 확인된 바 없다. 그럼에도 실무적으로 권장되는 이유는 두 가지다. 첫째, robots.txt와 마찬가지로 크롤러가 우선 확인하는 경로(/ 루트)에 기계 가독 사이트맵을 두는 것은 인덱싱 효율에 긍정적이라는 합리적 추정이 성립한다. 둘째, /llms-full.txt에 콘텐츠 전문을 제공하면 자바스크립트 렌더링이 필요한 SPA 구조를 우회해 콘텐츠 접근성을 높일 수 있다. 따라서 llms.txt는 "효과가 확정된 최적화"가 아닌 "비용 대비 위험이 없는 접근성 개선 조치"로 정의하는 것이 정확하다.
참고 자료
이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.