Citeon
플랫폼별 전략

Gemini가 참조하는 콘텐츠의 특징

박도현
박도현 · AEO 리서처

Google Gemini(AI Overviews 및 Gemini 앱의 Google Search Grounding 모드)는 쿼리 수신 시 실시간으로 Google 웹 색인에서 후보 페이지를 검색한 뒤 LLM이 합성해 답변을 생성하는 RAG(Retrieval-Augmented Generation) 구조를 사용한다. "인용"은 두 단계—Retrieval(후보 페이지 풀 구성)과 Generation(LLM이 실제 텍스트를 추출해 합성)—를 모두 통과해야 확정된다. SEO가 Retrieval 단계(검색 색인 순위)만 다루는 반면, Gemini 최적화는 Generation 단계에서 LLM이 실제로 텍스트를 인용 가능하도록 구조를 갖추는 것까지 포함한다. 두 단계를 모두 공략하지 않으면 색인 1위여도 인용에서 탈락할 수 있다.

Grounding 파이프라인 — 후보 페이지 풀 결정 요인

Gemini가 참조 후보를 구성하는 방식은 Googlebot이 구성한 표준 Search 색인을 그대로 사용한다. 별도의 AI 전용 크롤러가 있는 것이 아니므로, 후보 풀 진입 조건은 기존 SEO 신호와 동일한 지점에서 시작한다.

LLM이 인용을 결정하는 텍스트 내 신호

후보 풀에 진입하더라도 LLM이 실제로 해당 페이지의 문장을 합성에 사용하는지는 별개의 판단이다. Gemini가 텍스트에서 높게 평가하는 신호는 다음과 같다.

직접 답변 밀도 (Answer Proximity)

E-E-A-T 신호와 저자 권위

Schema.org 구조화 데이터 구현

JSON-LD 스키마는 Gemini가 텍스트를 파싱하지 않고도 저자 권위, 인용 출처, 엔티티를 구조적으로 인식하게 한다. Article 타입에 author, citation, dateModified를 명시하는 것이 기본이다.

{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "전기차 배터리 교체 비용 완전 가이드 2025",
  "datePublished": "2025-03-01",
  "dateModified": "2025-06-10",
  "author": {
    "@type": "Person",
    "name": "김지수",
    "url": "https://autotech.kr/author/jisoo-kim",
    "knowsAbout": ["전기차", "배터리 기술", "자동차 정비"]
  },
  "publisher": {
    "@type": "Organization",
    "name": "AutoTech Korea",
    "url": "https://autotech.kr",
    "logo": {
      "@type": "ImageObject",
      "url": "https://autotech.kr/logo.png",
      "width": 600,
      "height": 60
    }
  },
  "citation": [
    {
      "@type": "CreativeWork",
      "name": "국토교통부 전기차 배터리 실태조사 2024",
      "url": "https://www.molit.go.kr/report/2024-battery"
    }
  ],
  "mainEntityOfPage": {
    "@type": "WebPage",
    "@id": "https://autotech.kr/ev-battery-cost-2025"
  }
}

FAQ 유형 쿼리를 타깃으로 한다면 FAQPage 스키마를 별도로 추가해 질문-답변 쌍을 직접 노출한다. ArticleFAQPage는 같은 페이지에서 JSON-LD 배열로 병기할 수 있다.

robots.txt 설정 — 흔한 오해와 올바른 처리

Google은 현재 두 종류의 AI 관련 User-agent를 운영하며, 이 둘의 역할을 혼동하는 것이 실무에서 가장 빈번한 운영 오류다.

User-agent 역할 차단 시 영향
Googlebot 웹 색인 생성 (Search + Grounding의 데이터 원천) Search 색인 제외 → AI Overviews·Gemini Grounding 모두 탈락
Google-Extended Gemini 모델 학습 데이터 수집 (색인과 무관) 향후 모델 학습에서만 제외 (실시간 Grounding에 영향 없음)

오해: "Google-Extended를 차단하면 Gemini가 내 사이트를 인용하지 못한다"는 인식이 실무에서 흔히 발생한다. 올바른 처리: Gemini의 실시간 참조(Grounding)는 Googlebot이 구성하는 표준 Search 색인을 사용한다. Google-Extended 차단은 미래 모델 학습 데이터에서 제외되는 것일 뿐, 현재 배포된 Gemini 모델의 인용 동작에 영향을 주지 않는다. Grounding 허용을 유지하면서 학습 데이터 제공을 선택적으로 거부하려면 아래와 같이 분리 설정한다.

# Grounding 허용 (Gemini AI Overviews 참조 대상 유지)
User-agent: Googlebot
Allow: /

# 모델 학습 데이터 제공 거부 (Grounding에는 영향 없음)
User-agent: Google-Extended
Disallow: /

# 기타 크롤러 허용
User-agent: *
Allow: /

Sitemap: https://example.com/sitemap.xml

측정 및 검증 방법

Gemini 앱에서는 인용되는데 AI Overviews에서는 나오지 않습니다. 이유가 무엇인가요?

Gemini 앱(Google Search Grounding)과 AI Overviews는 동일한 색인을 기반으로 하지만, 쿼리 해석 모델과 답변 합성 전략이 다릅니다. AI Overviews는 주로 정보 탐색 의도(informational intent) 쿼리에서 발동되며 쿼리 유형별로 합성 여부를 별도로 결정합니다. 또한 AI Overviews는 국가·언어별로 롤아웃 단계가 상이해 한국어 쿼리 노출 빈도가 영어보다 낮습니다. Search Console에서 AI Overviews 필터 데이터가 누적되면 어떤 쿼리 유형에서 차이가 나는지 비교해 콘텐츠 포맷을 조정하세요.

FAQPage 스키마를 추가했는데 Gemini 인용이 늘지 않습니다. 무엇을 점검해야 하나요?

스키마는 필요 조건이지 충분 조건이 아닙니다. 점검 순서: (1) Rich Results Test에서 파싱 오류가 없는지 확인, (2) 스키마의 acceptedAnswer 텍스트가 실제 페이지 본문과 일치하는지 확인—불일치 시 Google이 스키마를 무시, (3) 해당 페이지가 Googlebot에 의해 실제로 인덱싱됐는지 site: 연산자로 확인, (4) 타깃 쿼리에서 답변 권위가 높은 경쟁 페이지가 이미 존재하는지 분석. FAQPage 스키마 단독 추가보다 Answer Proximity 개선과 E-E-A-T 강화를 병행해야 측정 가능한 변화가 납니다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.

박도현
박도현 · AEO 리서처

생성형 검색·LLM 인용에 관한 논문과 데이터를 읽고 실무 언어로 옮깁니다. 근거 없는 '카더라'를 싫어합니다.

내 사이트의 AI 검색 점수가 궁금하다면

30초 무료 진단으로 SEO·AEO·GEO 점수와 처방을 받아보세요.

무료 진단 시작
← 블로그 목록으로