Google AI Overviews(이하 AIO)는 2024년 5월 구글 I/O에서 정식 출시된 이후, how-to·비교·정의 유형 쿼리의 검색 결과 최상단을 차지하는 합성 답변 블록으로 자리잡았다. 기술적으로 AIO는 Gemini 모델이 구글의 기존 웹 색인을 RAG(Retrieval-Augmented Generation) 방식으로 참조해 멀티소스 답변을 합성하는 구조다. 별도 크롤러가 없고 Googlebot이 수집한 기존 색인 데이터가 소스 풀이므로, AIO 노출은 기존 SEO 기반 색인 품질에 직접 종속된다. YMYL(건강·법률·금융) 카테고리에서는 AIO 출현이 억제되는 경향이 있으며, 2025년 기준 절차형·비교형 쿼리에서 출현 빈도가 가장 높다.
AIO 작동 메커니즘: RAG 파이프라인과 소스 선택 기준
AIO가 특정 URL을 인용하는 경로를 이해하면 최적화 변수가 명확해진다.
- 색인 순위 선행 조건 — AIO 소스는 해당 쿼리에서 구글 색인 상위 10~20위권 페이지에서 주로 추출된다. 왜: AIO는 별도 검색 없이 기존 랭킹 신호를 소스 후보 풀로 재사용한다. 어떻게: Google Search Console Coverage에서 페이지가 "Indexed" 상태인지 확인하고, 대상 쿼리에서 오가닉 순위를 먼저 확보한다.
- semantic chunk 추출 — Gemini는 페이지 전체가 아닌 쿼리와 의미적으로 밀접한 문단 단위 청크를 추출한다. 왜: LLM attention 메커니즘상 쿼리와 코사인 유사도가 높은 구절이 인용될 확률이 높다. 어떻게: 각 섹션의 첫 1~2문장에 핵심 답변을 직접 서술하고, 200~250단어 이내 문단으로 분할한다.
- E-E-A-T 신호 가중치 — 저자의 실제 경험(Experience), 전문성(Expertise), 권위성(Authoritativeness), 신뢰성(Trustworthiness)이 소스 선택의 보조 필터로 작동한다. 왜: AIO는 오답 리스크를 줄이기 위해 신호가 강한 소스를 우선 선택한다. 어떻게:
Person스키마에knowsAbout와hasCredential을 명시하고, 저자 소개 페이지를 별도 URL로 독립 관리한다.
콘텐츠 구조 최적화: 직접 답변 밀도와 헤딩 전략
- 정의 문장 선행(inverted pyramid) — "X란 Y다" 형식의 정의 문장을 H2 직후 첫 문단에 40단어 이내로 배치한다. 왜: AIO는 정의형 쿼리에서 이 패턴을 그대로 인용하는 경향이 관찰된다. 어떻게: "AI Overviews는 Gemini 모델이 구글 색인을 RAG로 참조해 합성한 멀티소스 답변 블록이다"처럼 한 문장으로 완결한다.
- H2/H3 헤딩을 실제 쿼리 문구로 매핑 — 사용자가 실제로 검색하는 쿼리 문구를 헤딩 텍스트로 사용한다. 왜: Gemini는 헤딩을 섹션 토픽 신호로 활용해 관련 청크를 추출한다. 어떻게: Search Console Performance → Queries에서 상위 100개 쿼리를 내려받아 현재 헤딩과 텍스트 유사도를 대조한다.
- HowTo 절차형 포맷 — 번호 목록 + 각 단계 40~80단어로 구성한다. 왜: AIO는 how-to 쿼리에서 번호 목록을 렌더링 결과에 그대로 포함하는 패턴이 있다. 어떻게: HowTo JSON-LD 스키마의
step배열과 시각적 번호 목록의 텍스트를 일치시킨다.
구조화 데이터 구현: FAQPage·Article·E-E-A-T 스키마
JSON-LD 스키마는 Gemini가 페이지 구조를 파싱할 때 명시적 힌트를 제공한다. 아래는 Article(저자 E-E-A-T 포함)과 FAQPage를 하나의 @graph로 결합한 실제 구현 예시다.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@graph": [
{
"@type": "Article",
"headline": "구글 AI Overviews 최적화 실전",
"datePublished": "2026-06-18",
"dateModified": "2026-06-18",
"author": {
"@type": "Person",
"name": "박도현",
"url": "https://example.com/author/dohy",
"knowsAbout": ["AEO", "SEO", "GEO", "검색엔진최적화"],
"hasCredential": {
"@type": "EducationalOccupationalCredential",
"credentialCategory": "certificate",
"name": "Google Analytics Certified"
}
},
"publisher": {
"@type": "Organization",
"name": "Citeon",
"url": "https://citeon.io",
"logo": {
"@type": "ImageObject",
"url": "https://citeon.io/logo.png"
}
}
},
{
"@type": "FAQPage",
"mainEntity": [
{
"@type": "Question",
"name": "robots.txt로 AI Overviews 노출을 차단할 수 있나요?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Google-Extended 크롤러를 차단하면 AIO 및 Gemini 학습 데이터 제공을 거부하는 신호가 됩니다. robots.txt에 'User-agent: Google-Extended'와 'Disallow: /'를 추가합니다. 단, 이 지시는 기존 Googlebot 색인에는 영향을 주지 않으며, AIO 노출 완전 차단이 보장되지는 않습니다."
}
},
{
"@type": "Question",
"name": "AIO에 인용되면 오가닉 클릭이 감소하나요?",
"acceptedAnswer": {
"@type": "Answer",
"text": "AIO 출현 쿼리에서 오가닉 CTR이 감소하는 경향이 복수의 외부 연구에서 관찰됩니다. 감소폭은 쿼리 유형과 브랜드 인지도에 따라 편차가 큽니다. AIO 내 상위 인용 소스 자리를 확보하면 브랜드 노출 자체를 전환 채널로 활용할 수 있습니다."
}
}
]
}
]
}
</script>
SEO vs AEO vs AIO vs GEO 최적화 신호 비교
| 최적화 대상 | 주요 랭킹 신호 | 최적 콘텐츠 형식 | 측정 도구 |
|---|---|---|---|
| 전통 SEO | PageRank, 백링크, Core Web Vitals | 롱폼 서술형, 키워드 밀도 | Search Console, Ahrefs |
| AEO (피처드 스니펫·음성) | 직접 답변 밀도, FAQ 스키마, 40단어 답변 | Q&A 블록, 정의 문장, 순위 목록 | GSC Featured Snippet, SEMrush |
| AIO (Google AI Overviews) | E-E-A-T, semantic chunk, 색인 상위 순위 | 직접 답변 선행, 단락 분할, JSON-LD | SE Ranking AIO Tracker, 수동 쿼리 테스트 |
| GEO (ChatGPT·Perplexity) | GPTBot 허용, llms.txt, 도메인 권위 | 엔티티 중심 서술, 인용 가능 팩트 | 수동 쿼리, BrandMentions |
검증과 측정: AIO 출처 노출 추적
- Search Console CTR 추이 모니터링 — 2025년 6월 현재 GSC는 AIO 노출과 오가닉 노출을 분리 제공하지 않는다. 왜: 구글이 AIO 클릭 데이터를 별도 차원으로 공개하지 않는다. 어떻게: 대상 쿼리의 주간 CTR 추이를 기록하고, AIO 출현이 의심되는 날짜와의 상관관계를 수동으로 분석한다.
- SE Ranking AIO Tracker — 키워드별 AIO 출현 여부와 자사 URL이 소스로 인용됐는지를 자동 추적한다. 왜: 수동 검색은 로그인 상태·지역·개인화에 따라 결과가 달라진다. 어떻게: 핵심 쿼리 100개를 등록하고 7일 이동 평균으로 AIO 노출률 변화를 추적한다.
- Rich Results Test로 스키마 검증 — 배포 전
https://search.google.com/test/rich-results에서 JSON-LD 유효성을 확인한다. 왜: 스키마 오류가 있으면 구글이 구조화 데이터를 무시하고 일반 텍스트 파싱으로 폴백한다. 어떻게: CI 파이프라인에 Rich Results API 호출 단계를 추가해 배포마다 자동 검증한다.
흔한 오해: "AIO는 기존 SEO와 독립된 별도 채널이다"
실무자 사이에서 가장 자주 나오는 오해는 AIO가 기존 SEO와 무관한 별도 최적화 채널이라는 인식이다. 이 오해에서 비롯한 실수가 "AIO 전용 랜딩 페이지 별도 제작" 또는 "기존 블로그와 분리된 AIO 콘텐츠 사이트 운영"이다. 결과적으로 기존 사이트 SEO는 방치되고 새 도메인은 신뢰도가 낮아 AIO에 전혀 인용되지 않는 상황이 발생한다.
실제 메커니즘: AIO는 구글의 기존 랭킹 인프라 위에 Gemini 합성 레이어를 추가한 것이다. 소스 후보 풀 자체가 이미 색인된 상위 랭킹 페이지다. 해당 쿼리에서 색인되지 않았거나 하위 순위에 있는 페이지는 AIO 소스로 선택될 가능성이 구조적으로 낮다.
올바른 접근: 기존 SEO 기반(색인 완전성, Core Web Vitals, 상위 순위)을 먼저 확보한 뒤, semantic chunk 구조·E-E-A-T 스키마·직접 답변 밀도를 AIO 레이어로 추가한다. 기반 없이 AIO 레이어만 작업하는 것은 효과가 없다.
Google-Extended를 robots.txt로 차단하면 기존 오가닉 순위가 떨어지나요?
Google-Extended는 Googlebot과 독립된 별도 크롤러 토큰이다. robots.txt에서 Google-Extended를 차단해도 Googlebot의 색인 크롤링과 랭킹 신호 수집에는 영향이 없다. 단, 구글 공식 문서는 이 지시가 "AI 기능 학습 데이터 제공 거부" 신호임을 명시하며, 현재 기존 오가닉 순위 저하와 직접 연관된다는 공식 근거는 없다. 다만 AIO 소스 제외 효과의 완전한 보장도 없으므로, 차단 목적과 트레이드오프를 사전에 정의하고 적용해야 한다.
AIO 출현 이후 오가닉 클릭이 급감했습니다. 콘텐츠 전략을 어떻게 바꿔야 하나요?
AIO가 단답형 쿼리를 완전히 흡수하는 구조이므로, 클릭을 유지하려면 AIO가 완전히 답하기 어려운 콘텐츠 유형으로 전환이 필요하다. 구체적으로는: (1) 심층 비교 분석(도구 A vs B, 시나리오별 우열), (2) 최신 데이터·통계를 포함한 리포트형 콘텐츠, (3) 인터랙티브 계산기·도구형 페이지처럼 답변 자체를 HTML로 소비해야 하는 형식이 클릭 유인을 만든다. 동시에 AIO 내 인용 소스 자리를 유지해 브랜드 노출을 별도 KPI로 관리하는 투트랙 전략이 현실적이다.
참고 자료
이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.