Citeon
실무 심화

내부 링크 구조가 AI 인용에 미치는 영향

정유진
정유진 · 콘텐츠·SEO 에디터

Google AI Overviews·Perplexity·ChatGPT Search는 문서를 개별 URL 단위로 처리하지 않는다. 크롤러가 수집한 페이지 그래프를 바탕으로 RAG 파이프라인이 토픽 클러스터를 식별하고, LLM이 인용 후보를 선택할 때 해당 클러스터 내 권위 노드(hub)를 우선 참조한다. 내부 링크 구조는 이 그래프에서 노드 간 엣지를 정의한다 — 엣지가 없으면 클러스터도 없고, 클러스터가 없으면 AI 인용 풀 진입도 없다.

크롤 그래프에서 내부 링크가 하는 역할

클릭 깊이와 크롤 커버리지

GPTBot·ClaudeBot·Google-Extended 등 AI 크롤러는 robots.txt를 준수하며 BFS(너비 우선 탐색) 방식으로 사이트를 수집한다. 홈페이지(depth 0)에서 링크를 따라 이동하며, 클릭 깊이가 깊어질수록 수집 우선순위가 낮아진다. 사례에 따라 다르지만 클릭 깊이 4 이상 URL은 주요 AI 크롤러의 재방문 주기가 현저히 길어지는 경향이 관측된다.

허브-앤-스포크 클러스터 구조 구현

토픽 클러스터 모델은 pillar 페이지(허브)가 관련 세부 페이지(스포크)를 양방향으로 연결하는 구조다. 이 구조가 AI 인용에 유리한 이유는 크롤러가 클러스터 전체를 한 토픽의 권위 블록으로 인식하기 때문이다.

  1. Pillar 페이지 선정 — 가장 포괄적인 개요 문서를 pillar로 지정. 왜: LLM이 토픽 전체를 커버하는 단일 문서를 인용 기준점으로 삼는 경향. 어떻게: 2,000자 이상 포괄 콘텐츠 + cluster 페이지 전체 링크 색인.
  2. 양방향 링크 강제 — cluster → pillar, pillar → cluster 모두 배치. 왜: 단방향 링크만 있으면 그래프 엣지가 단절되어 클러스터 신호가 반감됨. 어떻게: CMS 템플릿에 "관련 주제" 자동 링크 블록 삽입.
  3. BreadcrumbList JSON-LD 삽입 — 왜: 크롤러가 페이지의 계층 위치를 명시적으로 파악하게 해 클러스터 그래프 해석 정확도를 높임. 어떻게: 아래 예시와 같이 모든 cluster 페이지에 삽입.
{
  "@context": "https://schema.org",
  "@type": "BreadcrumbList",
  "itemListElement": [
    {
      "@type": "ListItem",
      "position": 1,
      "name": "홈",
      "item": "https://example.com/"
    },
    {
      "@type": "ListItem",
      "position": 2,
      "name": "SEO 가이드",
      "item": "https://example.com/seo/"
    },
    {
      "@type": "ListItem",
      "position": 3,
      "name": "내부 링크 전략",
      "item": "https://example.com/seo/internal-linking/"
    }
  ]
}

이 마크업은 Google Rich Results Test에서 검증 가능하며, position 순서와 item URL이 실제 사이트 계층 구조와 일치해야 한다. 불일치 시 구조화 데이터 경고가 발생한다.

앵커 텍스트와 LLM 의미 신호

앵커 텍스트는 SEO에서 링크 타겟의 주제를 크롤러에 전달하는 신호다. RAG 파이프라인에서는 LLM이 청크 임베딩 시 앵커가 속한 문장의 맥락을 함께 처리해 링크된 페이지의 의미 표현에 영향을 미친다(추정, 공식 확인 없음).

내부 링크 구조 검증과 AI 인용 측정

신호 유형별 내부 링크 역할 비교

신호 속성 SEO (전통 검색) AEO (답변 엔진) GEO (생성형 검색)
내부 링크 주 역할 PageRank 흐름, 색인 경로 Featured Snippet 후보 권위 RAG 클러스터 그래프 노드 연결
앵커 텍스트 키워드 관련성 신호 질문-답변 매핑 힌트 LLM 청크 의미 벡터 품질 영향
권장 클릭 깊이 depth 4 이내 depth 3 이내 depth 3 이내 (크롤 빈도 직결)
pillar 페이지 기능 카테고리 랜딩 주제 권위 문서 인용 기준점 문서
고아 페이지 위험 색인 누락 가능성 Featured Snippet 배제 RAG 풀에서 완전 제외

흔한 오해: "내부 링크는 많을수록 좋다"

한 페이지에 내부 링크를 수십 개 배치하면 PageRank가 분산되어 개별 타겟 페이지가 받는 권위가 희석된다. LLM 관점에서는 링크 밀도가 지나치게 높은 페이지가 청크 분할 시 핵심 본문 비율이 낮아져 임베딩 품질이 저하될 수 있다. 또한 앵커가 의미 없이 반복되면 크롤러가 스팸 패턴으로 분류할 위험도 있다.

올바른 처리법: 본문 500자당 내부 링크 1~3개로 제한하고, 각 링크는 해당 섹션의 핵심 주제와 직접 관련된 타겟에만 배치한다. 내비게이션·사이드바·푸터 링크는 본문 링크 수 계산에서 분리하며, pillar↔cluster 연결 외의 cross-link는 사이트맵 수준에서 사전 설계한 후 삽입한다.

Q. 내부 링크와 외부 백링크 중 AI 인용에 더 중요한 것은?

두 신호는 레이어가 다르다. 백링크는 도메인 권위에 영향을 주어 AI 크롤러가 해당 사이트를 신뢰할 출처로 판단하는 데 기여하고, 내부 링크는 그 권위를 사이트 내 어느 페이지에 집중시킬지를 결정한다. 백링크가 부족한 신생 도메인일수록 내부 링크 구조 최적화의 상대적 효과가 더 크다. 백링크 수가 충분한 도메인에서는 내부 링크가 특정 cluster 페이지의 인용 빈도를 높이는 세밀한 조정 수단이 된다.

Q. JavaScript로 동적 렌더링되는 내부 링크는 AI 크롤러에 인식되는가?

GPTBot·ClaudeBot의 JavaScript 렌더링 지원 여부에 대한 공식 문서가 없다. 안전한 구현은 서버사이드 렌더링(SSR) 또는 정적 HTML에 내부 링크를 포함하는 것이다. Next.js App Router에서 서버 컴포넌트 내 <Link href="...">는 정적 HTML로 출력되므로 문제없다. 반면 Client Component에서만 조건부로 렌더링되는 링크는 크롤러에 보이지 않을 수 있으므로, pillar↔cluster 연결 링크는 반드시 서버 컴포넌트에 배치해야 한다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.

정유진
정유진 · 콘텐츠·SEO 에디터

스키마·FAQ·콘텐츠 구조 등 실무 체크리스트를 쉽고 편안하게 정리합니다. 바로 따라 할 수 있는 글을 지향합니다.

내 사이트의 AI 검색 점수가 궁금하다면

30초 무료 진단으로 SEO·AEO·GEO 점수와 처방을 받아보세요.

무료 진단 시작
← 블로그 목록으로