AI 검색에서 '신뢰'는 어떻게 계산되는가

Google AI Overviews·Perplexity·ChatGPT Search가 특정 출처를 인용하고 다른 출처를 무시하는 결정은 전통적 PageRank 링크 그래프가 아닌 다층 신뢰 점수(multi-layer trust score) 파이프라인에 의해 이루어진다. 이 파이프라인은 학습 시점의 암묵적 인용 빈도, 실시간 검색에서의 소스 품질 필터, 구조화 데이터 파싱 결과, 교차 출처 클레임 일관성을 단계별로 적용해 '이 콘텐츠를 인용할 가치가 있는가'를 판단한다. SEO가 크롤러 가시성을 최적화하는 작업이라면, GEO는 LLM이 신뢰 가중치를 부여하는 경로 자체를 설계하는 작업이다.

신뢰 점수의 4계층 구조

AI 검색의 신뢰 판단은 단일 알고리즘이 아니라 파이프라인 단계별로 다른 신호를 적용한다.

학습 시점 암묵적 가중치(Training-time Prior)
- 왜: LLM은 사전 학습 코퍼스에서 특정 도메인이 다른 출처로부터 얼마나 자주 인용·참조됐는지를 기반으로 도메인별 내재적 신뢰도를 형성한다. Wikipedia·PubMed·Reuters 등 고인용 출처는 모델 가중치에 높은 사전 신뢰가 내장된다.
- 어떻게: 브랜드는 Wikipedia 엔트리 확보, 학술 인용, 주요 언론 보도를 통해 이 계층에 진입해야 한다. 커트오프 이전 콘텐츠 인덱싱 시점이 중요하다.
검색 단계 소스 필터링(Retrieval-time Authority Filter)
- 왜: Perplexity·Bing Copilot은 RAG 파이프라인에서 벡터 유사도만으로 출처를 선택하지 않는다. 도메인 평판·스팸 이력·HTTPS 여부를 조합한 소스 품질 스코어로 후보를 사전 필터링한다.
- 어떻게: Core Web Vitals 정상화, canonical URL 설정, 중복 콘텐츠 제거로 크롤러가 신뢰 가능한 단일 버전을 인식하도록 한다.
구조화 신호 파싱(Structured Signal Parsing)
- 왜: LLM과 RAG 시스템은 JSON-LD 스키마를 파싱해 저자·발행일·기관·주제 영역을 메타데이터로 추출한다. 비구조화 텍스트 대비 스키마 명시 콘텐츠는 속성 추출 정확도가 높아 신뢰 신호로 작용한다.
- 어떻게: Article·Organization·Person JSON-LD를 삽입하고, author.sameAs를 ORCID·LinkedIn 등 외부 검증 가능한 URL로 연결한다.
교차 출처 일관성(Cross-source Consistency)
- 왜: AI 답변 생성 단계에서 동일 주장이 여러 독립 출처에 일관되게 등장하면 해당 클레임의 confidence score가 상승한다. 단독 출처 주장은 인용돼도 '추정'으로 처리될 가능성이 높다.
- 어떻게: 브랜드 핵심 사실(창립연도·핵심 기능·수상 이력)을 Wikipedia·공식 보도자료·파트너 사이트에 동일하게 기재해 일관성 신호를 축적한다.

E-E-A-T 신호의 기술적 구현

Google E-E-A-T(Experience·Expertise·Authoritativeness·Trustworthiness)는 품질 평가 가이드라인에 명시된 개념이지만, AI Overviews 인용 결정에도 동일 신호가 적용된다고 추정된다(Google 공식 확인 없음, Semrush·Lily Ray 리서치 기반 추정).

Author 엔티티 연결: 저자가 Google 지식그래프에 엔티티로 등재된 경우 해당 저자의 글은 기관 신뢰의 일부를 위임받는다. author.sameAs에 Google Scholar·ORCID·Wikipedia URL을 병기한다.
Publisher 엔티티 일관성: Organization 스키마의 name·url·logo가 모든 하위 페이지에서 동일해야 한다. 불일치하면 크롤러가 별개 엔티티로 처리해 권위가 분산된다.
dateModified 갱신: 콘텐츠를 실질적으로 업데이트할 때마다 ISO 8601 형식으로 갱신한다. AI 검색은 freshness를 신뢰 보조 신호로 사용한다.

Article + Organization JSON-LD 구현 예시

{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@type": "Article",
      "@id": "https://citeon.cloud/blog/ai-trust-signals#article",
      "headline": "AI 검색에서 신뢰는 어떻게 계산되는가",
      "datePublished": "2026-06-18T09:00:00+09:00",
      "dateModified": "2026-06-18T09:00:00+09:00",
      "author": {
        "@type": "Person",
        "name": "이서연",
        "url": "https://citeon.cloud/team/seoyeon-lee",
        "sameAs": [
          "https://www.linkedin.com/in/seoyeon-lee",
          "https://orcid.org/0000-0002-1234-5678"
        ]
      },
      "publisher": {
        "@id": "https://citeon.cloud#organization"
      },
      "about": {
        "@type": "Thing",
        "name": "생성형 엔진 최적화",
        "sameAs": "https://en.wikipedia.org/wiki/Generative_engine_optimization"
      }
    },
    {
      "@type": "Organization",
      "@id": "https://citeon.cloud#organization",
      "name": "Citeon",
      "url": "https://citeon.cloud",
      "logo": {
        "@type": "ImageObject",
        "url": "https://citeon.cloud/images/logo.png",
        "width": 600,
        "height": 60
      },
      "sameAs": [
        "https://www.linkedin.com/company/citeon",
        "https://twitter.com/citeon_cloud"
      ]
    }
  ]
}

신뢰 신호 비교: 전통 SEO vs AEO vs GEO

신호 유형	전통 SEO	AEO(답변엔진최적화)	GEO(생성형엔진최적화)
1차 신뢰 지표	링크 그래프(PageRank)	Featured Snippet 선정 신호	학습 코퍼스 인용 빈도 + KG 엔티티
저자 신뢰	도메인 권위 간접 위임	E-E-A-T 품질 평가	Person 엔티티 KG 등재 여부
구조화 데이터 역할	리치 결과 UI 향상	FAQPage·HowTo 직접 답변 추출	속성 추출 정확도 향상 → 신뢰 가중
콘텐츠 신선도	크롤링 빈도 영향	datePublished 명시 권장	dateModified 갱신 + Freshness 신호
교차 검증	외부 백링크 수	인용 출처 다양성	독립 출처 간 클레임 일관성
측정 도구	Ahrefs DR, Moz DA	Rank Tracker Featured Snippet율	AI 답변 인용율(수동 쿼리 샘플링)

검증과 측정: AI 인용율 추적 방법

GEO에서 신뢰 신호의 효과는 전통 SEO처럼 단일 도구로 측정되지 않는다. 실무에서는 아래 방법을 조합한다.

쿼리 샘플링: 브랜드·제품·카테고리 키워드 50~100개를 ChatGPT, Perplexity, Google AI Overviews에 직접 입력하고, 월 단위로 인용 출처를 스프레드시트에 집계한다.
Perplexity API citations 배열 활용: Perplexity Pro API 응답 JSON의 citations 배열을 파싱해 인용 도메인 빈도를 자동 집계한다. 쿼리 루프와 결합하면 대규모 추적이 가능하다.
Google Search Console AI 트래픽 분리: AI Overviews 클릭은 일부 계정에서 쿼리 레포트의 ai_overview 어트리뷰션으로 구분 가능하다(2025년 이후 점진 제공).
구조화 데이터 파싱 오류 점검: Google Rich Results Test와 Schema.org Validator로 JSON-LD 오류를 주기적으로 확인한다. 파싱 오류는 신뢰 신호 자체가 전달되지 않음을 의미한다.

흔한 오해: "AI 검색 신뢰 = 백링크 수"

오해: 백링크를 많이 확보하면 AI 검색에서도 신뢰가 자동으로 높아진다.

사실: 전통 PageRank 신호는 AI 검색 인용 결정에 간접적으로만 영향을 미친다. 백링크가 많아도 아래 조건이 충족되지 않으면 AI Overviews 인용에서 제외된다.

콘텐츠가 LLM 학습 커트오프 이전에 충분히 인덱싱·인용됐는가(training-time prior 확보 여부)
출처 엔티티가 지식그래프에 명확히 등재되고 sameAs 링크로 연결됐는가
동일 클레임이 다른 독립 출처에서 교차 확인 가능한가

올바른 처리법: 백링크 확보와 병행해 (1) Organization·Article JSON-LD 구조화, (2) 저자 Person 엔티티 KG 등재, (3) Wikipedia·Wikidata sameAs 연결, (4) 핵심 주장의 멀티 소스 배포를 동시에 진행해야 한다. 링크 단독 전략은 AI 검색 신뢰 파이프라인의 절반 이상을 건너뛰는 셈이다.

Q. JSON-LD를 정상적으로 삽입했는데도 AI Overviews에 인용되지 않습니다. 어디서 막히는 건가요?

JSON-LD 삽입은 신뢰 신호의 필요조건이지 충분조건이 아닙니다. 인용 누락의 주요 원인은 세 가지입니다. 첫째, 해당 도메인이 Google 학습 코퍼스에 충분히 포함되지 않았을 가능성입니다. 신규 도메인은 training-time prior가 낮아 실시간 검색 단계에서 아무리 잘 최적화해도 생성 단계에서 낮은 가중치를 받습니다. 둘째, 동일 클레임을 교차 확인할 수 있는 독립 출처가 부족한 경우입니다. 단독 출처 주장은 confidence score가 낮아 인용 우선순위에서 밀립니다. 셋째, canonical 불일치나 중복 URL로 크롤러가 정규 버전을 특정하지 못하는 경우입니다. Google Search Console 인덱싱 커버리지와 Rich Results Test를 먼저 점검하고, 이후 Wikipedia·Wikidata sameAs 연결과 외부 언론 인용 확보를 병행하십시오.

Q. llms.txt를 작성하면 AI 검색 신뢰 점수에 직접적인 영향을 줍니까?

llms.txt는 2026년 6월 기준 Google·Bing 공식 크롤러 사양에 포함되지 않습니다. Anthropic Claude·Perplexity 일부 크롤러가 비공식적으로 참조한다는 보고가 있으나, 이것이 인용 가중치에 직접 반영되는지는 검증된 데이터가 없습니다. llms.txt의 실질적 역할은 AI 크롤러에게 콘텐츠 구조와 핵심 엔드포인트를 안내하는 것으로, robots.txt와 달리 차단보다 '유도' 목적입니다. 신뢰 점수 직접 상승보다는 올바른 콘텐츠 섹션이 수집될 가능성을 높이는 간접 효과로 이해하는 것이 정확합니다. 현 시점에서 JSON-LD 구조화와 엔티티 KG 연결에 우선순위를 두고, llms.txt는 보조 수단으로 운영하는 것이 합리적입니다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.