Citeon
개념 심화

AI 검색에서 '신뢰'는 어떻게 계산되는가

이서연
이서연 · GEO 전략 리드

Google AI Overviews·Perplexity·ChatGPT Search가 특정 출처를 인용하고 다른 출처를 무시하는 결정은 전통적 PageRank 링크 그래프가 아닌 다층 신뢰 점수(multi-layer trust score) 파이프라인에 의해 이루어진다. 이 파이프라인은 학습 시점의 암묵적 인용 빈도, 실시간 검색에서의 소스 품질 필터, 구조화 데이터 파싱 결과, 교차 출처 클레임 일관성을 단계별로 적용해 '이 콘텐츠를 인용할 가치가 있는가'를 판단한다. SEO가 크롤러 가시성을 최적화하는 작업이라면, GEO는 LLM이 신뢰 가중치를 부여하는 경로 자체를 설계하는 작업이다.

신뢰 점수의 4계층 구조

AI 검색의 신뢰 판단은 단일 알고리즘이 아니라 파이프라인 단계별로 다른 신호를 적용한다.

  1. 학습 시점 암묵적 가중치(Training-time Prior)
    • 왜: LLM은 사전 학습 코퍼스에서 특정 도메인이 다른 출처로부터 얼마나 자주 인용·참조됐는지를 기반으로 도메인별 내재적 신뢰도를 형성한다. Wikipedia·PubMed·Reuters 등 고인용 출처는 모델 가중치에 높은 사전 신뢰가 내장된다.
    • 어떻게: 브랜드는 Wikipedia 엔트리 확보, 학술 인용, 주요 언론 보도를 통해 이 계층에 진입해야 한다. 커트오프 이전 콘텐츠 인덱싱 시점이 중요하다.
  2. 검색 단계 소스 필터링(Retrieval-time Authority Filter)
    • 왜: Perplexity·Bing Copilot은 RAG 파이프라인에서 벡터 유사도만으로 출처를 선택하지 않는다. 도메인 평판·스팸 이력·HTTPS 여부를 조합한 소스 품질 스코어로 후보를 사전 필터링한다.
    • 어떻게: Core Web Vitals 정상화, canonical URL 설정, 중복 콘텐츠 제거로 크롤러가 신뢰 가능한 단일 버전을 인식하도록 한다.
  3. 구조화 신호 파싱(Structured Signal Parsing)
    • 왜: LLM과 RAG 시스템은 JSON-LD 스키마를 파싱해 저자·발행일·기관·주제 영역을 메타데이터로 추출한다. 비구조화 텍스트 대비 스키마 명시 콘텐츠는 속성 추출 정확도가 높아 신뢰 신호로 작용한다.
    • 어떻게: Article·Organization·Person JSON-LD를 삽입하고, author.sameAs를 ORCID·LinkedIn 등 외부 검증 가능한 URL로 연결한다.
  4. 교차 출처 일관성(Cross-source Consistency)
    • 왜: AI 답변 생성 단계에서 동일 주장이 여러 독립 출처에 일관되게 등장하면 해당 클레임의 confidence score가 상승한다. 단독 출처 주장은 인용돼도 '추정'으로 처리될 가능성이 높다.
    • 어떻게: 브랜드 핵심 사실(창립연도·핵심 기능·수상 이력)을 Wikipedia·공식 보도자료·파트너 사이트에 동일하게 기재해 일관성 신호를 축적한다.

E-E-A-T 신호의 기술적 구현

Google E-E-A-T(Experience·Expertise·Authoritativeness·Trustworthiness)는 품질 평가 가이드라인에 명시된 개념이지만, AI Overviews 인용 결정에도 동일 신호가 적용된다고 추정된다(Google 공식 확인 없음, Semrush·Lily Ray 리서치 기반 추정).

Article + Organization JSON-LD 구현 예시

{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@type": "Article",
      "@id": "https://citeon.cloud/blog/ai-trust-signals#article",
      "headline": "AI 검색에서 신뢰는 어떻게 계산되는가",
      "datePublished": "2026-06-18T09:00:00+09:00",
      "dateModified": "2026-06-18T09:00:00+09:00",
      "author": {
        "@type": "Person",
        "name": "이서연",
        "url": "https://citeon.cloud/team/seoyeon-lee",
        "sameAs": [
          "https://www.linkedin.com/in/seoyeon-lee",
          "https://orcid.org/0000-0002-1234-5678"
        ]
      },
      "publisher": {
        "@id": "https://citeon.cloud#organization"
      },
      "about": {
        "@type": "Thing",
        "name": "생성형 엔진 최적화",
        "sameAs": "https://en.wikipedia.org/wiki/Generative_engine_optimization"
      }
    },
    {
      "@type": "Organization",
      "@id": "https://citeon.cloud#organization",
      "name": "Citeon",
      "url": "https://citeon.cloud",
      "logo": {
        "@type": "ImageObject",
        "url": "https://citeon.cloud/images/logo.png",
        "width": 600,
        "height": 60
      },
      "sameAs": [
        "https://www.linkedin.com/company/citeon",
        "https://twitter.com/citeon_cloud"
      ]
    }
  ]
}

신뢰 신호 비교: 전통 SEO vs AEO vs GEO

신호 유형 전통 SEO AEO(답변엔진최적화) GEO(생성형엔진최적화)
1차 신뢰 지표 링크 그래프(PageRank) Featured Snippet 선정 신호 학습 코퍼스 인용 빈도 + KG 엔티티
저자 신뢰 도메인 권위 간접 위임 E-E-A-T 품질 평가 Person 엔티티 KG 등재 여부
구조화 데이터 역할 리치 결과 UI 향상 FAQPage·HowTo 직접 답변 추출 속성 추출 정확도 향상 → 신뢰 가중
콘텐츠 신선도 크롤링 빈도 영향 datePublished 명시 권장 dateModified 갱신 + Freshness 신호
교차 검증 외부 백링크 수 인용 출처 다양성 독립 출처 간 클레임 일관성
측정 도구 Ahrefs DR, Moz DA Rank Tracker Featured Snippet율 AI 답변 인용율(수동 쿼리 샘플링)

검증과 측정: AI 인용율 추적 방법

GEO에서 신뢰 신호의 효과는 전통 SEO처럼 단일 도구로 측정되지 않는다. 실무에서는 아래 방법을 조합한다.

흔한 오해: "AI 검색 신뢰 = 백링크 수"

오해: 백링크를 많이 확보하면 AI 검색에서도 신뢰가 자동으로 높아진다.

사실: 전통 PageRank 신호는 AI 검색 인용 결정에 간접적으로만 영향을 미친다. 백링크가 많아도 아래 조건이 충족되지 않으면 AI Overviews 인용에서 제외된다.

올바른 처리법: 백링크 확보와 병행해 (1) Organization·Article JSON-LD 구조화, (2) 저자 Person 엔티티 KG 등재, (3) Wikipedia·Wikidata sameAs 연결, (4) 핵심 주장의 멀티 소스 배포를 동시에 진행해야 한다. 링크 단독 전략은 AI 검색 신뢰 파이프라인의 절반 이상을 건너뛰는 셈이다.

Q. JSON-LD를 정상적으로 삽입했는데도 AI Overviews에 인용되지 않습니다. 어디서 막히는 건가요?

JSON-LD 삽입은 신뢰 신호의 필요조건이지 충분조건이 아닙니다. 인용 누락의 주요 원인은 세 가지입니다. 첫째, 해당 도메인이 Google 학습 코퍼스에 충분히 포함되지 않았을 가능성입니다. 신규 도메인은 training-time prior가 낮아 실시간 검색 단계에서 아무리 잘 최적화해도 생성 단계에서 낮은 가중치를 받습니다. 둘째, 동일 클레임을 교차 확인할 수 있는 독립 출처가 부족한 경우입니다. 단독 출처 주장은 confidence score가 낮아 인용 우선순위에서 밀립니다. 셋째, canonical 불일치나 중복 URL로 크롤러가 정규 버전을 특정하지 못하는 경우입니다. Google Search Console 인덱싱 커버리지와 Rich Results Test를 먼저 점검하고, 이후 Wikipedia·Wikidata sameAs 연결과 외부 언론 인용 확보를 병행하십시오.

Q. llms.txt를 작성하면 AI 검색 신뢰 점수에 직접적인 영향을 줍니까?

llms.txt는 2026년 6월 기준 Google·Bing 공식 크롤러 사양에 포함되지 않습니다. Anthropic Claude·Perplexity 일부 크롤러가 비공식적으로 참조한다는 보고가 있으나, 이것이 인용 가중치에 직접 반영되는지는 검증된 데이터가 없습니다. llms.txt의 실질적 역할은 AI 크롤러에게 콘텐츠 구조와 핵심 엔드포인트를 안내하는 것으로, robots.txt와 달리 차단보다 '유도' 목적입니다. 신뢰 점수 직접 상승보다는 올바른 콘텐츠 섹션이 수집될 가능성을 높이는 간접 효과로 이해하는 것이 정확합니다. 현 시점에서 JSON-LD 구조화와 엔티티 KG 연결에 우선순위를 두고, llms.txt는 보조 수단으로 운영하는 것이 합리적입니다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.

이서연
이서연 · GEO 전략 리드

AI 검색(AEO·GEO) 전략과 구글·네이버 공식 가이드 해석을 담당합니다. 측정에서 매출까지 잇는 풀퍼널 관점으로 글을 씁니다.

내 사이트의 AI 검색 점수가 궁금하다면

30초 무료 진단으로 SEO·AEO·GEO 점수와 처방을 받아보세요.

무료 진단 시작
← 블로그 목록으로