웹 콘텐츠가 검색 엔진과 LLM 양쪽에서 신뢰할 수 있는 출처로 인식되려면, 저자·날짜·출처 세 가지 메타데이터가 기계가 파싱할 수 있는 형태로 HTML과 구조화 데이터 양쪽에 일관되게 존재해야 한다. Google은 이를 E-E-A-T(Experience·Expertise·Authoritativeness·Trustworthiness) 평가 항목으로 처리하고, GPTBot·ClaudeBot·PerplexityBot 등 AI 크롤러는 이 정보를 이용해 콘텐츠의 인용 가치를 판단한다. HTML 가시 텍스트에만 저자명을 표시하고 구조화 데이터에는 누락하면, 두 계층 모두에서 신뢰 신호가 약화된다.
1. 신뢰 신호가 크롤러와 LLM에 미치는 메커니즘
Google 품질 평가 기준(Search Quality Rater Guidelines)에서 E-E-A-T는 페이지 단위가 아닌 저자 엔티티 단위로 평가된다. 저자 엔티티가 Knowledge Graph와 연결되면 신뢰 신호가 사이트 전체로 전파된다. AI 크롤러는 대부분 JavaScript를 실행하지 않고 원시 HTML과 <head> 내 JSON-LD를 파싱하므로, 구조화 데이터에 빠진 정보는 LLM 학습 및 인용 선택 단계에서 누락될 수 있다.
- 저자 엔티티 연결:
schema:Person의sameAs로 Wikipedia·LinkedIn·ORCID를 연결하면 Google이 해당 저자를 Knowledge Graph 노드로 처리한다. 왜: 익명 byline보다 외부 엔티티가 연결된 저자가 E-E-A-T 신호를 더 강하게 전달하기 때문. 어떻게:"sameAs": ["https://www.linkedin.com/in/yourname"]배열 추가. - 날짜 신선도 신호:
dateModified가 최신이면 Google 크롤러 재방문 주기가 단축되고, AI 인용 시 "최신 정보"로 분류될 가능성이 높아진다. 왜: 명시적 날짜 없이는 크롤러가 fresh/stale 판단 자체를 하지 못하기 때문. 어떻게: 실질적 내용 변경이 있을 때만 갱신(날짜 인플레이션 방지). - 출처·인용 권위:
citation프로퍼티나 외부 권위 링크는 콘텐츠 주장의 증거 사슬을 기계가 추적할 수 있게 한다. 왜: AI 모델이 인용 가능한 출처를 선택하는 기준 중 하나가 "주장에 연결된 외부 참조"이기 때문. 어떻게: 핵심 수치·연구 결과마다 원문 URL을href로 연결.
2. JSON-LD Article 스키마 구현
Article(또는 TechArticle) 타입을 사용해 저자·날짜·발행사를 구조화 데이터로 선언한다. Google Rich Results Test와 Schema Markup Validator 양쪽에서 오류 없이 통과해야 유효하다.
{
"@context": "https://schema.org",
"@type": "TechArticle",
"headline": "콘텐츠 신뢰 신호 세팅 가이드",
"datePublished": "2026-06-18",
"dateModified": "2026-06-18",
"author": {
"@type": "Person",
"name": "정유진",
"url": "https://citeon.co.kr/authors/yujin-jung",
"sameAs": [
"https://www.linkedin.com/in/yujin-jung-seo",
"https://orcid.org/0000-0002-1825-0097"
]
},
"publisher": {
"@type": "Organization",
"name": "Citeon",
"url": "https://citeon.co.kr",
"logo": {
"@type": "ImageObject",
"url": "https://citeon.co.kr/logo.png",
"width": 200,
"height": 60
}
},
"mainEntityOfPage": {
"@type": "WebPage",
"@id": "https://citeon.co.kr/blog/trust-signals-guide"
},
"citation": [
{
"@type": "CreativeWork",
"name": "Google Search Quality Rater Guidelines",
"url": "https://static.googleusercontent.com/media/guidelines.raterhub.com/en//searchqualityevaluatorguidelines.pdf"
}
]
}
3. HTML 레이어 — <time> 태그와 byline 마크업
구조화 데이터만으로는 부족하다. 가시 HTML과 JSON-LD 값이 일치해야 Google의 페이지 레벨 일관성 검사를 통과한다. AI 크롤러도 JSON-LD가 없는 경우 <time> 태그와 rel="author"를 fallback으로 파싱한다.
<time datetime="...">: ISO 8601 형식(2026-06-18)을datetime속성에 명시. 왜: 화면 표시 텍스트("2026년 6월 18일")와 기계 파싱 값을 분리해 다국어 환경에서도 날짜 오인식을 방지. 어떻게:<time datetime="2026-06-18T09:00:00+09:00">2026년 6월 18일</time>.- 저자 byline
rel="author": 저자 프로필 링크에 이 속성을 추가하면 Google이 해당 링크를 저자 엔티티 허브로 취급한다. 왜:rel="author"없이href만 있으면 일반 앵커로 처리되어 저자 신호가 전달되지 않음. 어떻게:<a href="/authors/yujin-jung" rel="author">정유진</a>.
4. HTTP 레이어 신호 — Last-Modified와 sitemap lastmod
HTTP 헤더와 sitemap은 크롤러가 HTML 파싱 전에 읽는 신호다. JSON-LD와 값이 불일치하면 크롤러가 어느 쪽도 신뢰하지 않을 수 있다.
- HTTP
Last-Modified헤더: 서버가 실제 콘텐츠 변경 시각을 RFC 7231 형식으로 반환. 왜: Googlebot은If-Modified-Since조건부 요청으로 이 값을 확인해 재크롤링 여부를 결정하므로 크롤 예산이 절감됨. 어떻게: Next.js API Route에서res.setHeader('Last-Modified', new Date(article.updatedAt).toUTCString()). - sitemap.xml
<lastmod>:dateModified와 동일 값 유지. 왜: 불일치 발생 시 GSC가 크롤 예산을 낭비하고 "sitemap 오류" 경고를 기록. 어떻게: CMS 저장 훅에서 sitemap 자동 재생성을 트리거해 세 값(JSON-LD·<time>·lastmod)이 항상 동기화되도록.
5. 신뢰 신호 채널별 비교 및 검증 도구
| 신호 유형 | SEO(Google 랭킹) | AEO(Featured Snippet) | GEO(AI 인용) | 검증 도구 |
|---|---|---|---|---|
| JSON-LD Person + sameAs | E-E-A-T 저자 신호 | byline 노출 가능 | 인용 출처 저자 표기 | Rich Results Test |
| datePublished / dateModified | 크롤 빈도·신선도 | 날짜 배지 노출 | 최신성 판단 기준 | Schema Markup Validator |
| sameAs (Wikipedia/ORCID) | Knowledge Graph 연결 | 저자 패널 트리거 | 엔티티 신뢰도 상승 | Google Knowledge Panel 확인 |
| citation 프로퍼티 | 직접 신호 미약 | 간접 신호 | 주장 검증 가능성 상승 | Schema Markup Validator |
| HTTP Last-Modified | 크롤 예산 최적화 | 간접 효과 | 간접 효과 | curl -I 헤더 확인 |
흔한 오해 — dateModified 날짜 인플레이션
오해: 본문 내용을 수정하지 않아도 dateModified를 오늘 날짜로 바꾸면 크롤링 빈도가 높아지고 랭킹에 유리하다.
사실: Google은 실제 콘텐츠 변화 여부를 ETag와 Last-Modified로 교차 검증한다. JSON-LD의 dateModified만 갱신하고 본문이 동일하면, Googlebot이 "허위 신선도" 패턴으로 처리해 해당 사이트의 날짜 신호 신뢰도 전체를 하락시킬 수 있다. 올바른 처리: 수치 업데이트·섹션 추가·오류 수정 등 실질적 변경이 있을 때만 dateModified와 서버 Last-Modified를 동시에 갱신한다.
Q. 저자가 외부 필진(프리랜서)일 때 sameAs에 자사 도메인 URL을 넣어도 되나요?
sameAs의 목적은 저자 엔티티를 외부 Knowledge Graph(Wikipedia, ORCID, LinkedIn, Wikidata)와 연결하는 것이다. 자사 도메인 내부 URL(https://citeon.co.kr/authors/john)은 sameAs가 아닌 url 프로퍼티에 넣어야 한다. 외부 필진이 LinkedIn·ORCID 계정을 보유하면 해당 URL을 sameAs에 추가하고, 없다면 sameAs를 생략하고 name과 url만 선언해도 무방하다. sameAs에 내부 URL을 넣으면 Knowledge Graph 연결 효과가 없으며, 순환 참조 경고가 발생할 수 있다.
Q. datePublished와 dateModified 값이 같으면 후자를 생략해도 되나요?
생략하지 않고 동일한 ISO 8601 값으로 명시하는 것이 권장된다. dateModified가 없으면 Google은 크롤 시각을 수정 시각으로 추정하는데, 이는 실제 발행일보다 늦어질 수 있어 신선도 신호가 불리하게 계산된다. PerplexityBot 등 AI 크롤러는 dateModified가 없을 때 datePublished를 fallback으로 사용하지만, 구현체에 따라 날짜 자체를 파싱하지 못하는 경우도 있다. 신규 발행 시 두 필드를 동일 값으로 초기화하고, 이후 수정 시에만 dateModified를 갱신하는 패턴이 가장 안전하다.
참고 자료
이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.