Google AI Overviews·Perplexity·ChatGPT Search가 "주택담보대출 금리 비교"·"갭투자 양도세 계산" 같은 쿼리를 처리할 때, 인용 후보 선별 기준은 일반 콘텐츠 대비 2단계 이상 엄격하다. LLM 파인튜닝 단계에서 YMYL(Your Money or Your Life) 범주는 별도 안전 가중치를 받으며, RLHF 레이블러도 저자 자격 확인 가능 여부를 핵심 신뢰 지표로 사용한다. 결과적으로 도메인 DA(Domain Authority)가 높아도, 저자 자격증명·법적 면책·출처 인용이 기계 파싱 가능한 구조화 데이터 형태로 없으면 인용 풀 자체에서 배제된다. 이 글은 부동산·금융 브랜드가 GEO 관점에서 놓치기 쉬운 구현 지점을 다룬다.
AI 엔진의 YMYL 인용 판단 메커니즘
인용 결정에 작용하는 구조적 신호
- 저자 자격증명 파싱 가능성: LLM은 평문 "공인중개사 10년 경력"보다
PersonJSON-LD에hasCredential·memberOf가 명시된 페이지를 우선 처리한다. — 왜: RAG 파이프라인이 출처 신뢰도를 자격 확인 가능성으로 계량하기 때문. — 어떻게: 저자 프로필 페이지에RealEstateAgent또는FinancialAdvisor타입 스키마 적용,hasCredential.recognizedBy기관명까지 명시. - 법적 면책 구조화:
disclaimer속성 없는 금융 분석글은 AI 엔진이 "검증되지 않은 주장"으로 분류할 수 있다. — 왜: 면책 부재 텍스트는 사실 보증으로 오독되어 liability 리스크가 높은 인용 후보로 취급됨. — 어떻게:ArticleJSON-LD에"disclaimer"필드 추가, 본문 상단aside마크업 병행. - 출처 URL 명시적 연결: "한국부동산원 2024년 4분기 통계 기준"처럼 공공기관 URL이 연결된 수치는 인용 확률이 높아진다. — 왜: 검색 증강 생성 엔진은 cited source chain을 재귀적으로 신뢰 평가함. — 어떻게: 출처 URL을
cite태그와citationJSON-LD 배열로 이중 표기.
FinancialProduct JSON-LD 구현
schema.org의 FinancialProduct·LoanOrCredit·RealEstateAgent 타입은 AI 크롤러가 부동산·금융 콘텐츠의 신뢰 구조를 파싱하는 데 직접 활용된다. 아래는 주택담보대출 비교 가이드에 적용하는 완성 예시다.
{
"@context": "https://schema.org",
"@type": "Article",
"name": "2024년 4분기 주택담보대출 금리 비교 가이드",
"url": "https://example-finance.co.kr/mortgage-rate-2024",
"datePublished": "2024-10-01",
"dateModified": "2024-12-15",
"disclaimer": "이 문서는 정보 제공 목적으로만 작성되었으며 투자 권유 또는 금융 조언을 구성하지 않습니다. 금융 의사결정 전 전문가와 상담하십시오.",
"author": {
"@type": "Person",
"name": "이재영",
"jobTitle": "공인재무설계사(CFP)",
"hasCredential": {
"@type": "EducationalOccupationalCredential",
"name": "CFP",
"credentialCategory": "전문 자격증",
"recognizedBy": {
"@type": "Organization",
"name": "한국FPSB",
"url": "https://www.fpsbkorea.org"
}
}
},
"publisher": {
"@type": "FinancialService",
"name": "예시 파이낸셜",
"url": "https://example-finance.co.kr",
"areaServed": { "@type": "Country", "name": "대한민국" }
},
"citation": [
{
"@type": "CreativeWork",
"name": "한국은행 기준금리 결정 공고 2024-11",
"url": "https://www.bok.or.kr/portal/main/contents.do?menuNo=200656"
}
],
"about": {
"@type": "LoanOrCredit",
"name": "주택담보대출",
"loanType": "Mortgage",
"currency": "KRW",
"feesAndCommissionsSpecification": "은행별 중도상환수수료 0~1.5% 별도 확인 필요"
}
}
AI 크롤러 접근 분리: robots.txt 설계
부동산·금융 사이트는 모든 AI 크롤러에 전면 허용하는 것이 최선이 아니다. 실시간 인용에 기여하는 크롤러(GPTBot, PerplexityBot, ClaudeBot, GoogleOther)와 순수 사전학습 크롤러(CCBot)를 분리해야 한다. 특히 고객 보고서·내부 분석 경로가 인덱싱되면 규제 리스크가 발생한다.
- 인용 엔진 허용: GPTBot·PerplexityBot·ClaudeBot은 공개 아티클·가이드 경로만 허용. — 왜: 이 크롤러들이 실시간 인용 풀을 구성하므로 차단 시 GEO 노출 불가. — 어떻게:
Allow: /articles/ Allow: /guides/를 명시적으로 선언. - 민감 경로 Disallow:
/client-reports/,/proprietary-data/,/internal/는 전 크롤러에 차단. — 왜: 비공개 금융 분석이 LLM 학습셋에 들어가면 정보 유출 및 금융당국 규정 위반 가능성. — 어떻게: robots.txt 상단에 와일드카드Disallow선언 후 허용 경로만 Allow로 오버라이드. - llms.txt 작성: 사이트 루트
/llms.txt에 브랜드 소개·핵심 인용 허용 URL·면책 문구 요약 기재. — 왜: Perplexity·Claude가 이 파일을 참조해 사이트 컨텍스트를 파악하는 사례가 확인됨(아직 비표준, 추정). — 어떻게: Markdown 형식으로 브랜드명, 서비스 설명, 인용 가능 URL 목록, 면책 한 줄 요약 포함.
SEO·AEO·GEO 부동산·금융 신호 비교
| 항목 | SEO (전통) | AEO (답변 엔진) | GEO (생성형 엔진) |
|---|---|---|---|
| 신뢰 신호 위치 | 백링크·도메인 권위 | FAQ 마크업·Featured Snippet | JSON-LD hasCredential·disclaimer |
| YMYL 심사 방식 | Quality Rater 수동 평가 | Snippet 자격 알고리즘 | LLM 파인튜닝 안전 가중치 |
| 면책 조항 처리 | UX 보조 요소 | 텍스트 근접 파싱 | JSON-LD 필드 기계 파싱 필수 |
| 저자 자격 확인 | 평문·이미지 허용 | 구조화 바이오 선호 | Person.hasCredential 강제 |
| 출처 인용 방식 | 외부 링크 앵커텍스트 | 출처 URL 텍스트 근접성 | citation JSON-LD 배열 |
흔한 오해: "면책 조항이 많을수록 AI 인용이 줄어든다"
실무에서 자주 나오는 판단 오류다. 면책 문구가 평문으로만 길게 늘어서 있으면 LLM이 해당 페이지 전체를 "불확실성 높은 콘텐츠"로 분류할 수 있다. 그러나 JSON-LD disclaimer 필드로 구조화된 면책은 정반대 효과를 낸다. AI 엔진 입장에서 면책의 존재 자체가 "이 페이지는 규제 환경을 인식하고 있는 전문 발행인"이라는 신호로 작용한다. 올바른 처리법: 본문 내 면책 텍스트를 줄이는 것이 아니라, JSON-LD disclaimer 키에 한 문장으로 기계 파싱 가능하게 명시하고, 본문 면책은 aside 태그로 래핑해 메인 콘텐츠와 분리한다.
FAQ 1: FinancialProduct JSON-LD를 적용하면 Google의 YMYL 페널티를 받을 수 있나요?
페널티와는 무관하다. Google의 YMYL 분류는 페이지를 불이익 주는 기준이 아니라 품질 심사 기준을 높이는 분류다. FinancialProduct 스키마를 적용하면 오히려 Rich Results(금융 상품 카드) 자격이 생기고, AI Overviews 인용 심사 시 구조화 데이터가 있는 쪽이 유리하다. 단, 스키마에 기재한 수치(금리·수수료)가 실제 페이지 본문과 불일치하면 Google Search Central의 Structured Data 품질 가이드 위반으로 Rich Results 자격이 박탈된다.
FAQ 2: 매물 상세 페이지 수백 개에 RealEstateListing 스키마를 전부 적용해야 GEO 효과가 있나요?
매물 상세 페이지보다 콘텐츠 허브(비교 가이드·시세 분석·지역 리포트) 페이지에 우선 적용하는 것이 GEO 관점에서 효율적이다. AI 엔진은 단일 매물 정보보다 "강남구 아파트 평균 전세가 동향" 같은 집계·분석 콘텐츠를 인용 후보로 선호한다. 매물 페이지는 RealEstateListing 스키마를 적용하되, AI 크롤러 접근을 robots.txt에서 허용하는 것만으로도 사전학습 데이터 품질에 기여한다. 실시간 인용 효과는 에디토리얼 콘텐츠 허브에서 먼저 측정하라.
참고 자료
이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.