엔티티(Entity)와 지식그래프, 브랜드에 왜 중요한가

Google AI Overviews·Perplexity·ChatGPT Search가 브랜드를 답변에 포함할지 결정할 때, 이 시스템들은 키워드 빈도가 아니라 엔티티(entity) 노드와 그 속성·관계망을 기준으로 판단한다. Google 지식그래프(Knowledge Graph)는 약 5000억 개의 사실을 엔티티-관계 트리플(subject-predicate-object) 형태로 저장하며, LLM은 사전학습 단계에서 이 구조를 가중치로 압축한다. 브랜드가 이 그래프 안에서 식별 가능한 노드로 존재하지 않으면, 답변엔진은 해당 브랜드를 신뢰할 수 있는 인용 후보로 처리하지 않는다.

엔티티와 지식그래프의 작동 원리

지식그래프에서 엔티티는 고유 식별자를 가진 추상 객체다. "삼성전자"라는 문자열이 엔티티가 아니라, Wikidata QID Q20716으로 참조되는 노드가 엔티티다. 이 구분이 GEO 전략의 출발점이다.

엔티티 링킹(Entity Linking): 웹 문서 텍스트 내 언급("삼성전자의 갤럭시...")을 KG 노드에 연결하는 과정. 왜 — "삼성", "Samsung", "삼성전자㈜" 세 가지 표기를 단일 엔티티로 집계할 수 있어 브랜드 권위 신호가 분산되지 않기 때문. 어떻게 — Google Natural Language API가 salience 점수와 Wikipedia URL을 기반으로 후보 엔티티를 선택하고, sameAs 클루로 최종 연결한다.
트리플 스토어(Triple Store): (삼성전자, 설립연도, 1969) 형식으로 속성을 저장. 왜 — LLM이 사전학습 중 이 트리플을 반복 접하면서 "삼성전자는 1969년 설립"을 파라미터에 압축 저장하기 때문. 어떻게 — Schema.org의 foundingDate, legalName, numberOfEmployees가 트리플 공급원 역할을 한다.
엔티티 현저성(Entity Salience): RAG 파이프라인에서 쿼리 엔티티와 문서 엔티티가 일치할수록 유사도 점수가 높아짐. 왜 — dense retrieval 임베딩이 TF-IDF 대비 엔티티 공유를 더 강하게 반영하기 때문. 어떻게 — 브랜드명·제품명·핵심 토픽 엔티티가 문서 전반에 일관되게 등장해야 상위 청크에 포함된다.

브랜드 엔티티 구축 방법 — sameAs와 KG 등재

브랜드 엔티티를 KG에 확보하는 직접 경로는 세 가지다: Wikidata 등재, Wikipedia 항목 생성, 공식 사이트 JSON-LD에 sameAs 연결.

Wikidata 등재: Wikidata는 Google KG의 핵심 데이터 공급원이다. 왜 — Google은 Wikidata QID를 엔티티 표준 식별자로 사용하며, QID가 있는 브랜드는 Knowledge Panel 생성 가능성이 높아진다. 어떻게 — 신규 항목 생성 시 P31(instance of: Q4830453 business), P18(logo), P856(official website), P571(inception date) 등 최소 속성 4개 이상 입력.
sameAs 마크업: 공식 사이트 Organization JSON-LD에 Wikidata·Wikipedia·LinkedIn·Crunchbase URL을 sameAs 배열로 포함. 왜 — Google의 엔티티 조정(entity reconciliation) 알고리즘이 sameAs를 "이 도메인의 퍼블리셔 = 이 KG 노드" 확인 신호로 사용하기 때문. 어떻게 — 아래 코드 예시 참조.
NAP 일관성(Name-Address-Phone): 브랜드명·주소·연락처를 Google Business Profile, 공식 사이트, 언론 보도 전반에서 동일하게 유지. 왜 — 엔티티 링킹 알고리즘이 속성 일관성을 노드 병합 신뢰 신호로 사용하기 때문. 어떻게 — 브랜드 표기 가이드라인을 문서화하고 모든 퍼블릭 채널에 적용한다.

{
  "@context": "https://schema.org",
  "@type": "Organization",
  "@id": "https://example.com/#organization",
  "name": "Citeon",
  "legalName": "시테온 주식회사",
  "url": "https://example.com",
  "logo": {
    "@type": "ImageObject",
    "url": "https://example.com/logo.png"
  },
  "foundingDate": "2022",
  "address": {
    "@type": "PostalAddress",
    "streetAddress": "테헤란로 123",
    "addressLocality": "강남구",
    "addressRegion": "서울특별시",
    "postalCode": "06234",
    "addressCountry": "KR"
  },
  "sameAs": [
    "https://www.wikidata.org/wiki/Q{YOUR_QID}",
    "https://ko.wikipedia.org/wiki/시테온",
    "https://www.linkedin.com/company/citeon",
    "https://www.crunchbase.com/organization/citeon"
  ],
  "knowsAbout": [
    "https://www.wikidata.org/wiki/Q2539298",
    "https://www.wikidata.org/wiki/Q1133560"
  ]
}

@id에 URL + fragment를 사용하는 이유는, 동일 페이지 내 다른 스키마(WebSite, BreadcrumbList)가 이 조직을 publisher 또는 author로 참조할 때 중복 정의 없이 연결할 수 있기 때문이다. knowsAbout에 Wikidata QID URL을 포함하면 브랜드의 전문 영역을 KG 노드로 명시적으로 선언할 수 있다.

GEO 인용에서 엔티티 신호가 작동하는 방식

Perplexity·ChatGPT Search의 RAG 파이프라인은 쿼리 엔티티와 문서 엔티티의 매칭을 핵심 관련성 신호로 사용한다. 이 매칭이 작동하려면 브랜드 엔티티가 웹 전반에서 일관된 속성으로 언급되어야 한다.

엔티티 공동 출현(Co-occurrence): 특정 토픽 엔티티와 브랜드 엔티티가 동일 문서에서 함께 등장할수록, 그 토픽 관련 쿼리에서 브랜드 인용 가능성이 높아진다. 왜 — LLM 임베딩 공간에서 공동 출현 빈도는 의미적 거리와 직결되기 때문. 어떻게 — 콘텐츠 계획 시 키워드 대신 토픽의 Wikidata QID를 기준으로 삼는다.
엔티티 속성 완전성(Attribute Completeness): KG에 브랜드의 설립일·대표자·서비스 분류·수상 이력이 구조화 데이터로 존재할수록 LLM이 신뢰 가능한 인용 대상으로 처리한다. 왜 — 속성이 풍부한 엔티티는 사전학습 데이터에서 더 빈번하고 다양한 문장으로 표현되어 파라미터에 더 강하게 인코딩되기 때문(추정). 어떻게 — Schema.org Organization 타입에 매핑 가능한 속성을 최대한 JSON-LD로 표현한다.
권위 있는 외부 언급(Authoritative Mention): 언론사·업계 DB·나무위키에서 브랜드 엔티티가 독립적으로 언급되면 KG 신뢰도가 높아진다. 왜 — Google의 E-E-A-T 신호가 엔티티 신뢰도 판단에도 적용되기 때문. 어떻게 — 업계 미디어 기고, 공식 보도자료 배포, 업계 협회 디렉토리 등재.

검증과 측정

Knowledge Graph Search API

Google KG Search API(kgsearch.googleapis.com/v1/entities:search)를 사용해 브랜드명으로 엔티티를 조회한다. 왜 — 응답의 detailPageUrl 필드가 존재하면 Knowledge Panel 대상 엔티티로 등재된 것이기 때문. 어떻게 — 무료 API 키 발급 후 query 파라미터에 브랜드명 입력, resultScore와 @type을 확인한다. 응답에 Organization 또는 Corporation 타입이 없으면 Wikidata 등재 또는 sameAs 보강이 필요하다.

AI 답변 모니터링

Perplexity에서 브랜드 관련 쿼리를 정기 실행하고 인용 여부와 설명 정확성을 추적한다. 왜 — KG 상태와 LLM 인용 여부 사이에 수 주에서 수 개월의 시차가 존재하기 때문에 주기적 측정이 필요하다. 어떻게 — 브랜드명·대표 서비스명·CEO명 등 핵심 엔티티 쿼리 목록을 주 1회 실행해 변화를 추적한다.

SEO·AEO·GEO에서 엔티티 처리 방식 비교

관점	전통 SEO	AEO (답변엔진최적화)	GEO (생성형엔진최적화)
타겟 시스템	크롤러·색인기	구조화 데이터 파서	LLM 추론·RAG 레이어
핵심 신호	키워드·백링크 권위	FAQPage·HowTo 스키마	엔티티 노드·sameAs 일관성
엔티티 역할	순위 신호 중 하나	rich result 트리거 조건	인용 여부 결정의 핵심 앵커
브랜드 인식	도메인 권위(DA/DR)	구조화 QA 매칭	KG 노드 존재·속성 완전성
측정 도구	GSC 클릭수·순위	rich result 테스트·노출	KG API·AI 답변 인용 추적

흔한 오해 — "키워드 밀도를 높이면 엔티티 신호가 강해진다"

키워드 반복은 엔티티 신호와 무관하다. 엔티티는 텍스트 표면형("AI 마케팅")이 아니라 KG 노드(QID)와의 연결로 결정된다. "AI 마케팅"을 20회 반복한 페이지는, 해당 개념의 Wikidata QID를 JSON-LD knowsAbout에 한 번 명시한 페이지보다 엔티티 신호가 약할 수 있다. 올바른 처리법: (1) 타겟 토픽의 Wikidata QID를 확인한다. (2) JSON-LD about 또는 knowsAbout에 해당 QID URL을 포함한다. (3) 본문에서는 Wikidata label에 해당하는 공식 명칭을 일관되게 사용한다. 이 세 가지가 키워드 반복보다 엔티티 신호를 훨씬 강하게 만든다.

Google Knowledge Panel이 생성되려면 얼마나 걸리나요?

확정된 공식 타임라인은 없다. Wikidata 등재 후 Google이 해당 QID를 크롤링·처리하는 데 통상 수 주에서 수 개월이 소요된다는 것이 사례 기반 추정이다. 가속 조건은 (1) 공식 사이트 JSON-LD sameAs에 Wikidata URL 포함, (2) 언론 보도·Wikipedia 문서에서 독립적 언급 존재, (3) Google Business Profile 인증 완료다. Google은 Knowledge Panel 생성을 보장하지 않으며, 엔티티의 notability(주목성)를 내부 기준으로 판단한다. Knowledge Panel이 생성되지 않더라도 KG 노드가 존재하면 AI Overviews 인용 가능성은 높아진다.

sameAs에 포함할 URL의 우선순위는 어떻게 됩니까?

Google이 공식 순위를 공개하지는 않으나, 실무 패턴 기반 우선순위는 다음과 같다. (1) Wikidata URL — KG 직접 연결, 최우선. (2) Wikipedia — Google이 높은 권위를 부여하는 것이 관찰된다. (3) Google Business Profile URL — 로컬 엔티티 및 Knowledge Panel과 직접 연결. (4) LinkedIn, Crunchbase — 비즈니스 엔티티 신뢰도 보강. (5) 업계 디렉토리(Forbes, Bloomberg 프로필 등). sameAs 배열에는 실제 운영 중인 URL만 포함해야 하며, HTTP 404를 반환하는 URL은 포함하지 않는 것이 권고된다.

참고 자료

이 글의 권고는 아래 공식 문서·연구를 근거로 합니다.