목숨 걸고 온톨로지 전문가 되기 1탄(지식그래프)_1

2026. 5. 11. 14:01·독서&지식

지식그래프 (저자 이강배 외)

최신 LLM과 기법을 통해 AI 에이전트를 구축해봐도 어딘지 조금 멍청하게 동작을 했던 경험이 있을 것입니다. 2026년 5월 현 시점에서 내 부족한 AI에이전트에게 무엇을 추가하면 성능이 급격히 상승할까요? 이미 만들어진 전문영역 AI Agent에게 더 성능좋은 LLM, AI Agent 설계 변화, 다양한 테스트를 통한 오작동 감소 등으로 큰 변화를 이룰 수 있을까요? 저는 현시점에서 지식그래프를 활용한 '온톨로지' 구축이 가장 자신있게 내놓을 수 있는 답 같습니다. 

 

현 시점에서 AI 기술은 '도구'에 가깝고, 중요한 것은 이 도구들을 기존 전문화된 데이터와 어떻게 연결학고 활용하여, 내 비지니스 문제를 해결하는 것이라고 생각합니다. 개인이 AI시대에 생존할 수 있는 꽤 괜찮은 방법 중 하나가 자신이 위치에 있는 다양한 정보를 구축해서 AI 서비스에 활용하는 것입니다. 그래서 저는 '온톨로지를 활용한 검색' 분야를 제 전문 분야로 계속적으로 공부하고 전문화하고자 합니다. 그 시작으로 '지식그래프' 관련 책을 공부했습니다.

 

1. 지식그래프란?

 

지식그래프는 보통 삼중항 형식으로 구성됨

주체, 관계, 객체 예) 세종대왕이 한글을 창제했다.

 

구분 설명 예시
노드 개체나 하옥을 나타냄 삼성, 메모리
엣지 노드 간의 관계를 나타냄 생산한다
속성 개체나 관계에 대한 추가 정보를 제공함 주소지, 제품 사양
라벨 노드와 엣지의 유형을 나타내는 태그 회사, 제품

 

온톨로지는 지식그래프를 구성하는 개체와 관계를 정의하는 설계도 혹은 청사진

 

속성이름 도메인(출발 클래스) 레인지(도착 클래스) 설명
hasOrigin Wine County 해당 와인의 원산지
importedBy Wine Importer 와인을 수입한 회사
pairedWith Wine Food 함께 곁들이는 음식
hasType Wine WineType 와인의 종류(레드/화이트 등)
hasYear Wine xsd:gYear 생산 연도
hasPrice Wine xsd:integer 가격 (원 단위)

 

 

2. LLM과 지식그래프 결합

1)LLM과 지식그래프결합 기대효과

사실 기반 응답제공 :신뢰할 수 있는 배경지식을 LLM에 제공

의미 기반 추론 강화 : 약물A-> 질병 B 치료, 질병 B -> 증상 C발생이며, LLM기반으로 약물 A가 증상 C에도 효과가 있다는 추론

용어의 모호성 해소 : 위약(모호한 단어) -> 설탕 알약, 식염수 주사

사용자의 질문의 명확화 : 약물X에 대한 임상시험 결과? -> 약물<->시험<->결과 구조 

설명 가능한 AI 구현 : 지식그래프는 노드와 엣지의 연결 구조를 통해 추론 경로를 시각화 가능

 

 

2)지식그래프를 활용한 LLM 보완 방법

출처: Pan, S., Luo, L., Wang, Y., Chen, C., Wang, J., & Wu, X. (2024). Unifying large language models and knowledge graphs: A roadmap. IEEE Transactions on Knowledge and Data Engineering, 36(7), 3580-3599.

 

지식그래프 강화 LLM

LLM이 잘못된 정보를 생성하는 오류를 보완하기 위해 지식그래프를 주입하는 방식

 

LLM 증강 지식그래프

지식그래프는 테스트 외 정보에 취약하고 누락된 사실도 많기 때문에, LLM을 통해 텍스트에서 개체와 관계를 추출하거나, 누락된 사실을 보완함

 

시너지 LLM + 지식그래프(Synergized LLMs + KGs)

지식검색, 질의응답, 추천 시스템에서 AI가 더 정확하고, 더 설명 가능하며, 더 신뢰할 수 있도록 발전하는 기반

 

 

3)LLM을 통해 지식그래프를 작성하거나 업데이트 및 품질을 관리할 수 있음

개체 및 관계 추출(노드와 엣지 자동생성)

관계 분류(추출된 관계 유형 분류, 예 인과관계, 소유 관계, 상하관계)

개체연결

지식그래프 작성 및 업데이트(품질관리)

 

3. 지식그래프 활용 사례

1) 구글의 지식그래프 기반 검색

기존 검색의 단점: 의미 파악 부재, 사용자 의도 미반영, 정보 연결 부족

2) 삼성 SDS의 지식그래프 기반의 통합 지식검색 플랫폼:Insight Engine

사내 흩어져 있ㄴ던 사업 제안서, 프로젝트 산출물, 기술 문서 등 다양한 문서와 메타데이터를 수집 분석하여 지식그래프로 구조화

3)AbbVie의 AI기반의 통합연구 데이터 분석 플랫폼: ARCH

내부 실험 데이터, 논문, 특허, 유전체 정보, 약물 데이터 등을 통합하여 하나의 지식 그래프 플랫폼 구축

4) Amazon 추천시스템

제품의 속성과 개체가 관계를 미리 정의해두고, 그 위에 실시간으로 수집된 데이터를 얹어 업데이트함으로써, 사용자의 요구에 빠르고 정확하게 대응함(이 사용자는 nvidia 그래픽카드를 쓴다 -> G-Sync 호환 모니터 추천)

5) 팔란티어: 산재된 지식을 전략으로

온톨로지와 지식그래프 기반의 데이터 플랫폼을 통해, 실시간 통찰을 제공하는 전략 시스템을 지향

 

4. 온톨로지 개념과 구축 과정

온톨로지의 단점: 도메인이 복잡할수록 온톨로지 설계와 유지보수가 어렵고, 도메인 변경에 따라 온톨로지를 주기적으로 갱신해야 함

 

스키마와 온톨로지 차이

구분 스키마 온톨로지
기본개념 데이터 구조를 정의, 어떤 데이터가 어떤 타입을 가지는지와 관계를 명시 도메인의 개체, 속성, 관계, 제약, 규칙 등을 포괄적으로 모델링, 의미론적 지식 표현을 목표로함
주 목적 데이터베이스 구조 정의 및 데이터 무경성 유지 지식 표현 및 추론 가능
모델링 대상 주로 '데이터' 자체 "개념"과 "개념 간 관계"
표현 방식 RDB 스키마(SQL, DDL), NoSQL스키마, 그래프 스키마 등 OWL, RDF, RDFS 등
예시 고객 테이블: 이름과 나이 커럼 포함 고객은 사람의 하위 클래스이고 구매 행동을 수행할 수 있음 등의 지식 모델

 

 

온톨로지와 지식그래프 특성 비교

온톨로지 지식그래프 특성
클래스 라벨 유형, 범주
인스턴스 노드 개체
관계 엣지 관계
속성 속성 추가 정보

 

온톨로지의 구축과정

1) 도메인 이해: 대상 도메인의 지식을 수집 및 분석

ex) 도메인 지식, 온톨로지 사용 목적 및 필요성, 기존 온톨로지 여부 확인

 

2) 범위 결정: 온톨로지가 다룰 개념과 범위의 명확한 정의

ex) 제공하고자 하는 목적과 사용 대상을 결정하여 구축 범위를 명확하게 정의

 

3) 개체 탐색: 온톨로지에 필요한 용어 수집 및 인스턴스(개체) 탐색

ex) 도메인 관련 용어사전,문헌, 웹페이지 등에서 데이터를 수집하고 용어를 추출하여 인스턴스를 찾아냄

 

4) 클래스/속성 정의: 중요한 항목들을 열거하고 클래스와 속성 정의

ex) 클래스, 인스턴스, 속성을 구분하고 정의함. 공통된 개념 또는 범주에 속한 것을 모아 클래스를 정의하고, 같은 클래스에 속한 인스턴스의 공통적인 정보를 찾아 속성을 정의함

 

5) 관계 정의: 클래스들 간의 계층 구조와 관계를 정의하여 구조화

ex) 클래스 간의 존재하는 상화관게, 포함 관계 등의 계층적 구조와 인과 관계, 행위 등의 비계층적 관계를 적절한 용어를 선택하여 제약 조건을 통핸 관계를 명확히 함

 

6) 표현 및 구현: 온톨로지 언어를 사용하여 형식으로 표현

ex) 정의된 클래스, 인스턴스, 속성, 관계를 온톨로지 ㅇ너어 및 구축 프로그램을 사용하여 형식적으로 표현하고 온톨로지 구축을 완성함. 이때 사용되는 대표적인 온톨로지 언어로는 RDF(Resource Description Framework)와 OWL(Web Ontology Language)이 있으며, LOD(Linked Open Data), Topic Map 등을 사용하여 구축합니다.

 

7) 검증 및 평가: 온톨로지가 도메인의 지식을 정확하게 표현하는지 확인

ex) 온톨로지가 정상적으로 잗공하고 제기능을 발휘하는지 검증하고 테스트함

 

8) 배표 및 유지보수: 온톨로지를 활용하고, 필요에 따라 업데이트

도메인의 변화나 추가적인 요구 사항에 맞춰 유지보수 및 업데이트를 진행함

'독서&지식' 카테고리의 다른 글

랭체인 에이전트 및 도구, Pydantic 스키마로 구조화된 입력받기, ReAct  (0) 2026.04.03
랭체인 프롬프트, 모델, 출력파서, 랭체인 허브  (1) 2026.04.02
국회 예산안 및 결산안 심사 과정  (0) 2026.03.31
법률 관련 사이트 및 API 정보  (0) 2026.01.28
법률안 서비스 관련 배경 지식(법률 제정 및 개정 지식)  (1) 2026.01.26
'독서&지식' 카테고리의 다른 글
  • 랭체인 에이전트 및 도구, Pydantic 스키마로 구조화된 입력받기, ReAct
  • 랭체인 프롬프트, 모델, 출력파서, 랭체인 허브
  • 국회 예산안 및 결산안 심사 과정
  • 법률 관련 사이트 및 API 정보
AI강선생
AI강선생
AI강선생의 블로그 입니다.
  • AI강선생
    나의 배움과 성장의 궤적
    AI강선생
  • 전체
    오늘
    어제
    • 분류 전체보기 (66) N
      • 강의&프로젝트 (48)
      • 독서&지식 (9) N
      • 생각과다짐 (9)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    Rag
    길벗
    Claude
    혼공바이브코딩
    국회
    랭체인
    PostgreSQL
    spring
    지식그래프
    java
    rustfs
    오레일리
    docker
    llmagent
    AI agent
    클로드코드
    유리링
    FastAPI
    온톨로지
    claude code
    AI에이전트
    에이전트
    cursor
    멀티에이전트
    랭그래프
    챌린지
    한빛미디어
    게임기획
    인프런
    이지스퍼블리싱
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
AI강선생
목숨 걸고 온톨로지 전문가 되기 1탄(지식그래프)_1
상단으로

티스토리툴바