본문 바로가기
샘터 독서창고

팔란티어 해부하기 muon4u

by 행복한게이 2024. 12. 30.

https://www.srr.kr/security/%ED%8C%94%EB%9E%80%ED%8B%B0%EC%96%B4-%ED%95%B4%EB%B6%80%ED%95%98%EA%B8%B0---1%EB%B6%80

 

팔란티어 해부하기 - 1부

muon4u

www.srr.kr

 

이 내용은 요즘 인공지능기술과 데이터를 분석하는기술들에 대한 수요가 굉장히 많은상황에서 부상하고 있는 팔란티어를 이해하기 위한 내용을 찾다가 개인적인 관심을 이곳에 보관해두려한다. 기본적으로는 데이터베이스를 만들고, 활용하는데 필요한 자료를 어떤방식으로 저장해야 효율적으로 전산화할수있는가에 대한 고민이다. 

 

 

팔란티어 해부하기 - 1부

 

팔란티어라는 기업은 필자의 지식 범위 안에서 볼 때에 이 세상에 나온 기업들 중에서 가장 특이한 기업 입니다. 시장에서는 이 회사를 단순한 빅 데이터 통합 시스템 회사 혹은 AI 기술을 응용한 데이터 통합 회사 또는 보안 회사 등등으로 이해하고 있습니다. 그러나 이 회사는 정체성을 한 마디로 저으이 하기에 매우 방대한 개념의 솔루션을 가지고 있는 회사입니다.

 

이 회사는 한 마디로 전 세계 고객들이 어떠한 산업군에 있든지 그들이 직면하고 있는 다양한 "문제"들을 가장 빨리 해결해주는 회사라고 이해 하시면 됩니다. 그 뮨제들을 해결하는데 있어서 매우 정교한 AI 기술과 빅 데이터 응용 기술을 사용하는 것은 맞습니다.

 

회사의 설립자들은 피터 틸, 알렉스 카프, 조 론스데일, 스티븐 코헨, 나단 게스팅 정도로 파악이 되는데 회사를 주로 운영하는 사람은 알렉스 카프와 피터 틸 입니다. 이것은 소위 말해서 "~카더라"에 해당하는 내용입니다만, 2001년 9월 11일에 그 유명한 미국의 세계 무역 센터 테러 사건이 있었습니다. 그 때에 이 창업자들의 친구들이 그곳에 근무 하다가 생명을 잃게 된 사람들이 많았다고 합니다. 그래서 이 창업자들은 전 세계에 존재하는 모든 테러리스트들을 전부 색출해서 제거해야 한다는 의에 대한 사명감을 가지고 회사를 설립 했다고 하는 "~카더라" 이야기도 있습니다.

 

"저는 미국에서 제2의 9.11이나 그보다 끔찍한 사건이 일어나도록 두고 볼 수가 없었습니다.

바로 그날 온갖 가혹한 규제의 문이 열리고 말았으니까요." - 피터틸

 

미래에 또다시 그런 상황이 벌어지지 않게 하려면 정부 기관이 첨단 기술을 최대한 동원하고 수사관이 그것을 합법적으로 활용할 수 있도록 규칙을 정비 해야 한다는게 틸의 의견이다. (책 '피터틸' / 토마스 라폴트 지음)

 

피터 틸은 페이팔을 이베이에 매각한 돈으로 2003년 팔란티어를 창업하면서 본격적으로 빅데이터 분석을 시작했습니다. 피터틸은 소프트웨어와 데이터분석을 활용해 세상을 더 안전하고 공정하게 만들겠다는 사명이 있었습니다. 페이팔이 이베이를 겨냥했듯 팔란티어는 창업 초기 정보 기관을 타깃으로 삼았습니다. 2005년 CIA가 운영하는 산하 벤처 캐피탈인 인큐텔(In-Q-Tel)로 부터 200만 달러의 투자금을 받아냈습니다. 팔란티어의 첫 번째 분석 솔루션인 '팔란티어 고담'은 영화 '배트맨'의 배경이 되는 범죄도시의 이름으로 배트맨처럼 시민들을 지켜준다는 의미를 담았다고 합니다. 이 소프트웨어는 데이터와 알고리즘을 이용해 조기에 위협을 적발해냅니다.

 

팔란티어의 더 많은 정보와 제품에 대해서는 아래 링크를 참조하여 보시면 됩니다.

https://namu.wiki/w/%ED%8C%94%EB%9E%80%ED%8B%B0%EC%96%B4%20%ED%85%8C%ED%81%AC%EB%86%80%EB%A1%9C%EC%A7%80%EC%8A%A4

 

제가 이 기업을 소개 하면서 처음 부터 너무 김 빠지는 소리를 하는 것인지는 모르겠습니다만, 아마 전 세계에서 이 회사의 시스템과 기술력을 넘어서고자 하는 기업이 있다면, 아마 거의 불가능 하지 않을까 생각이 듭니다. 팔란티어가 일을 그만두거나, 어느날 일시에 모든 사업을 포기 하지 않는한 말이죠...

 

사이버 보안 분야에서도 거의 넘사벽 수준이 곧 이루어질 전망으로 보입니다.

팔란티어 해부하기 - 2부

 

팔란티어를 이해하기 위해서는 회사의 규모, 제품군의 기술적 수준 이전에 이 회사가 가장 집중하고 있는 제품군의 철학을 이해해야 합니다. 그것은 바로 고객들이 가지고 있는 가장 중요하고 시급한 "문제 해결"에 거의 광적으로 집중하고 있는 회사 입니다.

고객들에게 자사의 제품을 얼마나 많이 팔아 수익을 내려고 하느냐 보다도 고객들이 가지고 있는 문제의 본질이 무엇이고 그것은 근본적으로 해결하려고 하는 의지가 다른 어떤 기업보다도 강합니다.

 

팔란티어는 고객의 문제를 근본적으로 해결하기 위해서 자기들만의 정교한 시스템을 구축 하였습니다. 그것은 하나의 OS라고 부를만큼 정교하게 구성되어 있습니다. 그리고 그 OS의 중심에는 "온톨로지"라고 부르는 개념이 존재 합니다. 팔란티어가 이 온톨로지 라는 개념을 설정하는 이유는 바로 모든 문제 해결의 근원이 이곳에서 생성되기 때문입니다.

 

온톨로지의 구성은 다음과 같이 구성 됩니다.

 

개체(Entity): 데이터베이스에서 식별할 수 있는 개별적인 사물이나 개념을 나타냅니다. 예를 들어, 사람, 기업, 제품, 위치 등이 될 수 있습니다.

 

속성(Attribute): 개체의 특성이나 속성을 나타냅니다. 각 개체는 여러 속성을 가질 수 있으며, 이 속성들은 개체를 설명하고 특징 짓습니다. 예를 들어, 사람의 속성으로는 이름, 나이, 성별, 주소 등이 있을 수 있습니다.

 

관계(Relationship): 데이터 요소들 간의 연결을 나타냅니다. 예를 들어, 사람과 그 사람이 속한 조직 간의 관계, 제품과 해당 제조사 간의 관계 등이 있을 수 있습니다.

 

계층(Hierarchy): 데이터 요소들 간의 계층 구조를 정의합니다. 이것은 데이터를 더욱 구조화하고 조직화하는 데 도움이 됩니다. 예를 들어, 지리적 계층(국가, 주, 도시)이나 조직적 계층(회사, 부서, 직급) 등이 있을 수 있습니다.

 

팔란티어는 이 지구상에 존재하는 모든 객체들을 디지털화 하고 논리화 하는 시스템을 개발 했습니다. 모든 객체들을 디지털화 하고 논리화 하는 근본 목적은 모든 객체들이 가지고 있는 문제의 근본을 가장 투명하게 "가시화" 하려는 목적 입니다. 팔란티어가 가지고 있는 문제 접근 방식의 가장 중요한 철학은 이것입니다.

 

1. 모든 문제들이 전부 투명하게 드러나야 한다.

2. 모두가 문제의 우선 순위를 정하는 기준에 납득 되어야 한다.

 

팔란티어의 입장에서 "데이터" 자체는 아무런 의미가 없다고 합니다. 팔란티어가 중요하게 보는 것은 데이터 자체가 아니라 그 데이터가 가지고 있는 "의미" 입니다. 예를 들어서

 

"자동차" 라는 단순 명사의 데이터는 아무런 의미가 없습니다. 그러나 이제 그 "자동차"라는 명사에 대해서 위에서 보여준 4가지 방식에 따라서 의미를 부여하기 시작 합니다. 자동차 라는 단어는 여러가지 상황에 따라서 의미가 부여 될 수 있습니다.

 

자동차라는 단어를 온톨로지화 해보면

 

개체 : 자동차

 

속성 : 사람이나 물건을 실어 나르는 기계, 인간이 조작하거나 컴퓨터에 의하여 조작 가능함 / 모든 평면 위에서 움직임이 가능함

 

관계 : 자동차의 통제권을 가지고 있는 사람 외에 다른 자동차들 및 사람들과의 안전 거리 정보 / 자동차 제조 회사 정보 / 자동차 딜러 정보 /

 

계층 : 대한민국 서울시 강남구 대치동 00빌딩 / 회사 법인 차량 / 차량 이용자 : 대표이사

 

데이터들을 모두 온톨로지화 하고 조직의 문제들을 하나도 빠짐 없이 디지털화 하고 논리화 합니다. 즉, "가시화 " 합니다. 그러면 회사가 가지고 있는 모든 문제들이 전부 보이게 되며, 어떤 길이 최선의 문제 해결의 지름길인지 보이게 됩니다. 이 모든 작업들을 팔란티어 시스템은 순식간에 답을 산출 합니다.

 

메인 이미지 링크 출처 :

https://insidetelecom.com/wp-content/uploads/2024/01/Palantir-Israel-1024x576.jpg

팔란티어 해부하기 - 3부

팔란티어의 "아폴로"라는 솔루션은 고담과 파운드리 시스템을 가장 효율적으로 업그레이드 할 수 있는 시스템 입니다. 이 아폴로 솔루션을 개발하는데 시간이 6년이 걸렸습니다. 우리가 흔히 말하는 소프트웨어 패치 혹은 업그레이드의 개념이 이 세상의 모든 프로그램들을 일괄 단방향으로 패치 작업이 이루어 집니다. 그러나 팔란티어의 업그레이드 시스템은 커스터마이징의 개념을 가지고 패치가 필요한 고객들에게만 자동으로 작동 합니다.

 

이것은 완전한 고객 맞춤형 프로그램을 가장 빠른 범용 프로그램처럼 운영하는 혁신적인 방식 입니다.

 

이제 팔란티어 솔루션에 AI 기술이 더해 졌을 때에 파격적인 기능의 향상이 더해 졌습니다. 팔란티어의 CTO 샴 섕커는 이렇게 말했습니다.

 

"AI가 마치 20년 동안 팔란티어를 만나려고 준비해 온 것 같습니다."

 

저번 시간에 언급 했던 것처럼 회사(조직)의 문제를 온톨로지(Ontology)화 한다는 것은 기업의 문제를 1원칙 사고법으로 접근하다는 소리입니다. 1원칙 사고법은 문제의 본질을 파악하는 것입니다.

 

저와 여러분은 이미 Chat GPT를 많이 사용해 보셨을 것입니다. 그런데 이 Chat GPT를 사용하다 보면 이놈이 가끔 헛 소리를 할 때가 보입니다. 즉, 나의 질문에 이상한 대답을 하거나 근거도 없는 거짓의 답을 주게 되는 경우이죠. 우리는 이것을 할루시네이션(Hallucination) 이라고 부릅니다. 즉, AI가 보이는 환각 증세 라는 것이죠. 더 쉬운 말로 하면 일종의 프로그램 버그 같은 것으로 여겨질 수도 있습니다.

 

그런데 AI LLM이 할루시네이션(hallucination,환각증세)을 보이는 이유는 버그가 아니라 LLM의 자연스러운 기능입니다. 그럼 언제 이 할루시네이션(hallucination)을 LLM이 보일까요?

 

AI가 인간의 질문에 거짓말을 하게 되는 경우는

 

1. 설계해 놓은 데이터 구조(온톨로지)에 규칙이 존재하지 않은 경우

2. 설계해 놓은 데이터 구조(온톨로지)에 가짜 규칙이 존재하는 경우

3. 질문 자체가 추상적인 경우

 

입니다.

 

팔란티어가 사용하고 있는 LLM 은 GPT4 / Palm coding / Claude / Llama2 70B 이렇게 4개의 언어 AI를 사용하고 있으며 팔란티어는 다시 이것들을 모아서 또 하나의 AI로 통합하여 이용하고 있습니다. 시장에스 흔히 팔란티어의 경쟁 회사로 두 회사를 많이 이야기 합니다. 바로 snowflake, databricks 라는 회사 입니다. 그런데 이 두 회사의 솔루션 방식은 "데이터 저장 방식 솔루션" 입니다.

 

그러나 팔란티어는 "데이터 연결 방식 솔루션" 입니다. 이것을 SDDI(Software Defined Data Integration) 기술 방식 이라고 부릅니다. 이것은 마치 옛날에 네트워크 레이어에서 나온 기술 개념과 유사하게 보이는 개념 이기도 합니다.

 

SDN(Software-Defined Networking) 이라고 부르던 기술이 지금 까지도 네트워크 레이어에서는 매우 효율적으로 사용되고 있습니다. 참고로 더 자세한 정보를 보시려면 아래 링크를 참조 하시기 바랍니다.

 

자료 참조 링크

 

팔란티어의 서비스 방식은 snowflake, databricks 회사와는 본질적으로 다른면이 있는데 다음과 같은 특징이 있습니다.

 

1. 고객의 데이터를 저장하지 않고 데이터 연결을 통해서 통합을 이루어 가고 있습니다. 이때 비로소 데이터계의 OS와 같은 형태를 취하게 됩니다. 결국 고객들의 내부 시스템 상황이 아무리 바뀌어도 팔란티어라는 플랫폼 안에서 움직이기 때문에 언제나 연결을 통해서 통합을 이루어 갈 수 있습니다.

 

2. 데이터 원본을 저장하는 것 보다 데이터 추상화를 통하여 읽어 오는 방식이 문제 해결의 관점에서 훨씬 효율적입니다. 노력, 비용, 속도, 확장성 면에서 훨씬 유리합니다.

 

3. 고객들은 계속 새로운 환경을 마주할 것이고 새로운 문제들은 생겨날 것입니다. 그러면 계속 새로운 데이터들이 생성 될 것이고 그 데이터들을 어떻게 다시 통합 할 것인가에 대한 문제가 생기게 됩니다. 이러한 문제들을 팔란티어는 연결 방식으로 통합하여 문제를 빠른 속도로 해결해 갑니다.

 

팔란티어의 AIP 솔루션은 고객들을 향하여 다른 각도의 질문을 유도 합니다. 지금까지는 AI 소루션이 어떤 문제를 일으키거나 버그 같은 상황을 보이게 되면 사람들은 그 AI 시스템이 뭔가 잘못 되었다고 생각하고 AI의 로직을 수정하려고 바라 봅니다. 그러나 팔란티어는 반대로 말합니다. AI가 할루시네이션(hallucination)을 인간에게 보일 때에 인간은 AI를 수정하려 들지말고 먼저 인간 자기 자신을 바라보라는 것이죠~!

 

즉, AI가 할루시네이션(hallucination)을 보인다고 하는 것은 아래 3가지의 경우인데

 

1. 설계해 놓은 데이터 구조(온톨로지)에 규칙이 존재하지 않은 경우

2. 설계해 놓은 데이터 구조(온톨로지)에 가짜 규칙이 존재하는 경우

3. 질문 자체가 추상적인 경우

 

이런 3가지 경우의 오류 때문에 AI가 할루시네이션(hallucination)을 보였다면 그것은 인간이 설정해 놓은 전제 조건이 잘못된 것이지 AI의 운영 로직이 잘못 되었다는 것은 아니라는 것이죠~! 이를 통하여 팔란티어가 인간에게 주는 메시지는 인간이 사용하는 "불완전한 언어" 구조로 생각하고 논리를 세우려 하지 말고 보다 논리적이오 오류가 거의 없는 "수학적 언어" 방식으로 생각하고 논리를 세우라고 말하고 있습니다.

 

메인 이미지 링크 출처 :

https://media.licdn.com/dms/image/D5612AQHBPok_mXUQyg/article-cover_image-shrink_720_1280/0/1683814122154?e=2147483647&v=beta&t=pSs68bmNUmy28c52jdx-syceMVAy0ojBHH5E2EOqOaE

 

==============================

사이버 보안 교육 상담 : muon4u@gmail.com

 

온톨로지를 이해하기쉽게 설명한듯한 내용을 인용해보았다. 

https://wikidocs.net/179934

 

08-1-2. 온톨로지(Ontology)

``` 08-1-2. 작성자 : 잔싱롱, 윤종훈 ``` 지금까지 시맨틱 웹(Semantic Web)이 추구하고자 하는 지식정보들간의 의미관계의 재구성과 그러한 의미관…

wikidocs.net

08-1-2. 작성자 : 잔싱롱, 윤종훈

지금까지 시맨틱 웹(Semantic Web)이 추구하고자 하는 지식정보들간의 의미관계의 재구성과 그러한 의미관계를 표현하기 위한 서술형식인 RDF에 대해 알아보았다. 이러한 시맨틱 웹과 그것을 서술하기 위한 RDF형식은 정보공학과 디지털인문학 분야에서 활용되고 있는 '온톨로지(ontology)'란 개념에서 적극적으로 쓰이고 있다. 방금 이 글을 읽으면서 '시맨틱 웹과 RDF만 있으면 인터넷에 있는 지식정보들의 의미관계를 설명하는 데 충분한 거 아니야?' 라는 의문이 생김과 동시에 뜬금없이 등장한 이 '온톨로지(ontology)'라는 용어에 대해서 낯선 거리감이 생겨나기 시작할 것이다. 그렇다면 '온톨로지(ontology)'라는 개념이 무엇을 의미하고 나타내고자 하는 것인지, 어떻게 시맨틱 웹과 함께 활용되는지에 대해 살펴보도록 하겠다.

온톨로지(ontology)의 어원과 정의

온톨로지(ontology)의 본질적인 개념에 대해 파악하기 위해서는 단어의 어원을 우선적으로 살펴보는 것이 효과적이다. 'Ontology'는 희랍어(그리스어)로 'ontos'와 'logia'가 결합된 것이 그 어원인데, 여기서 'ontos'는 '존재' 또는 '존재하는 것'을 의미하며 'logia'는 '사고', '탐구', '학문'을 의미한다. 즉 'Ontology'의 개념적 정의를 한 마디로 정리하자면 "존재하는 것(ontos)에 대한 탐구와 학문(logia)"라고 할 수 있겠다. 이와 같은 어원을 통한 개념 설명만으로는 앞서 설명한 시맨틱 웹에서의 의미관계가 존재의 본질을 파악하는 온톨로지와 어떻게 연관될지 감이 오지 않을 수도 있다. "존재에 대한 탐구"를 조금 더 확장된 시각에서 바라보자면 단순히 하나의 객체에 대한 분석과 탐구가 아닌 그 객체가 속한 세계관을 탐구 대상으로 바라보고, 그 안에 있는 개별 대상들을 분류하고, 그러한 관계를 분석하는 과정을 통해 세계관에 속해 있는 개별 대상의 존재 체계를 파악하는 것이 온톨로지의 철학적 개념이라고 할 수 있다.

'이순신'을 단순히 '조선 중기의 무신(1545~1598)' 와 같이 대상을 개별적으로 파악하는 것보다는 '어떤 전투와 전쟁에 참여했는지', '출생지는 어디인지', '어떤 장수들과 함께 싸웠는지', '어떤 직책을 역임했는지' 처럼 같은 세계관 내의 연관있는 다른 대상들과의 관계를 통해서 '이순신'이라는 대상을 바라본다면 보다 더 확실한 이해와 함께 풍부한 지식정보의 획득을 꾀할 수 있는 것이다.

 

결국 온톨로지라는 것은 대상과 대상들과의 관계 파악을 통해서 존재의 본질과 의미 체계를 풍부히 하고자 하는 것인데, 따라서 이 온톨로지라는 개념은 다양한 분야에서 다양한 매개를 통해 확장되어 사용되기도 한다. 따라서 이 장에서 온톨로지와 디지털인문학에서의 활용에 대해 다루고자 하고 있지만, 도메인 영역과 매개에 따라서 그 개념과 활용의 범위가 달라지기 때문에 이 추상적인 온톨로지를 한 마디로 정의하는 것은 꽤나 힘든 일이다. 그러나 분류, 관계, 체계라는 이 세 가지 요소를 기억하며 앞으로 등장할 개념들을 접한다면 온톨로지의 맥락에 대해 파악하는 데 큰 도움이 될 것이라 생각한다.

온톨로지(ontology)의 기본 구성요소

앞선 설명에서 온톨로지의 맥락을 이해하기 위해서는 분류, 관계, 체계라는 세 가지 요소를 기억하는 것이 용이하다고 언급하였다. 이 세 가지 주요 요소가 곧 온톨로지의 구성요소와 흐름을 같이 한다고 보아도 무방하다. 하여 온톨로지를 설계하는 과정에서 필요한 기본적인 구성요소는 클래스(class), 속성(attribute), 관계(relation) 이다. 온톨로지를 설계하기 전에 먼저 자신이 관심 갖는 분야를 토대로 객체(individual)를 탐색하는 것이다. 다음 그림을 예시로 하여 하나씩 살펴보도록 하겠다.

온톨로지(ontology)의 설계 과정 및 방법

객체 탐색

인기 있는 스트리밍 플랫폼 '넷플릭스'(NETFLIX)라는 주제로 온톨로지를 설계해보자. 넷플릭스 얘기하면 먼저 떠오른 드라마가 〈D.P.〉이다.


이어서 〈D.P.〉라는 드라마속에 출현한 배우가 3명이 떠올랐다. 바로 구교환, 정해인, 손석구다.


그 중에 손석구라는 배우가 〈나의 해방일지〉에도 남주인공 역을 맡았다.


〈나의 해방일지〉는 넷플릭스뿐만 아니라 TVING에서도 방영되었다.


또 다른 넷플릭스 작품이 〈킹덤:아신전〉 생각났다. 해당 작품에 구교환이라는 배우가 조연으로 나와서 연관선을 지었다.


객체 탐색 단계에서 위와 같이 마무리했다. 넷플릭스를 중심으로 방영된 작품, 그 작품 속에서 함께 호흡을 맞춘 배우들을 떠오르는 대로 적어낸 다음 연관이 있는 객체들은 선으로 연결하여 관련성을 표시한다. 위 그림이 일종의 마인드맵이라고 할 수 있다. 여기서 주의해야할 점은 객체를 생각난대로 적어도 되지만 객체가 독립적인 사물이라서 어떤 그룹의 상위 또는 하위 개념이 아니라는 것이다.

클래스 설계

 

이 마인드맵에서 적어낸 객체(individuals)들을 살펴보자. 전술한대로 객체들이 규칙없이 분포되어 있는데 우리가 공통 성격을 가진 객체들을 분류해 보겠다. 우선, 노란색으로 표시된 '손석구', '구교환', '정해인' 과 같은 객체들은 <사람> 혹은 <배우>로 분류가 가능할 것이다.


그렇다면 파란색으로 표시된 'D.P', '나의 해방일지', '킹덤:아신전' 들은 <작품> 혹은 <드라마> 로 분류할 수 있을 것이다.


마지막으로 주황색으로 표시된 'NETFLIX'와 'TVING'은 <스트리밍 서비스>, <스트리밍 플랫폼> 등으로 분류가 가능할 것이다.


이처럼 하나의 공통된 세계관 속에 분포해 있는 객체(individuals)들은 공통된 성격의 것들끼리 묶어 범주화를 시킬 수 있다. 그리고 설계자의 의도와 판단에 따라 정해진 이 '범주'는 그 속에 속해 있는 객체들의 성격을 구분해준다. 이러한 '범주'를 우리는 온톨로지에서 '클래스(class)'라고 부른다. 분류한 결과는 아래 그림과 정리된 표를 참조하면 된다.

 

속성 설계

 

이제 흩어져 있던 객체들을 공통된 '클래스(class)'로 묶었으니 그 범주 안으로 좁혀 들어가보자. <배우> 클래스에 속해 있는 '손석구', '구교환', '정해인'은 사람 또는 배우의 기준으로 묶었기 때문에 이 객체들을 설명할 수 있는 정보의 형태는 유사성을 보이게 될 것이다. 만약 배우라는 '클래스(class)'로 묶는다면 그 안에 속해 있는 객체들이 공통적으로 가지고 있는 정보가 무엇인지 생각해보자. 생년월일, 최종학력, 데뷔작 등을 예로 들 수 있다. '클래스(class)'에 속해 있는 객체들이 공통적으로 가지고 있는 정보를 '속성(attribute)'이라고 부른다. 따라서 드라마와 스트리밍 플랫폼이라는 클래스에도 공통 속성을 찾아내고 결과가 아래와 같다.

관계 정의

이제 설계 속에서 객체(individuals)들을 범주화하고, 그 객체들이 가진 고유의 속성들을 정리하였다. 마지막으로 할 작업은 이렇게 정리된 객체(individuals)들과 클래스(class)들 사이의 관계를 정의하는 것이다.

<배우>는 <드라마>에 출연해 배역을 맡아 연기를 했을 것이고, <드라마>는 <스트리밍 플랫폼>에서 방영되었을 것이고, <배우>는 다시 <스트리밍 플랫폼>와 계약을 한 관계가 될 것이다. 아래 그림처럼 온톨로지 설계에서의 객체(individuals) 클래스(class)들은 서로간에 특정한 관계성(relation)을 가지고 있다. 시맨틱 웹의 서술형식인 RDF의 그것과 매우 유사하다고 생각하면 이해가 빠를 것이다. RDF형식을 빌려 관계성(relation)을 정의하자면 'A는 B의 배역을 맡다', 'A는 B와 계약했다', 'A는 B에서 방영되었다' 로 설명이 가능하다. 이렇게 정의된 관계성(relation)은 온톨로지 설계 내에 존재하는 객체(individuals) 클래스(class)들 사이에서 유기적으로 연결되어 보는 이로 하여금 보다 더 확대된 정보를 얻게 되는 역할을 한다.


이처럼 클래스(class), '속성(attribute)', 관계성(relation) 정의가 완료되고 이 요소들간의 관계가 논리적으로 타당한 것이 검증된다면 비로소 온톨로지(ontology)의 설계가 완료된 것이다. 앞서 서술했듯이 온톨로지라는 개념은 다양한 도메인 영역에 따라 광범위해지기 때문에, 위 예시들의 경우 '넷플릭스 온톨로지' 라고 이름을 붙여 설계를 완료한다고 할 수 있을 것이다.

Last edited by : Sept. 5, 2023, 5:14 p.m.