[Semantic Web] Linked Data and RDF
이번 포스팅에서는 Linked Data와 RDF를 설명하려고 한다.
Linked Data는 말 그대로 연결된 Data를 의미하며 그 이외의 뜻은 없다.
보통 데이터들을 생각하면 그냥 무작정 쌓여있는 데이터를 생각한다. 1GB만큼 쌓여있는 web log 데이터. 10TB 정도 되는 어느 큰 도서 정보. 이것들은 그냥 무작정 쌓여있는 데이터이다. Linked Data는 각각의 데이터들이 이어져 있는 것이다. 아래와 같이 연결된 Data를 Linked Data라고 한다.
이전 포스팅에서 잠깐 Linked Data에 대해서 “Ontology에서 데이터가 표현되는 기본적인 방식”이라고 설명을 했었다. Ontology에서 데이터는 위와 같이 이어져있다. 아직 구체적으로 이해가 되지 않겠지만, 그냥 “데이터가 이어져 있다” 정도로만 이해하고 넘어가도 큰 무리는 없다. 나중에 RDFS까지 설명이 되면 그 때는 Linked Data의 의미가 확실하게 이해될 것이다.
다음에 RDF를 설명해보자. 이전 포스팅에서 RDF는 Ontology에서 존재하는 가장 작은 단위의 데이터 집합이라고 말을 했었다. 문장 같은 것이라고 말을 했다. 우선 예를 먼저 봐보자.
문장1 : Apple is founded by Steve Jobs
“Apple”이라는 회사와 “Steve Jobs”라는 사람이 “is founded by” 관계로 이어져 있다. 그리고 또 다른 문장을 봐보자.
문장2 : Steve Jobs died on 2011/10/05
문장1과 문장2는 아래와 같이 서로 이어질 수 있다.
자 그러면 아래와 같은 문장을 더 추가해서 위의 그림에 한번 추가해보자.
문장3 : Apple is a competitor of Microsoft
문장4 : Microsoft is founded by Bill Gates
문장5 : Bill Gates is a friend of Steve Jobs
자 이런 식으로 세계의 모든 관계들을 표현한다고 해보자. 음 가능할 것 같기는 한데 뭔가 굉장히 무식한 방법이라는 생각이 든다. 왜냐하면 위의 그림에서(그래프) 봤을 때 Steve Jobs나 Bill Gates는 사람이고 2011/10/05는 날짜이고 Microsoft와 Apple은 회사인데, 그러한 구분이 전혀 없다. 이렇게만 놓으면 컴퓨터는 Microsoft-Bill Gates와의 관계가 Apple-SteveJobs와의 관계와 같다까지만 알지 SteveJobs가 사람인지 사물인지는 알 수 없다. 이것을 알게 해주기 위해서 우리는 Class라는 것을 만든다. OOP에서 설명하는 그 Class이다. 그리고 그 Class개념이 들어간 RDF가 RDFS이다.
이번 포스팅은 여기서 마무리 하고 다음 포스팅에서 RDFS에 대해서 설명해보자.