데이터 카탈로그

개방형 데이터 카탈로그 또는 포털은 용도는 단순하지만 언뜻 보기에는 복잡해 보일 수 있습니다. 홈페이지는 종종 슬라이드 쇼, 블로그 게시물 목록 또는 기본 카탈로그의 데이터를 사용한 시각화를 특징으로 합니다. 이러한 홈페이지는 데이터의 기본 구조를 쉽게 모호하게 만들 수 있습니다.

개방형 데이터 카탈로그의 구조를 이해하면 사용자, 개발자 및 이해관계자가 개방형 데이터 도구를 최대한 활용할 수 있습니다.

Catalog

카탈로그는 데이터셋으로 정렬된 정보를 포함하는 래퍼입니다. 카탈로그는 다음과 같은 기본적인 질문에 대한 답을 제공해야 합니다: “누가 이 데이터를 제공하고 있는가?” 및 “어떤 조건에서?”

DCAT - 웹에 게시된 데이터 카탈로그 간의 상호 운용성을 용이하게 하기 위해 설계된 RDF 어휘 - 카탈로그 레코드, 데이터 집합, 설명, 홈페이지, 언어, 라이센스, 게시자, 릴리스 날짜, 권한, 공간, 테마, 제목 및 업데이트 날짜 등의 필드를 제공할 것을 권장합니다.

Dataset

데이터 집합에는 메타데이터뿐만 아니라 개별 리소스도 포함됩니다. 메타데이터는 각 데이터 집합의 “누가, 무엇을, 언제, 어디서, 왜”를 표현합니다.

데이터 집합 메타데이터에는 여러 가지 사양이 있는데 DKAN은 현재 DCAT 및 Project Open Data 스키마를 준수합니다.

새 필드를 추가할 수 있는데 추가 사양 또는 사용자 지정 요구 사항을 준수하도록 DKAN에 전달합니다.

Resource

리소스는 공유 중인 실제 파일, API 또는 링크입니다. 리소스 유형에는 csv, html, xls, json, xlsx, doc, docx, rdf, txt, jpg, gif, gif, tiff, ods, odd, tsv, geojson 및 xml 파일이 포함됩니다. 리소스가 API인 경우 사이트 또는 응용 프로그램을 구축하기 위한 실시간 정보 소스로 사용할 수 있습니다.

Datasets and Resources within DKAN and CKAN

다음 이미지는 데이터셋 및 리소스가 DKAN 및 CKAN 내에서 어떻게 구성되는지 보여 줍니다. 스크린샷은 CKAN에 의해 구동되는 Data.gov에서 만들어집니다. DKAN은 가능한 경우 CKAN 규약을 따릅니다.

_images/DatasetResourceDiagram2.png _images/datasets-resources.png

<출처: https://dkan.readthedocs.io/en/latest/introduction/catalog-basics.html>