윌드빗 사용하기(Tutorial)

조직 생성

조직의 역할은 데이터를 제공하는 제공자의 소속을 의미합니다.

  1. 메인화면의 우측 상단에 있는 “조직” 버튼을 클릭하여 현재 등록된 조직을 확인합니다.

_images/org1.png
  1. 현재 등록된 조직의 목록이 보이며, 신규 등록을 원한다면 “조직추가” 버튼을 클릭합니다.

_images/org2.png
  1. 조직 생성을 위해 이름 등의 정보를 입력하고 “조직생성” 버튼을 클릭합니다. 여기서는 “인천시”를 입력하겠습니다.

_images/org3.png
  1. 조직 생성이 완료되었습니다. 새로 입력한 “인천시” 라는 조직명이 로고와 함께 보이고 있습니다.

_images/org4.png

데이터셋 등록

  1. 데이터셋을 등록할 때는 먼저 데이터 제공자의 조직을 선택하는 게 좋습니다. 여기서 데이터 제공자의 조직을 선택하지 않아도 나중에 제공자의 조직을 지정할 수 있습니다. 우리는 “인천시”에서 제공하는 데이터를 등록하기 위해 “인천시”를 선택하겠습니다.

_images/reg1.png
  1. 왼쪽에 데이터 제공자의 조직인 “인천시”가 선택되었습니다. “데이터셋 추가” 버튼을 클릭하여 데이터셋을 등록하겠습니다.

Note

데이터셋과 리소스

_images/datasets-resources2.png
_images/reg2.png
  1. 데이터셋을 생성하기 위해 제목과 설명, 태그 등 데이터셋에 필요한 메타데이터를 입력합니다. 여기서 중요한 것은 데이터셋에 대한 URL을 지정하는 것이 중요합니다. 필수 항목이므로 반드시 입력해야 합니다. 태그정보에는 데이터셋을 표현할 수 있는 정보를 최대한 많이 입력합니다. 그리고 아래쪽의 “다음” 버튼을 클릭합니다.

_images/reg3.png
  1. 데이터셋 등록을 위한 두번째 화면으로 실제 데이터를 업로드 하는 화면입니다. “업로드” 또는 “링크” 버튼을 클릭합니다.

_images/reg4.png
  1. 현재 데이터셋에 포함될 리소스(여기서는 물리적인 파일의 위치입니다)를 선택하고, 리소스의 이름과 설명등록 입력합니다. 마지막으로 등록하는 리소스의 포맷을 입력해야 합니다. 보통 파일의 확장자를 입력합니다. 예를 들면 CSV, XLS, XML, JSON, ZIP, JPG 등이 될 수 있습니다. 그리고 “끝” 버튼을 클릭하면 데이터셋 등록이 완료됩니다.

_images/reg5.png
  1. 데이터셋 등록이 완료되면 아래와 같이 등록된 데이터셋의 정보가 태그 목록과 함께 표출됩니다. 데이터셋에 대한 그룹(데이터 분류) 지정과 데이터셋의 활동이력 등도 볼 수 있습니다. 한 개의 데이터셋에 한 개의 리소스가 포함되어 있습니다.

_images/reg6.png

데이터셋에 리소스 추가

  1. 이미 등록된 데이터셋에 리소스를 추가할 수 있습니다. 한개의 데이터셋은 여러 개의 리소스를 가질 수 있고 리소스의 포맷도 다양하게 포함할 수 있습니다. 아래 화면에서 한 개의 데이터셋을 선택해서 상세화면으로 진입하겠습니다.

_images/append_res1.png
  1. 데이터셋의 상세화면에서는 메타정보의 확인이 가능하며 그룹정보, 활동흐름(이력정보) 등의 정보를 볼 수 있습니다. 우측에 있는 “관리하기”버튼을 클릭하여 데이터셋 관리화면으로 진입합니다.

_images/append_res2.png
  1. 데이터셋 관리화면에서는 메타데이터의 편집 및 리소스의 추가 등을 기능을 수행할 수 있습니다. “리소스”탭에서 “새로운 리소스 추가” 버튼을 클릭하여 파일 선택 화면이 표출되면 추가하고자 하는 리소스 파일을 선택합니다

_images/append_res3.png
  1. 리소스 파일과 이름, 리소스 파일을 설명할 수 있는 정보 및 파일의 포맷을 입력하고 “추가하기” 버튼을 클릭합니다. 파일의 포맷은 시스템에서 자동으로 선택을 할 수 있지만 정확하게 하기 위해서는 사용자가 입력할 수 있습니다. 여기서 잘못된 파일을 선택했을 경우는 “제거” 버튼을 클릭하면 선택된 리소스가 삭제됩니다.

_images/append_res4.png
  1. 리소스 추가가 정상적으로 완료되면 데이터셋의 상세화면으로 이동하고 리소스 메타정보 및 리소스 목록이 표출됩니다. 각 리소스별로 미리보기, 다운로드, 편집 등 리소스파일 형식에 따라 시스템에서 지원하는 기능이 탐색 버튼에 포함되어 표출됩니다. 아래의 예는 2개의 리소스 파일이 등록되었으며 csv포맷 파일과 xls포맷 파일입니다. 또한 현재 데이터셋에 2명의 팔로워가 있으며 “인천시”에서 데이터셋을 제공하고 있음을 알 수 있습니다.

_images/append_res51.png

데이터 찾기 및 다운로드

  1. 데이터 검색 창에 “인천” 이라는 키워드를 입력하고 검색을 시작합니다. 우리는 “인천” 이라는 키워드가 포함된 데이터를 모두 검색할 것입니다.

_images/search1.png
  1. “인천” 이라는 키워드로 검색된 모든 데이터셋을 표출해 줍니다. 아래의 예 에서는 3건의 데이터셋을 찾았으며 포함된 리소스의 포맷은 CSV임을 알 수 있습니다. 이 중에서 하나를 선택해서 상세화면으로 진입 하겠습니다.

_images/search2.png
  1. 데이터셋에 대한 상세화면에서는 메타데이터와 리소스를 확인할 수 있습니다.

_images/search3.png
  1. 리소스 우측 옆에 있는 “탐색” 버튼을 이용하여 리소스에 대한 미리보기, 다운로드, 편집 등의 기능을 수행할 수 있습니다. 우리는 여기서 미리보기를 클릭하겠습니다.

_images/search4.png
  1. 리소스에 대한 미리보기 기능을 클릭했을 경우 아래와 같이 그리드 형태로 데이터를 표출 합니다. 이것은 리소스의 포맷이 CSV 포맷이기 때문에 그리드로 표출이 된 것입니다. 리소스 뷰어는 포맷에 따라 여러가지 다른 형태로 자동표출 됩니다.

_images/search5.png
  1. 데이터에 위도/경도의 데이터가 포함되어 있는 경우 지도위에서 데이터를 표출할 수 있습니다. 컬럼 명 중에서 latitude(위도), longitude(경도) 라는 컬럼명으로 데이터가 존재 한다면 지도 뷰어가 자동 표출 됩니다. 아래의 예 에서는 V-WORLD 지도를 표출하고 있습니다. 화면의 하단에서는 리소스에 대한 메타데이터도 확인이 가능합니다.

_images/search6.png
  1. 표출된 데이터를 다운로드 하기 위해서는 우측상단에 있는 “다운로드” 버튼을 클릭합니다. 그러면 현재 데이터를 다운로드할 수 있습니다.

_images/search7.png

데이터 API

  1. 데이터를 조회하고 다운로드하기 위한 API도 있습니다. API를 확인하기 위해서는 우측상단의 “데이터API” 버튼을 클릭합니다.

_images/api2.png
  1. 데이터API는 각 리소스별로 존재하는 리소스ID를 이용하여 해당 리소스를 식별하며 리소스의 조회, 수정 등 리소스 이용하기 위한 작업을 할 수 있습니다.

_images/api3.png

파일저장소의 리소스를 데이터저장소에 업로드

  1. 데이터셋을 등록하면 묵시적으로 파일저장소에 데이터가 저장됩니다. 이 데이터를 데이터저장소에도 등록할 수 있습니다. 아래 화면에서 리소스 하나를 선택하고 상세화면으로 진입하겠습니다.

_images/datastore1.png
  1. 리소스 상세화면의 우측상단에서 “관리하기” 버튼을 클릭하여 리소스관리 상세화면으로 진입합니다.

_images/datastore2.png
  1. 리소스 관리 화면에서는 리소스편집, 데이터사전, 데이터스토어, 뷰 등의 기능을 수행할 수 있는데, 우리는 여기서 데이터스토어 탭을 선택하겠습니다. 선택된 화면에는 “데이터스토어에 업로드”라는 버튼이 있고, 이 버튼을 클릭하면 해당 리소스가 데이터스토어에 업로드 됩니다. 데이터스토어에 업로드 된다는 의미는 다른 데이터 포털에서 검색이 가능하다는 의미이기도 합니다. 업로드가 완료되면 업로드 상태 정보 및 로그 정보를 확인할 수 있습니다.

_images/datastore4.png

데이터 팔로우기능을 통한 변경 알림

  1. 팔로우기능 이란 사용자가 임의 데이터셋에 대해 메타 데이터 및 리소스 등의 정보 변경이 발생했을 경우 알림을 받기위해 데이터셋에 알림을 부여하는 것입니다. 데이터셋의 상세화면에서 좌측 상단의 Follow버튼을 클릭하면 기능이 활성화되며 현재의 데이터셋에 몇 명의 사용자 Follow를 하고 있는지도 표시해 줍니다. 알림의 표시는 우측상단의 숫자로 표기되며 아래의 예 에서는 현재 0으로 표기되어 있습니다. 다른 사용자가 데이터셋의 설명부분을 수정해 보도록 하겠습니다.

_images/follow1.png
  1. 만일 다른 사용자가 현재의 데이터 셋에 대한 설명을 수정했을 경우 아래의 화면 에서처럼 설명부분이 변경되었음을 확인할 수 있고 우측상단의 알림 기능 부분이 숫자가 1로 변경된 것을 알 수 있습니다. 누군가 에 의해 데이터셋이 변경된 것입니다. 알림 기능의 숫자를 클릭해보면 변경이력을 확인할 수 있습니다.

_images/follow2.png
  1. 알린 기능의 숫자를 클릭했을 경우 데이터셋의 변경에 대한 이력정보가 표출됩니다. 여기에는 변경을 한 행위자와 데이터셋의 이름 그리고 대략적인 변경일을 확인할 수 있습니다.

_images/follow3.png

데이터셋 삭제

  1. 데이터셋의 삭제는 아주 간단하게 이루어 집니다. 삭제 하고자 하는 데이터셋의 상세화면으로 진입한 후 리소스 우측의 탐색버튼에서 “편집”버튼을 클릭하여 편집화면으로 진입합니다. 편집화면 하단에는 “삭제” 버튼이 있으며 이 버튼을 클릭하면 삭제가 이루어 집니다.

_images/delete1.png
  1. 실제 삭제를 하기전에 한 번 더 물어봅니다. 여기서 “승인” 버튼을 클릭하면 삭제가 수행 됩니다.

_images/delete2.png
  1. 삭제가 완료되면 데이터셋의 목록화면으로 이동하면서 화면 상단에 “데이터셋이 삭제 되었습니다.” 라는 메시지가 출력됩니다.

_images/delete3.png

데이터 하베스트

  1. 데이터 하베스트는 CKAN기반의 다른 데이터 공유 포털로부터 데이터셋을 가져오는 기능을 수행합니다. 현재 아래의 예 에서는 등록된 하베스트 소스가 없다고 메시지가 출력 되고있습니다. “Add Harvest Source” 버튼을 클릭하여 새로운 하베스트 소스를 등록해 보겠습니다.

_images/harvest1.png
  1. “Add Harvest Source” 버튼을 클릭하면 아래와 같이 하베스트 소스 등록화면이 표출됩니다. URL 부분에 테스트를 위해 CKAN 기반의 다른 데이터 공유 포털의 주소를 등록해 보겠습니다. 역시 제목과 이름을 입력하고 Source Type을 선택합니다. 우리는 “CSW Server” 소스 타입을 선택했습니다. 그리고 하베스팅의 결과물을 등록할 조직을 선택해야 합니다. 하베스팅의 결과물이 선택된 조직의 데이터셋으로 등록됩니다.

_images/harvest2.png
  1. 하베스트 소스 등록이 완료되면 하베스트 소스에 대한 정보를 표출하는 화면으로 진입합니다. 데이터셋이 존재 한다면 목록을 보여 줍니다.

_images/harvest3.png
  1. 그리고 하베스트 소스의 메타데이터 정보도 표출됩니다. 실제 하베스팅을 수행 하려면 우측 상단의 “관리하기” 버튼을 클릭하여 하베스트 소스 관리 화면으로 진입해야 합니다.

_images/harvest4.png
  1. 하베스트 소스 관리 화면의 우측 상단에는 3개의 버튼이 있습니다. “Reharvest” 버튼은 실제 Harvesting을 수행합니다. “Clear”버튼은 하베스팅으로 수집된 데이터셋이 존재한다면 모두 삭제하는 기능을 수행 합니다. 마지막으로 “View harvest source” 버튼을 관리화면을 종료하고 보기 화면으로 이동합니다. 우리는 여기서 “Reharvest” 버튼을 클릭하며 실제 Harvesting을 수행해 보겠습니다. 아래의 화면에서 보이듯이 데이터셋이 0으로 표시되어 있으며 Harvest Job 또한 없는 것을 확인하였습니다. 그럼 “Reharvest” 버튼을 클릭하겠습니다.

_images/harvest5.png
  1. Harvesting작업을 수행할 것인지 물어봅니다. “승인” 버튼을 클릭하겠습니다.

_images/harvest6.png
  1. “Job” 탭에서는 Harvest가 종료된 시간을 표시해 줍니다. Harvesting의 결과는 6개의 데이터셋을 수집하였음을 알 수 있습니다.

_images/harvest7.png
  1. “대시보드” 탭을 클릭하면 수집이 완료된 7개의 데이터셋 목록을 볼 수 있습니다. 임의로 한 개의 데이터셋을 클릭하여 데이터셋에 대한 상세내용을 확인해 보겠습니다.

_images/harvest8.png
  1. 데이터셋에 대한 설명과 포함된 리소스 목록을 확인할 수 있습니다. 또한 각각의 리소스에 대한 미리보기, 다운로드 등의 기능도 가능합니다. 여기서 알 수 있듯이 데이터 하베스트는 CKAN 기반의 다른 데이터 공유 포털로부터 공개되고 있는 데이터셋의 목록과 메타데이터를 수집하는 기능이 수행됨을 알 수 있습니다.

_images/harvest9.png

대시보드

  1. 대시보드에서는 “윌드빗”에서 일어났던 데이터셋의 이력정보를 확인할 수 있습니다. 이것은 “뉴스피드” 탭에서 보여집니다.

_images/dashboard1.png
  1. “내 데이터셋” 탭에서는 현재 로그인된 사용자가 등록한 데이터셋 목록을 확인할 수 있습니다. 이 곳에서도 “데이터셋 추가” 버튼을 사용하여 데이터셋을 추가할 수 있습니다.

_images/dashboard2.png
  1. “내 기관” 탭에서는 “윌드빗”에서 데이터셋을 제공하려는 조직의 목록이 표출됩니다. “조직 추가” 버튼을 클릭하여 여기서 조직을 추가할 수도 있습니다.

_images/dashboard3.png
  1. “내 그룹” 탭에서는 등록된 데이터셋에 대한 데이터 분류 목록이 표출됩니다. 여기에 등록된 분류 그룹별로 데이터셋을 분류할 수 있습니다. 물론 분류그룹에 속하지 않는 데이터셋도 존재합니다.

_images/dashboard4.png