본문 바로가기

자기계발/대외활동

[공공빅데이터 청년인턴십] [day2 - 07.06(화)] 데이터에 대한 이해와 정형데이터 다루기(모델링)

교재> 2021년 공공 빅데이터 분석 청년인재 양성 데이터 전문 교육 과정

  • Part1 분석가를 위한 데이터 역량
  • Part2 분석가를 위한 기획 역량

 

별칭으로 "빨간교재" 라고 부르겠다.

 


2일차인 오늘은 어제와 다르게 강의 각 chapter마다 워크샵을 진행한다.

워크샵이라고 해서 거창할 건 없고

zoom으로 4~5명이 모여서 교재의 챕터별 workshop 문제를 같이 풀고, 풀이 및 정답을 LMS의 개인 페이지에 업로드하면 된다. 

오늘 워크샵 활동 내용은 아래에 공유한다.

* 워크샵 문제에 대해서는 정답이 따로 공유된 바가 없어서

오늘 조별로 토의+내 방식대로 정리한 거라 정답인 지 아닌 지는 확실히 모르겠다.


 

1강. 데이터와 데이터베이스 이해

(p.56) Workshop 1. - 데이터-정보-지식-지혜 구분하기 

'A회사의 Coffee'를 가정한 다음 시나리오에 대해서 데이터, 정보, 지식, 지혜로 구분하여 이야기해보자. (제시된 내용에 한정함)

 

데이터≫ 매출전표 정보 (전표번호, 종류, 금액, 시간대)

정보≫ 커피+빵 세트 메뉴 주문은 전체 주문 건의 20%에 불과하지만, 전체 매출액의 36%를 차지. 때문에 주문건수는 동일하지만 오후시간보다 오전시간대의 매출이 더 큼. 빵의 매출 기여도가 큼.

지식≫ 오후에는 음료 외 빵에 대한 주문이 발생하지 않는 이유에 대해 분석해보니, 오후 시간대 손님들은 커피에 곁들일 가벼운 디저트나 스낵을 찾는 반면, A회사에서 제공되는 빵은 식사대용에 적합.

지혜≫ 오후시간에 판매되는 빵의 리스트를 개선하거나 오전시간 세트메뉴의 프로모션을 촉진하여 매출을 높임.

 

 

 

2강. 데이터모델링 이해: 관계형 데이터모델 이해

(p.79) Workshop 2. 데이터모델 관계 완성하기

 

 

3강. ERD 해석하기

(p.83) Workshop 3. ERD 해석하기

 

SCH_프로젝트 SCH_프로젝트 단계는 1:M관계이며, 하나의 프로젝트는 여러 개의 프로젝트단계를 포함할 수 있다. 선택참여를 나타내는 표시로 미루어보아 단계가 없는 프로젝트도 있을 수 있다.

프로젝트 단계마다 여러 개의 프로젝트연락이력이 존재할 수 있고, 연락이력이 없는 프로젝트 단계도 있을 수 있다.

또한, 각각의 프로젝트 단계는 여러 개의 메일발송 이력도 가질 수 있지만, 메일을 발송한 이력이 없는 단계도 있을 수 있다. 프로젝트 점검 역시 각 단계에서 여러 차례 받을 수 있지만 점검을 받지 않는 단계도 있을 수 있다.

점검점검 상세내역도 여러 개 가질 수 있다. 점검 상세를 갖지 않는 점검도 있을 수 있다.

 

[추가논의] 데이터분석 관점

점검 수행 시작일자, 종료일자가 최근이 아닌 프로젝트 단계들을 파악해서 그 단계들이 많은 프로젝트를 고위험 프로젝트군으로 분류, 빠른 시일 내에 필요한 점검을 진행하는 등 적절한 조치를 취하도록 한다.

 

 

 

4강. 물리 데이터 모델링

(p.88) Workshop 4. 물리 데이터 모델링

 

 

 

 

참고 URLs

https://gngsn.tistory.com/48

 

ERD, 어렵지 않게 만들기

안녕하세요 〰️ 이 번 포스팅에서는 여러모로 쓸모있는! ERD를 알아보고 표기법에 대해 이야기해볼 예정입니다. **************** INDEX ***************** 💼 ERD❓ ⏳ ERD, 언제 사용할까❓ 🤖 ERD Notation **.

gngsn.tistory.com

 

 


 

온라인으로 강의만 듣는 게 아니라, 이렇 게 챕터마다 과제활동이 있다보니

시간이 굉장히 빠르게 흐르는 것처럼 느껴진다.

첫 날은 너무 정신이 없어서 블로그 포스팅을 하지 못했는데, 주말에 작성해보겠다.