0. 들어가기에 앞서
- 아래 강의는 안수빈 서울대학교 컴퓨터공학과 석박과통합과정 학생의 부스트 캠프 강의를 요약하여 개인적인 첨언을 담은 포스트입니다
1. 다양한 요소를 고려하는 데이터 시각화
- 데이터 시각화는 아래를 포함한 다양한 요소들을 고려할 필요가 있습니다.
- 목적
- 독자
- 데이터
- 스토리
- 방법
- 디자인
2. 언제나 그렇듯 시각화에도 절대적인 정답은 없습니다
3. 데이터셋 종류 (꼭 하나의 항목에만 포함되지는 않는다)
- 정형 데이터
- 데이터 엔트리가 있고, 변수가 있음. 변수의 수치적인 특성이나, 변수 간의 상관관계 등 수치적인 특성이 주된 고려 사항
- 시계열 데이터
- 시간 흐름이 있으면 모두
- 추세, 계절성, 주기성 등
- 지리 데이터
- 관계 데이터
- 계층적 데이터
- 계층이 있는 데이터
- 트리구조, 네트워크 등으로 시각화 가능
- 수치형: 연속형, 이산형
- 범주형: 명목형, 순서형
4. 시각화의 구성 요소
- 마크: 점, 선, 면
- 채널: 각 마크에 대한 효과 (면적, 기울기, 부피, 색 등)
- 전주의적 속성: (혼자만 색깔이 다르다든지, 크기가 다르다든지) 따로 집중하지 않아도 주의를 끄는 요소. 다만 여러 전주의적 요소가 작용하면 인지에 어려움 있을 수 있다
시각화 기본
- Bar Plot