0. 들어가기에 앞서

  • 아래 강의는 안수빈 서울대학교 컴퓨터공학과 석박과통합과정 학생의 부스트 캠프 강의를 요약하여 개인적인 첨언을 담은 포스트입니다

1. 다양한 요소를 고려하는 데이터 시각화

  • 데이터 시각화는 아래를 포함한 다양한 요소들을 고려할 필요가 있습니다.
  • 목적
  • 독자
  • 데이터
  • 스토리
  • 방법
  • 디자인

    2. 언제나 그렇듯 시각화에도 절대적인 정답은 없습니다

    3. 데이터셋 종류 (꼭 하나의 항목에만 포함되지는 않는다)

  • 정형 데이터
    • 데이터 엔트리가 있고, 변수가 있음. 변수의 수치적인 특성이나, 변수 간의 상관관계 등 수치적인 특성이 주된 고려 사항
  • 시계열 데이터
    • 시간 흐름이 있으면 모두
    • 추세, 계절성, 주기성 등
  • 지리 데이터
  • 관계 데이터
    • 객체 간의 관계를 시각화
  • 계층적 데이터
    • 계층이 있는 데이터
    • 트리구조, 네트워크 등으로 시각화 가능
  • 수치형: 연속형, 이산형
  • 범주형: 명목형, 순서형

    4. 시각화의 구성 요소

  • 마크: 점, 선, 면
  • 채널: 각 마크에 대한 효과 (면적, 기울기, 부피, 색 등)
  • 전주의적 속성: (혼자만 색깔이 다르다든지, 크기가 다르다든지) 따로 집중하지 않아도 주의를 끄는 요소. 다만 여러 전주의적 요소가 작용하면 인지에 어려움 있을 수 있다

    시각화 기본

  • Bar Plot