Post

분산의 의미

분산의 의미

분산

  • (데이터 - 평균)^2 의 평균.
    • (데이터-평균)^2를 편차제곱이라 한다.
    • (데이터-평균)을 편차 라고 한다.
      • 편차들 모두 합하면 0임
    • 데이터가 평균에 가까울수록 분산은 작아짐.
    • 데이터가 좁은 범위에 몰려있다 : 분산이 작다.
    • 데이터가 넓은 범위에 흩어져있다 : 분산이 크다.
  • 데이터가 얼마나 넓게 퍼져있나? 산포도

  • 분산은 대표값의 종류들 중 하나. (대표값 : 평균, 분산, 표준편차)
  • 평균 중 산술평균이란게 있음. (그외 기하, 조화 평균 등이 있음)
  • 산술평균
    • sum(데이터) / 갯수
  • 기대값
    • (사건이 벌어졌다면 이득 * 벌어질 확률) + 전체 사건
    • 확률적 사건에 대한 평균
  • 평균기대값
    • 표본으로부터 얻은 대표값들의 연산이면 평균
    • 확률변수에 중점두고 보면 기대값
  • 평균중앙값(median)
    • 중앙값 : 데이터 정렬, length에서 중간 length에 해당하는 값.
    • 정규분포 대칭형태가 한쪽으로 쏠려있다면 중앙값
  • 확률변수란 (동전 던지기에서)
    • 100원 동전을 던진다 (확률현상)
    • 던져서 이순신장군이 나오는 횟수 (확률변수: 확률현상에 대해 결과값이 확률적으로 정해짐.)
  • 대표값이란
    • 표본 데이터 분포의 특성.
  • 표준편차
  • 분산의 제곱근

그래서?

  • 표준편차, 분산, 중앙값, 평균을 알면 그래프가 어떤 모앙으로 생겼구나 알 수 있음.

참고
https://losskatsu.github.io/statistics/mean-vairance/#2-1-%EB%B6%84%EC%82%B0variance

This post is licensed under CC BY 4.0 by the author.