분산의 의미
분산의 의미
분산
- (데이터 - 평균)^2 의 평균.
- (데이터-평균)^2를
편차제곱
이라 한다. - (데이터-평균)을
편차
라고 한다.- 편차들 모두 합하면 0임
- 데이터가 평균에 가까울수록 분산은 작아짐.
- 데이터가 좁은 범위에 몰려있다 : 분산이 작다.
- 데이터가 넓은 범위에 흩어져있다 : 분산이 크다.
- (데이터-평균)^2를
데이터가 얼마나 넓게 퍼져있나?
산포도
- 분산은 대표값의 종류들 중 하나. (대표값 :
평균
,분산
,표준편차
) - 평균 중 산술평균이란게 있음. (그외
기하
,조화 평균
등이 있음) 산술평균
- sum(데이터) / 갯수
기대값
- (사건이 벌어졌다면 이득 * 벌어질 확률) + 전체 사건
- 확률적 사건에 대한 평균
평균
과기대값
- 표본으로부터 얻은 대표값들의 연산이면
평균
- 확률변수에 중점두고 보면
기대값
- 표본으로부터 얻은 대표값들의 연산이면
평균
과중앙값(median)
중앙값
: 데이터 정렬, length에서 중간 length에 해당하는 값.- 정규분포 대칭형태가 한쪽으로 쏠려있다면 중앙값
확률변수
란 (동전 던지기에서)- 100원 동전을 던진다 (
확률현상
) - 던져서 이순신장군이 나오는 횟수 (
확률변수
: 확률현상에 대해 결과값이 확률적으로 정해짐.)
- 100원 동전을 던진다 (
대표값
이란- 표본 데이터 분포의 특성.
표준편차
- 분산의 제곱근
그래서?
- 표준편차, 분산, 중앙값, 평균을 알면 그래프가 어떤 모앙으로 생겼구나 알 수 있음.
참고
https://losskatsu.github.io/statistics/mean-vairance/#2-1-%EB%B6%84%EC%82%B0variance
This post is licensed under CC BY 4.0 by the author.