본문 바로가기
  • base

기초통계학2

[기초통계학] 1. 수치적 기술통계 - 변동성 척도(범위, 사분위간 범위, 분산, 표준편차) 통계 자료들은 둘 이상의 다른 값들이 존재합니다. 이를 통계에서는 자료가 변동한다고 합니다. 자료들이 어느 정도로 변동하는지 나타내는 척도가 바로 변동석 척도입니다. 1. 범위 (range) 최댓값 - 최솟값 가장 간단하고 빠른 형태로 최댓값과 최솟값의 거리 자료가 많아 최댓값과 최솟값을 금방 찾을 수 없는 경우에는 예외 평균과 같이 특이값이 있을 때, 자료의 범위가 왜곡됨 자료의 수가 너무 적을 때 또한 범위가 변동성을 대표한다고 보기 어려움 2. 사분위 간 범위 (IQR) IQR = Q3 - Q1 일사분위수(Q1)와 삼사분위수(Q3)의 거리 사분위수 값은 양쪽 극단값 (최댓값과 최솟값)에서 비교적 자유로운 값이기 때문에 특이값이 많은 경우를 제외하고는 특이값의 영향을 받지 않는다고 할 수 있음 3. .. 2022. 8. 6.
[기초통계학] 1. 수치적 기술통계 - 중심위치의 척도(표본평균, 중앙값, 최빈값) 자료에 대하여 제일 먼저 알고 싶어 하는 사항은 자료들이 대략 어떠한 값을 갖고 있는지 알아보는 것입니다. 통계를 위한 자료들은 수치로 되어 있으므로, 수치들이 어떤 위치에 있는지 알아본다는 뜻이 됩니다. 수치가 어느 위치를 중심으로 모여있는지 나타내는 척도로 평균(mean), 중앙값(median), 최빈값(mode) 등이 있습니다. 1. 평균 (mean) 모든 자료의 값을 다 더한 후 전체 개수로 나눔 중심위치 척도 중 제일 많이 사용되는 통계량 우리가 아는 평균은 산술 평균(mathematical average, mean) 자료의 특이값에 영향을 많이 받는다. (ex. 증권 가격 자료에 IMF 당시의 가격이 존재) 2. 중앙값 (median) 특이값의 영향을 받지 않고 사용할 수 있는 척도 자료를 크.. 2022. 8. 5.