통계학

[통계학] 전통적인 통계학 vs 통계적 머신러닝

StatZealot 2022. 3. 10. 23:42
  1. 통계적 추론에서는 특정 데이터를 사용하여 모형을 설정하고 모수를 추정한 후, 일반적으로 추정에 사용한 데이터를 이용하여 모형의 적합도나 추정모수의 유의성을 검증한다. 그러나 통계적 머신러닝에서는 모형을 설정하고 모수를 추정한 데이터와 검증을 위한 데이터를 분리한다.  (중략) 따라서 통계적 머신러닝은 전통적인 통계학과 다르게 수리통계학적 지식이 없어도 누구나 쉽게 사용할 수 있다는 장점을 가지고 있다. (박유성, 4쪽)
  2. 전통적인 통계학은 통계학을 다변량, 시계열, 범주형 등으로 자료의 특성에 따라 분류하고 세분화하지만 통계적 머신러닝은 단순하게 목적변수의 관측여부에 따라 지도학습과 비지도학습으로 구분한다. (박유성, 4쪽)
  3. 전통적인 통계학에서는 데이터를 머신러닝과 같이 3개(학습, 검증, 시험)의 데이터로 구분하지 않는다. 전체 데이터를 이용하여 모형을 적합시키고 모형의 적합도를 전체 데이터로부터 구한다. 여러 후보 모형 중에서 가장 좋은 적합도를 보이는 모형을 선택하기 위해서다. 그리고 추정된 모수에 대해 유의성 검정을 하여 유의하지 않은 모수에 대응하는 특성변수를 제거하고 예측치의 신뢰구간 등을 구하는 절차를 따르게 된다. 이러한 모형진단을 위해 수리통계적, 확률론적 지식을 요구한다. 그러나 머신러닝에서는 모형진단을 위해서 어떠한 수리통계적, 확률론적 지식을 요구하지 않는다. 학습데이터와 시험데이터의 정밀도나 손실함수 값을 단순하게 비교하면 되기 때문이다. (박유성, 202쪽)
  4. 기계학습의 특색은 알고리즘에 의해 모형이 형성된다는 점 등입니다. 기계학습은 지식추출(knowledge extraction)을 지향하는바 이것이 통계학의 모형(model)과 대응합니다. (허명회, 162쪽)

 

< 파이썬을 이용한 통계적 머신러닝 제2판 > 박유성 지음, 자유아카데미 (2021)

< 데이터 과학 입문 > 허명회 지음, 자유아카데미 (2021)