-
[통계학] 교차검증(cross-validation)에 관하여Machine Learning 2022. 3. 1. 22:40
교차검증(이하 CV)의 아이디어는 간단하다. 주어진 데이터 셋을 나눠 일부를 학습(추정), 나머지를 검증(validation)에 사용하고 이 과정을 반복하여 (무엇에 대한?) 종합적인 결론을 내린다. 하지만 나는 왜 CV를 사용해야 하는지, 그것이 어떤 원리에 의해 작동하는지는 아직 정확히 모르고 있다. 공부하며 지속적으로 업데이트 할 계획이다.
1. Model Selection, Model Assessment
전자는 모형의 유연성(flexibility)을 선택하는 것, 후자는 test 오차 추정을 통해 성능을 평가하는 것을 말한다. CV는 이 두 가지 행위에 모두 사용될 수 있다. (James et al, 2013, 175쪽)
< An introduction to Statistical Learning > by G. James, D. Witten, T. Hastie and R. Tibshirani, Springer (2013)
'Machine Learning' 카테고리의 다른 글
training and test sets (0) 2022.07.06 랜덤포레스트 사용할 때 주요 이슈들 (0) 2020.08.04 전처리에 대해 (0) 2020.08.04