Informatik
-
[Machine Learning] 회귀(Regression)Informatik 2022. 1. 23. 22:50
통계학에서 회귀 분석이란 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다. [wikipedia] 분류(Classification) vs. 회귀(Regression) 분류는 $\mathbb {R}^d$상에 있는 데이터들을 한정된 클래스의 개수에 알맞게 할당하는 반면 회귀는 $\mathbb {R}^d$상에 있는 데이터들을 $\mathbb {R}$상의 실수 값으로 매핑(Mapping)한다. 지난 포스팅 [Machine Learning] 베이즈 결정 이론(Bayesian Decision Theory)에서 보았듯이 분류의 예시로는 스팸 메일 분류, 가짜 뉴스 판별 등이 있었다. 회귀로는 고차원에서 일차원으로 대응된 실수 데이터들, 예를 들어 화학 반응(고차원)에서의..
-
[Machine Learning] 선형 분류(Linear Classification)Informatik 2022. 1. 20. 20:40
선형 분류는 일차원 혹은 다차원 데이터들을 선형 모델(Linear Model)을 이용하여 클래스들로 분류(Classification)하는 머신러닝(Machine Learning) 기법이다. 아래 예시는 2차원 데이터를 어떤 선형 모델로 $R_0$ 혹은 $R_1$로 분류하는 선형 분류를 보여준다. 선형 판별 함수(Linear Discriminant Function): 클래스 분류의 기준이 될 수 있는 판별 함수(Discriminant Function)가 선형적이다. $$h: \mathbb {R}^n \rightarrow \mathbb {R}, \mathbf {x} \mapsto \mathbf {w}^{\top} \mathbf {x} + w_0$$ 분류 규칙(Classification Rule): $$y =..
-
[Machine Learning] 베이즈 결정 이론(Bayesian Decision Theory)Informatik 2022. 1. 14. 19:01
지도 학습(Supervised Learning)의 분류(Classification)에 해당하는 머신러닝(Machine Learning) 기법인 베이즈 결정 이론은 일상생활에서 흔하게 볼 수 있고 사용할 수 있는 기법이다. 예를 들어, 스팸 메일을 분류할 때 사용하거나, 가짜 뉴스를 판별한다던지, 더 나아가서 숫자, 글자, 문서까지도 분류할 수 있다. 베이즈 결정 이론의 큰 범주로 예 / 아니오로 분류하는 이진 분류(Binary Classification)와 여러 개의 군으로 분류하는 멀티 클래스 분류(Mutli-Class Classification)로 나눌 수 있다. 앞에서 든 예로 스팸 메일 분류와 가짜 뉴스 판별은 이진 분류에 해당하고, 숫자, 글자, 문서 분류는 멀티 클래스 분류에 해당한다. 이진 ..