[Machine Learning] 커널 능형 회귀(Kernel Ridge Regression)

Informatik 2022. 3. 2. 01:10

[Machine Learning] 회귀(Regression)

통계학에서 회귀 분석이란 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다. [wikipedia] 분류(Classification) vs. 회귀(Regression) 분류는 $R^{d}$ 상.

minicokr.com

※ [Machine Learning] 언더 피팅과 오버 피팅(Underfitting and Overfitting)

[Machine Learning] 언더 피팅과 오버 피팅(Underfitting and Overfitting)

일반적으로 학습 데이터는 실제 데이터의 부분 집합이므로 학습 데이터에 대해서 오차가 감소하지만 실제 데이터에 대해서 오차가 증가하는데, 이 현상을 오버 피팅이라고 부른다. [wikipedia] $m$

minicokr.com

능형 회귀(Ridge Regression)

SRM(Structural Risk Minimization) 원리로 클래스 함수(Class Function)를 제한하는 모델을 선택한다. 따라서 능형 회귀의 최적화 문제는 다음과 같다.

$min_{w} E (w) s.t. | | w | |^{2} \leq C$

라그랑주 승수법(Lagrage Multiplier)으로 최적 $w$ 를 구한다.

$\nabla_{w} L (w, λ) = \nabla_{w} (\frac{1}{N} w^{⊤} {XX}^{⊤} w - \frac{2}{N} w X t + λ \cdot (| | w | |^{2} - C)) = 0$

$∴ w = ({XX}^{⊤} + \underset{λ}{\underset{⏟}{N λ}} I)^{- 1} Xt$

최소 제곱 오차(Least Square Error):
$X = (x_{1} | \dots | x_{N}), t = (t_{1}, \dots, t_{N})$
$\begin{aligned} E (w) & = \frac{1}{N} \sum_{k = 1}^{N} (w^{⊤} x_{k} - t_{k})^{2} \\ = \frac{1}{N} \sum_{k = 1}^{N} w^{⊤} x_{k} x_{k}^{⊤} w - 2 w^{⊤} x_{k} t_{k} + cst. \\ = \frac{1}{N} w^{⊤} {XX}^{⊤} w - \frac{2}{N} w^{⊤} X t + cst. \end{aligned}$
최소 제곱 오차의 최적 $w$ :
$w = ({XX}^{⊤})^{- 1} Xt$

$λ$ 는 교차 검증(Cross Validation)으로 최적값을 찾을 수 있다. $λ$ 의 값이 클 수록 함수의 모양이 더 납작하다. 따라서, 노이즈(Noise)가 많은 고차원 데이터에 큰 $λ$ 값을 설정하면 도움이 된다.

※ [Machine Learning] 단순 선형 회귀(Simple Linear Regression)

[Machine Learning] 단순 선형 회귀(Simple Linear Regression)

※ [Machine Learning] 회귀(Regression) [Machine Learning] 회귀(Regression) 통계학에서 회귀 분석이란 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다. [wi..

minicokr.com

※ [Machine Learning] 다중 선형 회귀(Multiple Linear Regression)

[Machine Learning] 다중 선형 회귀(Multiple Linear Regression)

※ [Machine Learning] 회귀(Regression) 공부하기 [Machine Learning] 회귀(Regression) 통계학에서 회귀 분석이란 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법..

minicokr.com

항상 선형적인 모델 $R^{d} \to R$ 로 회귀가 가능한 건 아니다. 비선형적인 모양을 따르는 데이터를 처리할 때, 데이터들을 특성 함수로 매핑하여 특성 공간 내에서 선형 분류를 하도록 한다.

$Φ : R^{d} \to R^{h}$

※ [Machine Learning] 커널 기법(Kernel Method): 커널 트릭(Kernel Trick), 서포트 벡터 머신(Support Vector Machine)

[Machine Learning] 커널 기법(Kernel Method): 커널 트릭(Kernel Trick), 서포트 벡터 머신(Support Vector Machine)

기계 학습에서 회귀(Regression)나 $(x_{1}, y_{1}), \dots, (x_{N}, y_{N}) \in R^{n} \times R^{m}$ 분류(Classification) $$(\mathbf {x}_1, y_1), \cdots, (\mathbf {x}_N, y_..

minicokr.com

커널 능형 회귀(Kernel Ridge Regression)

모델을 재정의 하여, $y = w^{⊤} Φ (x)$ , 오차 함수(Error Function)을 최소화한다. ( $w \in R^{h}$ )

$E (w) = \frac{1}{N} \sum_{k = 1}^{N} (w^{⊤} Φ (x_{k}) - t_{k})^{2} s.t. | | w | |^{2} \leq C$

$\begin{array}{r} ∴ w = (Φ (X) Φ (X)^{⊤} + λ I)^{- 1} Φ (X) t / / where Φ (X) = (Φ (x_{1}) | \dots | Φ (x_{N})), and for an appropriate choice of parameter λ . \end{array}$

새로운 데이터는 다음과 같이 회귀한다.

$\begin{aligned} y & = w^{⊤} Φ (x) \\ = Φ (x)^{⊤} w \\ = Φ (x)^{⊤} (Φ (X) Φ (X)^{⊤} + λ I)^{- 1} Φ (X) t \end{aligned}$

커널 기법(Kernel Method)에서 배웠듯이 $< Φ (x) \cdot Φ (x) >= Φ (x)^{⊤} Φ (x)$ 을 커널 $K$ 로 치환하여 커널 트릭(Kernel Trick)을 적용하였다. 하지만, 여기서 문제는 위의 식에서 $Φ (x) Φ (x)^{⊤}$ 와 $Φ (x)^{⊤} Φ (x)$ 는 엄연히 다르다. 따라서 커널 트릭을 적용할 수 있는 형태로 재정리해야 한다.

$\begin{aligned} ∴ y (x) & = k (x, X) (K + λ I)^{- 1} t \\ = \sum_{i = 1}^{N} k (x, x_{i}) \cdot α_{i} \end{aligned}, where α = (K + λ I)^{- 1} t$

커널 함수가 함수 $y$ 의 모양에 상당히 큰 영향을 끼친다.

1. Richard O. Duda, Peter E. Hart, and David G. Stork. 2000. Pattern Classification (2nd Edition). Wiley-Interscience, USA.

2. Müller, K.R., Montavon, G. (2021). Lecture on Machine Learning 1-X. Technische Universität Berlin, Berlin, Germany.

저작자표시 비영리 변경금지

'Informatik' 카테고리의 다른 글

[How to] 맥의 가상 머신에서 GUI 리눅스 실행하기(Running GUI Linux in a virtual machine on a Mac) (0)	2022.12.05
[Machine Learning] 가우시안 프로세스 회귀(Gaussian Process Regression) (0)	2022.03.02
[Machine Learning] SVM(Support Vector Machine): 원초 문제에서 쌍대 문제로(From the Primal to the Dual Problem) (0)	2022.03.01
[Machine Learning] 커널 기법(Kernel Method): 커널 트릭(Kernel Trick), 서포트 벡터 머신(Support Vector Machine) (0)	2022.02.28
[Machine Learning] 멀티 클래스 선형 분류(Multi-Class Linear Classification) (0)	2022.02.22

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

인기포스트

ABOUT ME

지금은 독일 지금은 독일

능형 회귀(Ridge Regression)

커널 능형 회귀(Kernel Ridge Regression)

'Informatik' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

인기포스트

ABOUT ME

능형 회귀(Ridge Regression)

커널 능형 회귀(Kernel Ridge Regression)

'Informatik' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역