PCA
๐ โโ๏ธํด๋ํฐ์ผ๋ก ๋ณผ ๋ ํน์ ๊ธ์๋ ์ซ์๊ฐ ํ๋ฉด์ ๋ค ์๋์ค๋ฉด, ํด๋ํฐ ๊ฐ๋ก๋ก ๋๋ฆฌ์๋ฉด ๋ฉ๋๋ค
1
2
3
4
5
6
7
8
9
10
<๋ชฉ์ฐจ>
1. PreRequisites
2. PCA
2-1. PCA๋?
2-2. PCA์ฆ๋ช
(์ข ๊ธธ๋ค)
(1) ๐minimize(์ต์ํ)
(2) ๐งโโ๏ธmaximize
3. PCA ์์ฉ
3-1. ์ฐจ์์ถ์(์์)
3-2. ์ฐจ์์ถ์(์์)
1. PreRequistes
2. PCA
2-1. PCA๋?
๋ชฉํ:
์ฐจ์ ์ถ์๋ฅผ ํ ๋ ์ ๋ฐ์ดํฐ์ ๋ถ์ฐ์ ๋ณด์กดํ ๊ฒ
๊ฐ๋ :
์ขํ๊ฐ๋ค์ด ํ๋์ ๋ฐ์ดํฐ๋ค ๊ทธ๋์ ์ฌ๋ฌ ๊ฐ์ ๋ฐํฐ๊ฐ ๋ถํฌ๋ฅผ ์ด๋ฃจ๊ณ ์์
์ฌ๊ธฐ์ ๋ฐ์ดํฐ ๋ถํฌ์ ํ๊ท ์ผ๋ก๋ถํฐ ์์ํด ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช
ํด์ฃผ๋ ๋ฐฉํฅ์ PCA๋ผ ํ๋ค.
์ฆ ๋ชฉํ๋ฅผ ์ฌ์ ์ํ์๋ฉด ๋ค์๋งํด \(\color{red}{\nearrow}\)์ ๋ฒกํฐ๋ฅผ ์ฐพ์ ์ฐจ์์ถ์๋ฅผ ํด์ผํ๋ค
์์:
๋ง์ฝ ๋ด๊ฐ ์ฐพ์ ์ฃผ์ฑ๋ถ ๋ฒกํฐ์ ๋ฐ์ดํฐ๋ค์ ํ๋ํด์ ๋ดค์ ๋,
1์ฐจ์ ์ถ์ผ๋ก ๋ฐ์ดํฐ๋ค์ ์ ์ฌ์ ์์ผฐ๋ค๊ณ ํ์
์ฐจ์ ์ถ์ (2D \(\Rightarrow\) 1D)
๊ฒฐ๋ก :
์์ ๊ฐ๋
์ ํ ๋๋ก ์ด ๋ถํฌ์ ๋ถ์ฐ์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ์ธ \(\color{red}{\nearrow}\)๊ฐ ์ด ๋ถํฌ๋ฅผ ๊ฐ์ฅ ์์ค๋ช
ํ๋ ๋ฐฉํฅ์ด๊ณ ,
๊ทธ๋ฆฌ๊ณ ๋ ๋ฒ์งธ๋ก ๋ถ์ฐ์ด ํฌ๊ณ ์ฒซ๋ฒ์งธ ์ฃผ์ฑ๋ถ๊ณผ orthogonal ํ ๋ฐฉํฅ์ธ \(\color{green}{\nearrow}\)๊ฐ 2๋ฒ์งธ๋ก ์ ์ค๋ช
ํ๋ค.
2-2. PCA์ฆ๋ช (์ข ๊ธธ๋ค)
๋น์ฐํ๊ฒ ๋ฐ์๋ค์ด์ง๋ง๊ณ PCA ๊ฐ๋
์ ๋ํด ์ง๋ฌธ์ ๋์ ธ๋ณด์
---------------์ง๋ฌธ-----------------
1๏ธโฃ ์ ๋ถ์ฐ์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ์ด ์ด ๋ถํฌ๋ฅผ ์ ์ค๋ช
ํ๋๊ฐ?
2๏ธโฃ ์ ๊ทธ๋ค์์ผ๋ก ์ ์ค๋ช
ํ๋ ๋ฐฉํฅ์ ์ฒซ ๋ฒ์งธ ์ฃผ์ฑ๋ถ์ ์์งํ๋?
-----------------------------------------
์ ์ฃผ์ฑ๋ถ๋ถ์ ์ฆ๋ช
์ ์ฒ์๋ถํฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์์ํด๋ณด์
์ฐ์ ํ๊ท ์ผ๋ก๋ถํฐ ์ถ๋ฐํด ๊ฐ์ฅ ๋ถํฌ๋ฅผ ์ ์ค๋ช
ํ๋ ๋ฐฉํฅ์ ์ฐพ์์ผํ๋
ํ์ฌ 4์ฌ๋ถ๋ฉด์ ์๋ ๋ถํฌ๋ค์ ํ๊ท ์ด 0์ด ๋๋๋ก ๋ถํฌ์ ์ค๊ฐ์ ์ ๊ธฐ์ค์์ ์์ ์ผ๋ก ์ฎ๊ธฐ์
์ด๊ฒ ๋ฌด์จ ๋ง์ด๋๋ฉด ์๋ ๊ทธ๋ฆผ ์ฐธ๊ณ
๋ค์ ๋ณธ๋ก ์ผ๋ก ๋์ด๊ฐ์ ์๋ ๊ทธ๋ฆผ์ ๋ณด์
์ ์ด์ x,y ๋ถํฌ๋ค์ ์๋ n๊ฐ ์ค์์ i๋ฒ์งธ ๋ฐ์ดํฐ๋ฅผ $d_i$ ๋ผ ํ์ ย ย ย \(d_i = \begin{bmatrix} x_i \\ y_i\end{bmatrix}\)
ํ๊ท ์ ๋นผ์ง ์์ ๊ฒ์ ์ด๋ ๊ฒ ๋ํ๋ด์ ย ย ย \(\tilde{d_i} \color{blue}{=} \begin{bmatrix} x_i \\ y_i\end{bmatrix}\)
ํ๊ท ์ ๋บ ๊ฒ์ ์ด๋ ๊ฒ โ> ย \(\bar{d_i} \color{red}{=} \begin{bmatrix} \bar{x_i} \\ \bar{y_i}\end{bmatrix}\)
๊ทธ๋ฆฌ๊ณ ์์ 2๋ฒ์งธ ๊ทธ๋ํ๋ฅผ ๋ณด๋ฉด x, y๊ฐ์ ๋ถํฌ๋ฅผ ๋ํ๋ธ ๊ฒ์ด \(\ddots\ddots\ddots\ddots\cdots \color{pink}{\bullet}\) ์ด๋ ๊ฒ ์ฌ๋ฌ ๊ฐ์ ์ ๋ค๋ก ์๋๋ฐ
๊ทธ ํ๊ท ์ ์น ๊ตฌํด ๋์
ํ ๊ฒ์ด \(\bar{d_i} = \begin{bmatrix} \bar{x_i} \\ \bar{y_i}\end{bmatrix}\) ์ด๊ฒ์ด๊ธฐ๋ ํ๋ค
(1) ๐minimize(์ต์ํ)
(์ด ์์์ ๋ชจ๋ ๋ถํฌ๋ค์ ์ต์ error๋ฅผ ์ฐพ๋ ๊ฒ, ์ฆ ์ฃผ์ฑ๋ถ์ ์ฐพ๋ ๊ณผ์ ์ด๋ค)
์ ์๋๋ x,y ๋ถํฌ๋ค์ด ์์ ๋ ๋ชจ๋ ์ ๋ค๊ณผ ๋น๊ตํ์ฌ error(๊ฐ)์ด ๊ฐ์ฅ ์์ ๋๊ฐ ์ธ์ ์ธ์ง ๋น๊ตํ๋๊ฒ ๋ง๋๋ฐ ๊ทธ๋ฌ๋ฉด ๋๋ฌด ํ ๊ฒ ๋ง์์ง๋ฏ๋ก ๋๋ ์ ํ๋๋ง ๋ณด๊ฒ ๋ค
๊ทธ๋ฌ๋ฉด ์ด์ ๋ถํฐ orthogonalํ๋ฉด์ error๊ฐ ๊ฐ์ฅ ์ ์ ์ ๊ณผ ์ฐ๊ฒฐํด์ผํ๋๋ฐ ์์์ x,y๋ฅผ ๊ฐ์ง \(\color{pink}{\bullet}\)์ ์ ํฅํ๋ ๋ฒกํฐ๊ฐ ์์ ๊ฒ์ด๊ณ \(\vec{u}\)๋ก \(\perp\)ํ๊ฒ ์์ ์ ๋ฐ์ ๋ด๋ฆฌ์! ๊ทธ๋ ๊ฒ ๋๋ฉด ๊ทธ ๊ธธ์ด๋ ์ค์ฐจ
๋ค
์ ์ฌ๊ธฐ์ ๊ฐx,y ์ ๋ค์ ๋ถํฌ์ ๋ถ์ฐ์ ๊ฐ์ฅ ์ ์ค๋ช
ํ๋ ๋ฐฉํฅ์ projection ๋ด๋ ธ์ ๋ \(error^2\)์ ๊ฐ์ฅ ์๊ฒ ๋ง๋๋ ๋ฐฉํฅ์ผ๋ก ํฅํ๋๋ผ
์๋ ์์์ ๋ณด๋ฉด ์ต์ ๊ตฌ๊ฐ์ ์ฐพ๋ค๊ฐ ์ฐพ์ผ๋ฉด ๋ฉ์ถฐ์ ๋ง ๊ทธ๋๋ก ์์ ์ ๋ฐ์ ๋ด๋ ค \(\perp\)๋๋ค
์ ์ด๊ฒ์ผ๋ก 1๏ธโฃ ์ ๋ถ์ฐ์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ์ด ์ด ๋ถํฌ๋ฅผ ์ ์ค๋ช
ํ๋๊ฐ?
์ ๋ํ ์ง๋ฌธ์ ํด๊ฒฐ์ด ๋์๊ตฐ
์ด์ด์ min์ ๊ตฌํ๋๋ฐ ํ์ํ ์์ ์๋ฐ ์ฆ error์ ๊ธธ์ด๋ฅผ ๊ตฌํ๊ธฐ ์ํด ์๋ ํ๋ฅผ ๋ณด์
----------------์ฐธ๊ณ -------------------
(1) \(d_i^T u\) ย ์ ์ฌ์ํ ๊ฒฐ๊ณผ \(\Rightarrow\) ์ฆ ์ค์นผ๋ผ
(2) \(d_i^T u\cdot u\) ย ์ ์ฌ์ํ ๊ฒฐ๊ณผ์ u์ ๋ด์ ํ์ฌ u๋ฐฉํฅ์ฑ๋ถ์ ํ๋
(3) \(\left(d_i-d_i^T u\cdot u\right)\) ย \(d_i\) ๋ฒกํฐ์์ u๋ฒกํฐ์ ์ฑ๋ถ ์ ๊ฑฐ
(์ฆ \(a^Ta\) ๊ผด๋ก ๋ง๋ค๋ฉด ์ ๊ณฑ์ฒ๋ผ ๋์ด ๋์ด์ธ ์ค์ฐจ๋ฅผ ๊ตฌํ ์ ์๋ค)
-------------------------------------------
์ ์ ๋ฐ์ดํฐ ํ๋์ error length์ ๋ํ ์์ ์ด๋ ๋ค \(\color{red}{\Rightarrow}\) \(\left(d_i-d_i^T uu\right)^T \left(d_i-d_i^T uu\right)\)
์ด ์ด๊ฑด \(L_2\) norm์ \(\sqrt{x_1^{2}+x_2^{2}+\cdots}\) ํ์์ด๋ค?
๊ทผ๋ฐ ์๊น๋ ๋งํ์ง๋ง \(d_i\)๋ค ์ค ํ ์ ์ด ์๋๋ผ N๊ฐ์ ๋ชจ๋ ๋ฐ์ดํฐ์์ ๊ณ ๋ คํด์ผํ๋
\(\frac{1}{N}\sum_{i} \left(d_i-d_i^T uu\right)^T \left(d_i-d_i^T uu\right)\\ S.T. \quad \vert\vert u\vert\vert_2^2 = u^Tu=1\)
ํด์ \(\Rightarrow\) ์ ์ฒด \(d_i\) error length๋ฅผ ๋ํ ๊ฒ์ ์ ๊ณฑํด N๊ฐ๋ก ๋๋ ์ฃผ๋๋ฐ, ย ์กฐ๊ฑด์ ์ค์ฐจ๊ฑฐ๋ฆฌ์ ๊ณฑ์ด 1์ผ๊ฒ
์ฌ๊ธฐ์ ๋ถ๋ฐฐ๋ฒ์นํด๋ณด์ ย ย ์ฐธ๊ณ ๋ก \(d_i^T u\)๋ ์ค์นผ๋ผ๋ผ์ transposed ์ํฅ ์ ๋ฐ๋๋ค
\(\frac{1}{N}\sum_{i} \left(d_i^Td_i-d_i^Tu\cdot u^Td_i-d_i^T(d_i^Tu)u+d_i^Tu\cdot u^T(d_i^Tu)u\right)\)
์ ์๊น ์์๋ก $u^Tu=1$๋ก ์กฐ๊ฑด์ ๋ถ์ฌํ์๊ณ ์ค์นผ๋ผ๋ ์์ผ๋ก ๋ณด๋ผ ์ ์์ผ๋๊น
\(\frac{1}{N}\sum_{i} \left(d_i^Td_i-d_i^Tu\cdot u^Td_i-(d_i^Tu)d_i^Tu+(d_i^Tu)d_i^Tu\cdot u^Tu\right)\\ \Rightarrow \frac{1}{N}\sum_{i} \left(d_i^Td_i-d_i^Tu\cdot u^Td_i\right)\)
์์ฒ๋ผ ์ ๊ฐ๊ฐ ๋๋๋ฐ ์ฐ๋ฆฌ๋ \(\vec{u}\)๊ฐ ํ์ํ๊ณ , \(d_i^Td_i\) ์ด๊ฑฐ ํ์ ์์ผ๋๊น ์ ๊ฑฐํ์
why?โ> ์ด์ฐจํผ ๋ฐ์ดํฐ์ ์ ๊ณฑํฉ์ ๊ตฌํ ๊ฑด๋ฐ ์ ๊ฑด bias๋ผ์ ์์ผ๋ฉด ๋ชจ๋ธ ์์ธก์ ๋ถํ์ํ ์ํฅ์ ์ฃผ๊ฑฐ๋
๊ทธ๋ ๊ฒ ๋๋ฉด ๋จ๋ ์์ ์๋์ ๊ฐ๋ค
\(\Rightarrow \frac{1}{N}\sum \left(-d_i^Tu\cdot u^Td_i\right)\)
์ ๊ทธ๋ฆฌ๊ณ ์๊น error์ธ ์ด์์ ์ฐธ๊ณ ํ์ ย \(d_i=\tilde{d_i}-\bar{d_i}\)
๊ทธ๋ฆฌ๊ณ u๋ \(d_i\)์ ๊ด๊ณ์์ผ๋ ์์ ๋นผ์ฃผ์ ๊ทธ๋ผ ์์ ์์น๋ฅผ ๋ฐ๊พธ์ด ์ ๊ฐ ๊ฐ๋ฅํ๊ฒ ๋คโฌ๏ธ
\(\Rightarrow \frac{1}{N}\sum_{i} \left(-u^Td_i\cdot d_i^Tu\right) \\ \Rightarrow -u^T\frac{1}{N}\sum \left(d_i\cdot d_i^T\right)u \\ \Rightarrow -u^T\frac{1}{N}\sum_i \left((\tilde{d_i}-\bar{d_i})(\tilde{d_i}-\bar{d_i})^T\right)u\)
์ \(\color{lightgreen}{\square}\)๋ sample covariance matrix๋ ๋น์ทํ๋ค?
\(\begin{bmatrix} cov(x,x) & cos(x,y) \\cov(y,x) & cos(y,y) \end{bmatrix}\) ย ์ด๊ฒ covariance matrix์ธ๋ฐ symmetricํ์ฌ diagonalizableํ๊ธฐ ๋๋ฌธ์ด๋ค.
๊ทผ๋ฐ diagonalizableํ๋ค๊ณ symmetricํ์ง๋ ์๋ค ์์๋์
์๋ฌดํผ \(\color{lightgreen}{\square} = R_d\)๋ผ ํ๊ฒ ๋ค
์ ๊ทธ๋ฌ๋ฉด \(-u^TR_du\)๋ผ๊ณ ํํํ ์ ์๊ฒ ๋ค
์ด๋ \(R_d\)๋ฅผ ํตํด ์๊ฐํ ์ ์๋ ๊ฒ๋ค ย ย \(\begin{cases}if \quad 1D \rightarrow ๋ถ์ฐ\\ if \quad 2D \rightarrow covariance \quad matrix\end{cases}\)
์ ์์ฝํ์๋ฉด \(min=-u^T\frac{1}{N}\sum_i \left((\tilde{d_i}-\bar{d_i})(\tilde{d_i}-\bar{d_i})^T\right)u\) ์ด๊ณ
๋ณ์๋ฅผ ํตํด ๋ฐ๊พธ๋ฉด \(min\color{red}{=}-u^TR_du\) ์ด๋ ๊ฒ ํํํ ์ ์๊ฒ ๋ค
(2) ๐งโโ๏ธmaximize(์ต๋ํ)
์ ๊ฐ๋จํ๊ฒ ์๊ธฐํด ์์ ์์์ -๋ถํธ๋ง ๋บ ๊ฒ์ด๋ค ย \(max\color{red}{=}u^TR_du\)
์ด๊ฒ์ ๋ํ ์ฆ๋ช
์ Lagrangian function ์ฐ์
\(L=u^TR_du+\gamma(1-u^Tu)\)
\(\vec{u}\) ์ ๋ํ ๋ฏธ๋ถ \(\Rightarrow\) ์ฆ \(\vec{u}\)์ ๋ํ ๋ณํ๋์ ์์๋ณธ๋ค๋ ๋ป์ด๋ค.
\(dLu=du^TR_du\color{red}{+} u^TR_ddu\color{red}{-}\gamma d\color{skyblue}{u^Tu}\color{red}{-} \gamma\color{skyblue}{u^T}d\color{skyblue}{u}\)
์ฌ๊ธฐ์ \(\color{skyblue}{u^Tu}\)๋ ์ค์นผ๋ผ๋๊น transposed ์ทจํด๋ ๋๊ฐ๋ค
\(\Rightarrow 2u^TR_du \color{red}{-} 2\gamma u^Tdu \\ = \color{violet}{(}2u^TR_d-2\gamma u^T\color{violet}{)}du\)
์ด์์์ $\color{violet}{(}~~~~\color{violet}{)}$ ๋ถ๋ถ์ $\frac{dL}{du^T}$๋ค ์ด๊ฒ ๋ฌด์จ๋ง์ด๋๋ฉด L/ u row vectors๋ก ๋ฏธ๋ถํ๋ค๋ ๋ป
---------------๋ฒกํฐ์ ๋ฏธ๋ถ-----------------
1๊ฐ์ฉ ๋ฏธ๋ถํ ๊ฒ์ ๊ฐ๋ก๋ก ์์ ๊ฒ
\(\frac{dL}{du^T}\) \(\color{red}{=}\) \(\left[\frac{dL}{du_1} \color{lightgreen}{,} \frac{dL}{du_2} \color{lightgreen}{,} \frac{dL}{du_3} \cdots\right]\)
---------------------------------------------
์๋ฌดํผ ์ฐ๋ฆฌ๋ \(\color{violet}{(}~~~~ \color{violet}{)}\)du ๋ผ๋ ์์์ \(\color{violet}{(}~~~~ \color{violet}{)}\)๊ฐ ๋ฏธ๋ถ์ด๋ ๊ฒ์ ์ ์ ์๋ค
๐งโ๐จ๊ณ์ฐ
์ ๊ทธ๋ผ ์ฐ๋ฆฌ๊ฐ ํ ๊ฒ์ $\frac{dL}{du^T}=0$ ์ ๋ง์กฑํ๋ u ์ค์์ ๊ฐ์ฅ max๋ฅผ ์ฐพ์์ผ ํ๊ณ ์๊น $L$์์ ๋ง์กฑํ๋ค
์๋ฌดํผ ์๊น \(\color{violet}{(}~~~~\color{violet}{)}\)์์์ ์๋ณ์ผ๋ก ๋๊ธฐ๋ฉด \(u^Tr_d=\gamma u^T\)๊ฐ ๋๋ค
๊ทธ๋ฆฌ๊ณ transposed ์ทจํด์ฃผ์ whyโ> \(R_d\)๊ฐ symmetricํ๋ ๋น์ฐํ diagonalizableํ์ฌ orthogonal matrix๋ก decompose ๊ฐ๋ฅ
(์ฐธ๊ณ ๋ก \(\gamma\)๋ ์ค์นผ๋ผ๋ผ transposed ์ํฅ ์๋ค)
\(\left(u^Tr_d\right)^T=\left(\gamma u^T\right)^T \\ \color{red}{\Rightarrow} R_du = \gamma u \quad\quad\quad (\gamma: EigenValue,\quad u: EigenVector)\)
์ ์ด์ \(R_d\)๋ฅผ decompose ํ์
๊ทธ๋ฌ๊ธฐ ์ํด ์๊น ์ ์ ๋ดค๋ ์์ธ \(max=u^TR_du\)๋ก ๋์ด๊ฐ์
\(R_d\): ย ย ย symmetricํด์ diagonalizable๋๋ฏ๋ก orthogonal matrix๋ก decompose๋๋ค๊ณ ํ๋ค
\(u^TR_du \color{red}{=} u^T\left(\gamma_1 q_1q_1^T \color{red}{+} \gamma_2 q_2q_2^T \color{red}{+} \cdots \right)u\)
u๊ฐ ๋ฌด์์ผ ๋ \(q_1, ~~ q_2, ~~ \cdots\)๊ฐ ํฐ ๊ฐ์ผ๋ก ๋์ฌ๊น ?
์ ์๊น u๋ \(R_d\)์ EigenVector๋ผ๊ณ ํ๋ค ๊ทธ๋ง์ u๊ฐ \(q_1, q_2, \cdots\) ์ค์ ํ๋๋ผ๋ ์๊ธฐ๋ค
์ข๋ค ๊ทธ๋ผ ๋ง์ฝ \(\gamma_1 \quad \gamma_2\cdots\)์ด ๋ด๋ฆผ์ฐจ์์ด๊ณ ,ย ย \(u=q_1\) ๋ก ๋ณด์
\(\Rightarrow q_1^T \left(\gamma_1 q_1q_1^T\right)q_1\) ย ์ด๋ ๊ฒ ๋๋๋ฐ \(q_1^Tq_1=1\)๋ก ์์๋๋ \(\gamma_1\)๋ง ๋จ๋๋ค
์ ๊ทธ๋ผ ๋ด๋ฆผ์ฐจ์์ด๋ผ ํ์ผ๋ \(\gamma_1\)์ด ๊ฐ์ฅ ํฐ ์ฃผ์ฑ๋ถ ๋ฒกํฐ๊ณ ๊ทธ๋ค์์ผ๋ก๋ \(\gamma_2\)๋ค
์ฐธ \(q_1 \perp q_2\)๋๊น ์ฆ orthogonalํ์ฌ ์๋ ๊ทธ๋ฆผ์ ๋ถ์ฐ์ ๋๋ฅผ ๋ณด๋ฉด \(q_2\)๊ฐ ์ 2๋ฒ์งธ๋ก ํฐ ์ฃผ์ฑ๋ถ์ผ๋ก ๋ถํฌ๋ฅผ ์ ์ค๋ช
ํ๋์ง ์ ์ ์๋ค
์ ์ด์ 2๏ธโฃ ์ ๊ทธ๋ค์์ผ๋ก ์ ์ค๋ช
ํ๋ ๋ฐฉํฅ์ ์ฒซ ๋ฒ์งธ ์ฃผ์ฑ๋ถ์ ์์งํ๋?
์ง๋ฌธ์ ๋ํ ๋ต์ ํ ์ ์๋ค
3. PCA ์์ฉ
3-1. ์ฐจ์์ถ์(์์)
100์ฐจ์ ๋ฐ์ดํฐ๊ฐ ์๋ค๊ณ ๊ฐ์ ํ์
\(\begin{bmatrix} x\\y\\z\\ \vdots\\\vdots\\\vdots \end{bmatrix}\) ย ์ด๊ฒ์ 100์ฐจ์์ ํ ์ ์ด๋ผ ํ์
์ฌ๊ธฐ์ 100 Dim data์ ์๋ ํ ์ โ> 2 Dim data๋ก ์ถ์ํ๋ ค๋ฉด
i๋ฒ์งธ ๋ฐ์ดํฐ๊ฐ ์์ ๋ ์ถ์ํ ๊ฒฐ๊ณผ๊ฐ ์ด๋ ๊ฒ ๋๋ค \(d_i^Tq_1\cdot q_1+d_i^Tq_2\cdot q_2\)
์ ์์์๋ ์๊ธฐํ์ง๋ง ๋ฐ๋ก ์์ ์์ ๊ฐ๊ฐ (๋ด์ x๋ฐฉํฅ์ฑ) + (๋ด์ x๋ฐฉํฅ์ฑ)
์ ๋ํ๋ธ ๊ฑฐ์ด๋ค
์๋ฌดํผ ์ด ์์ด ๋ฌด์จ ๋ง์ด๋๋ฉด ์ด๋ค ๊ณต๊ฐ์ด ์์ ๋ 2 Dim์ ๋ด๋ฆฐ๋ค๋ ๊ฒ์ธ๋ฐ
์ด 2์ฐจ์์ \(q_1 \quad q_2\)๊ฐ span ํ๋ ๊ณณ์ด๋ค
์ด๊ฒ ๋ฌด์จ ๋ง์ด๋๋ฉด \(q_1=\begin{bmatrix} \vdots\\\vdots\\\vdots \end{bmatrix}, \quad q_2=\begin{bmatrix} \vdots\\\vdots\\\vdots \end{bmatrix}\) ย ๊ฐ๊ฐ 100๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์๋๋ฐ
\(q_1\)๊ณผ \(q_2\)๋ก linear combination ์ฆ spanํ๊ฒ ๋๋ฉด
\(a\begin{bmatrix} \vdots\\\vdots\\\vdots \end{bmatrix}+ b\begin{bmatrix} \vdots\\\vdots\\\vdots \end{bmatrix}\) ย ์ฆ 2 Dim ํ๋ฉด๋ง ๋ํ๋ธ๋ค๋ ๋ป
์ ๊ทธ๋ผ \(\color{blue}{\bullet}\)์ 100 Dim ์์ ํ ์ ์ด๋ผ ํ๊ณ ๊ทธ๊ฒ์ ์๋๋ก ๋ด๋ ธ๋ค๊ณ ์น์
์ฌ๊ธฐ์ 2 Dim์ผ๋ก ๋ด๋ฆฐ ์ ์ด \(d_i^Tq_1\cdot q_1+d_i^Tq_2\cdot q_2\) ๋ค
์ ์ฌ๊ธฐ์ ์ ์ฌ์ํ ์ ์ ๊ฐ์ ์ฐพ๊ธฐ ์ํด ์ขํ๊ฐ์ ๊ตฌํด์ผ๋๋๋ฐ
\(q_1\) ์ถ์ผ๋ก์ ์ขํ๊ฐ์ ๋ด์ ํ ๊ฐ \(\Rightarrow\) \(d_i^Tq_1\)
๋ง์ฐฌ๊ฐ์ง๋ก $q_2$ ์ถ์ผ๋ก์ ์ขํ๊ฐ์ ๋ด์ ํ ๊ฐ \(\Rightarrow\) \(d_i^Tq_2\)
๊ทธ๋ผ ์ ์ฌ์ํ ์ ์ ํํํ๋ ค๋ฉด \(a\begin{bmatrix} 1\\0 \end{bmatrix}+ b\begin{bmatrix} 0\\1 \end{bmatrix}\) ย ์ด๋ฐ์์ผ๋ก ์งํ๋๊ฒ ์ง?
์ ์ฌ์ํ ์ ์ ์์ ์๋ ์์ ์ญํ ์ ๋์ฒดํด์ค๋ค
์ ๊ทธ๋ฌ๋ฉด ๋ฐ์ดํฐ 10000๊ฐ ์ค์์ \(q_{1(100*1)}\), ย \(q_{2(100*1)}\)์ด๋
2์ฐจ์ ์ถ์๋ฅผ ์ํด์๋ ์ซ์ 200๊ฐ๊ฐ ํ์ํ๊ฒ ๊ตฐ
3-2. ์ฐจ์์ถ์(์์)
16x16์ธ 256 Dim์์ PCA๋ฅผ ํตํด 3 Dim์ผ๋ก ์์ถํ์ ๋
์ฐธ๊ณ
- ํํํ์ ย ย ์ฃผ์ฑ๋ถ ๋ถ์ (PCA: Principal Component Analysis) ์ ๋ชจ๋ ๊ฒ!, ๊ณ ์ณ๊ฐ ๋ถํด์ ์์ฉ
- ๊ณต๋์ด์ ์ํ์ ๋ฆฌ ๋ ธํธ ย ย ย ์ฃผ์ฑ๋ถ ๋ถ์(PCA)์ ๊ธฐํํ์ ์๋ฏธ
- ๋ธ๋ฆญ ย ย ย ์ฃผ์ฑ๋ถ ๋ถ์ (PCA)์ ์๋ฆฌ์ ์ ์ฌ์ฒด ๋ฐ์ดํฐ ๋ถ์์์์ ํ์ฉ
- ๊ณ ๋ ค๋ํ๊ต ์ฐ์ ๊ฒฝ์๊ณตํ๋ถ DSBA ย ย ย 01-4: Dimensionality Reduction - PCA