[ํผ๊ณต๋จธ์ ] 03. ์ ๋ฆฌ
โท ํค์๋ ํต์ฌ ํฌ์ธํธ
ํ๊ท : ์์์ ์์น๋ฅผ ์์ธกํ๋ ๋ฌธ์
ํ๊น๊ฐ๋ ์์์ ์์น๊ฐ ๋จ
k-์ต๊ทผ์ ์ด์ ํ๊ท : k-์ต๊ทผ์ ์ด์ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด ํ๊ท ๋ฌธ์ ํ
๊ฐ์ฅ ๊ฐ๊น์ด ์ด์ ์ํ์ ์ฐพ๊ณ ์ด ์ํ๋ค์ ํ๊น๊ฐ์ ํ๊ท ํ์ฌ ์์ธก์ผ๋ก ์ผ๋๋ค
๊ฒฐ์ ๊ณ์(R์ ๊ณฑ) : ๋ํ์ ์ธ ํ๊ท ๋ฌธ์ ์ ์ฑ๋ฅ ์ธก์ ๋๊ตฌ
1์ ๊ฐ๊น์ธ์๋ก ์ข๊ณ , 0์ ๊ฐ๊น๋ค๋ฉด ์ฑ๋ฅ์ด ๋์ ๋ชจ๋ธ
๊ณผ๋์ ํฉ : ๋ชจ๋ธ์ ํ๋ จ ์ธํธ ์ฑ๋ฅ์ด ํ ์คํธ ์ฑ๋ฅ๋ณด๋ค ํจ์ฌ ๋์ ๋
๋ชจ๋ธ์ด ํ๋ จ ์ธํธ์ ๋๋ฌด ์ง์ฐฉํด์ ๋ฐ์ดํฐ์ ๋ด์ฌ๋ ๊ฑฐ์์ ์ธ ํจํด์ ๊ฐ์งํ์ง ๋ชปํ๋ค
๊ณผ์์ ํฉ : ํ๋ จ ์ธํธ์ ํ ์คํธ ์ธํธ ์ฑ๋ฅ์ด ๋ชจ๋ ๋์ผํ๊ฒ ๋ฎ๊ฑฐ๋ ํ ์คํธ ์ธํธ ์ฑ๋ฅ์ด ์คํ๋ ค ๋์ ๋
๋ ๋ณต์กํ ๋ชจ๋ธ์ ์ฌ์ฉํด ํ๋ จ ์ธํธ์ ์ ๋ง๋ ๋ชจ๋ธ ๋ง๋ค๊ธฐ
์ ํ ํ๊ท : ํน์ฑ๊ณผ ํ๊น ์ฌ์ด์ ๊ด๊ณ๋ฅผ ๊ฐ์ฅ ์ ๋ํ๋ด๋ ์ ํ ๋ฐฉ์ ์ ์ฐพ์
ํน์ฑ์ด ํ๋๋ฉด ์ง์ ๋ฐฉ์ ์
์ ํ ํ๊ท๊ฐ ์ฐพ์ ํน์ฑ๊ณผ ํ๊น ์ฌ์ด์ ๊ด๊ณ๋ ์ ํ ๋ฐฉ์ ์์ ๊ณ์ ๋๋ ๊ฐ์ค์น์ ์ ์ฅ
๊ฐ์ค์น๋ ๋ฐฉ์ ์์ ๊ธฐ์ธ๊ธฐ์ ์ ํธ ๋ชจ๋ ์๋ฏธํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์
๋ชจ๋ธ ํผ๋ผ๋ฏธํฐ : ์ ํ ํ๊ท๊ฐ ์ฐพ์ ๊ฐ์ค์น์ฒ๋ผ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด ํน์ฑ์์ ํ์ตํ ํ๋ผ๋ฏธํฐ
๋คํญ ํ๊ท : ๋คํญ์์ ์ฌ์ฉํ์ฌ ํน์ฑ๊ณผ ํ๊น ์ฌ์ด์ ๊ด๊ณ ๋ํ๋
๋น์ ํ์ผ ์ ์์ง๋ง ์ฌ์ ํ ์ ํ ํ๊ท๋ก ํํํ ์ ์์
๋ค์ค ํ๊ท : ์ฌ๋ฌ ๊ฐ์ ํน์ฑ์ ์ฌ์ฉํ๋ ํ๊ท ๋ชจ๋ธ
ํน์ฑ์ด ๋ง์ผ๋ฉด ์ ํ ๋ชจ๋ธ์ ๊ฐ๋ ฅํ ์ฑ๋ฅ ๋ฐํ
ํน์ฑ ๊ณตํ : ์ฃผ์ด์ง ํน์ฑ์ ์กฐํฉํ์ฌ ์๋ก์ด ํน์ฑ์ ๋ง๋๋ ์ผ๋ จ์ ์์ ๊ณผ์
๋ฆฟ์ง : ๊ท์ ๊ฐ ์๋ ์ ํ ํ๊ท ๋ชจ๋ธ ์ค ํ๋, ์ ํ ๋ชจ๋ธ์ ๊ณ์๋ฅผ ์๊ฒ ๋ง๋ค์ด ๊ณผ๋์ ํฉ ์ํ
๋ผ์ : ๋ ๋ค๋ฅธ ๊ท์ ๊ฐ ์๋ ์ ํ ํ๊ท ๋ชจ๋ธ, ๋ฆฟ์ง์ ๋ฌ๋ฆฌ ๊ณ์ ๊ฐ์ ์์ 0์ผ๋ก ๋ง๋ค ์๋ ์์
ํ์ดํผํ๋ผ๋ฏธํฐ : ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ด ํ์ตํ์ง ์๋ ํ๋ผ๋ฏธํฐ ์ด๋ฐ ํ๋ผ๋ฏธํฐ๋ ์ฌ๋์ด ์ฌ์ ์ ์ง์ ํด์ผ ํจ ์) ๋ฆฟ์ง, ๋ผ์์ ๊ท์ ๊ฐ๋ alpha ํ๋ผ๋ฏธํฐ
โท ํต์ฌ ํจํค์ง, ํจ์
< scikit-learn >
* KNeighborsRegressor : k-์ต๊ทผ์ ์ด์ ํ๊ท ๋ชจ๋ธ์ ๋ง๋๋ ์ฌ์ดํท๋ฐ ํด๋์ค
n_neighbors : ์ด์์ ๊ฐ์ ์ง์ , ๊ธฐ๋ณธ๊ฐ 5
๋ค๋ฅธ ๋งค๊ฐ๋ณ์๋ KNeighborsClassifier ํด๋์ค์ ๊ฑฐ์ ๋์ผ
* mean_absolute_error( ) : ํ๊ท ๋ชจ๋ธ์ ํ๊ท ์ ๋๊ฐ ์ค์ฐจ๋ฅผ ๊ณ์ฐ
์ฒซ ๋ฒ์งธ ๋งค๊ฐ๋ณ์ = ํ๊น, ๋ ๋ฒ์งธ ๋งค๊ฐ๋ณ์ = ์์ธก๊ฐ
* mean_squared_error( ) : ํ๊ท ์ ๊ณฑ ์ค์ฐจ ๊ณ์ฐ
ํ๊น๊ณผ ์์ธก์ ๋บ ๊ฐ์ ์ ๊ณฑํ ๋ค์ ์ ์ฒด ์ํ์ ๋ํด ํ๊ท ํ ๊ฐ์ ๋ฐํ
* LinearRegression : ์ ํ ํ๊ท ํด๋์ค
fit_intercept ๋งค๊ฐ๋ณ์๋ฅผ False๋ก ์ง์ ํ๋ฉด ์ ํธ์ ํ์ตํ์ง ์์, ๊ธฐ๋ณธ๊ฐ True
ํ์ต๋ coef_ ์์ฑ์ ํน์ฑ์ ๋ํ ๊ณ์๋ฅผ ํฌํจํ ๋ฐฐ์ด
์ฆ, ์ด ๋ฐฐ์ด์ ํฌ๊ธฐ๋ ํน์ฑ์ ๊ฐ์์ ๊ฐ์
intercept_ ์์ฑ์๋ ์ ํธ ์ ์ฅ
* PolynomialFeatures : ์ฃผ์ด์ง ํน์ฑ์ ์กฐํฉํ์ฌ ์๋ก์ด ํน์ฑ์ ๋ง๋ ๋ค
degree ์ต๊ณ ์ฐจ์ ์ง์ , ๊ธฐ๋ณธ๊ฐ 2
interaction_only๊ฐ True ์ด๋ฉด ๊ฑฐ๋ญ์ ๊ณฑ ํญ์ ์ ์ธ, ํน์ฑ ๊ฐ์ ๊ณฑ์ ํญ๋ง ์ถ๊ฐ, ๊ธฐ๋ณธ๊ฐ False
include_bias๊ฐ False์ด๋ฉด ์ ํธ์ ์ํ ํน์ฑ์ ์ถ๊ฐํ์ง ์์, ๊ธฐ๋ณธ๊ฐ True
* Ridge : ๋ฆฟ์ง ํ๊ท ๋ชจ๋ธ ํ๋ จ
alpha ๋งค๊ฐ๋ณ์๋ก ๊ท์ ์ ๊ฐ๋ ์กฐ์ , ๊ฐ์ด ํด์๋ก ๊ท์ ์ธ์ง, ๊ธฐ๋ณธ๊ฐ 1
solver ์ต์ ์ ๋ชจ๋ธ ์ฐพ๊ธฐ ์ํ ๋ฐฉ๋ฒ ์ง์
* Lasso : ๋ผ์ ํ๊ท ๋ชจ๋ธ ํ๋ จ
max_iter ์๊ณ ๋ฆฌ์ฆ์ ์ํ ๋ฐ๋ณต ํ์ ์ง์ , ๊ธฐ๋ณธ๊ฐ 1000
< numpy >
* reshape( ) : ๋ฐฐ์ด์ ํฌ๊ธฐ๋ฅผ ๋ฐ๊พธ๋ ๋ฉ์๋
๋ฐ๊พธ๊ธฐ ์ ํ์ ๋ฐฐ์ด ์์ ๊ฐ์๋ ๋์ผํด์ผ ํจ
.reshape(-1,1) : ์ฒซ ๋ฒ์งธ ํฌ๊ธฐ๋ฅผ ๋๋จธ์ง ์์ ๊ฐ์๋ก ์ฑ์ฐ๊ณ , ๋ ๋ฒ์ฌ ํฌ๊ธฐ๋ฅผ 1
< pandas >
* read.csv( ) : csv ํ์ผ์ ๋ก์ปฌ ์ปดํจํฐ๋ ์ธํฐ๋ท์์ ์ฝ์ด ํ๋ค์ค ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํํ๋ ํจ์
sep : csv ํ์ผ์ ๊ตฌ๋ถ์ ์ง์ , ๊ธฐ๋ณธ๊ฐ ์ฝค๋ง(,)
header : ๋ฐ์ดํฐํ๋ ์์ ์ด ์ด๋ฆ์ผ๋ก ์ฌ์ฉํ csv ํ์ผ์ ํ ๋ฒํธ ์ง์ , ๊ธฐ๋ณธ์ ์ผ๋ก ์ฒซ ๋ฒ์จฐ ํ์ ์ด ์ด๋ฆ์ผ๋ก ์ฌ์ฉ
skiprows : ํ์ผ์์ ์ฝ๊ธฐ ์ ์ ๊ฑด๋๋ธ ํ์ ๊ฐ์ ์ง์
nrows : ํ์ผ์์ ์ฝ์ ํ์ ๊ฐ์ ์ง์
โท ํ์ธ๋ฌธ์
1. k-์ต๊ทผ์ ์ด์ ํ๊ท์์๋ ์๋ก์ด ์ํ์ ๋ํ ์์ธก์ ์ด๋ป๊ฒ ๋ง๋๋์?
> ์ด์ ์ํ์ ํ๊น๊ฐ์ ํ๊ท
2. ์ ํ ํ๊ท ๋ชจ๋ธ์ด ์ฐพ์ ๋ฐฉ์ ์์ ๊ณ์๋ฅผ ๋ฌด์์ด๋ผ๊ณ ๋ถ๋ฅด๋์?
> ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ
3. ์ฌ์ดํท๋ฐ์์ ๋คํญ ํ๊ท ๋ชจ๋ธ์ ํ๋ จํ ์ ์๋ ํด๋์ค๋ ๋ฌด์์ธ๊ฐ์?
> LinearRegression
4. a, b, c ํน์ฑ์ผ๋ก ์ด๋ฃจ์ด์ง ํ๋ จ ์ธํธ๋ฅผ PolynomialFeatures(degree=3)์ผ๋ก ๋ณํํ๋ค.
๋ค์ ์ค ์ด ๋ณํ๋ ๋ฐ์ดํฐ์ ํฌํจ๋์ง ์๋ ํน์ฑ์ ๋ฌด์์ธ๊ฐ์?
(1) 1
(2) a
(3) a*b
(4) a*b^3
5. ํน์ฑ์ ํ์คํํ๋ ์ฌ์ดํท๋ฐ ๋ณํ๊ธฐ ํด๋์ค๋ ๋ฌด์์ธ๊ฐ์?
> StandardScaler
6. ๋ค์ ์ค ๊ณผ๋์ ํฉ๊ณผ ๊ณผ์์ ํฉ์ ์ฌ๋ฐ๋ฅด๊ฒ ํํํ์ง ๋ชปํ ๊ฒ์ ๋ฌด์์ธ๊ฐ์?
(1) ๊ณผ๋์ ํฉ์ธ ๋ชจ๋ธ์ ํ๋ จ ์ธํธ์ ์ ์๊ฐ ๋์ต๋๋ค.
(2) ๊ณผ๋์ ํฉ์ธ ๋ชจ๋ธ์ ํ ์คํธ ์ธํธ์ ์ ์๋ ๋์ต๋๋ค.
(3) ๊ณผ์์ ํฉ์ธ ๋ชจ๋ธ์ ํ๋ จ ์ธํธ์ ์ ์๊ฐ ๋ฎ์ต๋๋ค.
(4) ๊ณผ์์ ํฉ์ธ ๋ชจ๋ธ์ ํ ์คํธ ์ธํธ์ ์ ์๋ ๋ฎ์ต๋๋ค.
์ฐธ๊ณ ๋์ : ํผ์๊ณต๋ถํ๋ ๋จธ์ ๋ฌ๋ + ๋ฅ๋ฌ๋, ๋ฐํด์ , ํ๋น๋ฏธ๋์ด, 2020๋
'Ability ๐ฑ > ML' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ํผ๊ณต๋จธ์ ] 04. ์ ๋ฆฌ (1) | 2022.06.21 |
---|---|
[ํผ๊ณต๋จธ์ ] 04. ๋ค์ํ ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ - ๋ก์ง์คํฑ ํ๊ท, ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ (0) | 2022.06.19 |
[ํผ๊ณต๋จธ์ ] 03. ํ๊ท ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ชจ๋ธ ๊ท์ (0) | 2022.04.25 |
[ํผ๊ณต๋จธ์ ] 02. ์ ๋ฆฌ (0) | 2022.04.24 |
[ํผ๊ณต๋จธ์ ] 02. ๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ - ํ๋ จ์ธํธ & ํ ์คํธ ์ธํธ, ์ํ๋ง ํธํฅ, ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ (0) | 2022.04.24 |