Ability ๐ŸŒฑ

๊ฒ€์ƒ‰๊ฒฐ๊ณผ 64 ๊ฐœ
[AWS Data Engineering] 8์žฅ. ๋ฐ์ดํ„ฐ ์†Œ๋น„์ž ์‹๋ณ„ ๋ฐ ํ™œ์„ฑํ™”

๋ฐ์ดํ„ฐ ์†Œ๋น„์ž๋Š” ๋ฐ์ดํ„ฐ์— ์•ก์„ธ์Šคํ•ด์•ผ ํ•˜๋Š” ์กฐ์ง ๋‚ด ์‚ฌ๋žŒ ๋˜๋Š” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์œผ๋กœ ์ •์˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๊ฐ€ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ชจ๋“  ์ž‘์—…์€ ๋ฐ์ดํ„ฐ ์†Œ๋น„์ž๊ฐ€ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ์œ ์šฉํ•˜๊ณ  ์‰ฝ๊ฒŒ ์•ก์„ธ์Šคํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ์ ์ ˆํ•œ ๋„๊ตฌ๋ฅผ ํ†ตํ•ด ์ ์ ˆํ•œ ๋ฐ์ดํ„ฐ ์†Œ๋น„์ž์—๊ฒŒ ์ ์ ˆํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ ์‹œ์— ์ œ๊ณตํ•˜์—ฌ ๊ธฐ์—…์ด ์ •๋ณด์— ๊ทผ๊ฑฐํ•œ ์˜์‚ฌ๊ฒฐ์ •์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ์žฅ์—์„œ๋Š” ๋‹ค์Œ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ๋ฏผ์ฃผํ™”์˜ ์˜ํ–ฅ ์ดํ•ด ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”๋กœ ๋น„์ฆˆ๋‹ˆ์Šค ์‚ฌ์šฉ์ž์˜ ์š”๊ตฌ ์ถฉ์กฑ ๊ตฌ์กฐํ™”๋œ ๋ณด๊ณ ๋กœ ๋ฐ์ดํ„ฐ ๋ถ„์„๊ฐ€์˜ ์š”๊ตฌ ์‚ฌํ•ญ ์ถฉ์กฑ ๋ฐ์ดํ„ฐ ๊ณผํ•™์ž ๋ฐ ML ๋ชจ๋ธ์˜ ์š”๊ตฌ ์‚ฌํ•ญ ์ถฉ์กฑ 1. ๋ฐ์ดํ„ฐ ๋ฏผ์ฃผํ™”์˜ ์˜ํ–ฅ ์ดํ•ด ๋ฐ์ดํ„ฐ ๋ฏผ์ฃผํ™”๋Š” ์ฆ๊ฐ€ํ•˜๋Š” ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ ๋ฐ์ดํ„ฐ์˜ ์ ‘๊ทผ์„ฑ์„ ์‹œ๊ธฐ์ ์ ˆํ•˜๊ณ  ๋น„์šฉ ํšจ์œจ์ด ๋†’์€ ๋ฐฉ๋ฒ•์œผ๋กœ ๊ฐ•ํ™”ํ•จ์œผ๋กœ์จ ๋Œ€๋ถ€..

[AWS Data Engineering] 5์žฅ. ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ํŒŒ์ดํ”„๋ผ์ธ ์„ค๊ณ„

๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ์€ ์—ฌ๋Ÿฌ ์†Œ์Šค์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ์ตœ์ ํ™” ๋ฐ ๋ณ€ํ™˜ํ•˜๋ฉฐ ๋ฐ์ดํ„ฐ ์†Œ๋น„์ž๊ฐ€ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ํ”„๋กœ์„ธ์Šค์ž…๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์—ญํ• ์˜ ์ค‘์š”ํ•œ ๊ธฐ๋Šฅ์€ ์ด๋Ÿฌํ•œ ํŒŒ์ดํ”„๋ผ์ธ์„ ์„ค๊ณ„ํ•˜๊ฑฐ๋‚˜ ์„ค๊ณ„ํ•˜๋Š” ๋Šฅ๋ ฅ์ž…๋‹ˆ๋‹ค. ์ด ์žฅ์—์„œ๋Š” ๋‹ค์Œ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ์„ค๊ณ„ ์ž‘์—… ์ ‘๊ทผ ๋ฐ์ดํ„ฐ ์†Œ๋น„์ž ์‹๋ณ„ ๋ฐ ์š”๊ตฌ ์‚ฌํ•ญ ์ดํ•ด ๋ฐ์ดํ„ฐ ์†Œ์Šค ์‹๋ณ„ ๋ฐ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ์ดํ„ฐ ๋ณ€ํ™˜ ๋ฐ ์ตœ์ ํ™” ์‹๋ณ„ ๋ฐ์ดํ„ฐ ๋งˆํŠธ์— ๋ฐ์ดํ„ฐ ๋กœ๋“œ ํ™”์ดํŠธ๋ณด๋“œ ์„ธ์…˜ ๋งˆ๋ฌด๋ฆฌ 1. ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ์•„ํ‚คํ…์ฒ˜ ์ ‘๊ทผ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ํ”„๋กœ์ ํŠธ๋ฅผ ์‹œ์ž‘ํ•  ๋•Œ ํ”ํžˆ ๋ณผ ์ˆ˜ ์žˆ๋Š” ์‹ค์ˆ˜๋Š” ๋ชจ๋“  ์ž‘์—…์„ ํ•œ ๋ฒˆ์— ์ˆ˜ํ–‰ํ•˜์—ฌ ๋ชจ๋“  ์‚ฌ์šฉ ์‚ฌ๋ก€๋ฅผ ํฌํ•จํ•˜๋Š” ์†”๋ฃจ์…˜์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ณด๋‹ค ๋‚˜์€ ์ ‘๊ทผ๋ฒ•์€ ๊ตฌ์ฒด์ ์ธ ์‚ฌ์šฉ ์‚ฌ๋ก€๋ฅผ ์‹๋ณ„ํ•˜๊ณ , ๊ทธ ํ•˜๋‚˜์˜ ๊ฒฐ๊ณผ์— ..

[ํ…์ŠคํŠธ๋งˆ์ด๋‹] Word2Vec Modeling ์‹ค์Šต

Word2Vec ์ด๋ก  one-hot encoding์€ ๋‹จ์–ด๋ฅผ ๋ฒกํ„ฐ๋กœ ๋‚˜ํƒ€๋‚ผ ๋•Œ ์ด ๋‹จ์–ด ์ˆ˜๋งŒํผ์˜ ๊ธธ์ด์˜ ๋ฒกํ„ฐ์—์„œ ๋‹ค๋ฅธ ๋ชจ๋“  ๊ฐ’์€ 0์œผ๋กœ ํ•˜๊ณ  ๋‹จ์–ด ๋ฒˆํ˜ธ์— ํ•ด๋‹นํ•˜๋Š” ์›์†Œ๋งŒ 1๋กœ ํ‘œ์‹œํ•œ๋‹ค. 'ํ† ๋ผ', '๋„์„œ๊ด€', '๋ฌผ' 3 ๋‹จ์–ด๋งŒ ์žˆ๊ณ  ์ˆœ์„œ๋Œ€๋กœ 1~3๋ฒˆ์ด๋ผ๋ฉด ํ† ๋ผ๋Š”(1,0,0), ๋„์„œ๊ด€์€(0,1,0), ๋ฌผ์€(0,0,1)๋กœ ๋‚˜ํƒœ๋‚œ๋‹ค. ๋‹จ์–ด์˜ ์˜๋ฏธ๋ฅผ ๊ณ ๋ คํ•˜์ง€ ์•Š์œผ๋ฉฐ ๋ฒกํ„ฐ์˜ ๊ธธ์ด๊ฐ€ ์ด ๋‹จ์–ด ์ˆ˜๊ฐ€ ๋˜๋ฏ€๋กœ ํฌ๋ฐ•ํ•œ ํ˜•ํƒœ๊ฐ€ ๋œ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹จ์–ด์˜ ์˜๋ฏธ๋ฅผ ๊ณ ๋ คํ•˜์—ฌ ์กฐ๋ฐ€ํ•œ ์ฐจ์›์— ๋‹จ์–ด๋ฅผ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์„ ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ์ด๋ผ๊ณ  ํ•œ๋‹ค. ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ์€ ๋‹จ์–ด์˜ ์˜๋ฏธ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ‘œํ˜„ํ•˜๊ธฐ ๋•Œ๋ฌธ์— one-hot encoding๋ณด๋‹ค ํ•™์Šต ์„ฑ๋Šฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ๋‹ค. ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ์˜ ์ข…๋ฅ˜์—๋Š” LSA, Word2Vec, GloVe, F..

[ํ…์ŠคํŠธ๋งˆ์ด๋‹] LDA์™€ Topic Modeling ๊ฐœ๋… ๋ฐ ํ™œ์šฉ

Topic Modeling ๋ฌธ์„œ๋ฅผ ์ด๋ฃจ๊ณ  ์žˆ๋Š” ํ‚ค์›Œ๋“œ๋“ค์„ ๋ฐ”ํƒ•์œผ๋กœ ๋ฌธ์„œ์—์„œ ์ฃผ์ œ(Topic)๋ฅผ ๋„์ถœํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ํ†ต๊ณ„์  ๋ถ„์„๋ฐฉ๋ฒ•์ด๋‹ค. ๋น„์ •ํ˜• ํ…์ŠคํŠธ ๋ถ„์„์— ๋งŽ์ด ์‚ฌ์šฉ๋˜๊ณ  ์žˆ์œผ๋ฉฐ ๋‹ค์–‘ํ•œ ์ข…๋ฅ˜์˜ ๋ฐ์ดํ„ฐ์—๋„ ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค. ์ฃผ์ œ๋ณ„ ํ‚ค์›Œ๋“œ ๋ถ„ํฌ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ฃผ์–ด์ง„ ๋ฌธ์„œ์—์„œ ๋ฐœ๊ฒฌ๋œ ํ‚ค์›Œ๋“œ ๋ถ„ํฌ๋ฅผ ๋ถ„์„ํ•จ์œผ๋กœ์จ ํ•ด๋‹น ๋ฌธ์„œ์— ์‚ฌ์šฉ๋œ ์ฃผ์ œ๋“ค์„ ์ถ”์ •ํ•˜๊ณ  ๋ฌธ์„œ๋“ค์„ ์ฃผ์ œ๋ณ„๋กœ ๋ถ„๋ฅ˜ํ•œ๋‹ค. ๋˜ํ•œ, ๋ฌธ์„œ๋“ค์ด ์–ด๋–ค ์ฃผ์ œ๋“ค์„ ํ•จ๊ป˜ ๋‹ค๋ฃจ๊ณ  ์žˆ์„์ง€ ์˜ˆ์ธก์ด ๊ฐ€๋Šฅํ•˜๊ณ  ์‹œ๊ฐ„์— ๋”ฐ๋ผ ์ฃผ์ œ๋“ค์˜ ๋™ํ–ฅ ํŒŒ์•…๊ณผ ์‹ ๊ทœ ๋ฌธ์„œ๊ฐ€ ์–ด๋Š ์ฃผ์ œ์— ๋Œ€ํ•œ ๊ฒƒ์ธ์ง€ ๋“ฑ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ž ์žฌ ๋””๋ฆฌํด๋ ˆ ํ• ๋‹น (Latent Dirichlet Allocation : LDA) > ๊ฐœ๋… ๋””๋ฆฌํด๋ ˆ ๋ถ„ํฌ๋ฅผ ์ด์šฉํ•˜์—ฌ ์ฃผ์–ด์ง„ ๋ฌธ์„œ์— ์ˆจ๊ฒจ์ ธ ์žˆ๋Š” ์ฃผ์ œ๋“ค์„ ์ถ”๋ก ํ•˜๋Š” ํ™•๋ฅ ๋ชจ๋ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด..

[๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด์Šคํ† ์–ด ๋ฆฌ๋ทฐ ํฌ๋กค๋ง] ํฌ๋กค๋ง ๋„๊ตฌ Uipath์™€ google-play-scraper ์„ฑ๋Šฅ ๋น„๊ต

ํ•˜๋‚˜์บํ”ผํƒˆ ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด์Šคํ† ์–ด ๋ฆฌ๋ทฐ๋Š” ๋ชจ๋‹ฌ ์œˆ๋„์šฐ๋ฅผ ํ†ตํ•ด ์ œ๊ณต๋œ๋‹ค ๋ธŒ๋ผ์šฐ์ € ์œ„์— ๋ ˆ์ด์–ด๊ฐ€ ๊น”๋ ค ์žˆ๊ณ  ์Šคํฌ๋กค ํ•  ๋•Œ๋งˆ๋‹ค ์ƒˆ๋กœ์šด ๋ฆฌ๋ทฐ๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ๋ฌดํ•œ ์Šคํฌ๋กค ํ˜•ํƒœ์ด๋‹ค ๋”ฐ๋ผ์„œ URL์ด ๋ณ€ํ™”์—†์ด ๊ทธ๋Œ€๋กœ ํŽ˜์ด์ง•๋˜๋ฉฐ, ๋‹ค์Œ ํŽ˜์ด์ง€๋กœ ๋„˜์–ด๊ฐˆ ์ˆ˜ ์žˆ๋Š” ๋ฒ„ํŠผ๋„ ์—†๋‹ค -> ์ด ๋ถ€๋ถ„์ด ๋ฐ์ดํ„ฐ ํฌ๋กค๋ง ๋ณต์žก๋„๋ฅผ ์ˆ˜์ง ์ƒ์Šน์‹œ์ผฐ๋‹ค Uipath๋กœ ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ ํฌ๋กค๋ง RPA ๋„๊ตฌ ์ค‘ ํ•˜๋‚˜์ธ Uipath๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด์Šคํ† ์–ด ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ๋ฅผ ํฌ๋กค๋งํ–ˆ๋‹ค โ— Uipath ํฌ๋กค๋ง ํ”„๋กœ์„ธ์Šค Flow chart โžก๏ธ ํ…Œ์ด๋ธ” ์ถ”์ถœ โžก๏ธ ์—‘์…€ ์ €์žฅ 1๏ธโƒฃ Main Sequence์— Flow chart ์ถ”๊ฐ€(Flow chart๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ž‘์—…) 2๏ธโƒฃ ํ…Œ์ด๋ธ” ์ถ”์ถœ 2-1. ์ถ”๊ฐ€๋œ Flow chart์— Sequence ์ถ”๊ฐ€ ํ›„ ์‹œ์ž‘๋…ธ๋“œ๋กœ ์ง€์ • 2-..