데이터 ν’ˆμ§ˆμ˜ λΉ„λ°€ (3)
Β·
πŸ›’οΈ Database
데이터 μˆ˜μ§‘ · μ •μ œ · λ³€ν™˜ · ν…ŒμŠ€νŠΈ(1) 데이터 μˆ˜μ§‘μˆ˜μ§‘μ—λ§Œ μ΄ˆμ μ„ 두면 데이터 νŒŒμ΄ν”„λΌμΈμ˜ μ‹œμž‘ 뢀뢄인 μ—…μŠ€νŠΈλ¦Όμ— μžˆλŠ” μ§„μž…μ μ΄ κ°€μž₯ μ€‘μš”ν•˜λ‹€κ³  μ†Œκ°œν•œλ‹€. Dockerλ₯Ό μ˜ˆμ‹œλ‘œ λ“€λ©΄ entrypoint라고 ν•  수 μžˆλ‹€. μ§„μž…μ μ˜ λ°μ΄ν„°λŠ” λͺ¨λΈλ§μ„ ν•˜λŠ” μ™ΈλΆ€ μ„Έκ³„μ˜ μ „ν˜•μ μΈ λ…Έμ΄μ¦ˆμ™€ λΆˆκ·œμΉ™μ„±μ„ λͺ¨λ‘ λ‚΄ν¬ν•˜κ³  μžˆμ–΄ κ°€μž₯ μ›μ‹œμ μ΄λ‹€. λŒ€κ²Œ 데이터 μ—”μ§€λ‹ˆμ–΄κ°€ 데이터 μˆ˜μ§‘ μ†ŒμŠ€λ₯Ό λ³΄μœ ν•˜μ§€λŠ” μ•ŠλŠ”λ‹€. λŒ€λΆ€λΆ„ 뢄석 μ„œλΉ„μŠ€ λ˜λŠ” API와 같은 일뢀 λΉ„μ¦ˆλ‹ˆμŠ€ λͺ©ν‘œ, μ—…μŠ€νŠΈλ¦Ό 도ꡬ에 μ˜μ‘΄ν•œλ‹€. 데이터 μ†ŒμŠ€λŠ” 크게 μ„Έκ°€μ§€λ‘œ λΆ„λ₯˜ λœλ‹€.μ• ν”Œλ¦¬μΌ€μ΄μ…˜ 둜그 λ°μ΄ν„°μ†Œν”„νŠΈμ›¨μ–΄ μ• ν”Œλ¦¬μΌ€μ΄μ…˜ λ‚΄μ˜ μž‘μ—…μœΌλ‘œ μƒμ„±λœ 데이터λ₯Ό λ‚˜νƒ€λ‚΄λ©° ν΄λΌμ΄μ–ΈνŠΈμš© λ˜λŠ” λ‚΄λΆ€μš©μΌ 수 μžˆλ‹€. μž‘μ—…μ€ μ‚¬μš©μž μ‹œμž‘ λ˜λŠ” ν”„λ‘œκ·Έλž˜λ° 방식일 수 μžˆλ‹€. μ†Œν”„νŠΈ..
데이터 ν’ˆμ§ˆμ˜ λΉ„λ°€ (2)
Β·
πŸ›’οΈ Database
μ‹ λ’°ν•  수 μžˆλŠ” 데이터 μ‹œμŠ€ν…œ ꡬ좕을 μœ„ν•œ 블둝 쑰립(1) 운영 데이터와 뢄석 λ°μ΄ν„°μ˜ 차이쑰직 λ‚΄ 데이터λ₯Ό κ°€μž₯ 크게 ꡬ뢄해 달라고 ν•œλ‹€λ©΄ κ°„λ‹¨ν•˜κ²Œ 운영 데이터와 뢄석 λ°μ΄ν„°λ‘œ λ‚˜λˆŒ 수 μžˆλ‹€. 운영 λ°μ΄ν„°μ˜ ν’ˆμ§ˆκ³Ό μ‹ λ’°μ„± κ΄€λ¦¬λŠ” μ’…μ’… (DevOps, SRE), 뢄석 λ°μ΄ν„°μ˜ κ΄€λ¦¬λŠ” μ†Œν”„νŠΈμ›¨μ–΄ ν”„λ‘œλ•νŠΈμ™€ 관련이 μžˆμ„ 것이닀. κ°„λ‹¨ν•œ 예둜 OLTP와 OLAP라고 λ³Ό 수 μžˆλ‹€. μš΄μ˜μƒμ΄λƒ 뢄석을 μœ„ν•΄ 이냐 차이둜 보면 λœλ‹€.운영 λ°μ΄ν„°λŠ” μš΄μ˜μƒ μƒμ„±λœ 데이터, μ‘°μ§μ—μ„œ 일상적인 μš΄μ˜μ„ 톡해 μƒμ„±λœ 데이터이닀. νŠΉμ • μ‹œμ μ˜ 인벀토리 μŠ€λƒ…μƒ·, 고객 인상 및 거래 기둝 λͺ¨λ‘ 운영 데이터에 μ†ν•œλ‹€.뢄석 λ°μ΄ν„°λŠ” λΆ„μ„μ μœΌλ‘œ μ‚¬μš©λ˜λŠ” 데이터, 데이터 기반 μ˜μ‚¬ 결정에 ν™œμš©λ˜λŠ” 데이터λ₯Ό λ§ν•œλ‹€. μ „ν™˜λ₯ , 클릭λ₯ , κΈ€λ‘œλ²Œ..
데이터 ν’ˆμ§ˆμ˜ λΉ„λ°€ (1)
Β·
πŸ›’οΈ Database
Introμ€ŒμΈν¬λŠ” 데이터 ν’ˆμ§ˆλ¬Έμ œλ‘œ 고객의 20%κ°€ μ΄νƒˆν•œ κ²½ν—˜μ„ 가지고 μžˆλ‹€. 데이터 쑰직이 ν’ˆμ§ˆ 문제λ₯Ό μ²˜λ¦¬ν•˜κΈ° μœ„ν•΄ 전체 μ—…λ¬΄μ˜ 40%이상 μ†Œλͺ¨ν•œλ‹€. ν•˜μ§€λ§Œ 데이터 κ΄€λ ¨ μ‚¬μ†Œν•œ μ΄μŠˆλŠ” μ§€μ†μ μœΌλ‘œ λ°œμƒν•˜κ³  데이터 였λ₯˜λŠ” ν”ν•œ μΌμ΄λ―€λ‘œ λ†€λž„ 일은 μ•„λ‹ˆμ—ˆλ‹€.남극 νƒν—˜κ°€λ“€μ€ μ‹ λ’°ν•  수 μ—†λŠ” μ €ν’ˆμ§ˆ λ°μ΄ν„°λ‘œ λͺ©μ μ§€μΈ λ‚¨κ·Ήμ˜ μœ„μΉ˜λ₯Ό 잘λͺ» 계산1999λ…„ ν™”μ„± κΈ°ν›„ ꢀ도선(NASA) μ‚¬κ³ λŠ” 미터법을 ν˜Όλ™ν•˜μ—¬ λ°œμƒν•œ 일, 이 일둜 1μ–΅ 2500만 λ‹¬λŸ¬ λΉ„μš© λ°œμƒν•„μžλŠ” 이처럼 ν”ν•˜μ§€λ§Œ 큰 사고λ₯Ό λ°œμƒν•  수 μžˆλŠ”λ°μ΄ν„° λ‹€μš΄νƒ€μž„μ„ 방지 ν•˜κΈ° μœ„ν•΄ 데이터 ν’ˆμ§ˆμ„ μœ μ§€, κ΄€λ¦¬ν•˜λŠ” 방법을 μ œμ‹œν•˜κ³ μž 문제λ₯Ό λΆ„μ„ν–ˆλ‹€.(1) 데이터 ν’ˆμ§ˆμ΄λž€?μ‹ λ’°μ„±(reliability), μ™„μ „μ„±(completeness), μ •ν™•μ„±(accuracy..
λ‹€ν–ˆλ‹€
'데이터' νƒœκ·Έμ˜ κΈ€ λͺ©λ‘