728x90

제λͺ©: "λ°μ΄ν„°λ‘œ μ „λ¬Έκ°€μ²˜λŸΌ λ§ν•˜κΈ° : νš¨μœ¨μ  μ˜μ‚¬ μ „달을 μœ„ν•œ λ°μ΄ν„° μ‹œκ°ν™”와 λΉ„μ¦ˆλ‹ˆμŠ€ μŠ€ν† λ¦¬ν…”λ§μ˜ κΈ°μˆ "
μ €μž: μΉΌ 올친

 

keyword

쀑앙 μ§‘μ€‘ν˜• 데이터 뢄석 νŒ€, λΆ„μ‚°ν˜• 데이터 뢄석, Data visualization society, Preppin data set

 

 

쀑앙 μ§‘μ€‘ν˜• 데이터 뢄석 νŒ€ vs λΆ„μ‚°ν˜• 데이터 뢄석 νŒ€

https://medium.com/@mikldd/data-team-structure-embedded-or-centralised-f179aa231108

 

λͺ¨λΈ Centralised(쀑앙 μ§‘μ€‘ν˜•) Hybrid Embedded(λΆ„μ‚°ν˜•)
νŒ€ ꡬ쑰 데이터 μ›¨μ–΄ν•˜μš°μŠ€λ‘œ 데이터λ₯Ό μˆ˜μ§‘ν•˜λŠ” 쀑앙 μ§‘μ€‘ν˜• μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ”
데이터 μ—”μ§€λ‹ˆμ–΄ νŒ€
μ½”μ–΄ 데이터 ν…Œμ΄λΈ”μ„ κ°œμ„ ν•˜λŠ” μž‘μ—…μ„ λΆ€λΆ„μ μœΌλ‘œ μˆ˜ν–‰ν•˜μ§€λ§Œ product νŒ€μ—μ„œλ„ μΌν•˜λŠ”
뢄석 μ—”μ§€λ‹ˆμ–΄λ§ νŒ€
λ§ˆμΌ€νŒ…κ³Ό 같은 λΉ„μ¦ˆλ‹ˆμŠ€νŒ€μ˜ μΌμ›μœΌλ‘œ μ™„μ „ ν†΅ν•©λ˜μ–΄ μΌν•˜λŠ” 
데이터 λΆ„석가 νŒ€
μž₯점 μ „λ¬Έμ„± κ°•ν™”
쀑앙 μš°μ„ ν™”
λ©˜ν† λ§
운영 λΉ„μš© κ°μ†Œ
--μ ˆμΆ©μ•ˆ-- Task Force
νš¨μœ¨μ„± 증가
Agile
Domain λ„μž… 용이
단점 즉각 λŒ€μ‘ λΆˆκ°€
μ΄ν•΄κ΄€κ³„μž 이외 μ ‘κ·Ό 뢈편

μš”κ΅¬μ‚¬ν•­ μ¦κ°€λ‘œ μΈν•œ κ΄€λ¦¬μ˜ 어렀움 Data 관리 λΉ„μš© 증가

 

 3곳의 μž‘μ€ IT νšŒμ‚¬λ₯Ό λ‹€λ‹ˆλ©΄μ„œ λŠλ‚€ λ°”λ‘œλŠ” 적어도 μ†Œκ·œλͺ¨ νšŒμ‚¬μ˜ 경우 Hybridμ—μ„œ Embedded 사이가 κ°€μž₯ μ λ‹Ήν•œ μœ„μΉ˜μΌ κ²ƒμœΌλ‘œ 보인닀. Centralised의 경우 λ‹΄λ‹Ήμžμ˜ λΆ€μž¬κ°€ 정말 큰 μ§€μ—° μ‚¬ν•­μœΌλ‘œ λ°œμƒν•œλ‹€. κ·Έλ ‡λ‹€κ³  Embedded ꡬ쑰둜 μš΄μ˜μ„ 맞좜 경우 Agile둜 λ°œμƒν•œ data legacyλ₯Ό 따라가기 μ–΄λ ΅κ³  common dataκ°€ μ—†μ–΄ λˆ„κ΅¬ν•˜λ‚˜ schemaλ₯Ό λ³€κ²½ν•˜κΈ° μ–΄λ €μ›Œ κ²°κ΅­ 더 큰 λΉ„μš©μ„ 치루게 될 κ°€λŠ₯ 성이 λ†’λ‹€. 제일 이상적인 상황은 κ΄€λ¦¬μžλ₯Ό μ—¬λŸΏ λ‘λŠ” κ²ƒμ΄μ§€λ§Œ μž‘μ„ 수둝 κ΄€λ¦¬μžλŠ” μ—†κ³  데이터 뢄석가가 이λ₯Ό λ‹€ 관리할 상황이 많기 λ•Œλ¬Έμ— μ μ ˆν•œ νŒ€μ˜ ꡬ쑰λ₯Ό κ°–μΆ°μ•Ό "κ³ λ‹¬ν”ˆ μ‚Ά"을 ν”Όν•  수 μžˆμ„ 것이닀. 졜근 νŽΈν•œ 관리 툴이 λ§Žμ§€λ§Œ λ‹€λ£° μ£Ό μ•„λŠ” μ‚¬λžŒμ΄ 적어 데이터 μ›¨μ–΄ν•˜μš°μŠ€λ₯Ό μ–΄λ–»κ²Œ κ΅¬μΆ•ν•˜κ³  관리할 μ§€κ°€ μ€‘μš”ν•œ KPI이닀.

 

Data Engineer : Analytics Engineer 

2022.4.24 κΈ°μ€€

  




 

κ΄€λ ¨ 자료

 

Carl Allchin (https://www.linkedin.com/in/carl-allchin-9160451b/

더보기

Tableau Zen Master이자 μ—¬λŸ¬ 번 νƒœλΈ”λ‘œ μ•°λ²„μ„œλ”λ₯Ό μ—­μž„ν–ˆμœΌλ©° 런던의 Data Schoolμ—μ„œ 세계 졜고의 데이터 뢄석 ꡐ윑 ν”„λ‘œκ·Έλž¨ 쀑 ν•˜λ‚˜μ˜ β€˜κΈ°νƒ€β€™ μˆ˜μ„ μ½”μΉ˜μ΄λ‹€. λΉ„μ¦ˆλ‹ˆμŠ€ μΈν…”λ¦¬μ „μŠ€ 뢄석가 및 κ΄€λ¦¬μžλ‘œ 금육 μ„œλΉ„μŠ€μ—μ„œ 10λ…„ λ„˜κ²Œ μΌν•œ ν›„ κ·ΈλŠ” μ»¨μ„€νŒ…, λΈ”λ‘œκΉ… 및 μ‹œμž₯을 μ„ λ„ν•˜λŠ” 데이터 μ†”λ£¨μ…˜μ— λŒ€ν•œ κ΅μœ‘μ„ 톡해 수백 개의 νšŒμ‚¬λ₯Ό μ§€μ›ν–ˆλ‹€. κ·ΈλŠ” νƒœλΈ”λ‘œ 및 기타 데이터 도ꡬ에 λŒ€ν•œ μœ μΌν•œ μ£Όκ°„ 데이터 μ€€λΉ„ 과제인 Preppin’ Data의 곡동 μ„€λ¦½μžμ΄λ‹€.

https://www.getdbt.com/data-teams/centralized-vs-decentralized

 

Centralized vs Decentralized Data Teams

Over the last four years, the data team at Snaptravel has grown from one analyst to almost a dozen, and they've experimented with five data team structures.

www.getdbt.com

https://medium.com/@mikldd/data-team-structure-embedded-or-centralised-f179aa231108

 

Data team structure: embedded or centralised?

Embedded data teams are closer to business problems but ownership of what to do when data goes wrong is complicated

medium.com

 

λ°˜μ‘ν˜•
λ‹€ν–ˆλ‹€