아티클 스터디

[2025/01/06]아티클 스터디 7회 - 데이터 분석가는 어떤 일을 하나요?

essay2892 2025. 1. 6. 16:53

요약

비즈니스에서 데이터 기반 의사결정이 선택이 아닌 필수인 시대가 됨

데이터 분석가는 '기획자', 데이터 엔지니어와 사이언티스트는 '개발자'에 가까움

실제로는 회사별로 상이함

데이터 사이언스 벤다이어그램(https://thedatascientist.com/data-science-without-programming/data_science_venn_diagram/)

 

데이터 분석(Data Analysis)은 Maths & Statistics, Business / Domain Expertise 영역

Maths & Statistics - 일반적으로 기초 통계학을 이해하는 정도(머신 러닝 사용시 미적분 벡터 등에 대한 지식도 필요)

 

Business / Domain Expertise - 수치를 보고 좋고 나쁨을 파악하기 위해서는 산업군에 대한 이해와 데이터가 어떤 의미를 담고 있는지 이해할 수 있어야 함, 각 수치가 어떤 의미를 갖는지 이해할 수 있어야 함

 

도메인에 대한 이해

서비스의 흐름을 파악해야 어떤 아이템을 분석할지, 어떤 부분을 개선할 지 생각할 수 있음.

도메인을 이해하기 위해서는 산업에 대한 관심을 가져야 함.

캐글에서 유사 산업 데이터를 찾아보고 데이터를 파악해 보는 것도 좋음

 

문제 해결

데이터로 어떤 것을 할 수 있을지, 어떤 데이터가 필요한지, 가장 빠른 문제 해결법은 어떤 것이 있을지 파악할 때 필요한 능력

 

의사소통

듣는 사람이 이해하기 쉽도록 결과를 공유, 질문에 대답할 준비.

 

의미있는 결론 도출

데이터 분석에서 목표 설정은 매우 중요. 데이터 내에 숨어있는 더 큰 메시지를 가리키는 단서를 알아차릴 수 있어야 함.

지표(Metric)를 쪼개서 보는 것이 중요. 다수의 Input Metric을 투입해서 Output Metric을 얻음

OMTM을 설정하여 어떻게 쪼갤 수 있을까를 고민해야 함.

지표 설정이 올바른지, 허영지표(Vanity Metric)를 세운 것은 아닌지 고민해야 함

 

 

주요 포인트

데이터 분석가는 사내에 다양한 데이터를 분석하는 업무로, 데이터 전체를 아우르며 각각의 데이터를 유형별로 쪼개고 그 안에서 인사이트를 발굴한다.

데이터 분석가는 도메인에 대한 이해, 문제 해결 능력, 의사소통 능력, 결론 도출 능력이 필요함

 

용어 정리

ETL : Extract, Transform, Load. 데이터 추출, 변환, 적재

YoY : Year on Year, 전년 동기 대비 증감률
YTD : Year To Date, 연초 대비 증감률
A/B 테스트 : 두 개의 변형 A와 B를 사용하는 종합 대조 실험

CTR : Click-Through Rate, 클릭률 = 클릭 수/노출 수

OMTM : One Metric That Matters, 서비스의 성장을 위해 지금 우리가 꼭 집중해야 하는 지표 (우선순위)
허영 지표 : Vanity Metric, 보기에는 좋지만, 실제 중요한 숫자들과 상관이 없는 지표

 

실무 적용 사례(채용공고)

동우화인켐(종합전자재료 기업 - Display, Chemical, Energy), 도쿄일렉트론코리아(반도체 장비 제조업체)

 

LG 에너지솔루션
넥슨 메이플스토리 - 데이터 분석가

 

데이터 처리 라이브러리(Python, R, SQL 등) 활용 능력
데이터 시각화(Grafana, Tableau 등), 모델링 역량
TensorFlow, Pytorch 등 AI, 딥러닝 라이브러리 활용 능력

데이터 표준화, 집계, 분석, 이해, 활용 능력 필요
데이터 모델링에 필요한 프로그래밍 언어, 소프트웨어 활용 역량 필요

 

 

 

[출처] 데이터 분석가는 어떤 일을 하나요?

(https://medium.com/modulabs/콘텐츠-크리에이터-소개-b2455d77c6d0)