요약
비즈니스에서 데이터 기반 의사결정이 선택이 아닌 필수인 시대가 됨
데이터 분석가는 '기획자', 데이터 엔지니어와 사이언티스트는 '개발자'에 가까움
실제로는 회사별로 상이함
데이터 분석(Data Analysis)은 Maths & Statistics, Business / Domain Expertise 영역
Maths & Statistics - 일반적으로 기초 통계학을 이해하는 정도(머신 러닝 사용시 미적분 벡터 등에 대한 지식도 필요)
Business / Domain Expertise - 수치를 보고 좋고 나쁨을 파악하기 위해서는 산업군에 대한 이해와 데이터가 어떤 의미를 담고 있는지 이해할 수 있어야 함, 각 수치가 어떤 의미를 갖는지 이해할 수 있어야 함
도메인에 대한 이해
서비스의 흐름을 파악해야 어떤 아이템을 분석할지, 어떤 부분을 개선할 지 생각할 수 있음.
도메인을 이해하기 위해서는 산업에 대한 관심을 가져야 함.
캐글에서 유사 산업 데이터를 찾아보고 데이터를 파악해 보는 것도 좋음
문제 해결
데이터로 어떤 것을 할 수 있을지, 어떤 데이터가 필요한지, 가장 빠른 문제 해결법은 어떤 것이 있을지 파악할 때 필요한 능력
의사소통
듣는 사람이 이해하기 쉽도록 결과를 공유, 질문에 대답할 준비.
의미있는 결론 도출
데이터 분석에서 목표 설정은 매우 중요. 데이터 내에 숨어있는 더 큰 메시지를 가리키는 단서를 알아차릴 수 있어야 함.
지표(Metric)를 쪼개서 보는 것이 중요. 다수의 Input Metric을 투입해서 Output Metric을 얻음
OMTM을 설정하여 어떻게 쪼갤 수 있을까를 고민해야 함.
지표 설정이 올바른지, 허영지표(Vanity Metric)를 세운 것은 아닌지 고민해야 함
주요 포인트
데이터 분석가는 사내에 다양한 데이터를 분석하는 업무로, 데이터 전체를 아우르며 각각의 데이터를 유형별로 쪼개고 그 안에서 인사이트를 발굴한다.
데이터 분석가는 도메인에 대한 이해, 문제 해결 능력, 의사소통 능력, 결론 도출 능력이 필요함
용어 정리
ETL : Extract, Transform, Load. 데이터 추출, 변환, 적재
YoY : Year on Year, 전년 동기 대비 증감률
YTD : Year To Date, 연초 대비 증감률
A/B 테스트 : 두 개의 변형 A와 B를 사용하는 종합 대조 실험
CTR : Click-Through Rate, 클릭률 = 클릭 수/노출 수
OMTM : One Metric That Matters, 서비스의 성장을 위해 지금 우리가 꼭 집중해야 하는 지표 (우선순위)
허영 지표 : Vanity Metric, 보기에는 좋지만, 실제 중요한 숫자들과 상관이 없는 지표
실무 적용 사례(채용공고)
데이터 처리 라이브러리(Python, R, SQL 등) 활용 능력
데이터 시각화(Grafana, Tableau 등), 모델링 역량
TensorFlow, Pytorch 등 AI, 딥러닝 라이브러리 활용 능력
데이터 표준화, 집계, 분석, 이해, 활용 능력 필요
데이터 모델링에 필요한 프로그래밍 언어, 소프트웨어 활용 역량 필요
[출처] 데이터 분석가는 어떤 일을 하나요?
'아티클 스터디' 카테고리의 다른 글
[2025/01/20]아티클 스터디 10회 - 6시그마란? (0) | 2025.01.20 |
---|---|
[2025/01/12]아티클 스터디 8회 - 제조 업계의 데이터 활용 – 4가지 과제와 해결 방법 설명 (0) | 2025.01.12 |
[2024/12/31]아티클 스터디 6회 - 개발 블로그는 어떻게 써야할까? (0) | 2024.12.31 |
[2024/12/30]아티클 스터디 5회 - 데이터 분석의 시작 (3) | 2024.12.30 |
[2024/12/24]아티클 스터디 4회 - SQL 질문 잘 하는 법; 구글링 (데이터리안) (1) | 2024.12.24 |