내일배움캠프 강의 숙제 11

[2025/01/02]데이터 전처리 & 시각화 숙제

이제는 응용! 배운 것을 다 활용해서 숙제를 해볼까요? 1. flights 데이터셋을 활용해서 그래프를 그려봅시다import seaborn as snsimport matplotlib.pyplot as plt# Seaborn의 내장 데이터셋 'flights' 불러오기flights_data = sns.load_dataset('flights')더보기1) 연도별 총 승객 수yearly_passengers = flights_data[['year','passengers']].groupby('year').sum().reset_index()plt.bar(yearly_passengers['year'], yearly_passengers['passengers'])plt.xlabel('Year')plt.ylabel('Pass..

[2024/12/23]엑셀보다 쉽고 빠른 SQL 5주차 숙제

음식 타입별, 연령별 주문건수 pivot view 만들기더보기select cuisine_type,max(if(age_group=10,order_count,0)) '10대',max(if(age_group=20,order_count,0)) '20대',max(if(age_group=30,order_count,0)) '30대',max(if(age_group=40,order_count,0)) '40대',max(if(age_group=50,order_count,0)) '50대'from(select fo.cuisine_type,case when age between 10 and 19 then 10when age between 20 and 29 then 20when age between 30 and 39 then 30..

[2024/12/20]엑셀보다 쉽고 빠른 SQL 4주차 숙제

식당별 평균 음식 주문 금액과 주문자의 평균 연령을 기반으로 Segmentation 하기평균 음식 주문 금액 기준 : 5,000 이하 / ~10,000 / ~30,000 / 30,000 초과평균 연령 : ~ 20대 / 30대 / 40대 / 50대 이상두 테이블 모두에 데이터가 있는 경우만 조회, 식당 이름 순으로 오름차순 정렬더보기SELECT restaurant_name,case when avg_price 5000 then 'price_group_1'when avg_price > 5000 and avg_price 10000 then 'price_group_2'when avg_price > 10000 and avg_price 30000 then 'price_group_3'when avg_price > 30..

[2024/12/19]데이터 분석 종합반 5주차 숙제

💁🏻‍♀️ 방금 배운 코호트 차트를 조금 더 잘 보이게 만들어볼게요!모든 주차가 같은 조건이면 떨어지는 구간만 색이 연해보이겠죠-? :)숙제 : 아래 그림의 오른쪽 차트와 같은 형태로 시각화 해봅시다-!더보기#라이브러리 불러오기import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltplt.rc('font', family='NanumBarunGothic')# 한글깨짐 방지plt.rc('font', family='NanumBarunGothic')sparta_data = pd.read_table('/content/cohort_data.csv',sep=',')sparta_data.tail()#날짜 데이터 타입 변경format='%Y-%m..

[2024/12/19]데이터 분석 종합반 4주차 숙제

📖 결제 마지막 페이지에서 할인 혜택을 제공할 경우 결제율을 올릴 수 있다는 것을 확인 했습니다. 그렇다면, 얼마만큼의 할인 혜택을 제공하는 것이 결제 전환율을 가장 높일 수 있는지 궁금해졌습니다!할인률이 높으면 높을수록 결제가 많아지는지 데이터를 통해 알아볼까요~? 증명하고자 하는 가설 : 할인율이 높으면 높을 수록 결제 전환율도 높을 것이다. 그리하여, 각 2706명에게 1만원, 2만원, 3만원 쿠폰을 동시에 발송 하였다 더보기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltplt.rc('font', family='NanumBarunGothic')sparta_data = pd.read_table('user_db1.csv',se..

[2024/12/18]데이터 분석 종합반 3주차 숙제

숙제_ 최적의 즉문즉답 시간대를 찾아라! 📖 스파르타코딩클럽은튜터님들이 실시간으로 질문에 답변을 해주는 “즉문즉답”을 운영하고 있습니다. 우리는 수강생의 즉문즉답의 수요가 많은 요일을 알아내서튜터님의 수를 요일에 따라 적절히 배치하고 싶은데요. 즉문 즉답은 궁금한 점을 튜터님께 질문하고 답을 얻는 시간이기 때문에,많은 수강생들의 수강이 완료되는 시점을 아는 것이 중요합니다! 팀장님께서“수강생들의 수업 완료 시간대는 주로 한가한 주말일 것이다” 라는 가설을 세웠습니다.이 가설을 증명을 해봅시다.더보기import pandas as pdsparta_data = pd.read_table('done_detail.csv', sep = ',')sparta_data.head()print(type(sparta_data..

[2024/12/17]데이터 분석 종합반 2주차 숙제

🕵🏻‍♀️ 국제 보건 기구로부터 탐정 여러분에게 의뢰가 들어 왔습니다.📃 요청 내용애리조나 사막지역 원주민인 피마 인디언이 세계에서 당뇨병 발병률이가장 많은 종족으로 조사되었습니다.피마 인디언은 사막지대에 살다보니, 조금만 먹어도 잘 생존 할 수 있도록,음식을 축적 해 놓으려는 유전자를 가지게 되었습니다.하지만, 식생활이 서구화 되면서 비만을 초래해 각종 성인병을 유발 한것으로 예측 됩니다.피마 인디언들을 포함해 세계인의 당뇨병 조기 발견 및 치료를 위해 우리 국제 보건 기구는“**당뇨병 발병에 가장 큰 영향을 미치는 요소는 글루코스(혈당) 수치라고 가설”**을 내렸습니다.우리가 제시하는 피마 인디언 당뇨병 데이터 세트를 분석해우리가 세운 가설이 맞는지 확인해주세요!사례는 두둑히 하겠습니다.💵 ?..

[2024/12/13]데이터 분석 종합반 1주차 숙제

🕵🏻‍♀️ 국제 보건 기구로부터 탐정 여러분에게 의뢰가 들어 왔습니다.📃 요청 내용애리조나 사막지역 원주민인 피마 인디언이 세계에서 당뇨병 발병률이가장 많은 종족으로 조사되었습니다.피마 인디언은 사막지대에 살다보니, 조금만 먹어도 잘 생존 할 수 있도록,음식을 축적 해 놓으려는 유전자를 가지게 되었습니다.하지만, 식생활이 서구화 되면서 비만을 초래해 각종 성인병을 유발 한것으로 예측 됩니다.피마 인디언들을 포함해 세계인의 당뇨병 조기 발견 및 치료를 위해 우리 국제 보건 기구는“당뇨병 발병에 가장 큰 영향을 미치는 요소는 글루코스(혈당) 수치라고 가설”을 내렸습니다.우리가 제시하는 피마 인디언 당뇨병 데이터 세트를 분석해우리가 세운 가설이 맞는지 확인해주세요!사례는 두둑히 하겠습니다.💵  📖 M..