TIL(Today I Learned)

[2024/12/15]내일배움캠프 QA/QC 1기 - 자습

essay2892 2024. 12. 15. 14:04

파이썬 문법 한걸음 더

조건문 : 특정 조건에 맞는 데이터 추출하기 위해 사용

if 조건문 :

 조건 = True 일때 실행되는 문

else :

 조건 = False 일때 실행되는 문

** 들여쓰기에 주의 **

더보기
age = 20
 
if age >= 20 :
  print('성인입니다')
else :
  print('청소년이에요')
# 성인입니다
 
age = 17
 
if age >= 20 :
  print('성인입니다')
else :
  print('청소년이에요')
# 청소년이에요
더보기
age = 65
 
if age > 80 :
  print('아직 정정하시군요')
elif age > 60 :
  print('인생은 60부터!')
else :
  print('아직어려요!')
# 인생은 60부터!
 
age = 20
 
if age > 80 :
  print('아직 정정하시군요')
elif age > 60 :
  print('인생은 60부터!')
else :
  print('아직어려요!')
# 아직어려요!

반복문 : 반복되는 작업을 자동화

for x in 리스트 :

 수행할 문장

더보기
fruits = ['사과', '배', '감', '귤']
 
for fruit in fruits :
  print(fruit)
# 사과
   배
   감
   귤
 
fruits = ['사과', '배', '배', '감', '수박', '귤', '딸기', '사과', '배', '수박']

count = 0
for fruit in fruits :
  if fruit == '사과' :
    count = count + 1

print(count)
# 2

비교연산자 : 주어진 두개의 값 비교, 결과를 True, False로 나타냄

더보기
x = 5
y = 10
ans1 = x > y
ans2 = y > x

print(ans1)
print(ans2)
# False
   True

조건문, 반복문 함께 연습해보기

학생 이름과 키가 기록된 데이터가 있습니다. 키가 170 이상인 학생을 출력해 봅시다!

student_height = {”김철수” : 171, “이슬기”: 160, “양승화”: 180, “이진화”: 175}

더보기
student_height = {'김철수':171, '이슬기':160, '양승화':180, '이진화':175}

for x in student_height :
  if (student_height[x] >= 170) :
    print(x)
 
# 김철수
   양승화
   이진화

 


 

데이터 분석 4강

파이썬을 사용한 타이타닉 생존율 데이터 분석(Pandas)

Pandas : 데이터 분석 기본 세팅, 데이터 분석에 사용

 1) Pandas 사용 선언

   - import pandas as pd

 2) 데이터 가져오기

   - titanic = pd.read_table('파일경로',sep=',')

   - titanic = pd.read_excel('파일이름.xlsx',engine='openpyxl')   < 엑셀 파일

 3) 데이터 확인 및 표 읽기

   - titanic.head()

 4) 공백란 제거

   - print(titanic.isnull().sum())

   - titanic = titanic.dropna()

더보기
import pandas as pd
titanic = pd.read_table('train.csv',sep=',')
titanic.head()
print(titanic.isnull().sum())
titanic = titanic.dropna()

데이터 분석

 1) 상관관계 구하기

더보기
corr=titanic.corr(method='pearson')   -  pearson은 방법론 중 하나
corr
#

 

corr = corr[corr.Survived !=1]    -    Survived 와 Survived의 상관관계는 무조건 1이므로 제거

corr

#

데이터 분석 5강

Matplotlib을 이용한 분석 결과 시각화

 1) 사용 선언

   - import matplotlib.pyplot as plt

 2) 그래프 그리기

   - corr.plot()

 3) 사용할 부분만 남기기

  a) 그래프로 나타낼 열 지정

   - corr['Survived'].plot()

  b) 필요없는 부분 삭제(PassengerId)

   - corr = corr.drop(['PassengerId'], axis ='rows')

     corr['Survived'].plot()

 4) 원하는 그래프로 변경하기(막대그래프화)

더보기

   - corr['Survived'].plot.bar()

 

import matplotlib.pyplot as plt
corr.plot()
#

 

import matplotlib.pyplot as plt

corr['Survived'].plot()
#

 

import matplotlib.pyplot as plt
corr = corr.drop(['PassengerId'], axis ='rows')
corr['Survived'].plot()
#

 

import matplotlib.pyplot as plt
corr = corr.drop(['PassengerId'], axis ='rows')
corr['Survived'].plot.bar()
#