전체 글 103

[2025/01/31]내일배움캠프 QA/QC 1기 - 29일차

코드카타(https://essay2892.tistory.com/88) 통계학&머신러닝 개인과제 제출(https://essay2892.tistory.com/89) 머신러닝 심화 강의 마무리머신러닝의 기초머신러닝의 기본, 개념회귀분석가장 설명을 잘하는 직선을 그리는 법 - 선형회귀실제 값과 예측 값의 오차를 계산하라 - Mean Squared Error분류분석특정 범주에 대한 확률 예측하기 - 로지스틱회귀맞춘 것에 대한 지표: 정확도, f1_score데이터 분석 프로세스데이터 수집 → 전처리 → 모델링 → 평가회귀, 분류 모델링 심화의사결정을 기반으로 한 모델 - 의사결정나무나무를 여러 개 만들어서 다수결 원칙을 사용하자 - 랜덤포레스트유유사종의 원리로 예측하자 - KNN약한 학습기를 여러 개 합치자 - 부..

[2025/01/24]~[2025/02/03]통계학/머신러닝 개인과제

더보기# 라이브러리 실행import pandas as pdimport numpy as npimport seaborn as snsfrom scipy import statsimport matplotlib.pyplot as pltfrom sklearn.linear_model import LogisticRegressionfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import LabelEncoderfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics imp..

[2025/01/31]알고리즘 코드카타 19회차

PYTHON1. 정수를 저장한 배열, arr 에서 가장 작은 수를 제거한 배열을 리턴하는 함수, solution을 완성해주세요. 단, 리턴하려는 배열이 빈 배열인 경우엔 배열에 -1을 채워 리턴하세요. 예를들어 arr이 [4,3,2,1]인 경우는 [4,3,2]를 리턴 하고, [10]면 [-1]을 리턴 합니다. def solution(arr):     arr.remove(min(arr))     if len(arr) == 0 :         return [-1]     else :         return arr 2. 단어 s의 가운데 글자를 반환하는 함수, solution을 만들어 보세요. 단어의 길이가 짝수라면 가운데 두글자를 반환하면 됩니다. def solution(s):     if len(s)..

코드카타 2025.01.31

[2025/01/27]내일배움캠프 QA/QC 1기 - 28일차

코드카타(https://essay2892.tistory.com/86) 베이직 라이브세션 1회 + 챌린지 라이브세션 1회 + 머신러닝 주요기법 2회더보기캐글에 이미 많은 데이터분석가들이 올려둔 분석 노트북이 존재. Code에서 정렬 기준 Hotness 를 Most Votes로 변경하고 찾아보면 좋음 금요일까지 숙제 해보기 시계열 데이터특정 시간 간격을 두고 연속적으로 관측된 값.예측, 트렌드 분석, 이상 탐지 등에 사용제조 공정 센서 데이터는 시간 단위, 분 단위, 초 단위로 기록 시계열 데이터의 특징시간 의존성, 자기 상관성, 트렌드와 계절성추세성, 순환성, 불규칙 요소 datetime - 시계열 데이터 다룰때 사용하는 라이브러리 .dayofweek 일주일을 숫자로 변환 분류 - 미리 정의된 범주(클래스..

[2025/01/27]알고리즘 코드카타 18회차

PYTHON1. 어떤 정수들이 있습니다. 이 정수들의 절댓값을 차례대로 담은 정수 배열 absolutes와 이 정수들의 부호를 차례대로 담은 불리언 배열 signs가 매개변수로 주어집니다. 실제 정수들의 합을 구하여 return 하도록 solution 함수를 완성해주세요. def solution(absolutes, signs):     return sum([a if b else -a for a, b in zip(absolutes, signs)]) 2. 프로그래머스 모바일은 개인정보 보호를 위해 고지서를 보낼 때 고객들의 전화번호의 일부를 가립니다.전화번호가 문자열 phone_number로 주어졌을 때, 전화번호의 뒷 4자리를 제외한 나머지 숫자를 전부 *으로 가린 문자열을 리턴하는 함수, solution..

코드카타 2025.01.27

[2025/01/24]내일배움캠프 QA/QC 1기 - 27일차

코드카타(https://essay2892.tistory.com/84) 통계&머신러닝 개인과제 진행중 머신러닝 오프닝 3회 + 머신러닝 주요기법 1회더보기알파 큼, R작음 > 모델이 단순 = 오버피팅 방지, 언더피팅 생길 수 있음 알파 작음, R큼 > 모델 복잡 = 오버피팅 생길 수 있음 벌점 = 알파x(베타^2 합) 릿지회귀 = 모든 독립변수의 가중치를 작게 제약(오버피팅방지) = 알파값을 어느정도 크게 넣음 라쏘 회귀 : 가중치 절대값의 합에 벌점 가중치 절대값의 합이 R 이하가 되도록 규제 벌점 = 알파x(베타 절댓값의 합) 불필요한 독립변수의 가중치를 0으로 만들어 모델에서 제외(과적합 방지) 엘라스틱넷 릿지, 라쏘를 결합한 선형회귀 기법 구 정규화 기법의 장점을 모두 활용 알파 = 0 이면, 릿지..

[2025/01/24]알고리즘 코드카타 17회차

PYTHONarray의 각 element 중 divisor로 나누어 떨어지는 값을 오름차순으로 정렬한 배열을 반환하는 함수, solution을 작성해주세요.divisor로 나누어 떨어지는 element가 하나도 없다면 배열에 -1을 담아 반환하세요. def solution(arr, divisor):     ar = []     for i in arr :         if i % divisor == 0 :             ar.append(i)     if len(ar) == 0 :         ar.append(-1)     answer = sorted(ar)     return answer SQL동물 보호소에 들어온 동물 중 고양이와 개가 각각 몇 마리인지 조회하는 SQL문을 작성해주세요. 이..

코드카타 2025.01.24

[2025/01/23]내일배움캠프 QA/QC 1기 - 26일차

코드카타(https://essay2892.tistory.com/82) 머신러닝 심화 강의 완강 통계학 라이브세션 6회 + 머신러닝 오프닝 2회더보기선형회귀 다중선형회귀 경사하강법  - 현재 상태에서 조금씩 내려가는 방법  - 오차가 가장 적게 나오는 가중치를 찾아 업데이트 진행  - 가장 큰 변화가 일어나는 방향을 따라 더 낮은 지점을 찾음  - 학습률 : 한번에 얼마나 큰 걸음을 내딛을지 결정  - 경사 : 가장 가파른 내리막 방향을 계산  - Local minima 문제에 빠지지 않고 Global minimum 찾아가야함  - linear_model.SGDRegressor # 확률적 경사하강법 회귀 모델 하이퍼 파라미터 : 모델에 직접적인 영향을 주는 값. 사람이 직접 수치를 조정해야 함. SGDRR..

[2025/01/23]알고리즘 코드카타 16회차

PYTHONString형 배열 seoul의 element중 "Kim"의 위치 x를 찾아, "김서방은 x에 있다"는 String을 반환하는 함수, solution을 완성하세요. seoul에 "Kim"은 오직 한 번만 나타나며 잘못된 값이 입력되는 경우는 없습니다. def solution(seoul):     return f"김서방은 {seoul.index('Kim')}에 있다" SQLPRODUCT 테이블에서 상품 카테고리 코드(PRODUCT_CODE 앞 2자리) 별 상품 개수를 출력하는 SQL문을 작성해주세요. 결과는 상품 카테고리 코드를 기준으로 오름차순 정렬해주세요. SELECT SUBSTR(PRODUCT_CODE, 1, 2) CATEGORY, COUNT(*) PRODUCTS FROM PRODUCT G..

코드카타 2025.01.23

[2025/01/22]내일배움캠프 QA/QC 1기 - 25일차

코드카타(https://essay2892.tistory.com/80) 통계학 복습 통계분석 실습📕국가별 기대 수명 데이터 분석 분석 목표본 분석의 목표는 세계 각국의 기대수명(Life Expectancy)에 영향을 미치는 요소를 파악하는 것입니다. 특히 **GDP(국내총생산)**과의 관계를 분석하여, 또한 선진국(Developed)과 개발도상국(Developing) 간의 기대수명 차이를 통계적으로 검증하고, 회귀 분석을 통해 기대수명 예측 모델을 구축하는 것이 주요 목표입니다. 데이터 설명이 데이터는 세계보건기구(WHO)에서 제공한 국가별 기대수명 데이터로, 주요 변수는 다음과 같습니다Country: 국가명Year: 연도 (2000-2015)Status: 국가 상태 ('Developed' 또는 'Dev..