목록분류 전체보기 (99)
핀아의 저장소 ( •̀ ω •́ )✧

💡 학습 목표 1. 지도 학습 알고리즘 중 하나인 회귀에 대해 학습 2. K-최근접 이웃 회귀와 선형 회귀 그리고 다항 회귀에 대해 학습 3. 다중 회귀에 대해 알아보고 특성 공학에 대해 학습 목차 K-최근접 이웃 회귀 농아 데이터 준비 데이터 분리 K-최근접 이웃 회귀 알고리즘 학습 및 정확도 측정 과대적합 vs 과소적합 선형 회귀 K-최근접 이웃의 한계 선형회귀 알고리즘 다항 회귀 다중 회귀 특성공학 데이터 준비 특성 만들기 다중 회귀 모델 훈련 및 모델 점수 측정 규제 릿지(ridge) 라쏘(lasso) 3️⃣ 다중 회귀 💡 여러 개의 특성을 사용하여 모델을 훈련시킨 선형 회귀를 다종 회귀라 함 ✅ 특성공학 💡 주어진 특성(무게, 길이 등)을 조합하여 새로운 특성을 만드는 일련의 과정 주어진 농어의..
현재 가상환경을 하나 만들어서 파이썬 프로젝트를 진행하고 있다고 해보자. 프로젝트를 하다보니 필요한 패키지가 많아서 장고도 깔고, 비클립트도 깔고 JWT도 깔고... 이것저것 다 깔았다. 그런데 프로젝트를 나 혼자하는게 아니다보니 똑같은 환경에서 동료도 작업을 진행해야하는데, 이 패키지들을 하나하나 다 설치하라고 하면 너무 번거로울 것만 같다. 이때 우리는 pip freeze라는 명령어를 활용해 이 모든 과정을 한 번에 처리할 수 있다. pip freeze라는 명령어는 현재 작업 환경(가상환경)에 설치되어있는 패키지의 리스트를 모두 출력해준다. 예를 들어 아래의 패키지들이 설치가 되어있다고 하자. >>> pip freeze asgiref==3.2.3 bcrypt==3.1.7 beautifulsoup4==..

💡 학습 목표 1. 지도 학습 알고리즘 중 하나인 회귀에 대해 학습 2. K-최근접 이웃 회귀와 선형 회귀 그리고 다항 회귀에 대해 학습 3. 다중 회귀에 대해 알아보고 특성 공학에 대해 학습 목차 K-최근접 이웃 회귀 농아 데이터 준비 데이터 분리 K-최근접 이웃 회귀 알고리즘 학습 및 정확도 측정 과대적합 vs 과소적합 선형 회귀 K-최근접 이웃의 한계 선형회귀 알고리즘 다항 회귀 다중 회귀 특성공학 데이터 준비 특성 만들기 다중 회귀 모델 훈련 및 모델 점수 측정 규제 릿지(ridge) 라쏘(lasso) 1️⃣ K-최근접 이웃 회귀 💡 회귀 알고리즘에 대해 알아보고 회귀 알고리즘의 한 종류인 K-최근접 이웃 회귀에 대해 정리하고 농어의 길이만 가지고 무게를 예측해보기 ✨ 회귀란? 지도 학습 알고리즘..
generator 는 간단하게 설명하면 iterator 를 생성해 주는 function이다. iterator 는 next() 메소드를 이용해 데이터에 순차적으로 접근이 가능한 object 이다. 💡 이터레이터란 next() 함수 호출 시 계속 그다음 값을 반환하는 객체 generator 는 일반적인 함수와 비슷하게 보이지만, 가장 큰 차이 점은 yield 라는 구문일 것이다. 아래는 generator 함수의 예시 구문이다. def generator(n): i = 0 while i < n: yield i i += 1 일반 함수와의 차이는 yield 외에는 없다. 그렇다면 먼저 yield 구문이 무엇인지 먼저 알아보자. ✅ yield yield 는 generator 가 일반 함수와 구분되는 가장 핵심적인 부..

💡 학습 목표 1. 지도 학습과 비지도 학습의 차이점 비교 2. 훈련 세트와 테스트 세트의 정의 3, 샘플링 편항 및 해결 방안 4. 데이터 전처리의 필요성 목차 지도 학습 vs 비지도 학습 훈련 세트와 테스트 세트 샘플링 편향 샘플링 편향 문제 해결하기 데이터 전처리 1️⃣ 지도 학습 vs 비지도 학습 머신러닝 알고리즘은 크게 지도 학습과 비지도 학습으로 나눌 수 있음 ✅ 지도 학습 (supervised learning) 지도 학습 알고리즘은 훈련 데이터(training data)가 필수로 필요함. 일반적으로 지도 학습에서 데이터는 입력(input), 정답은 타깃(target)이라 표현하며 이 둘을 합쳐 훈련 데이터(training data)라 부름 지도 학습은 정답이 있으니 알고리즘이 정답을 맞히는 ..

가끔씩 컬럼 내의 데이터가 아래와 같이 Dictionary 형태의 String으로 된 경우가 있다. 컬럼의 데이터들을 Dictionary의 Key값으로 Column을 만들고, Value들을 각각의 Row로 만든다면 분석이 한결 편리해진다. 이럴 때는 간단히 key값만 column으로 뽑고, values들만 모아서 list로 만들어 준 다음에, 이 둘을 DataFrame 생성시 인자로 넘겨 주면 된다. import json import pandas as pd # Dictionary로 보이는 값들은 사실 String이다. Dictionary로 읽어들인다. df = data.apply(lambda x:json.loads(x['loc']), axis=1 ) df = pd.DataFrame(df, columns=..