일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 인프라
- 짧은생각
- 머신러닝
- 넘파이
- 데이터프레임
- 데이터다루기
- IT인프라
- MachineLearning
- 프로젝트
- DX컨설턴트
- 교육
- 데이터
- 아키텍처
- It
- 자기개발
- 데이터분석가
- 판다스
- 데이터분석기초
- deeplearning
- KT에이블스쿨
- 데이터다듬기
- 정보화
- 오답노트
- KT에이블스쿨5기
- 딥러닝
- 구조
- 파이썬기초
- 미니프로젝트
- 파이썬
- 데이터분석
- Today
- Total
목록MachineLearning (12)
꾸준히 성장하기

어제는 데이터 준비와 모델링에 대해서 배웠습니다. 이제 여행을 위한 짐도 챙기고 계획을 세웠으니 다양한 알고리즘을 통해서 최적의 값을 찾아나서 봅시다! 오늘은 선형 회귀(Linear Regression)와 K-최근접 이웃(K-Nearest Neighbor)이라는 두 기본 알고리즘에 대해 다뤄보려고 합니다. 참고로 오늘과 내일 배울 알고리즘은 학습데이터 (x_train, y_train)를 모델링하는 것입니다. 1. Linear Regression(선형 회귀) 선형 회귀는 가장 기본적이면서도 강력한 예측 모델링 기법 중 하나입니다. 이는 독립 변수(x)와 종속 변수(y) 간의 선형 관계를 모델링합니다. 수학적으로 이는 y = ax + b와 같이 표현되며, 여기서 a는 기울기(가중치)이고, b는 절편(편향)입..

오늘은 데이터 준비부터 모델링까지 머신러닝의 기초 과정에 대해 다뤄보려고 합니다. (하지만 저에겐 기초가 아니었어요.. 모델링이라는 걸 해본 적 없는 찐문과생...😅) 처음에 이해하느라 조금 힘들었는데 최대한 쉽게 설명해보겠습니다. 1. 데이터 준비: 첫걸음을 뗄 준비하기 머신러닝 여행을 시작하기 전, 데이터 준비 과정은 우리가 어디로 가야 할지, 어떤 도구를 사용할지 결정하는 기초 작업입니다. 1) 라이브러리 불러오기 여행에 필요한 도구들을 준비합니다. numpy, pandas, matplotlib는 머신러닝 여정의 필수 아이템입니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt 2) 데이터 읽어오기 pandas를 사용해..

오늘은 회귀 모델의 성능을 평가하는 방법에 대해 이야기해보려 합니다. 성능 평가라 하면, 간단히 말해 '우리 모델이 얼마나 잘 맞추고 있는가?'를 파악하는 과정입니다. 이 과정에서 중요한 것은 숫자로 나타나는 값들, 즉 오차를 줄이는 것입니다. 오늘의 포스팅에서는 몇 가지 기본 용어와 함께 오차를 어떻게 해석하고, 평가할 수 있는지 살펴보겠습니다. 1. 용어 설명 먼저, 몇 가지 기본 용어를 짚고 넘어가겠습니다. 𝑦 (실제값): 우리가 예측하고자 하는 실제 값입니다. 𝑦̂ (예측값): 모델을 통해 예측된 값입니다. ȳ (평균값): 실제 값들의 평균입니다. 2. 오차에 대한 궁금증 성능 평가를 할 때, 우리의 관심사는 𝑦 - 𝑦̂ (오차), 즉 실제값과 예측값 사이의 차이입니다. 이 오차 값이 여러 개 있..

오늘은 머신러닝 5일간의 여정이 시작되었습니다. 갓장래 강사님이 돌아오셨습니다!!(너무 그리웠어요) 머신러닝의 전체적인 개요와 함께, 모델의 성능을 좌우하는 결정적인 요소 중 하나인 '데이터 전처리'에 대해 이야기해보려고 합니다. 머신러닝 모델의 성능은 얼마나 효과적으로 데이터를 전처리하고, 특히 결측치를 어떻게 처리하느냐에 크게 달려있는데요, 이 주제는 과거에도 한 번 다룬 적이 있습니다. 하지만 중요한 내용인 만큼 복습 차원에서 다시 한번 정리해보고자 합니다. 여러분도 이번 기회에 얼마나 잘 기억하고 있는지 체크해보세요!🌟 1. 머신러닝 개요 1) 분류 머신러닝은 데이터를 기반으로 패턴을 학습하고 예측하는 알고리즘의 집합입니다. 여기서 중요한 점은, 데이터 전처리의 중요성입니다. 코드는 복붙해서 사용..