일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- OSMnx
- 지도
- matplotlib
- Python
- covid19
- 에러
- geopandas설치
- geopandas에러
- 시각화
- geopnadas
- 라이엇api
- map
- r
- 마커클러스터
- covid
- Folium
- 오픈API
- 라이엇
- 오류
- pipwin
- 파이썬
- QGIS라벨링
- API
- riotapi
- 막대그래프
- kepler
- kepler.gl
- 인코등
- 코로나
- 공공데이터포털
- Today
- Total
목록Python/[Scikit-learn] (2)
Nerdy

앞전에는 회귀분석을 통한 예측 모델을 생성한 후 모델 성능을 측청하는 MAE, MSE, MAPE 등 지표들을 알아봤으면 이번 포스팅에서는 분류 모델의 성능 측정하는 방법을 알아볼려고 한다. # 사용 모듈 혼동행렬(오차행렬) : confusion matrix 정확도(accuracy) : accuracy_score 정밀도(precision) : precision_score 재현율(recall) : recall_score F1 score : f1_score F beta score : fbeta_score 먼저 실제값과 예측값을 기반으로 confusion matrix를 생성한다. from sklearn.metrics import confusion_matrix y_true = [0, 1, 0, 1, 1, 0, 1..

회귀분석을 통해 예측 모델을 만들고 해당 모델의 성능을 파악하기 위해 사이킷런에서는 판단할 수 있는 지표 모듈이 있다. # 선형 회귀모델(Linear Regression) 생성 사이킷런 라이브러리에 datasets 모듈을 생성한 후 당뇨병 데이터셋을 대상으로 선형회귀모델(Linear Regression)을 만든다. # 1. 데이터셋 가져오기 data = datasets.load_diabetes() # 당뇨병 데이터셋 로딩 data.target # 2. 데이터프레임 변환 후 합치기 df = pd.DataFrame(data.data, columns = data.feature_names) # 데이터셋 데이터 데이터프레임 변환 y = pd.DataFrame(data.target, columns = ['y']) ..