일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 라이엇
- 코로나
- covid
- r
- riotapi
- 시각화
- 에러
- matplotlib
- 오류
- API
- 오픈API
- 파이썬
- kepler
- geopandas설치
- pipwin
- OSMnx
- Python
- Folium
- 라이엇api
- covid19
- 공공데이터포털
- 인코등
- QGIS라벨링
- kepler.gl
- 막대그래프
- geopnadas
- map
- 마커클러스터
- 지도
- geopandas에러
- Today
- Total
목록Python/[Scikit-learn] (2)
Nerdy
앞전에는 회귀분석을 통한 예측 모델을 생성한 후 모델 성능을 측청하는 MAE, MSE, MAPE 등 지표들을 알아봤으면 이번 포스팅에서는 분류 모델의 성능 측정하는 방법을 알아볼려고 한다. # 사용 모듈 혼동행렬(오차행렬) : confusion matrix 정확도(accuracy) : accuracy_score 정밀도(precision) : precision_score 재현율(recall) : recall_score F1 score : f1_score F beta score : fbeta_score 먼저 실제값과 예측값을 기반으로 confusion matrix를 생성한다. from sklearn.metrics import confusion_matrix y_true = [0, 1, 0, 1, 1, 0, 1..
회귀분석을 통해 예측 모델을 만들고 해당 모델의 성능을 파악하기 위해 사이킷런에서는 판단할 수 있는 지표 모듈이 있다. # 선형 회귀모델(Linear Regression) 생성 사이킷런 라이브러리에 datasets 모듈을 생성한 후 당뇨병 데이터셋을 대상으로 선형회귀모델(Linear Regression)을 만든다. # 1. 데이터셋 가져오기 data = datasets.load_diabetes() # 당뇨병 데이터셋 로딩 data.target # 2. 데이터프레임 변환 후 합치기 df = pd.DataFrame(data.data, columns = data.feature_names) # 데이터셋 데이터 데이터프레임 변환 y = pd.DataFrame(data.target, columns = ['y']) ..