Mimikyu

Lasso & Ridge 회귀 분석, 로지스틱 회귀 & 랜덤포레스트를 활용한 변수 선택 및 분석

✅ Lasso & Ridge 회귀 분석 개요 Lasso와 Ridge 회귀는 선형 회귀에서 다중공선성을 해결하고 변수 선택(Feature Selection)을 할 때 유용한 정규화 기법입니다. 🔹 Lasso 회귀 (L1 정규화) 특징 불필요한 변수를 자동으로 0으로 만들어 제거하는 기능이 있음 (변수 선택 기능). 즉, 중요한 변수만 ...

당뇨 합병증 예측 - 데이터 분할 전 SMOTE 적용은 왜 위험한가?

1. 문제 정의 의료 데이터 분석에서 클래스 불균형 문제는 매우 흔합니다. 예를 들어, 합병증이 있는 환자와 없는 환자의 비율이 5:95와 같이 심각하게 불균형할 수 있습니다. 이런 경우, SMOTE(Synthetic Minority Over-sampling Technique)와 같은 오버샘플링 기법을 사용하여 데이터 균형을 맞추는 것이 일반적입니다....