데이터를 공부하면서.
데이터를 공부하며 생각했던 짤막짤막한 내용들 정리!
로지스틱 회귀(Logistic Regression)
로지스틱 회귀란 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법이다.
로지스틱 회귀의 목적은 일반 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수간의 관계를 구체적 함수로 나타내 향후 예측 모델에 사용하는 것이다. 이는 독립 변수의 선형 결합으로 종속 변수를 설명한다는 관점에서 선형 회귀 분석과 비슷하다. 그러나 로지스틱 회귀는 선형 회귀 분석과 달리 종속 변수가 범주형 데이터를 대상으로 하며 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류(Classification) 기법으로도 볼 수 있다. 로지스틱 회귀는 주로 종속변수가 이항형인 문제를 지칭할 때 쓰인다. 두 개 이상의 범주를 다루는 경우 다항 로지스틱 회귀(multinomial logistic regression)이라고 하며 복수의 범주이며 순서가 존재하면 서수 로지스틱 회귀(ordinal logistic regression)이라고 한다.
Multiple Linear Regression(다중 선형 회귀)
- 본문의 일부는 Data Science from scratch(밑바닥부터 시작하는 데이터 과학)을 참고했습니다.
- 본문의 소스코드의 일부는 Joel Grus의 Github에서 Unlicensed 라이선스로 배포되고 있습니다.