ML DL DS
-
6장 최소 제곱 추정법ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
6장 최소 제곱 추정법 Part 3. 통계적 추론통계적 추론: 확률변수와 분포에 대한 지식을 이용해 관측 자료로부터 통계적 모수를 학습하는 것.선형회귀분석 모형 추정을 위해 등장한 최소제곱법, 선형모형을 넘어 통합적 통계적 추론 방법을 구축한 피셔의 최대 우도 주청법, 베이지안 추정법을 설명https://github.com/JWarmenhoven/ISLR-pythonhttps://github.com/emredjan/ISL-python 최소 제곱 추정법이란RSS(Resiual Sum of Squares)의 시각화가우스 마르코프 정리 (Gauss Markov Therom)최소제곱 추정량(Least Squares Estimators)은 선형성, 오차분산의 일정성, 독립성이라는 가정하에서 최소분산을 가진 선형 ..
-
5장 회귀 분석ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
5장 회귀 분석 회귀분석이란회귀분석은 2개 이상의 확률변수들 사이의 관계를 추론하기 위해 등장상관성 분석과 달리 회귀분석에서는 변수들이 서로 상이한 지위를 가짐cf 공분산 Cov[X,Y]=E[(X−μ)(Y−ν)]Cov[X,Y] = E[(X-\mu)(Y-\nu)]Cov[X,Y]=E[(X−μ)(Y−ν)] 상관계수 ρXY≡Cov[X,Y]V[X]V[Y]\rho_{XY} \equiv {{Cov[X,Y]}\over{\sqrt{V[X]}\sqrt{V[Y]}}}ρXY≡V[X]V[Y]Cov[X,Y]종속변수가 불연속적인 경우, 종속 변수와 비선형관계를 가지는 경우로 확장되어 사용 가능기본 구조종속변수 = 체계적인 부분 + 비체계적 부분체계적 부분 = f(설명변수, 통제 변수)종속변수: 이론적 가설의 논리적 도착..
-
4장 독립성, 연관성 그리고 상관성ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
4장 독립성, 연관성 그리고 상관성Part 2. 자료에서 분석으로확률 지식을 이용해 자료를 분석하는 방법을 논의한다. 자료분석은 자료에서 드러나는 패턴을 찾아 읽고 해석하는 작업으로 부터 시작한다. 패턴해석의 기초개념은 연관성과 상관성이다. 상관성 분석을 확장해 회귀분석에 다다르며, 사회과학 분석 방법의 꽃인 회귀분석에 대해 집중적으로 살펴보며, 왜 20세기 사회과학방법론의 가장 중요한 방법론인지 설명한다.통계적 추론: 확률변수와 분포에 대한 지식을 이용해 관측자료로부터 미지의 정보를 얻는 것미지의 정보: 단순 기술통계를 제외하고 변수간의 관계를 뜻함변수간 관계에 대한 4가지 통계적 개념독립성(independence): X에 대한 정보는 Y에 대해 아무런 정보를 주지 못함.연관성, 종속성 (associa..