ML DL DS/사회과학자를위한데이터과학
-
7장 최대 우도 추정법ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
7장 최대 우도 추정법로날드 피셔님이 최대우도추정법을 완성함. MLE - 수리통계학 (참고)Likelihood Function 이란세타로 부터 추출된, 독립인 표본들의 결합분포로 보는 것이다.x가 주어질 때, 세타에 대한 함수로 본다.Regularity Condition - 사전 규칙R0: 세타가 다르면, pdf도 다르다R1: pdf들은 공통의 support를 가진다. pdf가 support란 0보다 큰 값을 갖게 되는 영역ex. 균등분포면 해당 구간, 정규분포면 −∞∼∞-\infty \sim \infty−∞∼∞R2: 세타의 참값 세타 제로는 오메가에 있는 interior point이다.세타 값의 open set을 잡아도 오메가에 들어간다. interior point: 경계가 아닌 점 [a, b]에서는..
-
6장 최소 제곱 추정법ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
6장 최소 제곱 추정법 Part 3. 통계적 추론통계적 추론: 확률변수와 분포에 대한 지식을 이용해 관측 자료로부터 통계적 모수를 학습하는 것.선형회귀분석 모형 추정을 위해 등장한 최소제곱법, 선형모형을 넘어 통합적 통계적 추론 방법을 구축한 피셔의 최대 우도 주청법, 베이지안 추정법을 설명https://github.com/JWarmenhoven/ISLR-pythonhttps://github.com/emredjan/ISL-python 최소 제곱 추정법이란RSS(Resiual Sum of Squares)의 시각화가우스 마르코프 정리 (Gauss Markov Therom)최소제곱 추정량(Least Squares Estimators)은 선형성, 오차분산의 일정성, 독립성이라는 가정하에서 최소분산을 가진 선형 ..
-
5장 회귀 분석ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
5장 회귀 분석 회귀분석이란회귀분석은 2개 이상의 확률변수들 사이의 관계를 추론하기 위해 등장상관성 분석과 달리 회귀분석에서는 변수들이 서로 상이한 지위를 가짐cf 공분산 Cov[X,Y]=E[(X−μ)(Y−ν)]Cov[X,Y] = E[(X-\mu)(Y-\nu)]Cov[X,Y]=E[(X−μ)(Y−ν)] 상관계수 ρXY≡Cov[X,Y]V[X]V[Y]\rho_{XY} \equiv {{Cov[X,Y]}\over{\sqrt{V[X]}\sqrt{V[Y]}}}ρXY≡V[X]V[Y]Cov[X,Y]종속변수가 불연속적인 경우, 종속 변수와 비선형관계를 가지는 경우로 확장되어 사용 가능기본 구조종속변수 = 체계적인 부분 + 비체계적 부분체계적 부분 = f(설명변수, 통제 변수)종속변수: 이론적 가설의 논리적 도착..
-
4장 독립성, 연관성 그리고 상관성ML DL DS/사회과학자를위한데이터과학 2022. 3. 16. 12:08
4장 독립성, 연관성 그리고 상관성Part 2. 자료에서 분석으로확률 지식을 이용해 자료를 분석하는 방법을 논의한다. 자료분석은 자료에서 드러나는 패턴을 찾아 읽고 해석하는 작업으로 부터 시작한다. 패턴해석의 기초개념은 연관성과 상관성이다. 상관성 분석을 확장해 회귀분석에 다다르며, 사회과학 분석 방법의 꽃인 회귀분석에 대해 집중적으로 살펴보며, 왜 20세기 사회과학방법론의 가장 중요한 방법론인지 설명한다.통계적 추론: 확률변수와 분포에 대한 지식을 이용해 관측자료로부터 미지의 정보를 얻는 것미지의 정보: 단순 기술통계를 제외하고 변수간의 관계를 뜻함변수간 관계에 대한 4가지 통계적 개념독립성(independence): X에 대한 정보는 Y에 대해 아무런 정보를 주지 못함.연관성, 종속성 (associa..