일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 논문제안서
- Titanic - Machine Learning from Disaster
- 통계석사
- 영국석사
- 케글타이타닉
- 통계학석사
- 통계예상문제
- blocking
- Data Science
- 통계대학원
- 통계디자인
- Spatial Data
- 관찰연구
- soap film smoothing
- 코호트연구
- RCB
- Machine Learning
- 데이터사이언스
- cohort study
- literature review
- 영국대학원
- 통계실험
- 타이타닉데이터
- 영국통계대학원
- mean model
- factorial design
- Smoothing
- statistical experiment
- 머신러닝
- gam모델
- Today
- Total
목록영국대학원 (6)
DS and stats

안녕하세요, 오늘은 논문 주제가 정해졌으면 제안서와 literature review에 대해서 말하려고 합니다! 저는 학사 때 논문을 쓴 적이 없어서 ㅋㅋㅋㅋ (시험과 논문 사이에서 끼인 세대라 둘다 없었음 ㄷ ㄷ) 처음 쓰는거 + 심지어 영어로 써야함 그래서 두근 두근 걱정도 많았는데요! 다행히 섬세한 지도교수님을 만나서 어떻게 써야하는지 비슷한 주제로 쓴 학생들의 제안서를 먼저 보여주셨어여 ㅋㅋㅋ 물론 그 비슷한 주제는 결국 다른 주제로 바꼈지만 읽어보면서 어떻게 써야하는지 감을 잡을 수 있었습니다! 한 오천단어 정도 쓰는 것을 추천하는데 제안서가 2천 단어 + literature review가 3천 단어 정도면 될 것 같습니다. 그러면 보통 16~20장 정도 나오는 것 같더라구요! 목차를 보면 우선 ..

우리가 코호트 연구를 진행할 때 할 수 있는 여러가지 방법이 있다. 그 중 예시를 들어보자면, 가정: A(새로운 치료제)와 B(기존 치료제) 중 어떤 것이 더 효과적인가 방법1: 동시에 한 클리닉은 새로운 치료제를 주입한 환자, 다른 클리닉에서는 기존의 치료제를 주입한 환자의 결과를 비교한다. 방법2: 과거의 기존 치료제를 주입한 환자들에게 새로운 치료제를 주입하여 결과를 비교해본다.(같은 환자에게 기존(과거) 치료제, 새로운 치료제(현재) 2번 주입하는 것) 방법3: 기존의 치료제를 이용한 과거의 결과를 바탕으로 다른 환자에게 새로운 치료제를 주입하여 결과를 비교한다. 방법1에서 confounder: 서로 다른 클리닉에서 주입하기 때문에 의사의 스킬이나 병원의 환경이 요소가 될 수 있고, 다른 환자들에..

관찰 연구는 무작위실험(randomised experiment)가 비윤리적이거나 실행불가능한 경우일 때, 노출 및 결과..?(treatment와 effects)사이의 관계를 실증적으로 조사하는 것이다 잘 디자인된 관찰연구는 가능한 비슷하고 간단한 무작위 실험과 닮았다. 실험과 다르게, 결과는 연구 설계 이전에 관측값으로 존재할 수도 있다. 즉, 존재가 아닌, 어떻게 사용하고 검토할 것인지 따라 분석의 방향을 정해야한다. 인과추론은 데이터로부터 원인-효과 관계가 있는지, 있으면 얼마나 있는지를 추론하는 것이다. 예를 들어, 기술에 대한 정부의 지출과 교수형에 대한 연관성를 찾으려고 한다고 가정해보자. => 정부가 기술에 대한 예산을 삭감하면 교수형이 줄어야한다는 시점을 가지는 것이다. 말도 안됨. 왜 말도..

2022.03.15 - [Data science - sem 2/Statistical design of investigation] - Statistical design - Anova Table Statistical design - Anova Table 우선 ANOVA란? 구글에 따르면 Analysis of variance, 평균 간의 차이를 분석하는데 사용된 통계적 모델과 그것과 관련된 추정 과정(변동)의 집합 잔차나 오류의 변동, treatment의 변동을 표로 나타낸 것이 eat-drink-study.tistory.com 앞에서 하나의 treatment factor에 대한 RCB에 대해서 정리했었다. 이 blocking은 factorial design과 결합했을 때 더욱 더 효과적이고, 각 block에..

우선 ANOVA란? 구글에 따르면 Analysis of variance, 평균 간의 차이를 분석하는데 사용된 통계적 모델과 그것과 관련된 추정 과정(변동)의 집합 잔차나 오류의 변동, treatment의 변동을 표로 나타낸 것이 ANOVA table 어떤 모델이 더 나은지 성능을 측정하기 위해서 reduced model과 general model을 사용하는데 null hypothesis \( H_0 \) : reduced model, alternative model \( H_1 \): general model이라고 하자. null model(= reduced model)에서 \( X\beta = X_0 \hat \mu \) 라서 저번 포스팅에서 구했던 SSE랑은 조금 다르게 나온다 \( SSE_0 = (..

2022.03.11 - [Data science - sem 2/Statistical design of investigation] - 통계 실험 디자인하기 - CRD(Completely Randomised design) 지난 번에 이어서, (means model) $$ Y_{ij} = \mu_i + \epsilon_{ij} $$ 여기서 \( \epsilon_{ij} \) 의 평균이 0이기 때문에 \(E[X] = \mu_i \) 가 된다. 이제 \( \mu_i = \mu + \tau_i \)를 이용하여 선형모델을 만들어보자. (treatment model) $$ Y_{ij} = \mu + \tau_i + \epsilon_{ij} $$ \( \mu_i \) 가 treatment의 영향을 안받는 모든 변수들의 ..