일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 논문제안서
- 케글타이타닉
- cohort study
- 통계디자인
- gam모델
- 통계학석사
- Machine Learning
- 통계실험
- 관찰연구
- 영국통계대학원
- Data Science
- Spatial Data
- RCB
- 통계예상문제
- factorial design
- statistical experiment
- literature review
- 머신러닝
- 통계대학원
- 타이타닉데이터
- 통계석사
- Smoothing
- blocking
- Titanic - Machine Learning from Disaster
- mean model
- 영국대학원
- 코호트연구
- 영국석사
- 데이터사이언스
- soap film smoothing
- Today
- Total
DS and stats
Observational study(관찰 연구) 추가 내용/Case-Control Study 본문
Observational study(관찰 연구) 추가 내용/Case-Control Study
으르미 2022. 4. 19. 08:00우리가 코호트 연구를 진행할 때 할 수 있는 여러가지 방법이 있다.
그 중 예시를 들어보자면,
가정: A(새로운 치료제)와 B(기존 치료제) 중 어떤 것이 더 효과적인가
방법1: 동시에 한 클리닉은 새로운 치료제를 주입한 환자, 다른 클리닉에서는 기존의 치료제를 주입한 환자의 결과를 비교한다.
방법2: 과거의 기존 치료제를 주입한 환자들에게 새로운 치료제를 주입하여 결과를 비교해본다.(같은 환자에게 기존(과거) 치료제, 새로운 치료제(현재) 2번 주입하는 것)
방법3: 기존의 치료제를 이용한 과거의 결과를 바탕으로 다른 환자에게 새로운 치료제를 주입하여 결과를 비교한다.
방법1에서 confounder: 서로 다른 클리닉에서 주입하기 때문에 의사의 스킬이나 병원의 환경이 요소가 될 수 있고, 다른 환자들에게 각각 주입하는 것이기 때문에 사람마다 효과, 병의 심각도에 따라 다를 수 있다.
방법2에서는 기존의 치료제의 효과가 남아있을 수 있고, 해당 날짜의 습도나 온도가 confounder가 될 수 있다.
방법3에서는 각 환자마다 병의 심각도나 효과가 다를 수 있다.
Confounding
병의 심각도나 진행상황에 차이가 있기 때문에 노출 집단과 비노출 집단이 비교가 불가능하다.
결과적으로, 효과의 추정치는 일반적으로 노출집단과 비 노출 집단간 다른 위험요소가 조정되었을 때 변한다.
Case-Control Study
- Controlled cohort study(통제된 코호트 연구)
: 시간이 지남에 따라 두 그룹(또는 그 이상)의 개인 그룹을 추적하고 각 그룹 내에서 질병의 발생을 계산
각 개인에 따라 노출 범주는 고정되어 있고 병의 결과는 무작위로 발생된다.
예를 들어, 병을 가지고 있는 경우가 있다고 할 때, 반대되는 사례의 경우가 두번째 그룹이 되고 이것을 controls(대조군)라고 한다.
모든 집단은 병의 결과는 알지만 노출 집단은 무작위로 다뤄진다.
case-control study에서는 m_0와 m_1이 미리 고정되어 있다.
코호트 연구에서는 질병의 결과가 노출집단과 비노출집단을 시간에 따라 추적하여 결정된다.
case-control study에서는 노출범주가 사례와 대조군의 이력을 근간하여 결정된다.
노출 E가 있는 경우 및 대조군의 비율을 비교한다.
E와 D 사이에 연관성이 없는 경우 사례 및 대조군에서 노출된 비율이 유사해야 함.
RR/OR
- odd ratio: 노출집단과 결과간의 연관성을 측정하는 방법
- 대조군 집단 or 사례 집단이 커지더라도 odd ratio는 변하지 않음
- 노출집단이 있는 사례와 대조군의 비율에 의존
- risk ratio: 두 그룹의 위험을 비교하는 방법
- 선택한 사례 및 대조군의 수에 따라 변하므로 case-control study에서는 추정 불가
- 계산 방법
- OR = \(\frac{a/c} {b/d} \) = \(\frac{a/b} {c/d} \) = \(\frac {ad} {cb} \)
- 신뢰구간에 따른 OR은 코호트 연구와 동일하게 계산되어 진다.
사례-대조군 연구에서 가장 큰 이슈는 어떻게 대조군을 결정할 것인가?
- case가 선택된 동일한 모집단에서 선택되어야 함
- 대조군은 사례군이 될 경우와 동일한 기회를 가져야 함
장점
+ 코호트 연구보다 빠르고 비용이 적다
+ 일반적으로 작은 샘플 사이즈를 요구한다
+ 특히 희귀질환 연구에 적합하다
+ 동시에 많은 위험인자 연구가 가능하다
단점
- 시간 순서 없음: 인과 관계 금지
- 단 하나의 질병 결과
- 상대적 위험에 대한 추정 없음
- 컨트롤이 샘플링되는 방식으로 인해 편향 오류가 발생할 가능성이 있음
'Data science - sem 2 > Statistical design of investigation' 카테고리의 다른 글
Observational studies and Causal inference (관찰 연구 및 인과추론) (0) | 2022.04.17 |
---|---|
[Statistical design] Factorial designs in blocks(RCB) & GCB (0) | 2022.03.15 |
Statistical design - Anova Table (0) | 2022.03.15 |
Experimental designs with multiple factors (0) | 2022.03.13 |
statistical design - Mean model vs. Treatment effects model (0) | 2022.03.12 |