티스토리 뷰
- 사건 발생과 관련한 인자가 1개일 때는 log rank test로 충분하지만, 실제 데이터에서는 2개 이상인 경우가 많음
- 치료 방법에 따른 생존의 차이를 보고자 할 때, 치료 방법뿐 아니라 나이, 성별, 환자의 다른 질환, 다른 위험 요소 등
직간접적으로 생존에 영향을 미치는 변수(potential confounders)들을 보정(통제)해야 할 필요가 있음
- 로지스틱 회귀분석은 사건 발생 여부에 초점을 두고, odds ratio를 종속변수로 하여 여러 독립 변수를 보정할 수 있음
- 생존 분석은 odds ratio와 유사한 hazard ratio를 다루므로 로지스틱 회귀분석의 알고리즘을 이용할 수 있으며,
이러한 분석 방법을 cox regression이라고 함
- cox regression은 시간에 관계없이 hazard raio가 일정하다고 가정함 (proportional hazrd assumption)
- 모수 회귀 모형은 추정된 회귀계수가 공변량과 생존 시간과의 관계라면,
비례 위험 모형에서는 공변량과 위험함수에 대한 관계이므로 추정량이 서로 반대 부호를 가지게 됨
- hazard ratio는 odds ratio와 유사하므로 임상적으로 해석이 용이함
예) JM package에 있는 pbc2.id data에서
- sex와 age로 비례 위험 모형을 만들었을 때의 해석

- 실제 hazards ratio는 exp(coef) 값임
- 두 변수 모두 p value 0.05 이하이므로 통계적으로 유의하다고 가정할 때, male에 비해 female의 사망 위혐률이 0.6189배로 감소함
- age의 경우, 1살 많을수록 사망 위험률이 1.04배로 4%씩 증가한다고 해석할 수 있음. 이는 5살 많으면 사망 위험률이 1.04^5 = 1.21배로 20% 증가한다고 추정 가능
library(survminer)
fit.coxph <- coxph(Surv(years, status=='dead') ~ sex + age + drug, data=pbc2.id)
ggforest(fit.coxph, data=pbc2.id)

ratio 1을 기준으로 각 변수의 위험도를 알 수 있음 (female 및 age)
- 층화 분석 (Stratified Analysis)
- data set의 각 층 내에서 관찰 및 기대값을 각각 계산하는 것 (예. 궤양에 의해 층화된 성별 효과에서의 log-rank test)
coxph(Surv(days, status==1) ~ sex, data=melanom)
coxph(Surv(days, status==1) ~ sex + strata(ulc), data=melanom)

--> 첫번째 회귀식과 같이 성별 만을 독립변수로 넣었을 경우 성별 차이가 유의미하게 다름
그러나 남성은 병이 심각하게 진행이 되고 병원에 방문하는 경향이 있을 수 있으므로
병의 진행도를 통한 보정을 해주면 성별 간 차이가 줄어들 수 있을 것
- 두번째 회귀식처럼 궤양을 공변수로 넣어주면 성별 차이에 대한 계수 및 p value가 변한 것을 알 수 있음
str.plot <- survfit(Surv(days, status==1) ~ sex + strata(ulc), data=melanom)
plot(str.plot, col = c('red', 'blue'), lty=c(1,1,2,2))
legend('bottomleft', c('Female with present of ulceration', 'Female with absent of ulceration',
'Male with present of ulceration', 'Male with absent of ulceration'), lty=c(1,1,2,2))

'데이터 분석 > 확률 통계' 카테고리의 다른 글
실험 통계 기초 (1) | 2023.05.15 |
---|---|
생존 분석 5 (TCGA cases) (0) | 2023.01.05 |
생존 분석 3 (생존 함수 비교 - 로그 순위 검정) (0) | 2023.01.05 |
생존 분석 2 (Kaplan-Meier estimation) (0) | 2023.01.05 |
생존 분석 1 (생존 함수 추정) (0) | 2023.01.04 |
- Total
- Today
- Yesterday
- 생존함수
- SNP
- r
- ECG
- PTB
- fasta
- vcf
- pmm
- psychopy
- NGS
- featuremap
- 실험통계
- 인공지능
- 생존곡선
- 평균분석
- Bioinfo
- plink
- 생존분석
- pre-train
- missing_value
- HRV
- GPU설치
- 그룹비교
- gray2rgb
- GradCam
- sounddevice
- cnn
- sequenced data
- rgb2gray
- 딥러닝
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |