티스토리 뷰
1. Exome Sequencing
- 엑솜은 전체 유전체 중 2만 여 개를 차지하는 엑손(exon, 유전자의 단백질 코딩)을 분석하는 것
- 분석 영역의 총 크기는 30 mega base pair(Mb)인데, 이것은 전체 유전체의 1~2% 정도
- 질환과 연관성이 알려진 변이의 대부분이 엑손 부위에 있기 때문에 WGS와 비교했을 때 시간 및 비용에서 효율적
- 엑솜 시퀀싱은 타겟유전자패널에 비해 진단율이 높고 질환과의 연관성이 잘 알려지지 않았던 유전자의 발굴 가능
2. Whole Genome Sequencing
- 엑솜 시퀀싱은 엑손에서 멀리 떨어진 인트론이나 조절 부위(regulatory region)에 존재하는 변이는 검출 불가능 -> WGS
- 타겟 유전자 패널과 비교하여 시퀸싱 깊이가 낮아져 정확도가 떨어질 수 있고
- 분석 유전자 수가 많이 의미가 불명확한 변이가 많아져 해석이 어려울 수 있음
- 전체 유전자 검사로 예기치 못한 돌연변이 발견 가능성 존재
3. 희귀 질환과 Sequencing
- 엑솜 혹은 WGS는 환자의 임상 증상 혹은 표현형만으로 특정 유전질환으로 진단 내리기 어려운 경우나
- 원인 유전자가 워낙 다양하여 일반적인 타겟 패널 시퀀싱으로 검사가 충분하지 못할 때 특히 유용
- 또한 유의한 결과가 나오지 않았더라도 결과 데이터를 보존한 후, 일정 기간 후 재분석하여 질환과 관련된 유전자 돌연번이를 찾을 수 있음 (새로운 유전자가 밝혀지거나 DB가 업데이트 되면서 기존에 의미를 알 수 없던 변이가 재분류될 수 있기 때문)
4. NGS로 할 수 있는 분석
- SNP 검출: 질환 위험도 예측(환자와 정상군의 odds ratio) but 재현이 안되거나 신빙성 낮고, 해석에 유의, 개인 식별 및 장기 이식 예후
- RNA-seq: RNA 가닥을 NGS에 적합한 lib를 만들어 시퀀싱하는 것
DNA에서 전사된 RNA 모두 시퀀싱하는 것이 전사체 시퀀싱(transcriptome sequencing)이며,
miRNA 등 non-coding RNA도 검사 가능 RNA는 변성되기 쉬우므로 상보적 DNA(cDNA)로 합성하여 라이브러리 구성
- 전사체 분석: 표준 서열 정보가 있는 경우, mapping하여 위치를 찾음
- 유전자 발현량: NGS는 유전자마다 mapping된 시퀀싱 리드 수를 세어 측정. 표준화는 RPKM이나 FPKM으로 나타냄
- 차등 발현 유전자: 두 개 이상 샘플이나 그룹을 비교하여 발현량이 유의미하게 차이가 나는 유전자를 찾는 것
특정 ontology나 pathway에 속한 유전자가 차등 발현 유전자에 유의하게 많이 포함이 되는지 확인하는 것으로
질환의 발병 기전 이해
- RNA 발현양 조절에 관여하는 DNA 변이(eQTL)이나 후성 유전체 시퀀싱을 통한 연관성 분석도 가능함
- 스플라이싱 분석: 인트론을 제거하여 (스플라이싱을 통해) 다른 조합의 엑손으로 이루어진 mRNA(isoform) 별 유전자
발현 차이를 비교
- DNA 메틸화: cytosine의 5번 탄소에 메틸기(-CH3)가 붙어 5-methylcytosine 형태로 변형되는 것
- 사이토신과 구아닌의 연결 부위(5'-Cytosine-phosphate-Guanine-3') 염기 서열에서 일어나기 때문에 CpG라고 지칭
- CpG가 많이 모여 있는 구간이 CpG island이며 유전자 promotor 근처에 흔하게 존재함
- 특정 유전자의 발현을 억제시키거나 암 활성화 유전자의 프로모터 CpG에 저메틸화로 암 발생을 촉진시킬 수 있음
- 사이토신은 NaHSO3을 통해 우라실로 변환이 가능한데, 메틸화된 사이토신은 변하지 않는 것을 이용하여 메틸화 정도를 측정함
- ChIP-seq (Chromatin immunoprecipitation): 농축된 단백질에 결합된 DNA를 추출하여 NGS를 통해 분석하는 방식으로 시퀸싱 깊이가 높은 부분을 binding site로 추측하여 분석
분석 가능한 단백질은 transcript factor, activator, repressor 및 구조 단백질
- Single Cell Sequencing: 세포마다 다른 고유한 유전적 변이 규명 가능, 순환종양세포나 종양 생검 조질, 줄기 세포 등 샘플의 양이 적은 경우나 다양한 클론을 규명하는 것이 중요할 때 사용. WGS, 전사체, 후성유전체 등 모두 가능하며, 레이저로 원하는 세포를 분리하여 분석함
'데이터 분석 > 생물 및 의료 데이터' 카테고리의 다른 글
| 단백질 구조 (0) | 2023.01.04 |
|---|---|
| 우분투에 PLINK 설치하기 (0) | 2023.01.04 |
| 코로나 바이러스 유전자와 단백질 구조 (0) | 2023.01.04 |
| 생물 정보 파일 포맷 (0) | 2023.01.04 |
| ECG 데이터 (0) | 2022.12.26 |
- Total
- Today
- Yesterday
- pmm
- gray2rgb
- plink
- psychopy
- sounddevice
- Bioinfo
- 실험통계
- GPU설치
- 생존함수
- GradCam
- SNP
- sequenced data
- pre-train
- 평균분석
- 딥러닝
- rgb2gray
- PTB
- NGS
- 그룹비교
- vcf
- HRV
- missing_value
- fasta
- featuremap
- cnn
- 인공지능
- r
- 생존분석
- ECG
- 생존곡선
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |