티스토리 뷰

728x90

1. Exome Sequencing

  • 엑솜은 전체 유전체 중 2만 여 개를 차지하는 엑손(exon, 유전자의 단백질 코딩)을 분석하는 것
  • 분석 영역의 총 크기는 30 mega base pair(Mb)인데, 이것은 전체 유전체의 1~2% 정도
  • 질환과 연관성이 알려진 변이의 대부분이 엑손 부위에 있기 때문에 WGS와 비교했을 때 시간 및 비용에서 효율적
  • 엑솜 시퀀싱은 타겟유전자패널에 비해 진단율이 높고 질환과의 연관성이 잘 알려지지 않았던 유전자의 발굴 가능


2. Whole Genome Sequencing

  • 엑솜 시퀀싱은 엑손에서 멀리 떨어진 인트론이나 조절 부위(regulatory region)에 존재하는 변이는 검출 불가능 -> WGS
  • 타겟 유전자 패널과 비교하여 시퀸싱 깊이가 낮아져 정확도가 떨어질 수 있고
  • 분석 유전자 수가 많이 의미가 불명확한 변이가 많아져 해석이 어려울 수 있음
  • 전체 유전자 검사로 예기치 못한 돌연변이 발견 가능성 존재


3. 희귀 질환과 Sequencing

  • 엑솜 혹은 WGS는 환자의 임상 증상 혹은 표현형만으로 특정 유전질환으로 진단 내리기 어려운 경우나
  • 원인 유전자가 워낙 다양하여 일반적인 타겟 패널 시퀀싱으로 검사가 충분하지 못할 때 특히 유용
  • 또한 유의한 결과가 나오지 않았더라도 결과 데이터를 보존한 후, 일정 기간 후 재분석하여 질환과 관련된 유전자 돌연번이를 찾을 수 있음 (새로운 유전자가 밝혀지거나 DB가 업데이트 되면서 기존에 의미를 알 수 없던 변이가 재분류될 수 있기 때문)


4. NGS로 할 수 있는 분석

 

- SNP 검출: 질환 위험도 예측(환자와 정상군의 odds ratio) but 재현이 안되거나 신빙성 낮고, 해석에 유의, 개인 식별 및 장기 이식 예후 


- RNA-seq: RNA 가닥을 NGS에 적합한 lib를 만들어 시퀀싱하는 것  
  DNA에서 전사된 RNA 모두 시퀀싱하는 것이 전사체 시퀀싱(transcriptome sequencing)이며,

  miRNA 등 non-coding RNA도 검사 가능 RNA는 변성되기 쉬우므로 상보적 DNA(cDNA)로 합성하여 라이브러리 구성


  - 전사체 분석: 표준 서열 정보가 있는 경우, mapping하여 위치를 찾음 

 

  - 유전자 발현량: NGS는 유전자마다 mapping된 시퀀싱 리드 수를 세어 측정. 표준화는 RPKM이나 FPKM으로 나타냄 


  - 차등 발현 유전자: 두 개 이상 샘플이나 그룹을 비교하여 발현량이 유의미하게 차이가 나는 유전자를 찾는 것

    특정 ontology나 pathway에 속한 유전자가 차등 발현 유전자에 유의하게 많이 포함이 되는지 확인하는 것으로 

    질환의 발병 기전 이해 

      

  - RNA 발현양 조절에 관여하는 DNA 변이(eQTL)이나 후성 유전체 시퀀싱을 통한 연관성 분석도 가능함 

 

  - 스플라이싱 분석: 인트론을 제거하여 (스플라이싱을 통해) 다른 조합의 엑손으로 이루어진 mRNA(isoform) 별 유전자

    발현 차이를 비교

 

 

- DNA 메틸화: cytosine의 5번 탄소에 메틸기(-CH3)가 붙어 5-methylcytosine 형태로 변형되는 것

  • 사이토신과 구아닌의 연결 부위(5'-Cytosine-phosphate-Guanine-3') 염기 서열에서 일어나기 때문에 CpG라고 지칭
  • CpG가 많이 모여 있는 구간이 CpG island이며 유전자 promotor 근처에 흔하게 존재함
  • 특정 유전자의 발현을 억제시키거나 암 활성화 유전자의 프로모터 CpG에 저메틸화로 암 발생을 촉진시킬 수 있음
  • 사이토신은 NaHSO3을 통해 우라실로 변환이 가능한데, 메틸화된 사이토신은 변하지 않는 것을 이용하여 메틸화      정도를 측정함

 

- ChIP-seq (Chromatin immunoprecipitation): 농축된 단백질에 결합된 DNA를 추출하여 NGS를 통해 분석하는 방식으로 시퀸싱 깊이가 높은 부분을 binding site로 추측하여 분석
분석 가능한 단백질은 transcript factor, activator, repressor 및 구조 단백질

- Single Cell Sequencing: 세포마다 다른 고유한 유전적 변이 규명 가능, 순환종양세포나 종양 생검 조질, 줄기 세포 등 샘플의 양이 적은 경우나 다양한 클론을 규명하는 것이 중요할 때 사용. WGS, 전사체, 후성유전체 등 모두 가능하며, 레이저로 원하는 세포를 분리하여 분석함

'데이터 분석 > 생물 및 의료 데이터' 카테고리의 다른 글

단백질 구조  (0) 2023.01.04
우분투에 PLINK 설치하기  (0) 2023.01.04
코로나 바이러스 유전자와 단백질 구조  (0) 2023.01.04
생물 정보 파일 포맷  (0) 2023.01.04
ECG 데이터  (0) 2022.12.26
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/02   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
글 보관함