일반적으로 환자의 혈액 등 샘플을 채취하여 기계에 넣고 sequence를 읽어내는 과정을 Sequencing Base Calling이라고 함. 긴 서열을 쪼개서 반복하여 읽은 각 정보를 read라고 하고, 이를 조합하여 원 서열 정보를 알아냄 Base Calling이 끝난 데이터를 reference sequence와 비교하여 어느 위치에 변이가 있나를 알아내는 과정이 variant calling임 variant calling 정보를 통계적으로 처리하여 최종 변이 정보를 저장한 파일이 vcf 파일 - Alignment Variant Calling Base calling을 완료하면 FASTA 혹은 FASTAQ 파일이 만들어짐. 이 데이터를 SAM -> BAM -> VCF 파일로 처..
PLink는 Whole genome association analysis toolset으로 http://zzz.bwh.harvard.edu/plink/download.shtml에서 다운받을 수 있으며, tutorial도 볼 수 있다. 참고: https://ubuntu.pkgs.org/16.04/ubuntu-universe-amd64/plink_1.07-6_amd64.deb.html 설치 방법 sudo apt-get update sudo apt-get install plink 설치할 폴더를 지정해주면, bin 폴더가 생긴다. 그리고 나서 plink 사이트에서 plink-1.07-x86_64.zip 파일 다운받고 unzip plink-1.07-x86_64.zip cd plink-1.07-x86_64 ./pl..
1. Exome Sequencing 엑솜은 전체 유전체 중 2만 여 개를 차지하는 엑손(exon, 유전자의 단백질 코딩)을 분석하는 것 분석 영역의 총 크기는 30 mega base pair(Mb)인데, 이것은 전체 유전체의 1~2% 정도 질환과 연관성이 알려진 변이의 대부분이 엑손 부위에 있기 때문에 WGS와 비교했을 때 시간 및 비용에서 효율적 엑솜 시퀀싱은 타겟유전자패널에 비해 진단율이 높고 질환과의 연관성이 잘 알려지지 않았던 유전자의 발굴 가능 2. Whole Genome Sequencing 엑솜 시퀀싱은 엑손에서 멀리 떨어진 인트론이나 조절 부위(regulatory region)에 존재하는 변이는 검출 불가능 -> WGS 타겟 유전자 패널과 비교하여 시퀸싱 깊이가 낮아져 정확도가 떨어질 수 있..
- Total
- Today
- Yesterday
- featuremap
- HRV
- 생존분석
- sequenced data
- psychopy
- sounddevice
- 딥러닝
- 실험통계
- rgb2gray
- NGS
- vcf
- 생존곡선
- ECG
- cnn
- PTB
- pmm
- 평균분석
- GradCam
- GPU설치
- 생존함수
- gray2rgb
- missing_value
- 인공지능
- pre-train
- r
- 그룹비교
- fasta
- Bioinfo
- SNP
- plink
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |