
일반적으로 환자의 혈액 등 샘플을 채취하여 기계에 넣고 sequence를 읽어내는 과정을 Sequencing Base Calling이라고 함. 긴 서열을 쪼개서 반복하여 읽은 각 정보를 read라고 하고, 이를 조합하여 원 서열 정보를 알아냄 Base Calling이 끝난 데이터를 reference sequence와 비교하여 어느 위치에 변이가 있나를 알아내는 과정이 variant calling임 variant calling 정보를 통계적으로 처리하여 최종 변이 정보를 저장한 파일이 vcf 파일 - Alignment Variant Calling Base calling을 완료하면 FASTA 혹은 FASTAQ 파일이 만들어짐. 이 데이터를 SAM -> BAM -> VCF 파일로 처..

(다음은 코네티컷 대학의 computational biology 페이지에 있는 파일 포맷 튜토리얼을 한국어로 정리한 것입니다. 출처: https://bioinformatics.uconn.edu/resources-and-events/tutorials-2/file-formats-tutorial/#) File Formats Tutorial 생물정보학에서 일반적으로 많이 쓰이는 다음의 파일에 대한 설명 FASTA FASTQ SAM BAM VCF GFF GTF 1. FASTA File format : FASTA File extensions : file.fa, file.fasta, file.fsa Example : XR_002086427.1 Candida albicans SC5314 uncharacterized n..
- Total
- Today
- Yesterday
- 평균분석
- 딥러닝
- gray2rgb
- cnn
- HRV
- 생존분석
- NGS
- 실험통계
- pre-train
- GradCam
- vcf
- ECG
- psychopy
- r
- fasta
- Bioinfo
- 인공지능
- rgb2gray
- 그룹비교
- 생존함수
- missing_value
- featuremap
- plink
- GPU설치
- sequenced data
- 생존곡선
- PTB
- sounddevice
- pmm
- SNP
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |