티스토리 뷰
다음은 뉴욕 타임즈의 "Bad News Wrapped in Protein: Inside the Coronavirus Genome" 기사를 한국어로 번역한 것입니다.
(By Jonathan Corum and Carl ZimmerApril 3, 2020)
바이러스는 “단순히 단백질에 싸인 나쁜 소식”이라고 1977년 생물학자 Jean과 Peter Medawar는 말했다.
2020년 1월, 과학자들은 아주 나쁜 소식 -Covid-19를 일으키는 바이러스인 SARS-CoV-2의 게놈을 해독했다. 이 샘플은 우한의 해산물 시장에서 일한 41 세의 한 남자에게서 나왔으며, 이 곳에서 첫 번째 사례 군이 나타났다.
연구원들은 현재 이 바이러스성 구조를 이해하기 위해 경쟁하고 있으며, 이는 계속되는 유행성 퇴치와 싸우기 위해 약물, 백신 및 기타 도구의 개발을 촉진할 수 있다.
RNA의 문자열
바이러스는 살아있는 세포를 가로채서 복제하고 확산시킨다. 코로나 바이러스가 적합한 세포를 찾으면, 전체 코로나 바이러스 게놈을 포함하는 RNA 가닥을 (그 세포에) 주입한다.
새로운 코로나 바이러스의 게놈 길이는 30,000 개 미만의 "문자"이며, 과학자들은 코로나 바이러스 복제에서 신체의 면역 반응 억제에 이르기까지 다양한 작업을 수행하는 29개의 단백질에 대한 유전자를 확인했다.
RNA 문자의 첫 번째 시퀀스는 다음과 같다.
이 서열은 감염된 세포 내부의 기계를 모아 RNA 문자(a, c, g 및 u)를 읽고 코로나 바이러스 단백질로 번역하며,
전체 코로나 바이러스 게놈과 그것이 암호화하는 단백질은 아래와 같다.
단백질 사슬 · ORF1ab
감염된 세포 내부에서 생성된 첫 번째 바이러스 단백질은, 함께 결합된 16개의 단백질 사슬이다. 이 단백질 중 2개는 가위처럼 작용하여 서로 다른 단백질 사이의 연결을 끊고 작업을 자유롭게 한다.
(이전의) 다른 코로나 바이러스에 대한 연구를 통해 과학자들은 SARS-CoV-2 단백질 중 일부가 무엇을하는지에 대해 잘 이해하게 되었다. 그러나 그와 다른 단백질은 훨씬 더 신비롭고 일부는 전혀 상관 없을 수도 있다.
세포질 방해(Cellular Saboteur · NSP1)
이 단백질은 감염된 세포의 자체 단백질 생산 속도를 늦춘다. 이 방해 행위는 세포가 더 많은 바이러스 단백질을 만들도록하고 바이러스를 막을 수있는 항-바이러스 단백질을 조립하지 못하게 한다.
미스터리 단백질(Mystery Protein · NSP2)
과학자들은 NSP2가 무엇을 하는지 잘 모르지만, 그것이 부착하는 다른 단백질은 일부 단서를 제공할 수 있다. 그 중 2개는 세포 주위에 엔도솜(endosomes)이라고하는 분자로 채워진 거품을 움직이는 데 도움을 준다.
태그 해제 및 절단(Untagging and Cutting · NSP3)
NSP3는 두 가지 중요한 일을 하는 큰 단백질이다. 하나는 느슨한 다른 바이러스성 단백질을 절단하여 자신의 작업을 수행할 수 있도록 하는 것이고, 다른 하나는 감염된 세포의 단백질을 변화시키는 것이다.
일반적으로 건강한 세포는 오래된 단백질을 파괴한다. 그러나 코로나 바이러스는 이러한 태그를 제거하여 단백질의 균형을 바꾸고 세포의 바이러스 퇴치 능력을 감소시킬 수 있다.
거품제조기(Bubble Maker · NSP4)
다른 단백질과 결합하여 NSP4는 감염된 세포 내에 액체로 채워진 기포를 형성하는 데 도움이 된다. 이 거품 안에는 바이러스의 새로운 복사본을위한 부분이 구성되어 있다.
단백질 가위(Protein Scissors · NSP5)
이 단백질은 다른 NSP 단백질이 없이 자체으로 절단함으로써 본 작업을 수행한다.
거품 공장(Bubble Factory · NSP6)
바이러스 공장 거품을 만들기 위해 NSP3 및 NSP4와 같이 작업한다.
복사 보조(Copy Assistants · NSP7 and NSP8)
이 두 단백질은 NSP12가 RNA 게놈의 새로운 복제본을 만드는데 도움을 주며, 궁극적으로 새로운 바이러스 내부에 있게된다.
세포의 중심에서(At the Heart of the Cell · NSP9)
이 단백질은 우리 자신의 게놈을 보유하는 감염된 세포의 핵에 작은 채널을 팽창시킨다. 그것은 핵 안팎으로 분자의 움직임에 영향을 줄 수 있지만, 어떤 목적인지는 알 수 없다.
유전자 위장(Genetic Camouflage · NSP10)
인간 세포에는 바이러스 RNA를 찾아 파괴하는 항-바이러스 단백질이 있는데, 이 단백질은 NSP16과 함께 바이러스의 유전자를 위장하여 공격받지 않도록 한다.
복사기(Copy Machine · NSP12)
이 단백질은 유전자 문자를 새로운 바이러스 게놈으로 조립한다. 연구자들은 항 바이러스 remdesivir가 다른 코로나 바이러스에서 NSP12를 방해한다는 사실을 발견했으며, 이 약물이 covid-19을 치료할 수 있는지에 대한 시험이 진행되고 있다.
감염된 세포가 NSP12에 대한 RNA 서열을 읽을 때 :
ucagcugaugcacaaucguuuuuaaaca ...
조금 미끄러졌다가, 다시 연속으로 읽음
풀어지는 RNA(Unwinding RNA · NSP13)
일반적으로 바이러스 RNA는 복잡한 꼬임으로 감긴다. 과학자들은 NSP13이 그것을 풀고 다른 단백질이 그 서열을 읽어 새로운 사본을 만들 수 있는지를 의심한다.
바이러스 교정기(Viral Proofreader · NSP14)
NSP12가 코로나 바이러스 게놈을 복제 할 때, 새 복사본에 잘못된 문자를 추가하는 경우가 있다. NSP14는 이러한 오류를 잘라내어 올바른 문자를 대신 추가 할 수 있도록 한다.
청소(Cleaning Up · NSP15)
연구진은 이 단백질이 감염된 세포의 항-바이러스 방어에서 숨길 수 있는 방법으로 살아 남은 바이러스 RNA를 절단할 수 있을 거라고 짐작한다.
더 많은 위장(More Camouflage · NSP16)
NSP16은 NSP10과 함께 바이러스 RNA를 절단하는 단백질에서 바이러스의 유전자를 숨길 수 있도록 도와준다.
스파이크 단백질(Spike Protein · S)
스파이크 단백질은 코로나 바이러스의 외부 층을 형성하고 내부의 RNA를 보호하는 4 가지 구조 단백질 (S, E, M 및 N) 중 하나이다. 또 이 구조 단백질은 바이러스의 새로운 사본을 조립하고 방출하는 것을 돕는다.
S 단백질은 3 개의 그룹으로 스스로 배열함으로써 바이러스 표면에 현저한 스파이크를 형성한다. 이 왕관 모양의 스파이크가 코로나 바이러스의 이름이 되었다.
스파이크의 일부는 인간 기도의 특정 세포에 나타나는 ACE2 (아래 노란색) 단백질에 확장되어 부착될 수 있고, 이 바이러스는 세포를 침범 할 수 있다.
SARS-CoV-2의 스파이크 단백질 유전자는 ccucggcgggca라는 12 개의 유전자 문자가 삽입되어 있는데, 이 돌연변이는 스파이크가 인간 세포에 단단히 결합하는 데 도움이 된다. 박쥐와 다른 종에 감염된 바이러스에서 진화하는 데 중요한 단계이며, 많은 과학 팀이 스파이크가 인간 세포에 부착되는 것을 막을 수있는 백신을 설계하고 있다.
탈출 아티스트(Escape Artist · ORF3a)
SARS-CoV-2 게놈은 소위 "액세서리 단백질" 그룹을 인코딩하는데, 이는 바이러스가 복제하기 쉽도록 감염된 세포 내부 환경을 변경하는 데 도움이 된다.
ORF3a 단백질은 감염된 세포의 막에 구멍을 뚫어 새로운 바이러스가 쉽게 탈출 할 수 있도록 하며, Covid-19의 가장 위험한 증상 중 하나인 염증을 유발한다.
ORF3b는 동일한 RNA와 겹치지만 SARS-CoV-2가이 유전자를 사용하여 단백질을 만드는지는 확실하지 않다.
외피 단백질(Envelope Protein · E)
외피 단백질은 바이러스의 유성 기포를 형성하는 것을 돕는 구조적 단백질이다. 바이러스가 세포 안에 들어간 후에 해야 할 일이 있을 수 있는데, 연구자들은 그것이 유전자를 켜고 끄는 데 도움이되는 단백질에 빗장을 건다는 것을 발견했다. E 단백질이 방해를 받으면 패턴이 변할 수 있다.
막 단백질(Membrane Protein · M)
바이러스의 외피의 일부를 형성하는 또 다른 구조 단백질.
신호 차단기(Signal Blocker · ORF6)
이 보조 단백질은 감염된 세포가 면역계로 보낼 신호를 차단한다. 또한 소아마비나 인플루엔자와 같은 다른 바이러스를 겨냥한 것과 같은 세포 자체의 바이러스 퇴치 단백질도 차단한다.
바이러스 해방자(Virus Liberator · ORF7a)
새로운 바이러스가 세포를 탈출하려고 할 때, 세포는 테더린이라는 단백질로 바이러스에 덫을 걸 수 있다. 일부 연구에 따르면 ORF7a는 감염된 세포의 테더린 공급을 줄이고 더 많은 바이러스를 피할 수 있다고 한다. 연구원들은 또한 단백질이 감염된 세포를 자극하여 자살을 일으켜 Covid-19의 폐 손상을 유발한다는 사실도 발견했다.
ORF7b는 이와 동일한 RNA 스트레치와 겹치지만, 그 유전자가 어떤 역할을 하는지는 분명하지 않다.
미스터리 단백질(Mystery Protein · ORF8)
이 보조 단백질의 유전자는 SARS-CoV-2에서 다른 코로나 바이러스와는 크게 다르며, 역할에 대해서는 연구 중이다.
뉴클레오캡시드 단백질(Nucleocapsid Protein · N)
N 단백질은 바이러스 RNA를 보호하여 바이러스 내에서 안정적으로 유지하도록 하며, 많은 N 단백질이 긴 나선형으로 서로 연결되어 RNA를 감싸고 있다.
보조 단백질 ORF9b 및 ORF9c는 이 동일한 스트레치 RNA와 중첩된다. ORF9b는 바이러스 방어의 핵심 분자인 인터페론을 차단하지만 ORF9c가 사용되는지는 확실하지 않다.
미스터리 단백질(Mystery Protein · ORF10)
SARS-CoV-2 바이러스의 가까운 친척은 이 작은 보조 단백질에 대한 유전자를 가지고 있지 않기 때문에, 아직 이것이 무엇인지 또는 바이러스가 단백질을 만들어 내는지 알 수 없다.
끝(End of the Line)
코로나 바이러스 게놈은 세포의 단백질 제조 기계를 막는 RNA 스니펫으로 끝난 다음, aaaaaaaaaaaaa의 반복 시퀀스로 사라진다.
Note: The four letters of DNA are A, C, G and T. In RNA molecules like the coronavirus genome, the T (thymine) is replaced with U (uracil).
Sources: Fan Wu et al., Nature; National Center for Biotechnology Information; Dr. David Gordon, University of California, San Francisco; Dr. Matthew B. Frieman and Dr. Stuart Weston, University of Maryland School of Medicine; Dr. Pleuni Pennings, San Francisco State University; Journal of Virology; Annual Review of Virology.
Model sources: Coronavirus by Maria Voigt, RCSB Protein Data Bank headquartered at Rutgers University–New Brunswick; Ribosome from Heena Khatter et al., Nature; Proteins from Yang Zhang’s Research Group, University of Michigan.
'데이터 분석 > 생물 및 의료 데이터' 카테고리의 다른 글
단백질 구조 (0) | 2023.01.04 |
---|---|
우분투에 PLINK 설치하기 (0) | 2023.01.04 |
NGS data 활용 영역 (0) | 2023.01.04 |
생물 정보 파일 포맷 (0) | 2023.01.04 |
ECG 데이터 (0) | 2022.12.26 |
- Total
- Today
- Yesterday
- gray2rgb
- r
- psychopy
- plink
- 인공지능
- 생존분석
- GPU설치
- 생존함수
- cnn
- 그룹비교
- 딥러닝
- GradCam
- SNP
- HRV
- NGS
- 평균분석
- rgb2gray
- sequenced data
- 생존곡선
- fasta
- pre-train
- PTB
- Bioinfo
- featuremap
- 실험통계
- sounddevice
- missing_value
- pmm
- ECG
- vcf
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |