다양한 방법으로 인트론을 제거할 수 있다.

 

 

t-ag : stop 코돈 부위가 있어서 더 짧은 mRNA가 만들어진다.

T-ag : stop 코돈 부위가 제거돼서 더 긴 mRNA가 만들어진다.

 

누굴 더 만들 것이냐? : SR protein이 조절한다.

SR protein은 exon2 내부에 결합하여 5' sst를 선택한다. 5' splicing site

 

 

 

2.1 steric hindrance(입체 장애)

 

2.2 minor, major splicing

 

 

 3. 초파리 Dscam 유전자 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Exon shuffling

 

 

 

 

 

 

 

 

 

 

RNA editing

 

 

 

 

 

 

 

 

 

 


 앞서 진핵생물이 인트론을 가짐으로써 얻을 수 있는 장점으로써 엑손(Exon)의 조합에 따른 다양한 종류의 단백질을 생산할 수 있다는 것을 꼽았다.

 

 하지만 그것과 함게 이어맞추기는 엑손을 거르거나 잘못된 이어맞추기 자리(Splicing site)를 인식하는 오류를 최대한 줄이기 위한 여러 기작을 갖는다고 했었다.

 

 문제는 대체 이어맞추기는 저 두 가지가 모두 나타날 수 있다. 어떻게 조절되는가?

 

 

 이 유전자는 SV40이라는 바이러스의 T 항원(T-antigen) 유전자다.

 

 유전자를 보면, 정상적인 이어맞추기 자리(5' SST, 3' SST) 말고도 인트론 중간에 5' 말단 이어맞추기 자리와 동일한 서열(5' sst)이 존재한다.

 

 그 결과 아래와 같은 두 가지 형태의 mRNA가 만들어질 수 있다.

 

 오른쪽은 5' SST에서 정상적으로 이어맞추기가 이루어진 상태이며, 왼쪽은 5' sst를 인식하여 이어맞추기를 한 상태다.

 

 그러나 재밌는 것은 인트론 중간에 정지 코돈(Stop codon)이 존재해서 왼쪽의 mRNA는 길이는 훨씬 길지만 실제로 모두 번역이 이루어지지 않는다. 

(저기서 인트론이 포함된 엑손을 확장된 엑손-extended exon-이라 부른다)

 

 그래서 각 mRNA에서 생산된 결과물을 각각 T-agt-ag라 부른다. 짧으니까 소문자다. 

 

 그런데 상식적으로는 왼쪽의 t-ag는 잘못된 녀석이므로 발현되지 않아야 하지만, 이 녀석도 하는 일이 있다. 

 

 본래 T-ag는 바이러스에 감염된 세포의 세포주기를 재시작하며 형질의 전환을 유도하는 단백질인데, t-ag는 이 과정에서 나타날 수 있는 세포자살(Apoptosis)를 차단한다.

 

 그렇다면 t-ag는 분명히 바이러스가 목적을 갖고 만든게 분명하다. 그러면 어떻게 조절하는가?

 

 이 단백질의 발현을 조절하는 과정에서 중요한 요소가 SR 단백질의 일종인 SF2/ASF라는 단백질의 농도다. 

 

 SF2/ASF의 농도가 높을 때는 이 단백질이 엑손 2와 가까운 위치에 있는 5' sst를 사용하도록 하여 t-ag의 발현이 늘어나는 반면, SF2/ASF의 농도가 낮을 때는 T-ag의 발현이 늘어난다. 

 

 많은 경우, 대체 이어맞추기는 여러개의 엑손 중 몇 가지가 상호 배제적으로 작용함에 따라 일어난다. 설명 이상한 거 안다. 

 

 

 

 이 유전자는 포유동물의 근육 수축에 관여하는 트로포닌 T(Troponin T)의 유전자다.

 

 트로포닌 T 역시 대체 이어맞추기를 통해 두 종류의 단백질을 만들 수 있는데, 무조건 엑손 3과 엑손 4 중 하나를 배제하도록 한다.

 

 즉, 1235와 1245만 만들어지고 2345나 1234, 1345같은 것들은 만들어지지 않는다는 뜻이다.

 

 이것은 엑손 3과 엑손 4 사이의 인트론의 길이가 너무 짧아서 생기는 문제다(...) 이것을 입체적 방해(Steric hindrance)라 부른다.

 

 이어맞추기를 하기 위해선 어떻게 해야 하는가? 우선 5' 말단 이어맞추기 자리를 U1 snRNP가 인식하고, 분기점 자리를 U2 snRNP가 인식해야만 한다.

 

 그러나 두 개가 모두 결합하기엔 인트론이 너무 짧다! 그래서 U1이나 U2 중 하나만 결합할 수 있다면 어떤 상황이 되겠는가?

 

 만약 엑손 3과 엑손 4 사이 인트론에 U1이 결합했다면, 엑손 4와 5 사이 인트론의 분기점 자리에 위치한 U2와 상호작용할 수 있다. 그러면 엑손 4는 제거된다.

 

 반대로, 엑손 3과 엑손 4 사이 인트론에 U2이 결합했다면, 엑손 2와 엑손 3 사이 인트론의 U1과 상호작용할 수 있고 엑손 3이 제거된다.

 

 엑손 3과 엑손 4가 모두 제거되거나 엑손 3과 엑손 4 사이의 인트론이 제거되지 않으면요? 둘 다 잘못된 mRNA로 간주하여 갈아버린다.

 

 이것과 유사한 방식으로, 주요 이어맞추기 자리(Major SST)부 이어맞추기 자리(Minor SST)의 조합을 통해 상호 배제적인 이어맞추기가 일어날 수 있다.

 

 

 

 

 이런 식으로 2번 엑손 또는 3번 엑손이 선택적으로 제거될 수 있다. 잘 살펴보면 위의 입체적 방해 기작과 크게 다르지 않다는 것을 알 수 있을 것이다.

 

 마지막으로, 별 다른 기작이 없이 임의로 대체 이어맞추기가 일어날 수 있으나, 어떤 엑손의 조합에서는 프레임 시프트(Frame shift)에 의해 엑손 중간에 종결코돈이 생겨 넌센스 mRNA(Nonsense mRNA)가 생기는 경우가 있다.

 

 넌센스 mRNA는 보통 세포질에서 RNase에 의해 분해되므로 단백질이 발현되지 않는다. 

 

 그러므로 정확히 말하면 이것은 상호 배제적인 대체 이어맞추기 과정은 아니다.

 

 정확히 말하면 대체 이어맞추기를 통해 가능한 여러 결과물을 내놓았는데 부적절한 mRNA를 모두 갈아없애버려 결과적으로 상호 배제적인 이어맞추기를 한 것과 같은 결과가 된 것이다(...)

 

 그러니 넌센스에 의한 mRNA 분해(NMD, Nonsense-mediated mRNA decay)에 의해 반드시 이런 결과가 나오는 것만은 아니란 것도 기억해두면 좋겠다.

 

 아니 그런데 프레임 시프트는 뭐고 넌센스 mRNA는 또 뭐죠?

 

프레임 시프트(Frame Shift)

 프레임 시프트란 염기서열 중에서 보통 염기 하나가 삽입되거나 결실됨에 따라 전체 코돈이 변하는 것을 뜻한다.

 

 넌센스 mRNA는 mRNA 중간에 종결코돈(UAA, UGA, UAG)이 생김에 따라 중간에 번역이 중단되는 것이다. 돌연변이로도 생길 수 있으며, RNA 편집과정에 의해서 생길 수도 있다.

 

 그러면 저기 위에 SA40에서 t-ag 단백질 같은건가요? 그거랑은 좀 다르다. 애초에 그건 처음부터 인트론에 종결코돈이 있었는데 엑손이 확장되면서 포함된거니까.

 

 이 경우는 이어맞추기가 끝난 후에 나중에 생겨난 것이다. 아직 어째서 mRNA에 저런 변화가 나타나는지 확실하게 알려지진 않았다. 

 

 따라서, 대체 이어맞추기에는 대략 다음과 같은 4가지 통제방법이 있다는 것을 알 수 있을 것이다. 정리하자.

 

 1. SR 단백질과 같은 이어맞추기 단백질들의 조절에 의해. 가장 흔한 방법이다.

 

 2. 인트론의 길이가 짧아 완전한 이어맞추기 복합체를 형성할 수 없는 경우.

 

 3. 주요 이어맞추기 자리와 부 이어맞추기 자리의 조합에 의해. 이 경우는 제법 드문 편이다.

 

 4. 엑손끼리 잘 못 조합될 경우 넌센스 mRNA가 발생함에 따라 RNase에 의해 분해되어 결과적으로 특정 mRNA만 남는 경우.

 


여기서는 약간 특수한 경우를 다뤄보도록 하겠다. 초파리의 Dscam(Down syndrome cell-adhesion molecule) 유전자는 무려 38,016개의 단백질 이성질체(Isoform)을 암호화 할 수 있다.

 

 아니 대체 엑손이 몇 개 길래 무려 38,000개 가량의 단백질이나 암호화 할 수 있단 말인가?!

(그 전에 어째서 초파리가 다운 증후군에 관련된 유전자를 갖는지는 넘어가자)

 

 

 

 이게 Dscam 유전자다. 대체 가능한 엑손의 수가 엄청나게 많다.

 

 각 엑손들은 상호 배제적이어서, 예를 들면 4번 엑손에 위치한 12개의 대체 가능한 엑손들 중에서 단지 하나의 엑손만 선택될 수 있다. 

 

 저 대체 가능한 가짓수를 모두 곱하면 12*48*33*2 = 38,016이 나온다. 그런데 대체 이걸 어떤 방식으로 조절한다는 말인가? 

 

 이 유전자의 6번 엑손의 대체 이어맞추기 기작은 기존에 살펴보았던 4가지 방법과는 아예 다른 방법을 사용한다.

 

 5번 엑손과 6번 엑손 사이의 긴 인트론에 위치한 도킹 자리(Docking site)와 6번 대체 엑손 사이의 짧은 인트론에 위치한 선택 서열(Selector sequence) 사이의 상호작용을 이용한다.

 

 뭔 말인지 못 알아먹겠다는거 안다(...) 

 

 

 

 엑손 5와 엑손 6 사이에 위치한 인트론에 엄청나게 긴 도킹 자리가 있다. 여기에 모식도와 같이 선택 서열이 결합할 수 있다.

 

 선택 서열은 각 대체 엑손들 사이에 위치한 인트론에 위치한 비교적 짧은 서열인데, 서로 결합하는 자리가 중복되기 때문에 동시에 두 개의 선택 서열이 결합하지 못 한다.

 

 즉, 임의로 무조건 하나의 선택 서열만 도킹 자리에 결합하게 되고, 이것으로 인해 대체 엑손 중 하나가 선택된다(상호 배제적).

 

 그래서 선택이 된 다음엔 어떻게 하나요? 모식도를 다시 잘 보라. (b)를 보자. 5번 엑손과 6-25번 엑손이 서로 가깝게 위치한다.

 

 나머지 엑손들은 고리 형태로 뒤에 빠져 있다. 짐작이 가는가? 5번 엑손과 6-25 엑손이 서로 가깝에 위치하기 때문에 그만큼 이어맞추기가 일어나기 쉬워진다는 말이다.

 

 그 결과 5번 엑손과 6-25엑손이 이어맞추기를 통해 서로 연결된다.

 

 그리고 도킹 자리와 선택 서열의 결합을 통해 6-25번 엑손은 이어맞추기 억제 단백질이 결합하기 못 하게 된다는 부가적인 효과를 갖는다.

 

 여기에서 이어맞추기를 억제하는 단백질은 Hrp36이라는 단백질로, 선택 서열에 의해 선택된 대체 엑손을 제외한 나머지 대체 엑손들에 결합하여 이어맞추기가 일어나는 것을 억제한다.

 

 그 결과, 선택서열에 의해 선택된 6-25번 엑손만 이어맞추기가 가능하게 된다.

 

 당연히 (c)와 같은 상황이라면 5번 엑손과 6-48번 엑손이 연결될 것이고, (d)에선 5번 엑손과 6-3번 엑손이 연결될 것이다.

 

 그러면 이제 이어맞추기를 조절하는 여러 단백질들에 대해 살펴보자. 

 

 이어맞추기를 조절하는 단백질은 앞에서도 몇번 언급했지만 대부분 SR 단백질들이다.

 

 이들은 엑손이나 인트론에 존재하는 이어맞추기 증폭인자(ESE, exonic 또는 ISE, Intronic splicing enhancer)나 억제인자(ESS, ISS, splicing silencer)로 불리는 서열에 결합한다.

 

 SR 단백질들은 공통적으로 RNA 인지 모티프(RRM, RNA-recognition motif)라는 도메인을 통해 RNA에 결합할 수 있다.

 

 그리고 한편으로는 세린과 아르기닌이 풍부한 RS 도메인(RS domain)을 갖고 있는데, RS 도메인은 이어맞추기에 관계된 여러 단백질들을 끌어모으고 활성화시킬 수 있다.

 

 그래서 이들은 주로 이어맞추기 증폭인자(ESE, ISE)에 결합하여 해당 부위에서 이어맞추기가 일어나도록 유도하는 역할을 한다. 

 

 반면에 이어맞추기 억제인자(ESS, ISS)에 결합하는 단백질들은 hnRNP(Heterogeneous nuclear ribonucleoprotein)이라 불리는 단백질들이다.

 

 이들 역시 SR 단백질과 유사하가 RNA 인지 모티프와 비슷한 부위를 통해 억제인자 부위에 결합하지만 이들은 RS 도메인이 없다.

 

 이들이 결합하게 되면 해당 서열 주변의 이어맞추기 자리의 넓은 공간을 물리적으로 차지하기 때문에 이어맞추기 복합체의 형성이 불가능해진다.

 

 위에서 보았던 Dscam 유전자에서 등장했던 억제인자인 Hrp36 또 한 이러한 단백질들에 속한다.

 

 그러나 SR 단백질과 hnRNP들은 서로 경쟁적으로 작용하기도 하는데, 한 가지 예로 HIV 바이러스에 감염된 세포는 hnRNPA1이라는 단백질을 이용하여 바이러스가 만드는 tat 단백질의 발현을 억제한다.

 

 hnRNPA1은 tat 유전자의 마지막 엑손에 결합하여 SR 단백질인 SC35가 근처의 증폭인자에 결합하는 것을 막고, 주변부에 hnRNPA1 단백질들이 모이고 결합하는 것을 촉진하여 이어맞추기 복합체의 형성을 막는다.

 

 그러나 다른 증폭인자인 SF2/ASF는 hnRNPA1보다 훨씬 친화력이 강하므로 hnRNPA1의 작용이 경쟁적으로 저해된다. 

 

 그 결과로 tat 단백질은 정상적으로 생성될 수 있다. 

 

 이것과 유사한 것으로 초파리의 성염색체에서 나타나는 현상을 볼 수 있다.

 

 초파리는 성염색체 X가 두개일 경우 암컷, 하나일 경우 수컷이 된다.

 

 초파리의 발생 과정에서 상염색체에서 발현되는 dpn은 억제인자이며 성염색체에서 발현되는 sisA와 sisB 단백질은 증폭인자이다.

 

 이 둘은 서로 경쟁적으로 작용하는데, 수컷은 저 dpn과 sisA, sisB의 비율이 1:1로 발현되어 친화력이 강한 dpn이 Sxl 유전자의 발현을 억제한다.

 

 반면, 암컷은 성염색체가 두개이므로 dpn과 sisA, sisB의 비율이 1:2로 발현되어 sisA, sisB에 의해 Sxl 유전자가 발현될 수 있다.

 

 그 결과 암컷에게서 발현되는 초기 Sxl 단백질에 의해 암컷으로 성숙하며, 수컷은 Sxl 단백질의 발현이 나타나지 않아 수컷이 된다. 

 


Exon Shuffling

엑손 뒤섞기에 대해선 그다지 자세한 기전에 대해서 설명하진 않을 것이다. 그냥 흘러가는 내용이다.

 

 원래라면 DNA 재조합이나 전위에 대해서 먼저 다뤘어야 하지만 부득이하게 넘어가므로 굉장히 붕 뜬 내용이 되지 싶다(...)

 

 개념만 대충 잡고 가자. 우선 진정세균(Bacteria)은 인트론이 거의 없지만 진핵생물은 인트론이 있다. 고세균은? 인트론을 일부 가진다.

 

 그렇다면 고세균에서 진정세균과 진핵세균으로 진화가 일어났다면 진정세균은 인트론을 없애는 쪽으로, 진핵세균은 인트론을 갖는 방향으로 진화했을 것이다.

(참고로 고세균은 진정세균보다 진핵생물과 조금 더 유연관계가 깊다!)

 

 물론 저 말이 옳은 것은 아니다. 하나의 모델일 뿐이다. 어쨌거나 중요한 것은, 진정세균. 편하게 원핵생물이라 하겠다. 물론 원핵생물엔 고세균도 포함되지만 고세균 역시 mRNA에서는 인트론이 거의 없다.

 

 원핵생물들은 인트론을 거의 가지지 않고 진핵생물은 인트론을 많이 갖는 이유가 무엇이냐는 것이다.

 

 원핵생물은 단순하다. 필요한 단백질의 수도 그다지 많지 않다. 그리고 DNA 복제의 속도가 매우 빠르다.

 

 일반적으로 원핵생물들은 복제의 속도가 빠를 수록 다양한 변이를 유발시킬 수 있어 생존에 훨씬 유리하다. 따라서 굳이 불필요한 인트론을 갖지 않게 되었다는 것이다.

 

 본래 인트론이 있었으나 원핵세포에서는 사라졌다는 것을 인트론 초기 모델(Intron early model)이라 한다.

 

 실제로 진핵생물이지만 단순하며 빠르게 성장하는 효모들은 복잡한 다세포 진핵생물들 보다 인트론의 비율이 낮다. 

 

 그렇다면 진핵생물은? 진핵생물은 인트론을 갖는 쪽으로 진화되었다. 

 

 그런데 한 유전자에서 여러 단백질을 발현시키기 위해 인트론을 만들었다기 보다는 인트론이 트랜스포존(Transposon)과 같은 기작을 통해 엑손들 사이에 끼어들어 갔다는 설명이 좀 더 지지받는다.

 

 무슨 뜻인가? 당장 우리 몸의 세포에 있는 인트론을 보면 고대 역전사 바이러스(Retrovirus)의 흔적들이 잔뜩 남아있다.

 

 혹자는 이것을 보고 우리 DNA는 바이러스 DNA의 모자이크로 이루어져 있다는 말도 했던 바 있다. 

 

 물론 이것에 대해 다루려면 본래 DNA 전위와 트랜스포존에 대해 다뤄야 하지만... 여기선 이게 주제가 아니니 넘어가자.

 

 어쨌거나 인트론이 없었으나 진핵세포에서 후천적으로 인트론이 생겨났다는 것은 인트론 후기 모델(Intron late model)이라 한다.

 

 그러나 진핵생물이 인트론을 가짐으로써 갖는 다른 장점은, 아예 연관이 없는 서로 다른 엑손들을 조합하여 다른 단백질을 만들 수 있다는 것이다.

 

 이것에 대한 증거는 몇 가지가 있는데, 다음과 같다.

 

 1. 하나의 엑손은 보통 하나의 단백질 도메인이나 서브유닛을 암호화한다.

 

 2. 많은 유전자와 그에 의한 단백질은 엑손 중복(Duplication)과 분리(Divergence)를 통해 만들어져 있다.

 

 3. 서로 전혀 연관이 없는 단백질을 암호화하는 유전자에게서 매우 유사한 엑손들이 발견된다.

 

 이것이 스플라이싱과는 별개로 아예 다른 유전자에 있는 엑손들을 조합하여 새로운 단백질을 만들었다는 증거들이다.

 

 이것에 대한 예로써, 인간이 갖는 유전자 중 LDL(Low-density lipoprotein) 수용체 유전자에는 분명히 C9 보체(Complement) 유전자와 EGF(Epidermal growth factor) 전구체 유전자에 관련된 엑손들이 포함되어 있다.

 

 

 

 매우 닮았다! 물론 정확하게 동일하진 않다. 인트론의 길이가 조금씩 다르며 엑손 또한 약간씩 차이가 나타난다.

 

 그런데 저건 어떻게 일어나나요? 대부분이 자리특이적 DNA 재조합이나 DNA 전위에 의해 일어난다.

 

 보통 엑손에 비해 인트론이 훨씬 길기 때문에 엑손이 통째로 묶여서 이동할 확률이 엑손이 쪼개질 확률보다 높을 것이다.

 

 그리고 이것과 함께 발달한 것이 대체 이어맞추기다. 기존의 유전자에 새로운 엑손이 첨가되더라도 기존 유전자의 기능을 유지시킬 필요가 있기 때문이다.

 

 실제로 이것을 이용하여 생물들의 진화적 추세를 살펴볼 수도 있다. 상당히 강력한 방법 중 하나다.

 


RNA editing

RNA는 전사와 이어맞추기를 모두 끝낸 후에 RNA 편집이라는 과정을 통해 염기서열을 인위적으로 바꿀 수 있다.

 

 이것은 돌연변이와는 다른데, 통제가 불가능한 돌연변이와는 달리 이것은 효소에 의해서 적절히 통제되는 과정이다.

 

 RNA 편집에는 자리특이적 탈아미노화(Site-specific deamination)와 안내 RNA(gRNA, Guide RNA)에 의한 U의 삽입 또는 결실이 있다.

 

 우선, 자리특이적 탈아미노화는 시티딘(C, Cytidine)이나 아데노신(A, Adenosine)을 탈아미노화시켜 각각 우리딘(U, Uridine)과 이노신(I, Inosine)을 만든다.

 

 아니 어떻게 저렇게 되는건가요?

 

 

 

 이렇게 된다. 우리딘은 아데노신과 상보적으로 결합할 수 있고, 이노신은 시티딘, 아데노신, 우리딘과 상보적으로 결합할 수 있다.

 

 이노신에 대해선 아마 다음에 언급할 기회가 있을 것이다.

 

 시티딘을 탈아미노화 시키는 효소는 시티딘 탈아미노화효소(Cytidine deaminase)이며, 아데노신을 탈아미노화 시키는 효소는 ADAR (Adenosine deaminase acting on RNA)에 의해 수행된다.

 

 이것은 조직 특이적으로 일어나는 기작으로, 모든 경우에서 일어나는 상황이 아니다.

 

 

 이것은 인간의 아포지단백 B(Apolipoprotein B) 유전자의 일부인데, 간에서는 RNA의 편집이 일어나지 않지만 장에서는 26번째 엑손의 2,153번째 코돈의 시티딘이 우리딘으로 바뀐다.

 

 그 결과 종결코돈 UAA가 생성되고, 장에서는 훨씬 짧은 단백질이 합성된다.

 

 간세포에서 합성된 큰 단백질은 콜레스테롤과 중성지방의 수송에 관여하고, 장에서 합성된 작은 단백질은 흡수된 지질을 여러 조직으로 수송하는 역할을 한다.

 

 그런데 수많은 시티딘 중에 어떻게 저거 하나만 바꾸나요? 글쎄다. 아마 주변의 특정 염기서열을 인식하거나, 또는 특정 2차 구조를 인식하여 결합할 수 있을 것이다. 명확하게 밝혀지진 않았다.

 

 이러한 탈아미노화 효소에 의한 RNA 편집은 많이 일어나는 것은 아니지만 상당히 중요한 위치를 차지한다.

 

 어떤 경우, 이 탈아미노화 효소는 바이러스에 대한 방어에 사용되기도 하는데 A3G(APOBEC3G)라 불리는 시티딘 탈아미노화효소는 DNA와 RNA를 모두 편집할 수 있다.

 

 HIV는 역전사 바이러스(Retrovirus)로 RNA를 유전물질로 갖는다.

 

 HIV가 자신의 RNA를 DNA로 역전사하게 되면 바이러스의 cDNA가 형성되는데, A3G는 cDNA를 공격하여 시티딘을 우리딘으로 바꾼다.

 

 A3G에 의해 야기되는 돌연변이는 바이러스가 감당할 수 없을 정도로 심하고, 손상된 DNA가 아예 숙주의 DNase에 의해 분해되기도 한다.

 

 그렇지만 이것에 대응하여 HIV는 Vif라는 효소를 만드는데, 이것은 A3G를 가수분해하여 자신을 보호한다. 결국 인간이 졌다.

 

 그러면 이제 안내 RNA에 의한 우리딘의 삽입이나 결실에 대해 살펴보자. 이것은 수면병을 유발하는 트리파노소마(Trypanosomes)라는 원생생물에게서 발견한 것이다.

 

 앞서 살펴본 탈아미노화 효소에 의한 염기의 변형은 염기 하나의 치환이 일어나 변이의 수준이 비교적 적다. 다른 코돈들은 그대로 유지되니까.

 

 그러나 지금 살펴볼 이 경우에는 염기의 삽입이나 결실이 일어나므로 변이가 일어난 뒤쪽의 코돈 서열이 통째로 바뀐다. 물론 3의 배수로 첨가된다면 뒤쪽 코돈은 무사하겠지만(...)

 

 트리파노소마의 미토콘드리아 단백질 유전자는 mRNA 전사 후 굉장히 많은 수의 우리딘이 mRNA 내부에 삽입된다.

 

 그러면 안내 RNA가 어떻게 우리딘을 첨가하는지 보기로 하자.

 

 

 

 안내 RNA는 앵커(Anchor) 역할을 하는 서열이 존재하여, mRNA의 특정 부위와 상보적인 결합을 할 수 있다.

 

 그러나 안내 RNA 중간중간에 아데노신이 끼어들어가 있어 완벽하게 상보적 결합을 하지 못 하고 아데노신 벌지(Bulge)를 형성한다.

(왜 아데노신만 있는지는 모른다. 아데노신이 아니라 시티딘이 있다면 구아노신이 첨가될 것이다)

 

 그러면 DNA를 수선하는 내부핵산가수분해효소(Endonuclease)에 의해 안내 RNA가 아니라 mRNA가 잘린다.

 

 그리고 평범한 수선기작에 의해 염기의 추가가 일어나는데, 아데노신 벌지가 생겨났으므로 우리딘이 첨가된다.

 

 우리딘을 첨가하는 효소는 3' 말단 우리딘전이효소(TUTase, 3' terminal uridynylyl transferase)에 의해 일어난다.

 

 우리딘들이 첨가된 후, 리가아제(Ligase)에 의해 연결되고 임무를 마친 안내 RNA는 떨어져 나가 다른 mRNA를 편집한다.

 

 아직까지 이게 인간에 대해서도 일어나는지는 확인된 바 없다. 

 

 이들은 어째서 이런 방식을 쓰는가? 이것에 대해서도 아직까지는 마땅히 설득력 있는 설명이 나오지 않고 있다. 

 

 그러나 염기의 삽입이나 결실은 굉장히 큰 수준의 단백질 변이를 유발하므로, 안내 RNA의 다양성을 통해 하나의 유전자에서 다양한 역할을 하는 단백질을 만들어 낼 수 있을 것이라 생각해 볼 수 있다.

복사했습니다!