전사(Transcription)가 끝났으니 이제 번역(Translation) 단계로 넘어가야 하는데, 번역은 세포질에서 일어나는 과정이다.

 

 진핵세포에서, 이어맞추기 과정까지 모두 끝낸 성숙한 mRNA는 엑손연결복합체(EJC, Exon junction complex)가 결합하여 이것이 확실히 성숙한 mRNA임을 나타낸다. 

 

 성숙한 mRNA는 핵공 복합체(Nuclear pore complex)를 통해 세포질로 이동하는데, 특정한 수송 단백질에 의해 결합되어서 이동되는 것으로 여겨진다.

 

 일각에서는 세포 소기관 중 하나인 볼트(Vaults)가 mRNA의 수송에 관여한다는 말도 있지만 확실하진 않다. 

 

 볼트의 구조가 핵공 복합체와 상당히 유사하여 처음에는 사실로 여겨졌으나 실험 결과에 따르면 볼트의 발현을 억제해도 멀쩡했다고.

 

 어쨌거나 정상적으로 5' 말단에 캡이, 3' 말단에 폴리아데닐화가 제대로 붙어있고 인트론이 제거된 mRNA만 세포질로 이동이 가능하다.

 

 인트론이 포함된 mRNA는 인트론 결합 단백질에 의해 세포질 밖으로 빠져나가지 못 한다.

 

 mRNA가 핵공을 빠져나가기 위해선 에너지가 필요한데, ATP가 아니라 GTP가 분해됨에 따라 진행되는 반응이다.

 

 원핵세포는 애초부터 핵막이 없으니 그냥 수송 단백질이 물어다 옮기면 된다.

 

 번역은 mRNA의 염기서열을 3개의 단위로 끊은 트리플렛 코드(Triplet code)로 해석하여, 각 코돈(Codon)마다 지정된 아미노산을 순서대로 중합하는 과정으로 진행된다.

 

 번역은 리보솜에서 일어나는데, 리보솜은 rRNA와 단백질의 거대한 복합체다. 

 

 리보솜에 mRNA가 결합하면, mRNA의 트리플렛 코드에 상보적으로 결합하는 안티코돈(Anticodon)을 갖는 tRNA가 아미노산을 갖고 들어와 차례차례 중합하여 폴리펩티드 사슬이 만들어진다.

 

 코돈은 4종류의 염기가 3개씩 묶여서 구성되므로, 아미노산을 표지할 수 있는 가짓수가 4^3 = 64 가지나 된다.

 

 인체에서 주로 사용되는 아미노산은 대략 22개 정도가 알려져 있고, 자세히 따지고 들어가면 세세한 변형 아미노산이 몇 가지 더 있다.

 

 여기선 굳이 아미노산의 종류에 대해서 새삼스럽게 다시 이야기 하진 않겠다.

 

 

 위의 표는 코돈표인데, 각 코돈마다 그에 대응되는 아미노산이 지정되어 있다는 것을 알 수 있다.

 

 이 중 기억해둘 것은 AUG는 메티오닌을 지정하고 있지만 그와 함께 개시 코돈(Start codon)으로써 사용된다는 점과, UAA, UAG, UGA는 정지 코돈(Stop codon)으로 사용된다는 것이다.

 

 진핵세포는 개시 코돈으로 무조건 AUG만 사용하지만 원핵세포는 AUG가 대부분이지만 가끔 GUG나 UUG를 사용하기도 한다. 여기선 일단 예외적인 상황은 제외하고 보도록 하겠다.

 

 그러면 거의 모든 단백질은 메티오닌부터 시작하겠네요? 번역 과정에서는 진핵세포는 항상 메티오닌부터, 원핵세포에서도 대부분의 경우 메티오닌부터 번역을 시작하게 된다. 

 

 그러나 단백질이 모두 중합된 후에는 효소에 의해 N 말단의 아미노산이 일부 떨어져 나가기도 하기 때문에 완전히 중합이 끝난 단백질을 풀어보면 메티오닌으로 시작하지 않을 수 있다.

(단백질의 중합은 N 말단 -> C 말단 방향으로 중합이 진행된다)

 

 그런데 요전에서 봤던 이노신(I, Inosine)은 어떻게 되나요? 

 

 이노신은 특별한 상보성을 띄지 않기 때문에 mRNA에 포함될 경우 하나의 코돈이 하나의 안티코돈에 대응되지 않을 수 있다. 

 

 이런 경우 돌연변이가 유발되므로, 보통 mRNA에는 이노신이 포함되지 않는 경우가 많다. 물론 전혀 없는 것은 아니겠지만.

 

 따라서, 트리플렛 코드의 해석은 AUG를 기준으로 3개씩 끊어서 해석하면 된다. 

 

 5'-GUCAUGGUUUCCGAAGUAUAGU-3' 라는 mRNA가 있다고 가정하자. 그러면 다음과 같이 끊어서 해석한다.

 

 ---AUG-GUU-UCC-GAA-GUA-UAG- 

 

 이걸 다시 코돈표를 이용하여 해석하면 다음과 같은 폴리펩티드 사슬이 될 것이다.

 

 Met-Val-Ser-Glu-Val 

 

 UAG는 정지 코돈이므로 아미노산이 지정되지 않고 번역이 종결된다. 

 

 이러한 것과 같이 하나의 mRNA 위에 존재하는 하나의 단백질 암호화 부위를 열린 읽기틀(ORF, Open reading frame)이라 하는데, 하나의 열린 읽기틀에서는 독립된 하나의 단백질이 중합된다.

 

 여기에서도 진핵생물과 원핵생물의 차이점이 나타나는데, 진핵생물은 하나의 mRNA가 두 개 이상의 단백질을 암호화하는(=두 개 이상의 열린 읽기틀을 갖는) 경우가 거의 없다.

 

 반면에 원핵생물들은 흔히 하나의 mRNA가 여러 개의 단백질을 암호화하고 있어(=여러 개의 열린 읽기틀을 갖는) 하나의 mRNA만으로도 여러 종류의 관계된 단백질들을 만들어낼 수 있다.

 

 

 

 하나의 mRNA가 하나의 열린 읽기틀만 갖는 경우는 모노시스트론 mRNA(Monocistronic mRNA)라 하고, 하나의 mRNA가 두 개 이상의 열린 읽기틀을 갖는 경우 폴리시스트론 mRNA(Polycistronic mRNA)라 한다.

 

 진핵생물은 거의 모노시스트론 mRNA를 만들지만, 원핵생물은 모노시스트론 mRNA 뿐만 아니라 폴리시스트론 mRNA도 자주 만든다.

 

 뒤에서 계속 진행하자.


tRNA

 tRNA다. tRNA는 앞에서 보았던 mRNA의 트리플렛 코드(Triplet code)의 각 코돈(Codon)에 상보적으로 결합할 수 있는 안티코돈(Anticodon) 부위를 갖고 있어 mRNA와 결합이 가능하다.

 

 tRNA는 자신들이 갖는 다양한 안티코돈에 따라 하나의 특이적인 아미노산에만 결합하는데, 예를 들면 안티코돈이 UAC인 tRNA는 항상 메티오닌만 결합한다.

 

 그렇다면 각각의 tRNA는 단지 하나의 코돈만 인식하여 특이적으로 결합할까? 얼핏 생각하기엔 정답인 것 같다. 

 

 그러나 그게 또 그렇지가 않다. 대부분의 tRNA는 하나 이상의 코돈을 인식할 수 있다. 아미노산과의 결합은 특이적이지만 코돈과의 결합은 반드시 특이적인 것은 아니라는 소리다. 

 

 이것에 관해서 설명하려면 지면이 꽤나 필요하므로(...) 번역이 끝나고 아마 따로 다루게 될 것이다. 

 

 지금까지는 그냥 하나의 tRNA가 하나의 코돈만 인식한다고 생각해도 무방하다. 

 

 

 

 tRNA는 몇 가지 구조적인 특징을 갖는데, 모든 tRNA는 CCA 부가효소(CCA-adding enzyme)이라는 특수한 형태의 RNA 중합효소에 의해 '3 말단에 5'-CCA-3' 서열이 추가된다.

 

 CCA 부가효소는 놀랍게도 RNA, 혹은 DNA와 같은 핵산이 없다. 어떻게 첨가할 수 있는가? 

 

 이것은 효소의 3차원적 구조에 의한 것은데, 효소 활성부위의 아미노산과 tRNA의 '3 말단 잔기 사이의 수소결합에 의해 조절된다.

 

 자세한 기전은 언급하지 않겠으나, 처음 효소가 결합하였을 경우에는 시티딘이 활성 부위로 들어와서 tRNA에 첨가가 가능한데, 두 개의 시티딘이 들어오고 나면 활성 부위의 변화가 일어나 하나의 아데노신이 첨가된다. 

 

 그 결과 CCA 서열이 첨가되고 나면 활성 부위는 더 이상 염기를 첨가하지 못 하고 효소가 떨어져나가게 된다. 즉, 핵산의 중합에 있어 반드시 주형이 필요한 것은 아니다.

 

 어쨌거나 이 서열은 아미노산이 결합하는 자리인데, 3'번 또는 2'번 탄소의 히드록시기와 아미노산의 카르복실기 사이에서 고에너지 아실결합(Acyl linkage)가 형성된다.

 

 여기에 관여하는 효소가 아미노아실 tRNA 합성효소(aaRS, Aminoacyl-tRNA synthetase)인데 tRNA에 아미노산이 충전(Charge)되는 과정은 다음에 다시 설명할 것이다.

 

 tRNA에는 그 뿐만 아니라 여러 변형된 형태의 염기들이 존재하는데, 유사우라실(ψ, Peudouracil), 디히드로우라실(D, Dihydrouracil), 히포크산틴(I, Hypoxantine), 티민(T, Thymine), 메틸화된 염기들 등이 있다.

(히포크산틴의 리보뉴클레오시드 버전이 이노신이다)

 

 이런 변형된 염기들은 tRNA의 구조를 형성하는 요인 중 하나이며, tRNA의 기능에도 비교적 큰 영향을 미칠 수 있다.

 

 tRNA는 단일 RNA 사슬이지만 서로 상보적인 서열끼리 결합하여 대략 위의 모식도와 같은 2차 구조를 이룬다. 

 

 여기에서 서로 염기쌍을 형성하지 않는 고리(Loop)나 벌지(Bulge)가 4개 발견되는데, 염기의 특징에 따라 D 고리, ψ 고리, 가변 고리, 안티코돈 고리로 나뉜다.

 

 D 고리에는 디히드로우리딘이 발견되고, ψ고리에서는 유사우리딘이 발견된다. 안티코돈 고리는 안티코돈이 위치해 있으며 가변 고리는 tRNA의 종류에 따라 길이가 3~21개로 천차만별이다.

 

 안티코돈은 안티코돈 고리의 중간에 위치해 있으며, 3' 말단에는 위에서는 피리미딘 염기(Y, Py)가 위치한다고 되어 있으나 꼭 그런 것은 아니다. 퓨린(R, Pu)이 위치하는 경우가 더 많다(...)

 

 안티코돈의 5' 말단에는 대부분 피리미딘 염기(Y)와 우라실이 위치하여, 5'-Py-U-XYZ-Pu-3' 의 구조를 갖는 경우가 많다. XYZ가 안티코돈이다.

 

 그런데 어째서 이런 구조가 보존이 되는가?

 

 이것은 진핵생물의 mRNA 위에 존재하는 특이한 염기서열인 코작 서열(Kozak sequence)라는 부위와 연관지어 생각해볼만 하다.

 

코작 서열

 코작 서열은 개시 코돈(AUG)의 상류와 하류에 특이한 염기를 갖는데, 대략 이러한 서열을 뜻한다. 5'-G/ANNAUGG-3'.

 

 푸른색은 개시 코돈이며, 개시 코돈의 상류에 G또는 A 염기가, 하류에는 G 염기가 있다.

 

 이 서열의 역할은 tRNA의 안티코돈 주변 서열과 상호작용하여 개시 코돈으로 tRNA를 유도하는 역할을 하여 번역을 촉진하게 된다. 

 

 다음으로, tRNA의 실제 3차원 구조는 저런 평면적인 구조가 아니라 접힌 L자형 구조를 하고 있는데, 이것을 모식도로 보면 다음과 같다.

 

 

 

 이 구조는 척 봐도 D 고리와 ψ고리에서 서로 염기쌍을 형성하지 않는 염기들끼리 상호작용을 하기 때문에 형성된다.

 

 또 한, RNA의 특징으로써 각 리보뉴클레오티드는 2'번 탄소에 위치한 히드록시기에 의해 이미 결합을 형성한 염기쌍이라도 다른 리보뉴클레오티드와 수소결합을 통한 상호작용이 가능하다.

 

 즉, 기본적으로는 RNA 이중나선에 의한 골격 형성이 일어남과 동시에 여러 염기들 사이에서의 부가적인 결합에 의해 이런 구조가 안정화될 수 있다.

 

 그러면 다음 포스트에서 어떻게 tRNA에 아미노산이 충전되는지 살펴보도록 하자.

 


tRNA charging

 tRNA에 아미노산이 결합한 상태를 충전된 tRNA(Charged tRNA)라 하는데, 이 과정은 아미노아실 tRNA 합성효소(aaRS, Aminoacyl-tRNA synthetase)에 의해 일어난다. 

 

 여기서는 너무 기니까 aaRS로 쓰겠다. 

 

 다음과 같은 순서로 tRNA와 아미노산의 결합이 일어난다.

 

 

 먼저 아미노산이 ATP를 소모하여 아데니릴화(Adenylylation)되는데, 아데니릴화 과정에서 피로인산(Pyrophosphate)이 발생한다.

 

 피로인산은 피로인산 분해효소에 의해 분해되고 여기서 발생한 에너지를 이용하여 아미노산이 AMP와 고에너지 에스테르 결합을 형성한다. (아미노산의 카르복실기와 AMP의 인산기에 존재하는 히드록시기 사이에서 에스테르 결합이 형성된다)

 

 이 과정이 끝나면 tRNA에 아미노산을 충전(Charging)시키게 되는데, 간단하게 에스테르 전이(Transesterification)를 통해 AMP를 아미노산에서 떼내어 아미노산을 tRNA에 결합시킨다.

 

 tRNA 3' 말단의 아데노신은 2'번 탄소와 3'번 탄소 둘 다 각각 히드록시기가 존재하기 때문에 aaRS를 두 그룹으로 분류할 수 있다.

 

Ⅰ형 효소는 2'번 탄소에 아미노산을 결합시키며, Ⅱ형 효소는 3'번 탄소에 아미노산을 결합시키는데, 둘 다 기능적인 차이는 없다.

 

 굳이 차이를 들자면 Ⅰ형효소는 주로 단량체인데 반해 Ⅱ형 효소는 2량체(Dimer) 혹은 4량체(Tetramer)를 이룬다는 소소한 차이가 있다.

 

 자 그러면 이 효소의 종류는 한 종류일까? 그룹은 Ⅰ형과 Ⅱ형으로 나눌 수 있지만 세부적인 종류는 훨씬 많을 것이다.

 

 왜냐? 그야 tRNA의 종류와 아미노산의 종류가 매우 다양하니까. 

 

 대부분의 생물체들은 20여 종 이상의 aaRS를 갖고 있는데, 일반적으로 하나의 아미노산에 하나의 효소가 대응한다.

 

 그러나 경우에 따라선 일부 효소가 누락될 경우도 있는데, 어떤 세균은 글루타민을 담당하는 aaRS가 없어 글루탐산을 충전한 후 다른 효소가 아미노화를 통해 충전된 글루탐산을 글루타민으로 바꾸기도 한다.

 

 어쨌거나 하나의 아미노산을 하나의 효소가 담당하는 것은 좋다. 그런데 여기서 문제가 생긴다.

 

 어떻게 적절한 tRNA를 찾을 것인가? 우선 생각할 수 있는 것은 tRNA의 안티코돈을 읽어내는 방법이다. 그것은 좋다. 다시 코돈표를 가져와보자.

 

 몇개의 코돈이 같은 아미노산을 암호화하긴 하지만 대부분은 앞의 두 자리가 같음을 알 수 있다. 즉, 발린을 충전하기 위해선 안티코돈이 5'-NAA-3' 일 경우만 인식하면 될 것이다.

 

 그러나 세린의 경우 암호화하는 코돈이 5'-AGC-3'와 5'-UCA-3'를 포함한 6 종류의 코돈에 의해 암호화된다.

 

 그리고 안티코돈이 5'-NAU-3'인 경우에도 무작정 이소류신을 갖다붙일 수가 없다. 안티코돈이 5'-CAU-3' 인 녀석은 메티오닌이니까.

 

 어떻게 같이 구분해 낼 수 있는가? 이것은 안티코돈 부위 뿐만 아니라 수용체 줄기(Acceptor stem)에서의 특이성이 함께 작용한다.

(수용체 줄기는 위로 쭉쭉 올려 tRNA 구조도를 보면 어디에 있는지 알 수 있다)

 

 수용체 줄기는 굉장히 중요한 인식부위인데, 종종 이 서열의 염기쌍 하나가 바뀌는 것 만으로도 다른 aaRS가 다른 아미노산을 충전하기도 한다. 

 

 이 특별한 염기쌍을 식별자(Discriminator)라 부르는데, 당연히 딱 정해진 것은 아니다. 효소마다 tRNA마다 조금씩 다르다.

 

 그러면 남은 또 하나의 문제는 각각의 aaRS가 어떻게 자신에게 맞는 아미노산과 결합할 것인가는 문제가 생긴다.

 

 많은 아미노산은 구조적으로 상당한 차이가 있지만 티로신과 페닐알라닌, 이소류신과 발린은 겨우 히드록시기 하나, 메틸기 하나 정도의 차이밖에 발생하지 않는다.

 

 aaRS의 활성부위는 자신이 결합해야 할 아미노산의 구조와 크기에 거의 일치하도록 되어있다. 그것이 효소의 기질특이성 아닌가.

 

 그러나 이소류신과 발린의 경우, 이소류신은 발린과 구조가 거의 비슷하지만, 메틸기가 하나 더 붙어 있어 크기가 크다. 따라서 발린-aaRS에는 이소류신이 결합하지 못 할 것이다.

 

 하지만 반대는 어떤가? 발린은 이소류신-aaRS의 활성부위에 결합이 가능하다. 물론 딱 들어맞지 않아 활성이 저해되어 약 1%의 확률로 tRNA에 오결합이 일어날 수 있다.

 

 그렇지만 이건 너무 확률이 높다. 그래서 aaRS는 활성부위 안에 별도로 교정기구를 갖는데, 아미노산이 아데니릴화가 일어난 후 교정기구에 들어갔을 경우 분해된다.

 

 무슨 뜻인가? 이소류신-aaRS의 교정부위는 아데니릴화가 일어난 이소류신보다 크기가 살짝 작아 아데니릴화 이소류신의 분해가 일어나지 않는다.

 

 그러나 발린을 생각해보자. 발린 역시 이소류신-aaRS에 들어가 아데니릴화가 될 수 있다. 그러나 발린은 이소류신보다 크기가 작아 교정부위에 들어갈 수 있다.

 

 그러면 아데니릴화 발린은 AMP와 발린으로 분해되어 쫓겨난다. 

 

 이런 두 과정을 통해 aaRS의 오류율은 0.01% 정도의 오류율을 보이게 된다.

복사했습니다!