RNA
모여라, RNA 패밀리
지금으로부터 38억 년 전. 살아 움직이는 것이라곤 없던 황량한 대지 한 구석, 걸쭉한 갈색 액체가 고인 작은 웅덩이에서 의미심장한 사건이 일어났다. 어디서 왔는지 모를 인산 분자와 우연히 만들어진 염기분자가 만났다. 여기에 당(糖) 분자 하나가 더 결합해 새로운 분자 RNA(리보핵산)가 탄생했다. 그러나 당장은 아무 일도 없었다
억년이 지난 뒤 지구 반대편 곳곳에서 비슷하게 생긴 분자를 무수히 발견할 수 있었다. 이 분자는 특이하게도 여럿이 모였을 때 자신과 똑같은 분자를 만드는 복제능력을 갖고 있었다. 원시 생명이 지구를 뒤덮기 시작한 것이다.
최초의 생체분자
시간이 흘러 유전정보 저장 기능을 DNA에게 넘겨준 RNA는 새 일거리를 찾아야 했다. RNA는 DNA보다 불안정해 돌연변이가 자주 일어났지만, 그만큼 진화 속도가 더 빨라서 많은 변종이 태어날 수 있었다. 새롭고 유익한 기능을 가진 RNA는 곧 세포에서 안정된 자리를 차지했다.
RNA 가족들 중 가장 긴 것은 유전정보를 담고 있는 mRNA다. 세포 안에는 염기서열이 수천 개에 이르는 큰 mRNA도 많다. mRNA는 유전정보를 담고 있지만(coding), 나머지 RNA는 유전정보를 저장하지 않으며(non-coding) 각자 고유한 기능을 수행한다.
단국대 분자생물학과 정선주 교수는 “mRNA는 진화 초기에는 존재하지 않았을 수도 있다”고 말한다. mRNA는 DNA의 유전정보를 단백질로 옮겨주는 역할만 하므로 핵산만으로 구성된 원시 생명에서는 필요 없기 때문이다. 반대로 세포의 핵심 기능을 맡다가 손자뻘 RNA들에게 할 일을 뺏긴 원시 리보자임은 조금씩 설 자리를 잃고 오늘날 일부 종에서만 간신히 명맥을 유지하고 있다.
RNA 가족은 ‘대표 3인방’이라 할 mRNA, rRNA, tRNA 외에도 여러 식구를 거느리고 있다. 이들은 mRNA, rRNA, tRNA 3인방이 유전정보를 단백질로 만드는 일에 묵묵히 종사하는 동안 이 과정을 돕거나 외부의 적과 싸우는데 앞장선다.
최근 연구가 활발한 마이크로(micro)RNA가 좋은 예다. 20~25개 염기서열로 이뤄진 작은 RNA 조각으로, 수백 종에 이르며 세포 곳곳에서 유전정보 발현을 조절하는 작은 난쟁이 같은 존재다.
마이크로RNA는 바이러스와 깊은 관계를 맺고 있다. 프랑스 식물분자생물학연구소 샤를-앙리 르셀리에 박사팀은 마이크로RNA가 사람 세포에서
바이러스의 증식을 억제한다는 사실을 지난해 4월 ‘사이언스’에 발표했고, 반대로 지난해 6월 미국 샌프란시스코 캘리포니아주립대 도널드 가넴
교수팀은 인체 면역세포의 공격을 피하게 도와주는 바이러스의 마이크로RNA를 발견했다.
정선주 교수는 “침입자인 바이러스와 이를 막는 마이크로RNA는 서로 경쟁에서 지지 않기 위해 공진화(co-evolution)를 거듭한 것으로 해석할 수 있다”고 설명했다. 마이크로RNA와 닮은 si(small interfering)RNA도 비슷한 역할을 담당한다.
어떤 RNA는 ‘틈새시장’을 파고들었다. 핵 안에서 발견되는 작은 RNA 조각인 sn(small nuclear)RNA는 RNA 집안의 가장인 mRNA가 본업인 유전정보 전달을 충실히 할 수 있도록 ‘출근 전에 옷매무새를 바로잡아 주는’ 스플라이싱(splicing) 과정을 돕는다. mRNA의 유전정보가 단백질로 번역되기 전에 꼭 필요한 단계다.
sno(small nucleolar)RNA도 다른 RNA를 도와주는 조연급 RNA다. 인(nucleolus)에서 발견되며 rRNA와 snRNA가 제 모습을 갖추는데 한몫을 담당한다.
RNA 가족의 말썽꾼, 바이로이드(viroid)는 얌전한 다른 RNA들과 달리 병을 일으키는 침입자 RNA다. 바이러스가 RNA 또는 DNA와 이를 둘러싼 단백질 껍질로 이뤄졌다면, 바이로이드는 껍질 없이 RNA만으로 이뤄졌으며 바이러스처럼 숙주 세포를 이용해 자신을 복제한다. 주로 식물에서만 병을 일으키며, 생명 활동을 영위하는 것들 중 가장 작은 존재다. 모든 RNA가 세포 내에서 자신의 역할을 수행하지만 바이로이드는 독립적인 병원체로 행동하는 특이종이다.
RNA 가족의 총 호구 수는 얼마나 될까? 정답은 ‘며느리도 모른다’. 바이러스의 일종인 박테리오파지에만 있는 pRNA, 세균에서만 발견되는 tmRNA 등 새로운 RNA가 심심치 않게 발견되고 있기 때문이다.
지난 5월에도 새로운 RNA가 발견됐다. 미국 뉴욕 콜드스프링하버연구소의 그렉 하논 박사팀이 쥐의 정소에서 마이크로RNA와 siRNA보다 약간 긴 새로운 RNA를 발견했다. 이 RNA는 쥐 정소에서 만들어지는 ‘피위’(Piwi) 단백질과 결합하기 때문에 piRNA(Piwi-interacting RNA)라는 이름이 붙었다. 이 RNA의 기능은 아직 확실하지 않지만, 망가질 경우 정자가 제대로 만들어지지 않았다.
아직도 일부 마이크로RNA를 비롯한 RNA 가족의 상당수는 정체가 베일에 싸여있다. 이들 중 일부는 세포 속에서 하는 일 없이 그저 놀고먹는다는 오해를 받기도 하고(어쩌면 우리가 그 기능을 모를 수도 있다), 마이크로RNA처럼 암 예방과 깊은 관련을 맺고 있다는 사실이 알려져 과학자들의 주목을 한 몸에 받고 있는 유망주도 있다.
지금으로부터 38억 년 전. 살아 움직이는 것이라곤 없던 황량한 대지 한 구석, 걸쭉한 갈색 액체가 고인 작은 웅덩이에서 의미심장한 사건이 일어났다. 어디서 왔는지 모를 인산 분자와 우연히 만들어진 염기분자가 만났다. 여기에 당(糖) 분자 하나가 더 결합해 새로운 분자 RNA(리보핵산)가 탄생했다. 그러나 당장은 아무 일도 없었다
억년이 지난 뒤 지구 반대편 곳곳에서 비슷하게 생긴 분자를 무수히 발견할 수 있었다. 이 분자는 특이하게도 여럿이 모였을 때 자신과 똑같은 분자를 만드는 복제능력을 갖고 있었다. 원시 생명이 지구를 뒤덮기 시작한 것이다.
최초의 생체분자
최초의 생명은 어디에서 시작했을까. 한때 많은 과학자들은 ‘유전정보를 저장하고 있는
DNA야말로 최초의 생체분자’라고 생각했다. 하지만 지금은 RNA에서 생명이 시작됐다는 가설이 더 큰 지지를 받고
있다. 이를 뒷받침하는 대표적인 예가 1983년 테트라히네마(Tetrahynema)란 작은 벌레에서 발견된 ‘리보자임’(ribozyme)이다.
리보오스(ribose)에 효소를 뜻하는 ‘엔자임’(enzyme)을 합성한 단어다.
오늘날 모든 RNA는 자신을 복제할 때 효소의 도움이 반드시 필요하다. 하지만 리보자임만은 다른 도움 없이도 스스로를 자르고 붙일 수 있다. 만약 여기에 자신을 복제하는 능력이 갖춰지면, 이론적으로는 다양한 형태로 끝없이 퍼져나갈 수 있다.
리보자임은 복제 능력이 있을까. 지난 2001년 미국 매사추세츠공대(MIT) 화이트헤드연구소 존스턴 박사팀은 인공 합성한 리보자임을 이용해 어떤 RNA든 염기서열 14개 길이까지 정확히 복제하는데 성공했다. 성공률도 98.5%로 매우 높았다. 이 사실은 단백질이 존재하지 않았던 먼 옛날, RNA가 효소의 기능도 수행했다는 가설에 힘을 실어준다.
그러나 외가닥인 RNA는 쉽게 잘려 분해되기 때문에 더 안정한 분자가 필요했다. 같은 핵산 가족인 DNA는 두 가닥이 서로 단단히 결합하고 있어 화학적 안정성이 훨씬 뛰어났다. RNA는 DNA와 결합할 수 있기 때문에 효소의 도움을 받으면 자신의 정보를 DNA로 옮길 수 있다. 실제로 에이즈(AIDS) 바이러스는 RNA를 이용해 DNA를 합성할 수 있다.
오늘날 모든 RNA는 자신을 복제할 때 효소의 도움이 반드시 필요하다. 하지만 리보자임만은 다른 도움 없이도 스스로를 자르고 붙일 수 있다. 만약 여기에 자신을 복제하는 능력이 갖춰지면, 이론적으로는 다양한 형태로 끝없이 퍼져나갈 수 있다.
리보자임은 복제 능력이 있을까. 지난 2001년 미국 매사추세츠공대(MIT) 화이트헤드연구소 존스턴 박사팀은 인공 합성한 리보자임을 이용해 어떤 RNA든 염기서열 14개 길이까지 정확히 복제하는데 성공했다. 성공률도 98.5%로 매우 높았다. 이 사실은 단백질이 존재하지 않았던 먼 옛날, RNA가 효소의 기능도 수행했다는 가설에 힘을 실어준다.
그러나 외가닥인 RNA는 쉽게 잘려 분해되기 때문에 더 안정한 분자가 필요했다. 같은 핵산 가족인 DNA는 두 가닥이 서로 단단히 결합하고 있어 화학적 안정성이 훨씬 뛰어났다. RNA는 DNA와 결합할 수 있기 때문에 효소의 도움을 받으면 자신의 정보를 DNA로 옮길 수 있다. 실제로 에이즈(AIDS) 바이러스는 RNA를 이용해 DNA를 합성할 수 있다.
돌연변이가 만든 RNA 패밀리
시간이 흘러 유전정보 저장 기능을 DNA에게 넘겨준 RNA는 새 일거리를 찾아야 했다. RNA는 DNA보다 불안정해 돌연변이가 자주 일어났지만, 그만큼 진화 속도가 더 빨라서 많은 변종이 태어날 수 있었다. 새롭고 유익한 기능을 가진 RNA는 곧 세포에서 안정된 자리를 차지했다.
먼저 단백질을 합성하는 rRNA(ribosomal RNA)가 나타났다. 세포 내의 리보솜(ribosome)이란
소기관에서 발견되는 rRNA는 아미노산 분자를 사슬처럼 엮어서 효소를 비롯한 여러 유용한 단백질을 만들어 바쳤다. 이 전략은
대성공이었다.
뒤를 이어 여러 RNA 가족이 세포 기능을 분담하기 시작했다. 아미노산을 하나씩 끌고 와 단백질 공장인 리보솜에 바치는 운반자 노릇을 자청한 tRNA(transfer RNA)도 덩달아 크게 번창했다. tRNA는 독특한 3개의 고리와 함께 아미노산과 결합하는 부분을 갖고 있다.
그러나 RNA의 대부분(95%)은 주인공의 지위를 잃고 DNA에 저장된 유전정보를 운반하는 전령(messenger RNA, mRNA)으로 전락했다. mRNA가 유전정보를 핵 밖으로 싣고 나오면, 이를 rRNA와 효소가 읽어 들인다. 이 정보에 따라 tRNA의 도움을 받아서 아미노산을 한 줄로 길게 엮으면 세포가 원하는 여러 단백질을 만들 수 있다.
뒤를 이어 여러 RNA 가족이 세포 기능을 분담하기 시작했다. 아미노산을 하나씩 끌고 와 단백질 공장인 리보솜에 바치는 운반자 노릇을 자청한 tRNA(transfer RNA)도 덩달아 크게 번창했다. tRNA는 독특한 3개의 고리와 함께 아미노산과 결합하는 부분을 갖고 있다.
그러나 RNA의 대부분(95%)은 주인공의 지위를 잃고 DNA에 저장된 유전정보를 운반하는 전령(messenger RNA, mRNA)으로 전락했다. mRNA가 유전정보를 핵 밖으로 싣고 나오면, 이를 rRNA와 효소가 읽어 들인다. 이 정보에 따라 tRNA의 도움을 받아서 아미노산을 한 줄로 길게 엮으면 세포가 원하는 여러 단백질을 만들 수 있다.
RNA 가족들 중 가장 긴 것은 유전정보를 담고 있는 mRNA다. 세포 안에는 염기서열이 수천 개에 이르는 큰 mRNA도 많다. mRNA는 유전정보를 담고 있지만(coding), 나머지 RNA는 유전정보를 저장하지 않으며(non-coding) 각자 고유한 기능을 수행한다.
단국대 분자생물학과 정선주 교수는 “mRNA는 진화 초기에는 존재하지 않았을 수도 있다”고 말한다. mRNA는 DNA의 유전정보를 단백질로 옮겨주는 역할만 하므로 핵산만으로 구성된 원시 생명에서는 필요 없기 때문이다. 반대로 세포의 핵심 기능을 맡다가 손자뻘 RNA들에게 할 일을 뺏긴 원시 리보자임은 조금씩 설 자리를 잃고 오늘날 일부 종에서만 간신히 명맥을 유지하고 있다.
RNA 가족은 ‘대표 3인방’이라 할 mRNA, rRNA, tRNA 외에도 여러 식구를 거느리고 있다. 이들은 mRNA, rRNA, tRNA 3인방이 유전정보를 단백질로 만드는 일에 묵묵히 종사하는 동안 이 과정을 돕거나 외부의 적과 싸우는데 앞장선다.
단결해서 침입자 막는다
최근 연구가 활발한 마이크로(micro)RNA가 좋은 예다. 20~25개 염기서열로 이뤄진 작은 RNA 조각으로, 수백 종에 이르며 세포 곳곳에서 유전정보 발현을 조절하는 작은 난쟁이 같은 존재다.
정선주 교수는 “침입자인 바이러스와 이를 막는 마이크로RNA는 서로 경쟁에서 지지 않기 위해 공진화(co-evolution)를 거듭한 것으로 해석할 수 있다”고 설명했다. 마이크로RNA와 닮은 si(small interfering)RNA도 비슷한 역할을 담당한다.
어떤 RNA는 ‘틈새시장’을 파고들었다. 핵 안에서 발견되는 작은 RNA 조각인 sn(small nuclear)RNA는 RNA 집안의 가장인 mRNA가 본업인 유전정보 전달을 충실히 할 수 있도록 ‘출근 전에 옷매무새를 바로잡아 주는’ 스플라이싱(splicing) 과정을 돕는다. mRNA의 유전정보가 단백질로 번역되기 전에 꼭 필요한 단계다.
sno(small nucleolar)RNA도 다른 RNA를 도와주는 조연급 RNA다. 인(nucleolus)에서 발견되며 rRNA와 snRNA가 제 모습을 갖추는데 한몫을 담당한다.
RNA 가족의 말썽꾼, 바이로이드(viroid)는 얌전한 다른 RNA들과 달리 병을 일으키는 침입자 RNA다. 바이러스가 RNA 또는 DNA와 이를 둘러싼 단백질 껍질로 이뤄졌다면, 바이로이드는 껍질 없이 RNA만으로 이뤄졌으며 바이러스처럼 숙주 세포를 이용해 자신을 복제한다. 주로 식물에서만 병을 일으키며, 생명 활동을 영위하는 것들 중 가장 작은 존재다. 모든 RNA가 세포 내에서 자신의 역할을 수행하지만 바이로이드는 독립적인 병원체로 행동하는 특이종이다.
RNA 패밀리 호구조사
RNA 가족의 총 호구 수는 얼마나 될까? 정답은 ‘며느리도 모른다’. 바이러스의 일종인 박테리오파지에만 있는 pRNA, 세균에서만 발견되는 tmRNA 등 새로운 RNA가 심심치 않게 발견되고 있기 때문이다.
지난 5월에도 새로운 RNA가 발견됐다. 미국 뉴욕 콜드스프링하버연구소의 그렉 하논 박사팀이 쥐의 정소에서 마이크로RNA와 siRNA보다 약간 긴 새로운 RNA를 발견했다. 이 RNA는 쥐 정소에서 만들어지는 ‘피위’(Piwi) 단백질과 결합하기 때문에 piRNA(Piwi-interacting RNA)라는 이름이 붙었다. 이 RNA의 기능은 아직 확실하지 않지만, 망가질 경우 정자가 제대로 만들어지지 않았다.
아직도 일부 마이크로RNA를 비롯한 RNA 가족의 상당수는 정체가 베일에 싸여있다. 이들 중 일부는 세포 속에서 하는 일 없이 그저 놀고먹는다는 오해를 받기도 하고(어쩌면 우리가 그 기능을 모를 수도 있다), 마이크로RNA처럼 암 예방과 깊은 관련을 맺고 있다는 사실이 알려져 과학자들의 주목을 한 몸에 받고 있는 유망주도 있다.
최근엔 RNA를 이용해 질병을 치료하려는 시도가 활발하다. 앨나일램, 앰비온, 바이오니아 등 많은 국내외
제약회사들이 세포에 해를 끼치는 유전자의 발현을 억제하는 siRNA를 이용해 유전질환 치료제를 개발하고 있다. 콜레스테롤 증가에 관여하는
유전자에 siRNA를 처리해 콜레스테롤 수치를 낮추는 식이다. RNA를 이용해 치료할 수 있는 범위는 암에서 간염, 신경질환, 비만까지 점점
넓어지고 있다.
차세대 치료제로 기대를 모으고 있는 앱타머(aptamer)도 RNA를 이용했다. RNA를 무작위로 합성해서 1015개 정도의 RNA 집단을 만든 다음 핵산, 당, 단백질 등과 서로 잘 결합하는 것만 골라내 복제한 핵산이다.
외부 침입자(항원)의 특징을 기억했다가 다시 침입했을 때 공격하는 항체와 비슷하다. 암세포를 인지하는 앱타머에 항암제를 실은 나노입자를 붙이면 원하는 암세포를 정확히 찾아가 공격하는 ‘나노쉘(nanoshell) 폭탄’을 만들 수 있다.
최근 미국 제약회사 알케믹스와 미국 매사추세츠공대(MIT) 로버트 랭거 박사팀, 그리고 단국대 정선주 교수팀 등이 노인성 황반 변성, 암 등 여러 질환을 치료하기 위한 목적으로 앱타머를 연구하고 있다.
많은 학자들은 RNA 치료에 큰 기대를 걸고 있다. RNA 치료는 화학물질을 사용하지 않아 안전하며 바이러스성, 유전성 질병처럼 치료법이 제한된 분야에서 뛰어난 효과를 발휘한다. 진화의 역사를 간직한 RNA를 들여다보면 의학의 미래가 보인다.
차세대 치료제로 기대를 모으고 있는 앱타머(aptamer)도 RNA를 이용했다. RNA를 무작위로 합성해서 1015개 정도의 RNA 집단을 만든 다음 핵산, 당, 단백질 등과 서로 잘 결합하는 것만 골라내 복제한 핵산이다.
외부 침입자(항원)의 특징을 기억했다가 다시 침입했을 때 공격하는 항체와 비슷하다. 암세포를 인지하는 앱타머에 항암제를 실은 나노입자를 붙이면 원하는 암세포를 정확히 찾아가 공격하는 ‘나노쉘(nanoshell) 폭탄’을 만들 수 있다.
최근 미국 제약회사 알케믹스와 미국 매사추세츠공대(MIT) 로버트 랭거 박사팀, 그리고 단국대 정선주 교수팀 등이 노인성 황반 변성, 암 등 여러 질환을 치료하기 위한 목적으로 앱타머를 연구하고 있다.
많은 학자들은 RNA 치료에 큰 기대를 걸고 있다. RNA 치료는 화학물질을 사용하지 않아 안전하며 바이러스성, 유전성 질병처럼 치료법이 제한된 분야에서 뛰어난 효과를 발휘한다. 진화의 역사를 간직한 RNA를 들여다보면 의학의 미래가 보인다.
출처
miRNA Database site
miRanda는 5가지 종에 대한 Data Base를 보여 준다 : Homo sapiens(miRNA stats: 1100), Mus musculus(717), Rattus norvegicus(387), Drosophila melanogaster(186), Caenorhabditis elegans(233)
miRNA name을 입력해서 많은 정보를 검색할 수 있다
Target이 되는 mRNA name을 입력해서 miRNA를 찾을 수 있다
Homo sapiens, Mus musculus, Rattus norvegicus에 대해서는 miRNA 발현에 관련된 조직을 선택 해 검색할 수 있다
Target이 되는 모든 유전자의 Data Base 다운로드 제공
직관적이고 심플한 디자인
miRBase는 비교적 다양한 종에 대한 Data Base를 보여 준다
miRNA name을 입력해서 많은 정보를 검색할 수 있다
Species와 염색체를 선택해서 해당 염색체를 target으로 한 miRNA의 정보를 확인할 수 있다
Species와 유전자 길이를 선택해서 선택한 유전자 길이 내에 2개 이상의 miRNA가 있는 것만 검색할 수 있다.
miRNA 발현에 관련된 조직을 선택 해 검색할 수 있다
염기서열을 입력해서 BLASTN이나 SSEARCH로 miRNA를 찾을 수 있다
Target이 되는 모든 유전자의 Data Base 다운로드 제공
miRNAMap는 곤충(2), 척추동물(9), 벌레(1)에 대한 Data Base를 보여 준다
miRNA의 이름을 입력해서 많은 정보를 확인할 수 있다
목표가 되는 mRNA의 이름을 입력해서 miRNA를 찾을 수 있다
홈페이지에서 제공하는 생물의 사진을 클린한 후 miRNAs 또는 miRNAs Targets를 선택하면 모든 자료를 확인할 수 있다
miRNAs에 대한 통계자료와 홈페이지 이용 방법에 대한 설명이 잘 되어 있다
4개의 Software와 2개의 Data base를 제공한다
SOFTWARE
설명
DIANA microT v3.0
miRNA의 몇 개의 매개변수를 입력하여 목표가 되는 mRNA을 검색하는데 사용된다
DIANA microT v4.0
Artificial Neural Networks를 기반으로 한 miRNA target 예측 프로그램이다
DIANA mirExTra
6개의 뉴클레오티드 motifs로 단백질로 코딩되는 transcripts에 대한 microRNA의 효과를 분석해 주는 알고리즘이다
DIANA mirPath
인간과 쥐의 miRNA를 빠르고 쉽게 분석하기 위한 필요성을 충족하기 위해 고안 됨
DATABASES
설명
DIANA microT v3.0
miRNA의 몇 개의 매개변수를 입력하여 목표가 되는 mRNA을 검색하는데 사용된다
DIANA microT v4.0
Artificial Neural Networks를 기반으로 한 miRNA target 예측 프로그램이다
DIANA mirExTra
6개의 뉴클레오티드 motifs로 단백질로 코딩되는 transcripts에 대한 microRNA의 효과를 분석해 주는 알고리즘이다
DIANA mirPath
인간과 쥐의 miRNA를 빠르고 쉽게 분석하기 위한 필요성을 충족하기 위해 고안 됨
DATABASES
TarBase v5.0
TarBase database의 업그레이드 버전으로 1300개 이상의 실험에서 얻은 miRNA의 target을 가지고 있다
miRGen 2.0
specific miRNA, specific transcription factor의 이름을 적어서 검색할 수 있다
TarBase database의 업그레이드 버전으로 1300개 이상의 실험에서 얻은 miRNA의 target을 가지고 있다
miRGen 2.0
specific miRNA, specific transcription factor의 이름을 적어서 검색할 수 있다
miRNA의 sequence를 입력해서 miRNA binding sites를 검색하는 기능을 제공
MicroInspector는 비교적 다양한 종에 대한 Data Base를 보여 준다
miRNA binding sites를 검색하는 기능 외에는 제공하지 않는다
포유동물에서 예상되는 miRNA의 target을 검색해 준다
Human, Mouse, Rat, Dog, chicken, Chimpanzee, Rhesus, Cow, Opossum, Frog를 검색할 수 있다.
Data base, Software download는 제공되지 않는다
miRDB는 5가지 종에 대한 Data Base를 보여 준다 : Human, Mouse, Rat, Dog, Chicken
miRNA name, Gene target name으로 검색하는 것과 miRNA sequence를 입력하여 gene target을 검색, 반대로 gene sequence를 입력하여 miRNA를 검색하는 기능이 주어진다
predicted miRNA gene targets에 대한 세부적인 통계 자료와 Data Base 다운로드 제공
NCBI
proteomics에 대한 정보 제공.
blast(Basic Local Alignment Search Tool)
서열의 유사성을 확인할 수 있음.
단백질의 sequence를 검색할 수 있음.
protein 구조를 볼 수 있음.
PubMed : MEDLINE에 대한 정보 및 생체 3차 구조등을 제공함.
MultAlin(Multiple sequence alignment by Florence corpet) : sequence를 검색할 수 있음. enzyme site가 일정치 않으므로 결과간에 약간씩 차이가 있음.
Reverse complement : Antisence를 생성해주는 기능.
genome에 대한 정보를 제공. gene sorter의 기능이 있음.
gene에 대한 각종 정보를 제공함.
miRBase에 관한 정보를 제공함.
Targetscan
mirRNA를 검색 miRNA의 Number of Targets과 [view targets, view expression profile, view in miRBase, view in miRo]를 검색가능.
KEGG: Kyoto Encyclopedia of Genes and Genomes : Pathway에 대한 정보를 제공함.
질병관리본부
microRNA Target Prediction Tools
microRNA Target Prediction Tools
by Chris on November 16, 2009
miRecords is resource for animal miRNA-target interactions developed at the University of Minnesota. miRecords consists of two components. The Validated Targets component is a large, high-quality database of experimentally validated miRNA targets resulting from meticulous literature curation. The Predicted Targets component of miRecords is an integration of predicted miRNA targets produced by 11 established miRNA target prediction programs
PicTar is an algorithm for the identification of microRNA targets. This searchable website provides details (3′ UTR alignments with predicted sites, links to various public databases etc) regarding microRNA target predictions in vertebrates, several Drosophila species, and C. elegans.
miRanda is an algorithm for finding genomic targets for microRNAs. This algorithm has been written in C and is available as an open-source method under the GPL. MiRanda was developed at the Computational Biology Center of Memorial Sloan-Kettering Cancer Center. This software will be further developed under the open source model, coordinated by Anton Enright and Chris Sander (miranda@cbio.mskcc.org).
TargetScan: Prediction of microRNA targets – These are the most recent TargetScanS predictions (April 2005). They are essentially the 3′UTR targets reported in the Lewis et al., 2005 paper, with a few changes arising from updated gene boundary definitions from the April 2005 UCSC genome browser mapping of RefSeq mRNAs to the hg17 human genome assembly. To avoid difficulties in browser display, the few predictions spanning splice junctions are excluded.
RNAhybrid is a tool for finding the minimum free energy hybridization of a long and a short RNA. The hybridization is performed in a kind of domain mode, ie. the short sequence is hybridized to the best fitting part of the long one. The tool is primarily meant as a means for microRNA target prediction.
miRNA – Target Gene Prediction at EMBL – This website provides access to our 2003 and 2005 miRNA-Target predictions for Drosophila miRNAs. Both methods make use of genome comparison across insect species. Our 2005 predictions are based on pairing rules from a systematic experimental study (Brennecke & Stark et al., 2005) and have a very high sensitivity and specificity as assessed by experimental tests (see Supplement in Stark & Brennecke et al., 2005). We thus highly recommend to use the new predictions.
DIANA MicroT Analyzer – A tool for prediction of MicroRNA targets
RegRNA – is an integrated web server for identifying the homologs of Regulatory RNA motifs and elements against an input mRNA sequence. Both sequence homologs or structural homologs of regulatory RNA motifs can be identified.
MicroInspector – A scanning software for detection of microRNA binding sites.
RNA22 – A pattern-based method for the identification of microRNA-target sites and their corresponding RNA/RNA complexes.
TargetBoost – MicroRNA target prediction demo.
psRNATarget: A Plant Small RNA Target Analysis Server – A plant small RNA (including microRNAs) target analysis server, which features two important analysis functions: 1) reverse complementary matching between miRNA and target transcript using a proven scoring schema, and 2) target site accessibility evaluation by calculating unpaired energy (UPE) required to “open” secondary structure around miRNA’s target site on mRNA. PsRNATarget incorporates recent discoveries in plant miRNA target recognition, e.g. it distinguishes translational and post-transcriptional inhibition, and it reports the number of miRNA/target site pairs that may affect miRNA binding activity to target transcript. psRNA Target is replacing miRU (Plant microRNA Potential Target Finder) by the same group.
마이크로RNA(microRNA; miRNA)란
*마이크로RNA 생성
마이크로RNA는 복잡한 여러 단계를 거쳐 생성된다 (그림) [1]. 포유류 마이크로RNA의 50% 이상은 다른 유전자의 인트론 부분에서 발견된다. 따라서 이러한 마이크로RNA는 대부분 그 해당 유전자의 전사 (transcription)를 통해 생성되고, 나머지 유전자간 (intergenic) 영역에 존재하는 마이크로RNA는 독자적으로 전사된다고 여겨진다. 이렇게 주로 RNA polymerase II (Pol II) 에 의해 전사된 1차 마이크로RNA 전구체 (primary miRNA precursor; primiRNA)는 핵 (nucleus) 내에서 RNase III의 일종인 Drosha 단백질에 의해 60~100개 뉴클레오타이드 길이의 머리핀 (stem-loop) 구조를 이루고 있는 2차 마이크로RNA 전구체 (secondary miRNA precursor; pre-miRNA)로 가공 (processing) 된다. 이때 보조 인자 (cofactor) 로 DGCR8 단백질이 관여한다. 이렇게 생성된 pre-miRNA는Exportin5 (Exp5) 단백질에 의해 세포질 (cytoplasm) 로 배출되어, 또다른 RNase III의 일종인 Dicer 단백질에 의해 miRNA-miRNA* duplex로 가공된다. 이 과정에 TRBP 단백질과 PACT 단백질이 참여하여, 최종 마이크로RNA 가닥 (mature miRNA strand) 을 선택해 RISC (RNAinduced silencing comlex) 로 전달한다고 생각되지만 아직 명확하지는 않다. RISC에 적재 (loading) 된 마이크로RNA는 표적 mRNA에 서열 특이적인 결합을 이끄는 안내자 (guide) 역할을 하게 된다.
마이크로RNA 생성 |
http://www.cdc.go.kr/contents/information/had/b/11934_view.html
*마이크로 RNA 생합성 (microRNA biogenesis)
약 80% 정도의 포유류 miRNA genes은 protein coding 또는 nonprotein coding transcripts의 intron region에 존재하고, 나머지 20%는 noncoding RNAs의 exon region에 존재한다. miRNA genes은 RNA polymerase II에 의해 한 개 이상의 hairpin loop를 가진 long primary miRNA transcripts로 전사되어 double-stranded RNA-binding protein인 DGCR8에 결합한 후, Drosha (RNase III enzyme)에 의해 precursor miRNAs로 잘려진다 [1](그림 1). 최근 다른 종류의 miRNA precursors (mirtrons)가 발견되었는데 이들은 Drosha processing에 필요한 stem-loop가 없어서 spliceosome에 의해 branched pre-mitrons가 만들어진 후, lariat-mediated debranching에 의해 pre-miRNAs를 형성한다[2]. 이들 pre-miRNAs은 Exportin-5에 의해 세포질로 이동된 후, Dicer (RNase III enzyme)와 TRBP (RNA binding protein)에 의해 22 nts 길이의 miRNA/miRNA duplex를 형성한다. 이 duplex 중 한 가닥만이 guided strand로써 Argonaute (Ago) protein에 loading 되어 RNA-induced silencing complex (RISC)를 만들고 target mRNA에 결합하는 mature miRNA가 된다[3]. 이때 miRNA 5' 말단의 2~8 nts seed region이 target gene을 인지(recognition)하는데 중요한 역할을 담당해, seed region과 target gene 사이의 상보적인 염기서열 정도(complementary degree)에 따라 target gene의 translational repression이 일어나거나 mRNA degradation이나 cleavage가 일어난다 (그림).
*Review Article
MicroRNAs: their discovery, biogenesis, function and potential use as biomarkers in non-invasive prenatal diagnostics
Michael R. Ladomery, Deborah G. Maddocks, Ian D. Wilson
MicroRNA는 20~25개의 nucleotide로 구성된 small non-coding RNA로 gene expression을 조절하는 regulator 중 하나이다. 알려진 바에 의하면, MicroRNA는 target mRNA와 complementary sequence를 이루어 transcription을 저해하거나 mRNA의 degradation을 유도함으로써 gene silencing을 일으킨다. MicroRNA의 존재가 공식적으로 알려진 것은 1993년의 일로, 비교적 최근이라고 할 수 있는데, 이 때문에 MicroRNA의 regulation과 processing, expression 등에 관련된 메커니즘은 아직까지 명확하지 않은 부분들이 많다.
gene expression을 silencing하는 small non-coding RNA는 mRNA의 degradation을 일으키는 siRNA(short interfering RNA)와 chromatin을 targeting하여 epigenetic modification을 일으키는 siRNA, 그리고 miRNA로 나뉜다. miRNA는 일반적으로 mRNA의 translation에 관여하는 것으로 알려져 있으나 식물에서는 epigenetic regulation과도 연관되어 있다. 또한 최근의 연구 결과, 동물과 식물 모두에서 세포의 정상적인 development와 physiology를 형성하는 데에 기여하는 것으로도 알려져 있다.
miRNA는 3가지 과정을 거쳐 생성되는데, (1) 대개 RNA polymerase Ⅱ에 의해 transcription되어 primary transcript(pri-miRNA)를 이루었다가 (2) precursor miRNA로 부분적인 processing이 일어난 후 (3) 세포질에서 mature form을 형성하게 된다. mRNA로부터 transcription된 pri-miRNA는 상대적으로 길고 stem loop 구조를 띠고 있으나 Drosha라는 효소에 의해 60~100개의 nucleotide로 잘린다. 이것이 핵 바깥으로 보내지면 Dicer라는 효소에 의해 평균 22개의 짤막한 nucleotide로 잘리는 것이다. 이후에 두 가닥의 RNA 중 guider의 역할을 하는 guide strand가 target에 binding하고 passenger strand는 버려지거나 RISC(RNA-induced silencing complex) complex의 일부가 된다.
miRNA가 target RNA를 찾아가는 메커니즘은 아직까지 충분한 연구 결과가 나오지 않고 있다. 그러나 miRNA가 translation을 저해할 것인지 mRNA의 degradation을 일으킬 것인지는 sequence의 상보성 정도뿐만 아니라 Ago protein의 성질에도 영향을 받는다. Ago protein은 RISC complex의 일부로서 slicer activity를 갖는 Argonaute protein로서 cleaving일 수도 있고 non-cleaving일 수도 있다.
target sequence를 인지하는 데에는 5‘ end의 2-8번째에 위치한 nucleotide가 매우 중요한 역할을 하는 것으로 알려져 seed sequence라고도 불리지만, 강력한 seed sequence가 없어도 target을 찾는 것이 가능하기 때문에 target recognition에서 seed sequence의 역할은 아직까지 불명확하다. 또한 mRNA 상에서의 binding 위치에 관해서는 3’UTR이 가장 많은 것으로 보고되고 있다. 이는 3'UTR이 translation되지 않으므로 binding한 miRNP를 떼어낼 수 없기 때문인 것으로 보고 있다. 그리고 하나의 mRNA가 여러 miRNA에 의해 제어당할 수도 있고, 하나의 miRNA가 여러 mRNA와 association할 수도 있다.
마지막으로, miRNA는 RNA interference를 일으킨다는 점에서 siRNA와 곧잘 혼동되는데, miRNA는 매우 효과적으로 genome-encoded된 siRNA라고 볼 수 있다. 둘 모두 Dicer에 의해 20여개 남짓한 수의 nucleotide로 잘리지만 miRNA가 mRNA를 targeting하는 데에 비해 siRNA는 주로 virus나 transposon에 대한 방어 기작에 연관되어 있다.
miRNA biogenesis and gene silencing |
*마이크로 RNA 이름
마이크로 RNA의 이름은 해당 마이크로RNA를 생성하는 종의 약칭, 성숙한 마이크로 RNA를 나타내는 miR, 일련번호의 3가지 파트로 구성되며 하이픈(-)으로 구분하여 적는다. [38] 한 stem loop 시퀀스로부터 생성된 마이크로RNA가 두 개 존재한다면 5' 방향에서 시작된 것에는 -5p를, 3' 방향에서 시작된 것에는 -3p를 붙인다. 둘중에 어느 하나가 두드러지게 나타난다고 하면 상대적으로 미약하게 발견되는 쪽에 상보성 염기라는 의미로 asterisk(*) 기호를 붙여 표기한다.
참조
김연재 , 김종헌 , 박종배,마이크로RNA와 암, 생화학분자생물학회, 2012년.
디 노보 어셈블리(de novo assembly)란
디 노보 어셈블리(de novo assembly)란, 시퀀싱한 리드들로 지놈을 새롭게 어셈블리를 한다는 뜻이다. 여기서 de novo란 라틴어에서 유래한 말로 ’처음부터(from the beginning)‘, ’다시(again)‘를 뜻한다. 디 노보 어셈블리는 주로 서열이 밝혀지지 않은 종의 지놈 서열을 알아내고자 할 때 수행한다.
CNV(Copy Number Variation)란
CNV(Copy Number Variation, 유전체 단위 반복 변이)란 하나의 개체에서 1Kbps(Kilo base pairs) 이상의 염기 서열의 반복 횟수가 다른 개체에 비해 많거나 적은 것으로 정의된다. 한 개체에서의 염기 서열의 반복 횟수가 비교 대상인 다른 개체에 비해 많을 경우는 증가(gain), 적을 경우 감소(loss), 동일할 경우 중립(neutral)이라 부르며, CNV는 상대적인 개념이기
에 한 개체에서의 증가는 비교 대상인 다른 개체에서의 감소가 된다. 염기 서열의 반복 횟수를 복제 수(copy)라고 하는데, 예를 들어 복제 수 2는 한 개체에서의 반복되는 염기 서열이 다른 개체에 비해 2배인 경우를 뜻한다.
CNV는 유전병을 비롯한 각종 질병과 개체간의 특징 발현에 직접적으로 영향을 미치는 것으로 알려져 알려져 있다.
참조 : 차세대 시퀀싱으로 생성된 페어드 엔드 리드를 이용한 CNV 발견 기법, 문명진외
페어드 엔드 리드(paired-end reads)란
페어드 엔드 리드(paired-end reads)란, 서로의 대략적인 거리를 알고 있는 한 쌍의 리드를 의미한다. 예를 들어 Illumina 시퀀싱은 약 500bps의 리드를 생성하고, 이 리드의 양쪽 끝
75bps의 염기 서열을 읽어낸다. 이때 두 리드를 읽는 방향은 3’와 5’로 각각 반대가 된다. 두 리드 사이의 350bps 구간에 대한 염기 서열은 알아낼 수 없으나, 이를 통해 양쪽 75bps의 염기 서열 둘이 약 350bps 떨어져 있다는 정보를 얻어낼 수 있다. 이렇게 얻어진 거리 정보를 가진 75bps 리드 한 쌍을 페어드 엔드 리드라 한다. 페어드 엔드의 거리는 시퀀싱 방식에 따라 다르지만, 하나의 시퀀싱 방식으로 생성되는 페어드 엔드의 길이는 거의 일정하다.
페어드 엔드를 이용하면 유전체 구조 변이를 조사할 수 있다. 예를 들어, 페어드 엔드 사이의 거리가 레퍼런스 시퀀스에서의 거리보다 멀 경우 짧은 삽입(Insertion)이 있으며, 반대로 가까울 경우 짧은 삭제(Deletion)가 있다는 것을 알아낼 수 있다. 또한 페어드 엔드의 방향 정보를 통해 역위(Inversion) 여부도 파악할 수 있다.
리드 생성에 사용된 염기 서열을 테스트 시퀀스(test sequence)라 한다. 테스트 시퀀스에서 페어드 엔드 리드를 얻는 구체적인 예는 다음과 같다. Illumina에서는 약 500bps의 길이의 페어드 엔드 리드를 제공하는데 페어드 엔드의 길이는 조금씩 달라질 수 있으므로 오차율을 설정해줄 필요가 있다. 한 페어드 엔드의 오차율을 100bps로 설정하였다고하면 한 페어드 엔드의 길이는 400~600bps 정도이다. 전체 염기 서열에서 임의의 영역을 선택한 후, 그곳에서부터 연속된 400~600bps 영역을 추출하고, 추출된 영역에서 양 끝의 75bps를 잘라내어 페어드 엔드 리드를 생성한다. 이러한 과정으로 생성된 리드 길이의 합이 전체 염기 서열의 길이의 n배가 될 때까지 반복한다. 이러한 n을 커버리지(coverage)라 하고, 생성된 리드들을 테스트 쿼리(test query)라 한다. 커버리지가 높아질수록 보다 정확한 정보를 얻을 수 있으나 비용이 많이 소요된다는 단점이 있다. 아래 그림은 리드의 길이 3bps, 리드 사이의 거리 14bps인 페어드 엔드 리드의 생성 예를 보여준다.
차세대 시퀀싱 방식을 시뮬레이터를 이용한 페어드 엔드 리드의 생성 예 |
참고 : 차세대 시퀀싱으로 생성된 페어드 엔드 리드를 이용한 CNV 발견 기법, 문영진외
전사체(transcriptome)란
전사체(transcriptome)란, 전사를 의미하는 transcription과 전체를 의미하는 접이머 -ome이 결합하여 만들어진 합성어로, 어떤 종류의 세포 또는 조직에서 특정 순간에 발현 중인 RNA의 총합을 말한다.
gene fusion이란
Gene fusion이란, 아래의 translocation(A), deletion(B), inversion(C) 등과 같이 염색체 구조 변이에 의해서 두 개의 유전자가 합쳐져 만들어진 새로운 유전자를 말한다.