Histone deacetylase inhibitor [hdac inhibitor]

히스톤을 비활성화시키는 억제제

ROC curve

prediction power를 나타내는 그래프

용어들

zegote?

dominant : 우성
recessive : 열성

off-the-shelf : 기성품의
commodity machine : 기성 전자 제품 (ex. x86 window computer)


consensus sequence(공통배열)

여러 개의 시퀀스에서 가장 빈번하게 등장하는 알파벳 순서

명확한 정의는 아니다

같은 길이에 대해서 단순하게 다음과 같다.
ACCTTGCT
ACGTTAAT
TCGTAGAC
-----------
ACGTTGAT  : consensus sequence

Bisulfite sequencing

Bisulfite sequencing (also known as bisulphite sequencing) is the use of bisulfite treatment of DNA to determine its pattern of methylation

16s RNA

:16S 리보솜 RNA(16S ribosomal RNA, 16S rRNA)는 원핵생물 리보솜의 30S 소단위체를 구성하고 있는 rRNA로, 1,500 뉴클레오타이드 정도의 길이를 갖는다

:모든 생명체에 존재하면서 종간에 차이가 뚜렷한 RNA

:16S 리보솜 RNA의 서열을 비교하여 원핵생물을 동정할 수 있다.[1] 이 RNA의 서열은 대부분 상당히 보존되어 있는 한편 일부 구간에서는 높은 염기서열 다양성이 나타난다. 특히 동종간에는 다양성이 거의 없는 반면에 타종간에는 다양성이 나타나므로 생물동정에 사용된다. 특히 배양이 불가능하거나 어려운 생물, 또는 보고된 적이 없는 생물의 동정 및 분류에 유용하게 사용된다.

genome browser

integrated genome browser
UCSC genome browser

p53

튜머 서프레스 진

앤트로피

앤트로피
게인

AIC(Akaike information criterion), BIC(Bayesian information criterion)

model parameter 개수를 고르는 기법

homology(sequence similarity)

homology(상동) : 종류가 다른 생물체 사이에서 어떤 기관이 형태·기능은 일치하지 않아도 발생학적으로는 같은 기원을 가진 관계

오솔로지(orthology: 종분화적 상동성)
파랄로지(paralogy: 유전자중복형 상동성)
어떤 DNA 서열이 종의 분화에 의해 나타났을 경우에는 오솔로그(ortholog)라고 하며, 일반적으로 같은 생물 종 내에서 유전자가 중복되어 만들어진 서열은 파랄로그(paralog)라고 한다. 즉 오솔로그는 서로 다른 종에서 거의 비슷한 DNA 서열이 행하는 기능이 같을 때 사용하고, 파랄로그는 일반적으로 같은 종에서 거의 비슷한 DNA 서열이 행하는 기능이 서로 다를 때 사용한다.
->오솔로그 파랄로그 모두 기능이 다르고 비슷한 DNA서열을 의미한다. 다만 오솔로그는 달느 종에서의 상동이고 파랄로그는 같은 종에서의 상동이다.


BBH(Bidirectional Best Hit)
:두 개의 시퀀스 A, B와 각각의 서브시퀀스 {a1,a2,...am}, {b1,b2,...bm}이 있을 때,
A의 서브시퀀스 ai에 가장 가까운 B의 서브시퀀스가 bj이고
bj의 가장 가까운 시퀀스가 ai일 때,
(ai, bj)를 BBH라고 한다.


COGs(Clusters of Orthologous Groups)
:시퀀스 A, B, C의 서브시퀀스 ai, bj, ck가 서로 서로 BBH 관계일 때,
{ai, bj, ck}는 COG이다.
COG 두 개의 원소가 겹치면 COG를 통합할 수 있다.

Homology는 같은 조상으로부터 내려운 구조를 말한다. 즉, 박쥐의 날개나, 영장류의 팔은 서로 homologous한 관계이다. 이들은 비슷한 기능을 할 수도 있지만 서로 다른 기능을 할 수도 있다. 중요한 것은 이들이 진화 관점에서 봤을 때 이 기관이 같은 조상으로부터 파생된 것이라는 점이다. 이와 반대로, Analogy는 서로 비슷한 기능을 하지만 서로 다르게 진화해 온 것을 말한다. 예를 들어, maple seed의 날개와 알바트로스의 날개는 서로 analogous한 관계에 있다. 서로 비슷한 기능을 하지만, 이것은 서로와 무관하게 독립적으로 진화해 온 것이다.

어떤 구조는 homologous하거나 analogous한 관계일 수 있는데, 예를 들어 박쥐의 날개와 새의 날개는 서로 어류의 등뼈에서 진화했다는 점에서 homologous한 관계라고 할 수도 있다. 그러나 박쥐의 날개와 새의 날개는 서로 독립적으로 나는 능력을 진화시켜 왔다는 점에서 analogous한 관계일 수도 있다.

그렇다면, 유전자에서 Homology는 어떤 관계가 있는가? 만일, 어떤 단백질과 DNA 사이에서 유전자의 서열이 비슷하다면, 이들은 서로 비슷한 기능을 할 가능성이 높으며, 이 경우 homologous한 관계일 가능성 또한 높다. 그러나, 이것은 공통의 조상을 가지지 않더라도 두 서열이 비슷할 가능성 또한 존재한다. 짧은 서열이 경우 그냥 서로 비슷할 수도 있고, 특정 단백질로 바인딩되기 위해 선택되면서 (transcription factor와 같은) 서로 비슷해질 수도 있다. 이것은 단지 비슷할 뿐이지 homologous한 것은 아니다.

homologous 서열은 다음 두 종류가 있는데, Orthology와  Paralogy가 그것이다.

만일 speciation event에 의해서 분화된 homologous 서열이라면, Orthology이다. 어떤 종이 다른 두 종으로 분화할 때, 분화된 종에서의, 분화된기 전의 단일 유전자에서 분화된 두 유전자는 orthologous한 관계에 있다. 즉, Orthology는 서로 다른 종에 있으며, 비슷한 기능을 하는 유전자(gene)을 말한다. 예를 들어, APOBEC3G는 Homo Sapiens 외 다른 종에게서도 발견되는데, 이것은 서로 다른 종임에도 불구하고 비슷한 효과를 가진다. 즉, 이것은 애초에 이들이 한 종에서부터 갈라져 나왔으며, 같은 조상을 가지고 있다는 것을 뜻한다. 이런 유전자들(orthologs)은 항상 그런 것은 아니지만, 보통 같은 기능을 하는 유전자일 가능성이 대단히 높다.

이와 달리, 두 유전자가 gene duplication에 의해 분화되었다면, 이 homologous 서열을 Paralogy라고 한다. 만일, 어떤 기관 내에서의 유전자가 동일한 유전자에서 다른 위치를 차지하기 위해 duplication 되었다면, 이 카피는 paralogous한 관계에 있다. gene duplication이란, 유전자를 포함한 DNA 영역 복제를 뜻한다. gene duplication은  homologous recombination이나, restrotransposition 과정에서 오류가 발생할 수도 있다. 이 유전자의 두 번째 복제는 때때로 selective pressure로부터 자유롭고, 이것은 원래의 기능을 잃지 않는 돌연변이를 일으킬 수도 있다.



이런 paralogous한 관계에 있는 서열의 집합을 각각의 Paralogs라고 부른다. Paralogs는 전형적으로 비슷하거나 비슷한 기능을 하지만, 복제된 유전자에 대해 원래의 slective pressure에 의해 손실된 부분 때문에, 이 복제는 돌연변이에 대해 상대적으로 자유롭고, 새로운 능력을 획득할 가능성도 크다.

예를 들어, 헤모글로빈과 마이오글로빈은 서로가 공통의 조상을 가졌을거라 추측된다. 즉, 이미 알려진 헤모글로빈의 4종류는 각각에 대해서 paralogous하다. 각각의 유전자는 산소 운반이라는 공통적인 기본적 기능을 하지만, 그들은 그 기능에 있어서 이미 분화되었다. 즉, 헤모글로빈 F와 같은 경우, adult 헤모글로빈에 비해 더 높은 산소 친화력을 가진다.


출처 : http://celdee.tistory.com/326

진화론을 믿진 않지만 개념 이해는 필요하므로

바이오 인포메틱스란

생물학을 계산가능하(computable)게 만드는 것

클러스터링의 원칙

within cluster distance maximize
between cluster minimize

graph theory

*large scale network
small world network
scale free network


*center
hub : 엣지가 가장 많은 노드
betweenness centrality : 모든 노드 쌍에 대해서 pairwise shortest pathway를 구했을 대 그 pathway가 가장 많이 지나는 노드