Una
secuencia de ADN o secuencia genética es una sucesión de letras representando
la estructura primaria de una molécula real o hipotética de ADN o banda, con la
capacidad de transportar información.
Las
posibles letras son A, C, G, y T, que simbolizan las cuatro subunidades de
nucleótidos de una banda ADN - adenina, citosina, guanina, timina, que son
bases covalentemente ligadas a cadenas fosfóricas. En el típico caso, las
secuencias se presentan pegadas unas a las otras, sin espacios, como en la
secuencia AAAGTCTGAC, yendo de 5' a 3' de izq. a derecha.
Una
sucesión de cualquier número de nucleótidos mayor a cuatro es pasible de
llamarse una secuencia. En relación a su función biológica, que puede depender
del contexto, una secuencia puede tener sentido o antisentido, y ser tanto
codificante o no codificante. Las secuencias de ADN pueden contener "ADN
no codificante."
Las
secuencias pueden derivarse de material biológico de descarte a través del
proceso de secuenciación de ADN.
En
algunos casos especiales, las letras seguidas de A, T, C, y G se presentan en
una secuencia. Esas letras representan ambiguedad. De todas las moléculas
muestreadas, hay más de una clase de nucleótidos en esa posición. Las reglas de
la Unión Internacional de Química Pura y Aplicada (IUPAC) son las que siguen:
A
= adenina
C
= citosina
G
= guanina
T
= timina
R
= G A (purina)
Y
= T C (pirimidina)
K
= G T (keto)
M
= A C (amino)
S = G C (enlaces fuertes)
W = A T (enlaces débiles)
B
= G T C (todos y A)
D
= G A T (todos y C)
H
= A C T (todos y G)
V
= G C A (todos y T)
N
= A G C T (cualquiera)
No hay comentarios:
Publicar un comentario