You are on page 1of 9

El Proyecto Internacional HapMap

El Consorcio Internacional HapMap *

* Las listas de participantes y afiliaciones aparecen al final del documento

..............................................................................................................................................................................
.............................................

El objetivo del Proyecto Internacional HapMap es para determinar los patrones comunes de la variacin de
la secuencia de ADN en el genoma humano y para hacer esta informacin libremente disponible en el
dominio pblico. Un consorcio internacional est elaborando un mapa de estos patrones a travs del genoma
mediante la determinacin de los genotipos de un milln o ms variantes de secuencias, sus frecuencias y el
grado de asociacin entre ellos, en muestras de ADN de las poblaciones con ascendencia de partes de frica,
Asia y Europa . El HapMap permitir el descubrimiento de variantes de secuencias que afectan enfermedad
comn, facilitar el desarrollo de herramientas de diagnstico, y mejorar nuestra capacidad de elegir
objetivos para la intervencin teraputica.

Las enfermedades comunes como las enfermedades cardiovasculares, el cncer, la obesidad, la diabetes, las
enfermedades psiquitricas y las enfermedades inflamatorias son causadas por combinaciones de factores1
gentica y ambiental mltiple

El descubrimiento de estos factores genticos proporcionar nuevos conocimientos fundamentales sobre la


patognesis, diagnstico y tratamiento de las enfermedades humanas. Las bsquedas de variantes causales en
las regiones cromosmicas identificadas por anlisis de ligamiento han tenido un gran xito para muchos un
solo gen rara

trastornos. Por el contrario, los estudios de ligamiento han tenido mucho menos xito en la localizacin de
las variantes genticas que afectan a las enfermedades comunes complejas, ya que cada variante individual
contribuye modestamente a risk2,3 enfermedad. Un enfoque complementario a la identificacin de estos
factores de riesgo genticos especficos es la bsqueda de una asociacin entre una variante especfica y una
enfermedad, mediante la comparacin de un grupo de individuos afectados con un grupo de controles no
afectados.

En ausencia de una fuerte seleccin natural, no es probable que sea un amplio espectro de frecuencia de
dichas variantes, muchos de los que son propensos a ser comn en la poblacin. Una serie de estudios de
asociacin, se centr en los genes candidatos, las regiones de unin a una enfermedad o ms encuestas a
gran escala, ya han llevado al descubrimiento de factores de riesgo genticos para enfermedades comunes.
Los ejemplos incluyen la diabetes tipo 1 (antgeno leucocitario humano (HLA5), insulin6 y CTLA4 (ref. 7)),
la enfermedad de Alzheimer (APOE) 8, la trombosis venosa profunda (factor V) 9, la enfermedad
inflamatoria intestinal (NOD2 (refs 10, 11) y tambin 5q31 (ref. 12)), hipertrigliceridemia (APOAV) 13, la
diabetes tipo 2 (PPARg) 14,15, la esquizofrenia (neoregulina 1) 16, el asma (ADAM33) 17, accidente
cerebrovascular (PDE4D) 18 y el infarto de miocardio (LTA) 19.

Un enfoque para hacer estudios de asociacin supone la comprobacin de cada variante causal putativo de
correlacin con la enfermedad (el enfoque "directo"). Para buscar el genoma completo de la enfermedad
asociaciones implicara el gasto sustancial de la secuenciacin de todo el genoma de numerosas muestras de
pacientes para identificar la variants3 candidato. En la actualidad, este enfoque se limita a la secuenciacin
de las partes funcionales de los genes candidatos (seleccionado sobre la base de un funcional anterior o

hiptesis gentica) para los potenciales candidatos variantes asociadas a la enfermedad.

Un enfoque alternativo (el enfoque "indirecta") ha sido proposed20, por el que un conjunto de variantes en la
secuencia del genoma podra servir como marcadores genticos para detectar asociacin entre una regin
genmica particular y la enfermedad, si los marcadores mismos tenan efectos funcionales. La bsqueda de
las variantes causales podra entonces ser limitada a las regiones que muestran asociacin con la
enfermedad.

Dos puntos de vista de la gentica de poblaciones humanas sugieren que el enfoque indirecto es capaz de
captar la variacin de secuencia ms humano, con mayor eficiencia que el enfoque directo. En primer lugar,
el 90% de la variacin de secuencias entre los individuos se debe a variants21 comn.

En segundo lugar, la mayora de stos fueron originalmente de eventos de mutacin histricos individuales,
y por lo tanto estn asociados con las variantes cercanas que estaban presentes en el cromosoma ancestral en
que se produjo la mutacin. Estas asociaciones hacen que el enfoque indirecto factible estudiar variantes en
genes candidatos, las regiones cromosmicas o a travs de todo el genoma. No se requiere conocimiento
previo de las variantes funcionales putativos. En cambio, el enfoque utiliza informacin de un conjunto
relativamente pequeo de variantes que capturan la mayora de los patrones comunes de variacin en el
genoma, de modo que cualquier regin o gen pueden ser probados para la asociacin con una enfermedad en
particular, con una alta probabilidad de que tal asociacin ser detectable si existe.

El objetivo del Proyecto Internacional HapMap es determinar los patrones comunes de la variacin de la
secuencia de ADN en el genoma humano, mediante la caracterizacin de variantes de secuencias, sus
frecuencias, y las correlaciones entre ellos, en muestras de ADN de las poblaciones con ascendencia de
partes de frica, Asia y Europa . El proyecto supondr una serie de herramientas que permitan el
acercamiento asociacin indirecta a aplicarse fcilmente a cualquier candidato de genes funcionales en el
genoma, a cualquier regin sugerido por anlisis de ligamiento basado en la familia, o en ltima instancia, a
todo el genoma de las exploraciones para los factores de riesgo de enfermedades.

variantes comunes responsables de riesgo de enfermedad sern abordadas ms fcilmente por esta estrategia,
pero no todas las variantes que predisponen son comunes. Sin embargo, hay que sealar que incluso una
variante asociada con la enfermedad relativamente poco comn potencialmente puede ser descubierto
utilizando este enfoque. Reflejo de sus orgenes, la variante poco frecuente estar viajando en un cromosoma
que lleva un patrn caracterstico de las variantes de secuencias cercanas. En un grupo de personas afectadas
por una enfermedad, la variante poco frecuente se enriquecer en la frecuencia en comparacin con su
frecuencia en un grupo de controles no afectados. Esta observacin, por ejemplo, fue de gran ayuda en la
identificacin de los genes responsables de fibrosis22 qustica y dysplasia23 diastrfico, despus de
vinculacin haba sealado a la regin cromosmica general.

A continuacin ofrecemos una breve descripcin de la variacin de la secuencia humana, y luego describir la
estrategia y los componentes principales del proyecto. Estos incluyen la eleccin de las muestras y las
poblaciones de estudio, el proceso de participacin de la comunidad o de la consulta pblica, la seleccin de
polimorfismos de nucletido nico (SNP), genotipificacin, de liberacin y de anlisis de datos.
variacin de la secuencia de ADN humana

Cualquier dos copias del genoma humano difieren una de otra por aproximadamente el 0,1% de los sitios de
nucletidos (es decir, una variante por cada 1.000 bases de media) 24-27. El tipo ms comn de variante, un
SNP, es una diferencia entre los cromosomas de la base presente en un sitio particular en la secuencia de
ADN (Fig. 1a). Por ejemplo, algunos cromosomas en una poblacin pueden tener una C en ese sitio (el
"alelo C '), mientras que otros tienen una T (la' Tallele '). Se ha estimado que, en la poblacin humana del
mundo, cerca de 10 millones de sitios (es decir, una variante por cada 300 bases en promedio) varan de tal
manera que ambos alelos se observan a una frecuencia de $ 1%, y que estos 10 millones de SNPs comunes
constituyen 90% de la variacin en el 21,28 poblacin. El 10% restante se debe a una amplia gama de
variantes que son cada uno rara en la poblacin. La presencia de determinados alelos de SNP en un
individuo est determinado por la prueba ( 'genotipado') una muestra de ADN genmico.

Casi cada sitio variable resulta de un nico evento mutacional histrico como la tasa de mutacin es muy
baja (del orden de 1028 por sitio por generacin) en relacin con el nmero de generaciones ya que el
ancestro comn ms reciente de cualquier par de los seres humanos (del orden de 104 generaciones). Por
esta razn, cada nuevo alelo se asocia inicialmente con los otros alelos que se encontraban presentes en el
fondo cromosmica en que se origin. El conjunto especfico de alelos observados en un solo cromosoma, o
una parte de un cromosoma, se denomina haplotipo (Fig. 1b). Nuevos haplotipos se forman mediante
mutaciones adicionales, o por recombinacin cuando los cromosomas maternos y paternos de cambio
correspondientes segmentos de ADN, lo que resulta en un cromosoma que es un mosaico de los dos
haplotypes29 parental.

La herencia conjunta de alelos de SNP en estos haplotipos conduce a asociaciones entre estos alelos en la
poblacin (conocidos como desequilibrio de ligamiento, LD). Debido a que la probabilidad de
recombinacin entre dos SNPs aumenta con la distancia entre ellos, en promedio estas asociaciones entre
SNPs disminucin con la distancia.

Muchos estudios empricos han demostrado que los niveles altamente significativos de LD, y con frecuencia
fuertes asociaciones entre SNPs cerca, en el genome30-34 humano. Estas asociaciones fuertes significan que
en muchas regiones cromosmicas hay slo unos pocos haplotipos, y stas representan la mayor parte de la
variacin entre las personas en esos regions31,35,36.

Las fuertes asociaciones entre SNPs en una regin tienen un valor prctico: genotipificacin de slo unos
pocos SNPs, cuidadosamente seleccionadas en la regin proporcionar suficiente informacin para predecir
gran parte de la informacin sobre el resto de los SNPs comunes en esa regin. Como resultado, slo unos
pocos de estos SNPs etiqueta '' son obligatorios para identificar cada uno de los haplotipos comunes en un
region35,37-39 (Fig. 1c).

Como el grado de asociacin entre los marcadores cercanos vara dramticamente a travs de la genome30-
32,34,35,40, no es eficaz utilizar SNPs seleccionados al azar o uniformemente espaciados en la secuencia del
genoma.
En cambio, los patrones de asociacin deben determinarse empricamente para la seleccin eficiente de la
etiqueta SNPs. Sobre la base de estudios empricos, se ha estimado que la mayor parte de la informacin
sobre la variacin gentica representada por los 10 millones de SNPs comunes en la poblacin podra ser
proporcionada por el genotipado de 200.000 a 1.000.000 de etiqueta SNPs en todo el genome31,36,38,39.
Por lo tanto, una reduccin sustancial de la cantidad de genotipificacin se puede obtener con poca prdida
de informacin, mediante el uso de conocimiento de la LD presente en el genoma.

Por SNPs comunes, que tienden a ser mayores que los SNP raros, los patrones de LD reflejan en gran
medida la recombinacin histrico y events41 demogrfica. Algunos eventos de recombinacin se producen
repetidamente a 'hotspots'30,42. El resultado de estos procesos es que los cromosomas actuales son mosaicos
de regions29 cromosoma ancestral. Esto explica las observaciones que los haplotipos y los patrones de LD
son compartidos por los cromosomas aparentemente no relacionadas dentro de una poblacin y, en general,
entre populations43.

Estas observaciones son la base conceptual y emprica para la elaboracin de un mapa de haplotipos del
genoma humano, el "HapMap '. Este mapa describir los patrones comunes de variacin, incluidas las
asociaciones entre SNPs, e incluir la etiqueta SNPs seleccionados de manera ms eficiente y completa
capturar esta informacin.

El Consorcio Internacional HapMap

Una primera reunin para discutir los problemas cientficos y ticos asociados con el desarrollo de un mapa
de haplotipos humana se llev a cabo en Washington DC los das 18-19 de julio de 2001
(http://www.genome.gov/10001665). Se organizaron grupos para considerar las cuestiones ticas, para
desarrollar el plan cientfico y para elegir las poblaciones incluir. El Proyecto Internacional HapMap (http:
//www.hapmap.a continuacin, org /) se inici formalmente con una reunin en Washington DC los das 27-
29 de octubre de 2002 (http://www.genome.gov/10005336). Los grupos participantes y fuentes de
financiacin se enumeran en la Tabla 1. muestras de ADN y las poblaciones Las poblaciones humanas son
el resultado de numerosos factores sociales, histricos y los procesos demogrficos. Como resultado, no hay
poblaciones son tpicos, especial o fuertemente bounded44,45. Como la mayora de los patrones comunes de
variacin se puede encontrar en cualquier population46, nadie poblacin es esencial para su inclusin en el
HapMap. No obstante, decidimos incluir varias poblaciones de diferentes geogrfica ancestral lugares para
asegurar que el HapMap incluira la mayor parte del variacin comn y algunas de las variaciones menos
comn en diferentes poblaciones, y para permitir el examen de varias hiptesis acerca de los patrones de LD.

Los estudios de distribucin de frecuencias alelo sugieren que ancestral la geografa es una base razonable
para el muestreo de 44,47,48 poblaciones humanas. Estudios piloto utilizando muestras de los yorubas,
japons, individuos chinos y con ascendencia del norte y occidental Europa han demostrado similitud
sustancial de sus patrones de haplotipos.

Aunque las frecuencias de haplotipos a menudo differ31,44. Dado estos hallazgos cientficos, junto con la
consideracin de la tica, asuntos sociales y culturales, estas poblaciones se acercaron para inclusin en el
HapMap a travs de un proceso de participacin de la comunidad o consulta (vase el recuadro 1).
El HapMap desarrollado con muestras de estos cuatro grandes poblaciones incluir una cantidad sustancial
de la variacin gentica que se encuentra en todas las poblaciones de todo el mundo. El objetivo de la
HapMap es mdica, y los patrones comunes de variacin identificados por el proyecto ser til para
identificar los genes que contribuyen a la enfermedad y la respuesta a los frmacos en muchas otras
poblaciones.

Las muestras de varias otras poblaciones se estn recogiendo para los estudios que examinar similitud de
sus patrones de haplotipos son aquellos en los que el HapMap. Si los patrones encontrados son muy
diferentes, las muestras de algunas de estas poblaciones pueden ser genotipados en gran escala para hacer
que el HapMap ms aplicable a ellos. Otros estudios de seguimiento en otras poblaciones, pequeas y
grandes, son susceptibles de ser llevado a cabo por cientficos en muchas naciones para el descubrimiento de
genes de enfermedades comunes.

El proyecto estudiar un total de 270 muestras de ADN: 90 muestras (vase la informacin complementaria,
parte 1) a partir de una poblacin de Estados Unidos Utah con ascendencia del Norte y Europa Occidental
(muestras recogidas en 1980 por el Centre d'Etude du polymorphisme Humain (CEPH) 49 y utilizados para
otros mapas genticos humanos, 30 tros de dos padres y un hijo adulto), y nuevas muestras recogidas de 90
personas Yoruba en Ibadan, Nigeria (30 tros), 45 sin relacin japons en Tokio, Japn, y 45 no relacionadas
chinos Han en Beijing, China. Todos los donantes dieron su consentimiento especfico para su inclusin en
el proyecto. membresa poblacin se determin de manera apropiada para cada cultivo: para los yoruba
preguntando al donante si los cuatro abuelos eran Yoruba, para los chinos Han preguntando al donante si al
menos tres de los cuatro abuelos eran chinos Han, y para los japoneses por auto -identificacin. Las muestras
CEPH estn disponibles.

de la organizacin no lucrativa Instituto Coriell de Investigacin Mdica (http: // locus.umdnj.edu/nigms/);


lneas celulares y el ADN de las nuevas muestras estarn disponibles a partir Coriell a principios de 2004
para futuros estudios con protocolos de investigacin aprobados por los comits de tica correspondientes.
Se prev que otros investigadores determinar el genotipo de SNP adicionales en estas muestras en el futuro,
y que estos datos van a mejorar continuamente el HapMap.

Estas muestras tendrn identificadores de poblacin y sexo sin informacin que podran vincular a los
donantes individuales. Como el objetivo de este proyecto es nicamente para identificar los patrones de
variacin gentica, no se incluir ninguna informacin fenotpica mdica u otra.

Alrededor del 50% ms muestras se recogieron del que se usar, por lo que la inclusin de una muestra de
cualquier donante en particular no pueden ser conocidas.

Las muestras de 45 individuos no relacionados deben ser suficientes para encontrar 99% de los haplotipos
con una frecuencia de 5% o mayor en una poblacin. Los estudios de LD pueden utilizar muestras
individuales al azar, tros o genealogas ms grandes; cada diseo tiene ventajas (facilidad de muestreo) y
desventajas (disminucin de la eficiencia con un nmero creciente de individuos relacionados). Anlisis de
datos y simulaciones informticas existentes sugerido que los individuos no relacionados y tros tienen un
poder considerable para la estimacin de los patrones de LD locales. Los tros proporcionar informacin
til sobre la exactitud de las plataformas de genotipado que se utiliza para el proyecto.
Eleccin de SNPs

Se necesita una alta densidad de SNPs para describir adecuadamente la variacin gentica a travs de todo el
genoma. Cuando se inici el proyecto, la densidad media de los marcadores en la base de datos pblica
dbSNP (http: // www.ncbi.nlm.nih.gov/SNP/)50 fue de aproximadamente una cada kilobases

(2,8 millones de SNP), pero, dada su distribucin variable, muchas regiones tenan una menor densidad de
SNPs.

Ms SNPs se obtuvieron mediante la secuenciacin aleatoria al azar de todo el genoma y de todo el


cromosoma (flujo ordenado) Bibliotecas 51, utilizando mtodos desarrollados para el mapa SNP humana
inicial de 52 aos, y tambin por la colaboracin con Perlegen Sciences 36 ya travs de la compra de la
secuencia de huellas de Applied Biosystems 53 para la deteccin de SNP (ver informacin complementaria,
parte 2). Un resultado til de esta bsqueda de ms SNPs es la confirmacin de SNPs se encontr
previamente. SNPs para el que cada alelo se ha visto de forma independiente en dos o ms muestras ( "doble
golpe" SNP) tiene una frecuencia menor alelo promedio ms alto que hacer "-single 'SNPs28.

Esto conduce a un ahorro sustancial en el desarrollo del ensayo. El 4 de noviembre de 2003, el nmero de
SNPs (con una nica posicin genmica) en dbSNP (build 118) fue de 5,7 millones, y el nmero de SNPs de
doble golpeado fue de 2 millones de dlares. Para febrero de 2004, se espera que 6,8 millones de SNPs (con
una posicin genmica nica) para estar en dbSNP y disponible para el proyecto, incluyendo 2,7 millones de
SNP-Doble golpe.

Como la medida de LD y haplotipos vara por 100 veces a travs de la genome30-32,34,35, una estrategia de
genotipado jerrquico ha sido

adoptado. En una primera ronda de genotipado, el proyecto tiene como objetivo determinar el genotipo con
xito 600.000 SNPs espaciados a intervalos de 5 kilobases aproximadamente y cada una con una frecuencia
del alelo menor de al menos un 5%, en las muestras de ADN de 270. Se da prioridad a los SNPs previamente
validados, SNP-Doble golpe y SNPs que causan cambios de aminocidos (ya que estos pueden alterar la
funcin de la protena). Cuando se producen estos datos de genotipos (a mediados de 2004; ver ms abajo
para los detalles de la publicacin de datos), que se analizarn las asociaciones entre SNPs vecinos. SNPs
adicionales sern entonces genotipo en las mismas muestras de ADN a una densidad superior slo en las
regiones donde las asociaciones son dbiles. Rondas adicionales de anlisis y determinacin del genotipo se
llevarn a cabo segn sea necesario. Se espera que ms de un milln de SNPs se genotipo general. Esta
estrategia permitir jerrquica regiones del genoma con la menor LD que se caracteriza a densidades de
hasta un SNP por kilobase, maximizando la caracterizacin de las regiones con las asociaciones slo en
distancias cortas.

genotipado
Cada centro de genotipado es responsable de la genotipificacin de todas las muestras de todos los SNPs
seleccionados en las regiones cromosmicas asignados (Tabla 1). Entre los centros, se estn utilizando un
total de cinco tecnologas de genotipado de alto rendimiento, que proporcionar una oportunidad para
comparar su precisin, la tasa de xito, rendimiento y costo. El acceso a varias plataformas es una ventaja
para el proyecto, como un ensayo de SNP que falla en una plataforma puede ser desarrollado con xito
utilizando otro mtodo con el fin de llenar un vaco en el HapMap. Todas las plataformas sern evaluados
utilizando un conjunto comn de criterios de rendimiento para asegurar que la calidad de los datos
producidos por el proyecto cumple con un nivel elevado y uniforme.

la calidad del genotipo se evalu en tres maneras. En primer lugar, al comienzo del proyecto, todos los
centros se les asign el mismo conjunto seleccionado al azar de 1.500 SNPs para el desarrollo del ensayo y
genotipado en las 90 muestras de ADN CEPH que se utiliza para el proyecto.

centros de genotipado producen datos que eran en promedio ms de 99,2% y ms de 99,5% de precisin (en
comparacin con el

el consenso de al menos otras dos plataformas). En segundo lugar, todos los experimentos de genotipado
incluye muestras de los controles internos de calidad, con cada placa de 96 pocillos que contiene duplicados
de cinco muestras diferentes, y uno en blanco. Adems, los datos de tros proporcionan un cheque por la
herencia mendeliana consistente de alelos de SNP. Para todas las poblaciones, los datos de las muestras no
relacionadas proporcionan una verificacin de que los SNPs estn en equilibrio Hardy Weinberg (una prueba
de apareamiento gentico patrones). Aunque una pequea proporcin de SNPs puede fallar stos cheques
por razones biolgicas, que ms tpicamente fallan si un genotipado plataforma hace errores consistentes,
tales como heterocigotos undercalling.

En tercer lugar, una muestra de genotipos SNP depositado por cada centro sern seleccionados al azar y re-
genotipo por otros centros. Estas rigurosas evaluaciones de terceros de la calidad garantizarn la
exhaustividad y fiabilidad de los datos producidos por el proyecto. publicacin de los datos

El proyecto se compromete a la publicacin de datos rpida y completa, y para asegurando que permanecen
libremente disponibles los datos del proyecto en el pblico dominio sin costo alguno para los usuarios. El
proyecto sigue la liberacin de datos principios de un "proyecto de recurso de la comunidad '(http:
//www.wellcome.ac.uk/en/1/awtpubrepdat.html).

Todos los datos sobre los nuevos SNPs, las condiciones de ensayo, y alelo y genotipo las frecuencias sern
liberados rpidamente de dominio pblico en Internet en el Centro de Coordinacin de datos HapMap
(DCC) (http: //www.hapmap.org/) y depositado en dbSNP. genotipo individual y los datos de haplotipos
inicialmente estarn disponibles en el DCC bajo un corto plazo "click-wrap" contrato de licencia. Esta
estrategia ha sido adoptada para garantizar que los datos del proyecto no se pueden incorporar en las patentes
restrictivas, y as seguir siendo de libre acceso en el largo plazo. La nica condicin para el acceso a los
datos es que los usuarios no deben ponerse de acuerdo para restringir el uso de los datos por otros y
compartir los datos solamente con otras personas que han accedido a la misma condicin. Cuando los
haplotipos se definen en una regin, entonces el individuo genotipos, y haplotipos SNPs etiqueta en esa
regin se dar a conocer pblicamente a dbSNP, donde no existen las condiciones de concesin de licencias.
Los participantes del proyecto han acordado que sus propios laboratorios tendrn acceso a los datos a travs
de la DCC y bajo la licencia click-wrap, asegurando que todos los cientficos tienen el mismo acceso a los
datos para la investigacin.
El consorcio cree que los datos SNP, genotipo y haplotipo en la ausencia de utilidad especfica no
constituyen invenciones patentables apropiadamente. utilidad especfica implicara, por ejemplo, la bsqueda
de una asociacin de un SNP o haplotipo con un fenotipo mdicamente importantes tales como un riesgo de
enfermedad o la respuesta al frmaco. El proyecto no incluye ningn fenotipo estudios de asociacin. Sin
embargo, la poltica de liberacin de datos no bloquea los usuarios de la declaracin de la propiedad
intelectual adecuado en este tipo de asociaciones, siempre que cualquier patente que tenga lugar no se utiliza
para impedir el acceso de otros a los datos de HapMap.

Anlisis de los datos

El proyecto aplicar los mtodos existentes y nuevos para el anlisis y la visualizacin de los datos. LD entre
pares de marcadores se calcular utilizando medidas estndar, tales como D0 (ref. 54), R2 (refs 55, 56) y
otros. Se estn evaluando diversos mtodos para definir las regiones de alta LD y haplotipos a lo largo de los
cromosomas. Los mtodos existentes incluyen "ventana deslizante 'profiles57,58 LD, unidad de LD mapas
59, bloques de haplotipos 31,35 y estimaciones de las tasas de recombinacin meitica a lo largo de los
cromosomas 35,60-62. Tras el anlisis de la LD en la primera fase del proyecto, regiones en las que hay
poca o ninguna sern identificados LD y calificados para su posterior seleccin y genotipificacin de SNP.
Los mtodos para seleccionar colecciones ptimos de etiqueta SNPs se desarrollarn y evaluarn (vase ms
arriba). El proyecto supondr una serie de puntos de vista de los datos y la etiqueta SNPs que sern de
utilidad para la comunidad cientfica. A medida que se harn todos los mtodos y anlisis de datos
disponibles, otros investigadores tambin sern capaces de analizar los datos y mejorar los mtodos de
anlisis.

Para ayudar a la optimizacin de la seleccin y el anlisis de LD y haplotipos de SNP, un estudio piloto est
en marcha para producir un conjunto denso de genotipos a travs de grandes regiones genmicas. Diez
regiones de 500 kilobases del genoma (vase la informacin complementaria, parte 3) se sucedern en 48
muestras de ADN no relacionadas (HapMap CEPH 16 (actualmente secuenciado), 16 Yoruba, 8 japoneses y
los chinos Han 8). Todos los SNPs identificados, as los nuevos SNPs en las bases de datos pblicas, se
genotipo en todas las 270 muestras de ADN HapMap, y el genotipo de datos se dar a conocer a las
directrices descritas anteriormente. Este estudio proporcionar datos de genotipo densos para el desarrollo de
mtodos para la seleccin de SNP y para evaluar la integridad de la informacin extrada, para guiar a las
ltimas etapas de genotipado.

Cuando se utiliza el HapMap para examinar grandes regiones genmicas, el problema de comparaciones
mltiples surgir de la prueba de decenas a cientos de miles de SNPs y haplotipos para las asociaciones de
enfermedades. Esto conducir a la dificultad de separar lo verdadero de resultados falsos positivos. De este
modo, los nuevos mtodos estadsticos, estudios de replicacin y el anlisis funcional de las variantes sern
importantes para confirmar los hallazgos e identificar los SNPs funcionalmente importantes.
Conclusin

El objetivo del Proyecto Internacional HapMap es desarrollar una herramienta de investigacin que ayudar
a los investigadores de todo el mundo para descubrir los factores genticos que contribuyen a la
susceptibilidad a la enfermedad, a la proteccin contra la enfermedad y de la respuesta al frmaco. El
HapMap proporcionar un acceso directo importante llevar a cabo candidato-gen, linkagebased y estudios de
asociacin de genoma completo, la transformacin de una estrategia inviable en una prctica. En su mbito
de aplicacin y las consecuencias potenciales, el Proyecto Internacional HapMap tiene mucho en comn con
el Proyecto Genoma Humano, que secuenci el genoma humano 63. Ambos proyectos han sido
cientficamente ambicioso y tecnolgicamente exigentes, han implicado una intensa colaboracin
internacional, se han dedicado a la rpida publicacin de los datos en el dominio pblico, y la promesa de
tener profundas implicaciones para nuestra comprensin de la biologa humana y la salud humana.
Considerando que el proyecto de secuenciacin del genoma cubra toda la, incluyendo el 99,9% del genoma
donde todos somos lo mismo, el HapMap caracterizar los patrones comunes dentro del 0,1% en los que se
diferencian entre s.

Para el potencial completo del HapMap se haga realidad, deben ocurrir varias cosas. La tecnologa para la
determinacin del genotipo debe ser ms rentable, y los mtodos de anlisis debe ser mejorado. Los estudios
piloto con otras poblaciones deben ser completado para confirmar que el HapMap es aplicable en general,
teniendo en consideracin la ampliacin de la HapMap si es necesario para que todas las principales
poblaciones del mundo pueden obtener el mayor beneficio. Para utilizar las herramientas creadas por el
HapMap, ms adelante proyectos conjuntos deben establecer cuidadosamente el fenotipo de los individuos
afectados y no afectados para muchas enfermedades comunes de una manera que preserva la
confidencialidad, pero conserva detalla los datos de exposicin clnicos y ambientales. estudios de cohortes
longitudinales de cientos de miles de personas tambin sern inestimable para evaluar las contribuciones
genticas y ambientales a la enfermedad.

Tambin se debe prestar atencin cuidadosa y sostenida a las cuestiones ticas que se plantearn por el
HapMap y los estudios que se van a utilizar. Al consultar a los miembros de las poblaciones de donantes
sobre el proceso de consentimiento y las implicaciones de los resultados especficos de la poblacin antes de
la recogida de muestras, el proyecto ha ayudado a avanzar en el estndar tico para la investigacin gentica
internacionales de poblacin. Futuros proyectos de gentica de poblaciones continuarn refinando este
enfoque.

Ser un desafo permanente para evitar malas interpretaciones o malos usos de los resultados de estudios que
utilizan el HapMap. Los investigadores que utilizan el HapMap deben presentar sus resultados de manera
que se eviten estigmatizar a grupos, transmitir una impresin de determinismo gentico, o adjuntar niveles
incorrectos de importancia biolgica de las construcciones son esencialmente sociales tales como la raza.

El HapMap es muy prometedora como una nueva y poderosa herramienta para el descubrimiento a mejorar
nuestra comprensin de los factores hereditarios implicados en la salud y la enfermedad. Al darse cuenta de
sus beneficios implicar la estrecha colaboracin de investigadores de ciencia bsica, los genetistas de
poblaciones, epidemilogos, mdicos, cientficos sociales, especialistas en tica y el pblico.

You might also like