Tecnologías Novedosas De Tamizaje Rápido - Elfos Scientiae

   EMBED

Share

Preview only show first 6 pages with water mark for full document please download

Transcript

CAPÍTULO 19 T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 347 TECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA ISABEL A GUILLÉN PÉREZ1, JULIO R FERNÁNDEZ MASSÓ2 1 Departamento de Cicatrización y Regeneración. 2 Neurobiología Molecular. División de Farmacéuticos. Centro de Ingeniería Genética y Biotecnología (CIGB), Ave 31 e/ 158 y 190, Cubanacán, Playa. AP 6162, CP 10600, Ciudad de La Habana, Cuba. INTRODUCCIÓN G racias al desarrollo vertiginoso de las técnicas de secuenciación de ADN, y a la posibilidad de almacenar información en bases de datos de fácil acceso a todos los usuarios, se han podido secuenciar un gran número de genes e, incluso, genomas completos de diferentes organismos que van desde los microbios hasta el hombre. Este poderoso avance se ha podido constatar además en diversas esferas de la ciencia, como la medicina, la biología molecular y la biotecnología (industrial, farmacéutica y agropecuaria), lo que a su vez, según el criterio de muchos investigadores ha permitido adentrarnos en la “era del genoma funcional” o “era post-genómica”. Los adelantos que se realicen en el estudio de la incidencia de las mutaciones génicas en la población y, su repercusión en la aparición y desarrollo de las enfermedades (genómica), así como en los patrones de expresión molecular a nivel de ARN mensajero (ARNm) (transcriptoma) y proteínas (proteómica), serán el complemento imprescindible para descifrar y comprender la función de múltiples genes que conforman el recientemente secuenciado genoma humano, y de otros muchos organismos vivos cuya composición genética ya ha sido develada [1,2]. Por lo que en los próximos años el descubrimiento de nuevos genes, la evaluación del polimorfismo, grupos alélicos de genes conocidos o desconocidos en las poblaciones, y el diagnóstico de enfermedades, serán entre otros muchos, 348 CAPÍTULO 19 los retos futuros para la comunidad científica mundial. Esto, unido al acelerado desarrollo de la industria farmacéutica, permitirá la obtención de novedosos fármacos y terapias. Entre las técnicas clásicas que han permitido incrementar durante décadas el conocimiento de las funciones génicas, se encuentra el Northern blot [3], cuya aplicación como herramienta experimental es clave en la comprobación de los resultados obtenidos mediante las técnicas de tamizaje rápido (HTS, del inglés high throughput screening); los ensayos de protección con la ARNasa [4], y la hibridación diferencial de colonias [5], entre otras tecnologías. Estas metodologías, que hoy en día no dejan de tener gran importancia y aplicación en las investigaciones científicas, llevan implícitas desventajas en su uso, como son: el tiempo que consumen en su desarrollo, el número limitado de muestras que se pueden analizar en cada experimento, la cantidad necesaria de ARN y ADN complementario (ADNc) en su realización, su reproducibilidad, la fiabilidad de la cuantificación de la expresión génica, y la necesidad de conocer, en algunos casos la secuencia de los genes en estudio. Por estas razones, los científicos han abordado, avanzado y perfeccionado los métodos para la introducción de las técnicas de HTS en las investigaciones clínicas e industriales. Las técnicas de HTS, introducidas para el estudio comparativo de la expresión génica en cuanto al análisis de la representatividad del ARNm en células y tejidos, constituyen herramientas moleculares actuales, excelentes para el estudio de la función de los genes (Tabla 19.1). Tabla 19.1. Técnicas que permiten hacer tamizaje rápido de la expresión génica y el genoma Estos métodos novedosos han sido desarrollados para el análisis en gran escala de la secuencia génica y la expresión génica a nivel de ARNm y proteínas, por lo que permiten hacer un estudio comparativo del polimorfismo genético en las poblaciones y, conocer la diferencia de expresión génica entre muestras diferentes, pero relacionadas en su origen. La decisión de los investigadores de aplicar una u otra de las técnicas mencionadas anteriormente, depende en gran medida, de las posibilidades materiales de T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 349 que dispongan, como por ejemplo la posibilidad de contar con laboratorios espaciosos, con el equipamiento necesario para el trabajo, y el financiamiento adecuado. De todas estas tecnologías las menos costosas son: la expresión diferencial y el RDA, las cuales son de fácil acceso para laboratorios pequeños y con pocos recursos. Por el contrario, los EST, el SAGE y los bio-arreglos, necesitan un desarrollo tecnológico integral para su eficiente y confiable aplicación. A continuación se describen de forma general las bases funcionales y los procedimientos de trabajo de cada una de las técnicas de HTS. Es necesario tener en cuenta que estas metodologías están en constante perfeccionamiento, racionalización y desarrollo. EXPRESIÓN DIFERENCIAL Desde que se comenzó a establecer esta técnica en 1992 [6], su utilización se presentó como un método rápido y de alta reproducibilidad para la comparación diferencial de la expresión génica de dos o más poblaciones celulares o tejidos. Inicialmente se utilizaron nucleótidos radiactivos y luego se hizo menos riesgoso su uso con el empleo de nucleótidos marcados con fluoresceína. La aplicación de esta técnica y de otras que se comentarán más adelante, involucra etapas “claves”, en las que el control y buen manejo de las muestras garantizan la confiabilidad en el resultado final. Entre las etapas “claves” se encuentran la óptima selección de la fuente de la muestra y la pureza del ARN a estudiar, por lo que condiciones inadecuadas de aislamiento y almacenamiento de células y tejidos los cuales constituyen el material de partida para e l aislamiento del ARN total, pueden conducir a resultados no satisfactorios y no confiables durante su desarrollo. El ARN total, libre de ADN genómico, se utiliza en la realización de la transcripción inversa con un oligo dT (5’-T12 MG-3’) que da lugar a una primera cadena del ADNc, la cual es utilizada como “ADN cebador” para desarrollar la reacción en cadena de la polimerasa (PCR) [11] con el empleo de oligonucleótidos de 10 bases (5’-ATGGTCTCAA-3’) que pueden reconocer e hibridar en sitios específicos o aleatorios del “DNA cebador” y utilizan para esto el oligonucleótido 5’-T12 MG-3’ y un deoxy nucleótido (dNTP) marcado con radioactividad o con fluoresceína. Cada uno de estos oligonucleótidos de 10 bases puede generar miles de fragmentos de ADNc amplificados en un solo tubo de reacción. Las porciones de los ADNc amplificados se separan por peso molecular mediante electroforesis en geles de poliacrilamida desnaturalizantes, y el patrón de bandas se visualiza por autorradiografía. La comparación del número y concentración de bandas de ADNc entre las 350 CAPÍTULO 19 muestras estudiadas, permite identificar el ADN amplificado diferencialmente lo que implica un aumento o disminución de sus niveles de expresión. Seguidamente se procede a realizar el aislamiento, clonaje en vectores plasmídicos y su secuenciación, con vistas a identificar las secuencias completas de estos genes en bibliotecas de ADNc y poder así estudiar detalladamente sus funciones (ver Figura 19.1). La expresión diferencial es un método simple y de fácil realización. Si se utilizan combinaciones de oligonucleótidos de 10 bases en proporciones adecuadas, es posible detectar todos los ARNm sintetizados por las células, (Figura 19.1). Esta técnica ha sido utilizada exitosamente en muchas áreas de la investigación, como por ejemplo, el aislamiento de genes relacionados con el crecimiento, el desarrollo y la aparición de enfermedades en el hombre, como son el cáncer, las enfermedades coronarias y la diabetes, entre otras múltiples patologías [12-14]. ANÁLISIS DE REPRESENTACIÓN DIFERENCIADA (RDA) Esta técnica basada en dos herramientas básicas de la biología molecular, la hibridación del ADN y la PCR [7], permite determinar la diferencia en la expresión génica entre muestras de interés; por ejemplo, entre la muestra control y las muestras tratadas o transformadas. En una primera etapa, los ARNm obtenidos a partir de poblaciones celulares diferentes (el control y la muestra) se someten a un proceso de transcripción inversa (TI) (Figura 19.2). Seguidamente se digieren las muestras de ADNc con una endonucleasa de alta frecuencia de corte. A los múltiples fragmentos ADNc obtenidos, se les realiza la PCR mediante la utilización de oligonucleótidos que hibridan en ambos extremos del ADNc. De esta forma se amplifican todos los ARNm de las diferentes muestras estudiadas. En una segunda etapa, los oligonucleótidos inicialmente ligados a los extremos de los fragmentos de ADNc son escindidos y esta región se utliza para ligar nuevos oligonucleótidos, pero esta vez sólo a los dos extremos de aquellos fragmentos de ADNc en los que se espera encontrar una diferencia o alteración en la expresión génica (muestra tratada). Posteriormente se procede a la hibridación entre ambas muestras de ADNc (control y muestra tratada) en una relación molar de una molécula de ADNc de muestra tratada por cada mil moléculas de ADNc control (1:1000), con el propósito de promover la hibridación entre las cadenas simples comunes en la mezcla de ADNc control y tratado. T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 351 Figura 19.1. Expresión diferencial. El ARN mensajero (ARNm) extraído a partir de células eucariotas, es procesado mediante la reverso transcripción (TI) con el “cebador” oligo-dt (T12GM, donde M puede ser una G,A o C). La simple cadena de ADN obtenida es complementaria al ARNm inicial. Un “ADN cebador” secundario (oligonucleótido de 10 bases), es diseñado para que hibride de forma azarosa con el ADN de simple cadena generado, el cual en combinación con el oligo-dt es utilizado para amplificar grupos de ADN complementarios (ADNc) de doble cadena, a partir del ADNc “cebador” generado por la reverso transcripción. Los ADNc resultantes son visualizados en geles de poliacrilamida. La banda de interés que representa el ADNc diferencialmente expresado (muestra nombrada como T) en relación con la muestra control (muestra nombrada como C) es señalada por una flecha. 352 CAPÍTULO 19 Figura 19.2. El ARNm obtenido a partir de diferentes fuentes biológicas (células tratadas y control) se procesa mediante la reverso transcripción. El ADNc se fragmenta con una endonucleasa de alta frecuencia de corte. Los fragmentos son amplificados a través de la PCR, e hibridados, con el objetivo de poder conocer la diferente representatividad de los transcritos entre ambas poblaciones celulares. Como tercera etapa, se somete la muestra resultante de la hibridación a una PCR que sólo amplifica las moléculas homodúplex (ADNc tratado-ADNc tratado, que contienen ambas cadenas del ADNc de la muestra a investigar), por contar en sus extremos con los oligonucleótidos añadidos en la segunda etapa de este procedimiento. Las moléculas heterodúplex (ADNc control-ADNc tratado) no son sustrato de la polimerasa durante la amplificación debido a que contienen en sólo uno de sus extremos el oligonucleótido que sirve como cebador para iniciar la polimerización [15]. La mayor ventaja de la utilización de la RDA es la posibilidad de amplificar exclusivamente los fragmentos presentes en la muestra tratada, debido a que hay un enriquecimiento de aquellos ARNm expresados diferencialmente. T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 353 Al igual que la expresión diferencial, la RDA se ha empleado para aislar genes expresados diferencialmente durante el desarrollo de los organismos vivos, durante los procesos patológicos y en células estimuladas con factores de crecimiento [16, 17]. “MOTIVOS” DE SECUENCIA EXPRESADOS (EST) Sólo un por ciento muy bajo del genoma de los organismos superiores corresponde a secuencias que codifican proteínas (en el hombre es el 3 %). En 1991, Adams y colaboradores [8] describieron por primera vez la aplicación de la secuenciación rápida de ADNc, procedimiento en el que se seleccionaron aleatoriamente clones de ADNc de bibliotecas obtenidas a partir de ARNm del cerebro humano y se secuenciaron de forma parcial. Estos clones representaban los genes expresados en el tejido cerebral y fueron denominados “motivos” de secuencias expresadas (EST). A partir de ese momento muchos laboratorios en el mundo siguieron este procedimiento de trabajo para realizar estudios similares en diferentes organos y tejidos de variadas especies de animales y plantas. Los EST se pueden utilizar para determinar las variaciones en una o más bases de los genes en estudio, con lo cual se puede determinar su polimorfismo (single nucleotide polimosphism [SNP], a traducir “polimorfismo de un solo nucleótido”). Esta posibilidad hace a este procedimiento una herramienta potente para el estudio de las enfermedades humanas de origen genético [18] y para estudios relacionados con la evolución de las especies [19]. Esta tecnología alberga un gran valor por la posibilidad que brinda de descubrir nuevos genes y mapear sus posiciones en los cromosomas. Su aplicación permite, además, determinar el perfil de expresión génica de una célula o un tejido en estudio, los cuales definen sus características biológicas básicas. Durante la década de 1990, el procedimiento de los EST desempeñó un papel primordial en el descubrimiento de genes que codifican para los ARNm, y contribuyó enormemente a la definición de las secuencias limites entre intrones y exones en el genoma. De esta forma ha permitido predecir las regiones transcripcionales y ha contribuido, en gran medida a la comprensión del genoma humano, gracias a que ha facilitado distinguir entre las secuencias genómicas que se expresan y las que no lo hacen. Los clones de ADNc (aislados de bibliotecas de ADN) son seleccionados al azar y secuenciados [20]. Seguidamente, el resultado de la secuenciación se compara con las secuencias almacenadas en las bases de datos de genes disponibles en Internet (GeneBank, dbESt y UniGene), e inmediatamente se seleccionan las secuencias nuevas, que no han sido informadas en la literatura internacional, ni en estas bases de datos con anterioridad (Figura 19.3). 354 CAPÍTULO 19 A partir del análisis de la frecuencia de aparición de secuencias en una biblioteca de expresión, es posible calcular, de forma aproximada, los niveles de expresión de cada gen en las células o tejidos en estudio. Entre las desventajas de este método está la necesidad de facilidades de secuenciación de ADN en gran escala, lo cual, en la mayoría de los casos, es incompatible con las posibilidades reales de los pequeños laboratorios de investigación y con pocos recursos. Figura 19.3. La secuenciación de los fragmentos genómicos, permite comparar con los existentes en las bases de datos de secuencias. Si son secuencias desconocidas hasta el momento, se procesan mediante un programa que permite predecir la localización de los EST, mediante la detección del sitio de inicio de la transcripción y los sitios de posible empalme transcripcional. Una vez definida la localización de los enlaces de intrones/exones, es que se puede tener certeza de la secuencia génica del gen transcrito (a). Un ejemplo de alineación de secuencia genómica y de ESTs, es la que permite identificar la posición de los intrones por prevalencia de secuencias GT y AG en las regiones de enlace con los exones (b). T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 355 ANÁLISIS SERIADO DE LA EXPRESIÓN GÉNICA (SAGE) El análisis seriado de la expresión génica permite estudiar todos los transcritos de una muestra y ha sido utilizada de forma satisfactoria para comparar cuantitativamente los perfiles de expresión génica de una célula normal y una célula cancerosa [21, 22]. Esta técnica se basa fundamentalmente en pequeños “motivos” de secuencia de ADN que contienen suficiente información para identificar sólo un transcrito dentro de la población de ARNm [23]. Con el empleo de esta técnica, los clones de ADNc son digeridos al azar y secuenciados desde uno o ambos extremos de cada hebra de ADN clonada. En el desarrollo del método, el proceso de secuenciación no se realiza sobre un único fragmento de ADNc, sino sobre una mezcla de fragmentos de ADNc obtenidos a partir de diferentes transcritos, los cuales forman concatámeros (Figura 19.4). Luego estas secuencias, las cuales brindan información de múltiples genes, se comparan con las existentes en los bancos de genes y permite identificar secuencias desconocidas hasta ese momento. Posteriormente, mediante la determinación de la frecuencia con que estos clones (novedosos o no) aparecen en una biblioteca de expresión, se pueden calcular los niveles de ARNm de cada gen, siempre que la variación en la expresión génica entre la muestra control y la muestra en estudio sea altamente significativa. Mediante la determinación del número de veces que un motivo de secuencia se observa en una población particular, se puede obtener información directa de los niveles de expresión de ciertos transcritos, cuyos resultados se analizan finalmente mediante los análisis estadístico adecuados para estos fines [23]. Las aplicaciones del SAGE son múltiples. Entre los resultados obtenidos se encuentran la obtención de marcadores para el diagnóstico de enfermedades basado en la diferencia de expresión de estos marcadores en los tejidos normales y los tejidos enfermos (por ejemplo, en tumores gastrointestinales, cáncer de páncreas, transformaciones debidas a mutaciones en los genes reguladores de p53, entre otros) [21, 22]. TECNOLOGÍA DE LOS BIO-ARREGLOS La técnica más atractiva y poderosa de los HTS son los bio-arreglos. Esta tecnología permite conocer la expresión génica diferencial a través de la cuantificación del aumento o disminución en la expresión de genes durante la manifestación de enfermedades, o el desarrollo de un estado fisiopatológico, aspecto este de vital importancia para lograr un desarrollo acelerado en el aumento de los niveles de salud en el mundo. 356 CAPÍTULO 19 Figura 19.4. Análisis de la expresión génica (SAGE). En la etapa 1, se aísla el ARN mensajero a partir del ARN total procesado con oligo dt celulosa. En la etapa 2 mediante la utilización de la transcripción inversa, y un oligo dt marcado con biotina, se obtiene una primera cadena de ADNc. En la etapa 3, el ADNc obtenido, se fragmenta mediante una endonucleasa de alta frecuencia de corte. En la etapa 4, se favorece la unión de los extremos 3’ de los ADNc digeridos, a perlas magnéticas recubiertas con estreptavidina. En las etapas 5 y 6, los ADNc se dividen en dos fracciones diferentes a las cuales se les adicionan los oligonucleótidos A y B, respectivamente. Estos oligonucleótidos contienen sitios de unión para la enzima de restricción tipo II-S (esta enzima fragmenta el DNA a una distancia definida desde su sitio de reconocimiento), lo que permite que en las etapas 7 y 8, los ADNc sean separados de los oligonucleótidos A y B. Los ADNc son ligados para formar concatámeros, y finalmente clonados, amplificados y secuenciados (23). T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 357 Los bio-arreglos ofrecen ventajas evidentes en relación con las demás tecnologías de los HTS explicadas con anterioridad en este capítulo (EST, SAGE, ARN y expresión diferencial). Estas ventajas están dadas por el hecho de que los bioarreglos son menos laboriosos, más sensibles, no necesitan del conocimiento previo de las secuencias génicas en estudio y, sobre todo, tienden cada vez más a miniaturizarse y a contener mayor cantidad de genes por área. Todo esto conduce a un procesamiento paralelo de miles de genes con una mayor precisión y rapidez . Sin embargo, los bio-arreglos no constituyen la panacea de los estudios de expresión génica, ya que los resultados obtenidos mediante esta tecnología requieren una validación con otras herramientas analíticas, como, por ejemplo, el Northern blot, la hibridación in situ, la inmunohistoquímica, la proteómica, la bioinformática y la bioestadística [24]. Hasta la fecha se han desarrollado dos formas de realizar las bio-arreglos: los macro y los microarreglos, clasificación que está relacionada con el número de muestras en los soportes, el diámetro del “spot” y el tipo de soporte sobre el cual se organicen las biomoléculas sometidas a tamizaje. Las biomoléculas a utilizar en las bio-arreglos pueden ser bibliotecas de DNAc [25], fragmentos obtenidos por PCR (500 a 5000 pb) [10], oligonucleótidos (20 a 25 mer) [11], y proteínas [26]. Cientos de miles de muestras utilizadas en el tamizaje se aplican e inmovilizan de forma organizada sobre soportes de vidrio o de plástico, los cuales son rígidos e impermeables y ofrecen ventajas importantes en relación al uso de las membranas de nylon que también pueden ser utilizadas con estos fines, por ejemplo son más prácticas, resistentes a los tratamientos de la hibridación molecular y abarcadoras, ya que en ellos se pueden incluir más de 8000 genes/microarreglo [27]. La hibridación de las bio-arreglos se realiza con las sondas de interés (ARN, ADN y proteínas) marcadas con radioactividad, fluoresceína, fosfatasa alcalina, entre otros), cuyos resultados son analizados posteriormente mediante técnicas imagenológicas basadas en la emisión de señales isotópicas, fluorescentes y quimioluminescentes. Estas técnicas se pueden realizar de forma manual o semiautomática. Finalmente, el estudio y la aplicación de los resultados de la diferencia de expresión génica que se obtienen con la utilización de las bio-arreglos, requiere la generación de una base de datos que sirva para el manejo de los genes representados en sus soportes y el análisis, la cuantificación y la interpretación de las señales que se visualicen en cada investigación [28]. 358 CAPÍTULO 19 BIO-ARREGLOS DE A D N C La primera información sobre el uso de esta tecnología se publicó en la revista Science en 1995 [10]. Desde entonces se ha ido desarrollando a través de los años, y actualmente constituye una de las herramientas más poderosa para el estudio de la expresión génica en los organismos vivos, desde las bacterias, las levaduras, las plantas, los animales hasta el hombre. Su uso permite cuantificar la expresión de cientos a miles de genes expuestos simultáneamente a las muestras de ADNc a analizar, lo que permite conocer la diferencia en la expresión génica en muestras tratadas con fármacos o toxinas, células con estructuras alteradas y sus respectivos controles no tratados o no alterados. Los principios básicos de la tecnología de las bio-arreglos de ADNc se basan en la deposición de pequeñas cantidades, aproximadamente 5 nanolitros (2-10 ng) de ADN de secuencias conocidas (obtenida de los bancos de datos de secuencias génicas) o desconocidas (obtenidas de bibliotecas de ADNc) sobre soportes de vidrio, plástico o membranas de nylon en posiciones conocidas y muy bien organizadas, utilizando con este fin máquinas organizadoras automatizadas o semiautomatizadas. Estos grupos de ADNc a utilizar en los bio-arreglos se pueden obtener por amplificación mediante la técnica de la PCR, pudiendo ser fragmentos entre 0,5 kb y 0,2 kb), o se pueden utilizar clones de ADNc (ADNc insertado en un vector plasmídico). La utilización de soportes sólidos, similares a los portaobjetos de vidrio de los microscopios, va aparejada con la intención de analizar una gran cantidad de genes (10 000 a 30 000 muestras). En estos casos el marcaje de la sonda de ARNm o ADNc se debe realizar con fluorescencia. Los soportes de vidrio deben ser cubiertos previamente con poli-L-lisina (Sigma, EE.UU.) y a continuación los ADNc se fijan a esta matriz mediante luz ultravioleta (UV) (ver Figura 19.5). La sonda de ADNc marcada con fluorescencia se hibrida con los microarreglos de ADN [29]. Seguidamente, los resultados de la hibridación se obtienen mediante un escáner que genera una imagen y un dato numérico para cada señal en el soporte. El lector de bio-microarreglos es generalmente un microscopio confocal fluorescente que tiene acoplado un escáner y una computadora, además de contar con un sistema doble o múltiple de iluminación a láser (ScanArrayer 4000 y 5000, Estados Unidos). Por otro lado, la decisión de utilizar soportes de nylon depende de la baja densidad de clones a analizar (1 000 a 10 000 clones), y además, del empleo de métodos de marcaje de sondas que involucran isótopos radioactivivos (32 P y 33 P) o quimioluminescencia (fosfatasa alcalina). T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 359 Figura 19.5. Etapas básicas para la confección de los microarreglos de ADN. Se realiza el aislamiento del ARNm de las células o tejidos a estudiar, seguidamente se obtienen los ADNc marcados (con fluoresceina, isótopos radioactivos o fosfatasa alcalina), y se hibridan con los ADNc organizados en los bio-arreglos. En la figura, se observa cómo los ADNc son diferencialmente expresados mediante un aumento o disminución de la señal (ver los puntos negros y grises). El ADNc que se va a organizar en membranas de nailon, puede tener orígenes similares a los comentados para los soportes sólidos ya sean de vidrio o plástico, con la diferencia de que las membranas no requieren ningún tratamiento previo para fijar el ADN. Una vez aplicada la muestra, se logra un enlace óptimo sobre la superficie de la membrana mediante su exposición a luz UV. Luego, se realiza la hibridación de la muestra de ADNc marcado con las muestras ancladas al bio-arreglo de ADNc (vea procedimiento detallado en “AtlasTM ADNc Expresion Arrays User Manual”, sitio web http://www.clontech.com). El procesamiento, análisis e interpretación de la expresión génica se realiza a través de potentes programas de análisis de imágenes (AtlasImagenTM , http:// www.clontech.com), los cuales se basan en la integración de toda la información sobre los genes analizados, una eficiente capacidad cuantificadora de la señal y el acceso directo a una gran cantidad de secuencias almacenadas en los bancos de genes. El objetivo de los analizadores de imágenes de los bio-microarreglos es brindarle al investigador la información cuantificada de la intensidad de la señal de cada ADNc anclado sobre el soporte, y enlazar esta información con su identificación y coordenadas de ubicación. Esto permite interpretar fácilmente los resultados y poder diseñar etapas posteriores de investigación y análisis. 360 CAPÍTULO 19 Durante años, el uso de los bio-arreglos de ADN ha permitido descubrir nuevos genes y comprender sus funciones. Un ejemplo lo constituyen los estudios de diferenciación de la expresión génica en roedores, en presencia o ausencia de una dieta con restricción calórica. Los resultados obtenidos permitieron demostrar la importancia de este tipo de dieta en el retardo de los procesos celulares relacionados con la edad y el envejecimiento. Estos estudios podrían proporcionar la clave para lograr una mayor longevidad y duración del tiempo de vida en los mamíferos [30]. Mediante estudios de la expresión diferencial de genes en la artritis reumatoide, se han podido identificar cerca de cien genes involucrados en el proceso inflamatorio de este padecimiento [31], de esta misma manera se han identificado genes que participan en la resistencia de determinadas células cancerosas a los tratamientos antitumorales [32]. CHIPS DE ADN Para construir los chips de ADN se utilizan oligonucleótidos, que se organizan en el orden de cientos de miles (de 10 000 a 100 000 moléculas por cm2 ), con una alta resolución espacial y localización precisa sobre soportes sólidos, en este caso portaobjetos de vidrio a los que se les han añadido sustancias químicas, por ejemplo, ácidos carboxílicos importantes para la unión irreversible de la biomolécula al soporte. Estas biomoléculas pueden ser sintéticas o naturales. La síntesis in situ de los oligonucleótidos que se utilizarán en los chips de ADN, se realiza con desprotección selectiva del extremo amino de los nucleótidos y el extremo 5’ de los oligonucleótidos, mediante una pantalla fotolitográfica e irradiación con luz UV [33]. Varios ciclos de desprotección selectiva y acoplamiento de estas moléculas sintéticas al soporte sólido, permiten la creación de los chips de ADN, las cuales pueden contener hasta 96 000 sondas/chip de las biomoléculas seleccionadas [34]. El consorcio comercial “Affymetrix” (Santa Clara, CA, EE.UU.) es pionero en el uso de la desprotección fotolitográfica, y en la síntesis de oligonucleótidos sobre fase sólida. Este consorcio fabrica los chips de ADN y ha expuesto al mercado los denominados “Genechips”, que contienen información de aproximadamente 12 000 genes humanos, útiles para los estudios del cáncer, estudios neurobiológicos, toxicológicos, entre otros. Las sondas (ARNm) a utilizar en la hibridación de los chips de ADN son marcadas directamente con grupos químicos fluorescentes e introducidos en la cámara de hibridación para su complementación con las biomoléculas ancladas al T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 361 chip. El rayo de excitación láser atraviesa el soporte sólido y la luz emitida por las moléculas excitadas (fluorescencia) pasa a través de lentes y filtros ópticos hasta llegar a un detector sensible que, mediante un barrido de la emisión de luz en los chips, permite cuantificar la intensidad de las imágenes fluorescentes. Existen varios equipos en el mercado (GenePix TM 4000 scanner, Axon Instrument, CA, EE.UU.) que brindan una alta resolución e imágenes multicolores de los resultados de la hibridación de los chips (Figura 19.6). Finalmente se relacionan las señales obtenidas y las secuencias previamente conocidas y organizadas en los chips de ADN con los niveles de expresión génica. El uso de la tecnología de los chips de ADN ha facilitado el estudio del polimorfismo genético, y la comprobación de la presencia de miles de alelos alternativos en poblaciones de animales [35]. Por ejemplo, ha permitido conocer el gran polimorfismo que existe en el gen de la proteasa de clase B del virus de inmunodeficiencia humana (VIH-1). De este estudio se obtuvo información importante para la terapia de esta enfermedad [36]. También se han podido validar nuevos medicamentos y conocer las variaciones en la expresión génica entre células normales y células con alteraciones particulares [37]. LA APLICACIÓN DE LA BIOINFORMÁTICA A LA TECNOLOGÍA DE LOS BIO-ARREGLOS El desarrollo de la bioinformática es crucial para la interpretación de los resultados que se obtienen con la tecnología de los HTS. La bioinformática es una disciplina que incluye aspectos de la ciencia de la computación, de la ingeniería de “software”, de las matemáticas y de la biología molecular [38, 39]. Por eso la bioinformática se considera una ciencia integral que, utilizada en la “era del genoma funcional”, puede funcionar como enlace entre la selección de genes de expresión variable, su caracterización y su posible función [40]. El comienzo de la era genómica en la industria farmacéutica se inició con el desarrollo de los EST en el 1993, año en el que se produjo un salto vertiginoso en la información de secuencias génicas. Este salto hizo necesario comenzar a construir toda una infraestructura bioinformática, que se caracterizó rápidamente por la posibilidad de comparar secuencias mediante su alineación. Esta etapa marcó la creación de una base de datos cuya función es servir como una herramienta de búsqueda y alineación de secuencias génicas. Esta base de datos se denominó BLAST (del inglés basic local alignment search tool). 362 CAPÍTULO 19 Figure 19.6. A partir de muestras de células o de tejidos se obtiene el ARNm, que mediante la transcripción inversa utilizando nucleótidos marcados con fluoresceina dan lugar a una mezcla de ADNc, que es utilizada como sonda en la hibridación de los chips de ADN (a). Los chip de ADN son preparados utilizando portaobjetos de microscopios donde se encuentran punteados de forma organizada miles de oligonucleótidos (conteniendo las regiones génicas de interés) (b). Finalmente se realiza la hibridación y lavado de los chip de ADN para crear así los híbridos fluorescentes (c). El desarrollo de los EST requirió una infraestructura adecuada para el procesamiento de una gran cantidad de datos y la realización de análisis básicos. De esta forma se aceleró la creación de programas cada vez más sofisticados que contenían información sobre los genes de diversas bibliotecas de DNAc, procedentes de tejidos, enfermedades y estadios del desarrollo. Este impetuoso desarrollo se aceleró con la secuenciación de múltiples genes microbianos [41]. Fue así como se comenzaron a diseñar algoritmos novedosos que permitieran el ensamblaje de las secuencias leídas, realizándose este desde secuencias pequeñas (en el rango de las kilobases) hasta secuencias de genomas completos (en el rango de las megabases). También a partir de estos algoritmos, fue posible el análisis de la expresión génica, la realización de estudios filogenéticos, y la dilucidación de la estructura primaria y/o función de genes novedosos. Todos estos aspectos fueron incorporados paulatinamente al BLAST, lo que fue de vital importancia para el desarrollo de las compañías biotecnológicas y farmacéuticas productoras de antibióticos. En la actualidad la bioinformática ha vuelto a revolucionarse, con la secuenciación del genoma humano [1, 41], los estudios de polimorfismo de un sólo nucleótido (SNP) y las investigaciones de la expresión génica mediante el empleo de la tecnología de los bio-arreglos. T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 363 Los nuevos programas, además de requerir la aplicación de algoritmos específicos y el manejo de datos, necesitan la incorporación de nuevos elementos a la bioinformática, teniendo en cuenta la interpretación de los datos con el mínimo error posible, lo cual constituye el verdadero valor de los conocimientos, procedentes de la utilización estas tecnologías. La ingeniería de los software está sufriendo una transformación cualitativamente superior que va encaminada hacia la “integración inteligente” de todos los elementos biológicos como son: fragmentos de ácidos nucleicos, cromosomas completos, proteínas, células, organismos y poblaciones (Figura 19.7). Así, con el desarrollo de analizadores de bases de datos cada vez más potentes, los procedimientos de tamizaje rápido podrán contribuir al desarrollo de nuevos medicamentos, con una velocidad y eficiencia impensables hasta nuestros días [27]. Figura 19.7. Esta figura refleja la integración que debe existir entre todos los datos obtenidos a partir de muchas fuentes interrelacionadas, para finalmente poder brindar un análisis global de los resultados mediante el uso de las técnicas de HTS. Por ejemplo, para poder comprender los patrones de expresión de ciertos genes durante el desarrollo de una enfermedad maligna, es necesario conocer su ubicación en el genoma, su polimorfismo, sus patrones de expresión durante las diferentes etapas de la vida, la frecuencia de aparición de esta enfermedad en la población, las secuencias de las proteínas para las cuales codifican, los receptores a los cuales se unen estas proteínas y la importancia fisiológica de estos genes, entre otras múltiples informaciones. R EFERENCIAS 1. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M,, et al. Sequence of human genome. Science 2001;291(550):1304-51. 364 CAPÍTULO 19 2. International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature 2001;409:860-921. 3. Alwine JC, Kemp DJ, Stark GR. Method for deletion of specific RNAs in agarose gels by transfer to diazobenzyloxymethyl-paper and hybridization with DNA probes. Proc Natl Acad Sci 1977;74:5350-4. 4. Berk AJ, Sharp PA. Sizing and mapping of early adenovirus RNAms by gel electrophoresis of S1 endonuclease-digested hybrids. Cell 1977;12:721-32. 5. St. John TP, Davis RW. Isolation of galactose-inducible DNA sequences from Saccharomyces Cerevisiae by differential plaque filter hybridization. Cell 1979;16:443-52. 6. Liang P, Pardee AB. Differential exposition of eukaryotic messenger RNA by means of the polymerase chain reaction. Science 1992;257:967-71. 7. Lisitsyn N, Lisitsyn N, Wigler M. Cloning the differences between two complex genomes. Science 1993;259:946-51. 8. Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al. Complementary DNA sequencing: expressed sequence tags and human genome project. Science 1991;252:1651-6. 9. Velculescu VE, Zhang L, Volgelstein B, Kinzler KW. Serial analysis of gene expression. Science 1995;270:484-7. 10.Schena M, Shalon D, Davis RW, Brown PO. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 1995;270:467-70. 11. Saiki RK, Walsh PS, Levenson CH, Erlich HA. Genetic analysis of amplified DNA with immobilized sequence-specific oligonucleotide probes. Proc Natl Acad Sci. 1989;86:6230-4. 12. Liang P, Averboukh L, Keyomarsi K, Sager R, Pardee AB. Differential expresion and cloning of messenger RNAs from human breast cancer versus mammary epithelial cells. Cancer Res 1992;52:6966–8. 13.Utans U, Liang P, Wyner LR, Kraovsky MJ, Russell M. Chronic cardiac rejection: identification of five upregulated genes in transplanted hearts by differential RNAm expresion. Proc Natl Acad Sci USA 1994;91:6463–7. 14. Nishio Y, Aiello LP, King GL. Glucose induced genes in bovine aortic smooth muscle cells identified by RNAm differential expresion. FASEB J 1994;8:103–6. 15. Kosian DH, Kirschbaum BJ. Comparative gene expression analysis. Trends in Biothecnology 1999;17:73-8. 16. Gress TM, Wallrapp C, Frohme M, Muller-Pillaseh F, Lacher U, Fries H, et al. Identification of genes with specific expression in pancreatic cancer by DNAc representational difference analysis. Genes Chromosomes Cancer 1997;19:97-103 17. Wada J, Kumar A, Ota K, Wallner EI, Batlle DC, Kanwar YS. Representational difference analysis of DNAc of genes expressed in embryonic kidney. Kidney Int 1997;51:1629-38. 18. Collins FS. Positional cloning moves from perditional to traditional. Nat.Genet 1995;9:347-50. 19. Marra MA, Hillier L, Waterston RH. Expressed sequence tags EST ablishing bridges between genomes.Trends Genet 1998;14:4-7. 20. Okubo K, Hori N, Matoba R, Niiyama T, Fukushima A, Kojima Y, Matsubara K. Large scale cDNA sequencing for analysis of quantitative and qualitative aspects of gene expression. Nature Genet. 1992;2:173-9. T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO: ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA 365 21. Zhang L, Zhou W, Velculescu VE, Kern SE, Hruban RH, Hamilton SR, et al. “Gene expression profiles in normal and cancer cells.” Science 1997; 276:1268-72. 22. Polyak K, Xia Y, Zweier JL, Kinzler KW, Vogelstein B. A model for p53-induced apoptosis. Nature 1997;389:300-4. 23. Bertelsen AH, Velculescu VE. High-throughput gene expresion analysis using SAGE. Drug Discovery Today 1998;3:152-9. 24. Sundberg SA, Chow A, Nikiforov T, Garrett Wada H. Microchip-based systems for target validation y HTS. DDT 2000;5(12):S92-103. 25. Walker J. Rigley K. Gene expression profiling in human peripheral blood mononuclear cells using high-density filter-based DNAc microarray J immunology Methods 2000;239:167-79. 26. Lueking A. Protein microarray for gene expression and antibody screening. Anal Biochem 1999;270:103-11. 27. Lennon GG. High-throughput gene expression analysis for drug discovery. DDT 2000;5(2):59-66. 28. Chen Y, Dougherty ER, Bittner ML. Ratio-base decisions and the quantitative analysis of DNAc micromatriz images. J Biomedical Optics 1997;2:364-74. 29. Xiang CC. DNAc microarray technology and its applications. Biotechnology Advances 2000;18:35-46. 30. Han ES, Hilsenbeck SG, Richardson J, Nelson JF. DNAc expresion arrays reveal incomplete reversal of age-related changes in gene expression by calorie restriction. Mechanisms of Angeing y Development 2000;155:157-74. 31. Heller RA, Schena M, Chai A, Shalon D, Bedilion T, Gilmore J, et al. Discovery y analysis of inflamatory disease-related genes using DNAc microarray. Proc Natl Acad Sci Estados Unidos 1997;94:2150-5. 32. Ono K, Tanaka T, Tsunoda T, Kitahara O, Kihara C, Okamoto A, et al. Identification by cDNA microarray of genes involved in ovarian carcinogenesis. Cancer Res 2000;60(18):5007-11. 33. Pirrung MC, Fallon L, McGall G. Proofing of photolithographic DNA syntesis with 3´ 5´dimethoxybenzoinyloxycarbonyl-protected deoxynucleoside phosphormidites. J Organic Chem 1998;63:241-6. 34. Hacia G. Detection of heterozygous mutations in BRCA1 using high-density oligonucleotide arrays and two color fluorescence analysis. Natural Genetic 1996;14:441-7. 35. Lipshutz RJ, Fodor SP, Gingeras TR, Lockhart D. High density synthetic oligonucleotide arrays. Nature Genetics Supplement 1999;21:20-4. 36. Kozal M. Extensive polymorphisms observed in HIV-1 clase B protrease gene using high density oligonucleotide arrays: inplications for therapy. Nature Med 1996;7:753-9. 37. Sgroi DC, Teng S, Robinson G, LeVangie R, Hudson JR Jr, Elkahloun AG. In vivo gene expression profile analysis of human breast cancer progression. Cancer Res 1999;59:5656-61. 38.Waterman MS. Introduction to computational biology: maps, sequences, and genomes. London: Chapman and Hall; 1995. 39. Gusfield D. Algorithms on Strings, Trees y Sequences. Cambridge: University Press; 1997. 40. Searls DB. Using bioinformatics in gene y drug discovery. DDT 2000;5(4):135-42. 41. Saunders NJ, Jeffries AC. The growing utility of microbial genome sequences. Genome Biology (Reports) 2000; 1(1):410.1-410.3.