Información

¿Qué proteínas forman parte de los complejos de proteínas más diferentes?


Dejar norte ser el número de complejos de proteínas diferentes (como se define aquí) de los que una proteína puede ser una parte estable durante un período de tiempo considerable (y no solo de forma transitoria). ¿Qué proteínas tienen la mayor norte?

Una respuesta debe incluir el número de diferentes complejos de proteínas de los que forma parte la proteína.

¿O por dónde debería empezar a hacer mi propia investigación? No tengo ni idea.


Esta respuesta no aborda la cantidad de complejos en los que participa una proteína, sino una pregunta relacionada: ¿Con cuántas proteínas interactúa una proteína?
Reconozco que esta es una pregunta fundamentalmente diferente, aunque creo que es un buen punto de partida sobre el cual otras personas pueden construir una mejor respuesta.


Tomando los datos de STRING v11 para todas las interacciones proteína-proteína (PPI) en Escherichia coli str. K-12 substr. MG1655, podemos crear un subconjunto de estos PPI para incluir solo los de tipo de acción "vinculante". Esta base de datos proporciona puntuaciones de PPI entre 0 y 1 basadas en experimentos (co-purificación, co-cristalización, Y2H), extracción de texto, co-ocurrencia, co-expresión y co-localización de genes codificantes a través de genomas.

Si no establecemos un límite para la confianza en estas interacciones de unión, vemos que 2585 proteínas tienen ≥1 socio de unión, y una proteína tiene 273 socios de unión asombrosos (pfo, una supuesta piruvato-flavodoxina oxidorreductasa). Además, esta base de datos establece esto E. coli La cepa tiene 4127 genes codificadores de proteínas distintos, por lo que aproximadamente el 63% (2585/4127) de los genes codifican una proteína que interactúa con al menos otra proteína distinta.

Si limitamos las interacciones a aquellas con una puntuación de "alta confianza" (≥0,900), se ve que sólo 656 proteínas (~ 16%) tienen ≥ 1 pareja de unión, con un máximo de 55 parejas de unión observadas para 4 proteínas. Como era de esperar, y de acuerdo con el comentario de Maximilian Press, estas proteínas están todas asociadas con el ribosoma (sra, rpsP, rpsI, y rpsR). El pico en el gráfico a continuación en 54 socios que interactúan para los IBP de alta confianza es un grupo de proteínas ribosomales, la mayoría de las cuales están anotadas como co-interactuantes.

Dos notas importantes sobre la interpretación de las interacciones en esta base de datos:

  1. las variantes de empalme y las proteínas modificadas postranscripcionalmente se colapsan en nodos únicos en la red de interacción, por lo que todas las variantes de productos génicos están representadas por una secuencia codificante
  2. Las auto-interacciones (por ejemplo, dimerización) no se cuentan, que son un tipo válido de complejo proteico según la pregunta.

Proteína integral

Una proteína integral, a veces denominada proteína de membrana integral, es cualquier proteína que tenga una región funcional especial con el fin de asegurar su posición dentro de la membrana celular. En otras palabras, una proteína integral se encierra en la membrana celular. Lo hace con regiones de aminoácidos específicos que son atraídos hacia la mitad de la membrana plasmática. En la siguiente imagen se puede ver una proteína integral típica.

La proteína integral que se ve aquí atraviesa la membrana plasmática (P) varias veces. Este no es siempre el caso, algunas proteínas integrales tienen una sola región que se extiende a la hidrofóbico capa interna de la membrana plasmática. La región de la proteína que se ve en verde también es hidrófoba. La influencia positiva de estas interacciones no polares y la fuerza negativa de intentar empujar hacia una región llena de agua mantienen las proteínas integrales en su lugar. Además de esta función básica causada por la estructura similar de todas las proteínas integrales, una sola proteína integral puede participar en muchas reacciones diferentes.

Una proteína integral se puede comparar con una proteína periférica. Una proteína periférica a menudo se une a la membrana plasmática, pero solo a las cabezas de la fosfolípido moléculas. La mayoría pueden desprenderse fácilmente y no están realmente adheridas a la membrana. Una proteína integral, debido a la química del entorno que la rodea, nunca puede abandonar la membrana plasmática. A veces, una proteína periférica y una proteína integral trabajarán en conjunto para completar una tarea.


Contenido

Los primeros estudios de proteínas que podrían considerarse proteómicas comenzaron en 1975, tras la introducción del gel bidimensional y el mapeo de las proteínas de la bacteria. Escherichia coli.

La palabra proteoma es una mezcla de las palabras "proteína" y "genoma", y fue acuñada por Marc Wilkins en 1994 cuando era un Ph.D. estudiante de la Universidad Macquarie. [5] La Universidad de Macquarie también fundó el primer laboratorio de proteómica dedicado en 1995. [6] [7]

Después de la genómica y la transcriptómica, la proteómica es el siguiente paso en el estudio de los sistemas biológicos. Es más complicado que la genómica porque el genoma de un organismo es más o menos constante, mientras que los proteomas difieren de una célula a otra y de vez en cuando. Los genes distintos se expresan en diferentes tipos de células, lo que significa que es necesario identificar incluso el conjunto básico de proteínas que se producen en una célula.

En el pasado, este fenómeno se evaluó mediante análisis de ARN, pero se encontró que carece de correlación con el contenido de proteínas. [8] [9] Ahora se sabe que el ARNm no siempre se traduce en proteína, [10] y la cantidad de proteína producida para una determinada cantidad de ARNm depende del gen desde el que se transcribe y del estado fisiológico actual del celda. La proteómica confirma la presencia de la proteína y proporciona una medida directa de la cantidad presente.

Modificaciones postraduccionales Editar

No solo la traducción del ARNm causa diferencias, sino que muchas proteínas también están sujetas a una amplia variedad de modificaciones químicas después de la traducción. Las modificaciones postraduccionales más comunes y ampliamente estudiadas incluyen la fosforilación y la glicosilación. Muchas de estas modificaciones postraduccionales son críticas para la función de la proteína.

Fosforilación Editar

Una de esas modificaciones es la fosforilación, que ocurre con muchas enzimas y proteínas estructurales en el proceso de señalización celular. La adición de un fosfato a aminoácidos particulares, más comúnmente serina y treonina [11] mediada por serina-treonina quinasas, o más raramente tirosina mediada por tirosina quinasas, hace que una proteína se convierta en un objetivo para unirse o interactuar con un conjunto distinto de otras proteínas que reconocen el dominio fosforilado.

Debido a que la fosforilación de proteínas es una de las modificaciones de proteínas más estudiadas, muchos esfuerzos "proteómicos" están orientados a determinar el conjunto de proteínas fosforiladas en una célula o tipo de tejido en particular en circunstancias particulares. Esto alerta al científico sobre las vías de señalización que pueden estar activas en ese caso.

Ubiquitination Editar

La ubiquitina es una pequeña proteína que se puede fijar a ciertos sustratos proteicos mediante enzimas llamadas ubiquitina ligasas E3. Determinar qué proteínas son poliubiquitinadas ayuda a comprender cómo se regulan las vías de las proteínas. Este es, por tanto, un estudio "proteómico" legítimo adicional. De manera similar, una vez que un investigador determina qué sustratos están ubiquitinados por cada ligasa, es útil determinar el conjunto de ligasas expresadas en un tipo de célula en particular.

Modificaciones adicionales Editar

Además de la fosforilación y ubiquitinación, las proteínas pueden someterse a (entre otras) metilación, acetilación, glicosilación, oxidación y nitrosilación. Algunas proteínas experimentan todas estas modificaciones, a menudo en combinaciones dependientes del tiempo. Esto ilustra la complejidad potencial de estudiar la estructura y función de las proteínas.

Las proteínas distintas se crean en entornos distintos Editar

Una célula puede producir diferentes conjuntos de proteínas en diferentes momentos o en diferentes condiciones, por ejemplo, durante el desarrollo, la diferenciación celular, el ciclo celular o la carcinogénesis. Aumentando aún más la complejidad del proteoma, como se mencionó, la mayoría de las proteínas pueden sufrir una amplia gama de modificaciones postraduccionales.

Por lo tanto, un estudio de "proteómica" puede volverse complejo muy rápidamente, incluso si el tema de estudio es restringido. En entornos más ambiciosos, como cuando se busca un biomarcador para un subtipo de cáncer específico, el científico en proteómica podría optar por estudiar múltiples muestras de suero sanguíneo de múltiples pacientes con cáncer para minimizar los factores de confusión y tener en cuenta el ruido experimental. [12] Por lo tanto, a veces se necesitan diseños experimentales complicados para explicar la complejidad dinámica del proteoma.

La proteómica proporciona un nivel de comprensión diferente al de la genómica por muchas razones:

  • el nivel de transcripción de un gen da sólo una estimación aproximada de su nivel de traducción en una proteína. [13] Un ARNm producido en abundancia puede degradarse rápidamente o traducirse de manera ineficiente, lo que da como resultado una pequeña cantidad de proteína.
  • como se mencionó anteriormente, muchas proteínas experimentan modificaciones postraduccionales que afectan profundamente sus actividades, por ejemplo, algunas proteínas no están activas hasta que se fosforilan. Se utilizan métodos como la fosfoproteómica y la glicoproteómica para estudiar las modificaciones postraduccionales.
  • muchas transcripciones dan lugar a más de una proteína, mediante empalmes alternativos o modificaciones postraduccionales alternativas.
  • muchas proteínas forman complejos con otras proteínas o moléculas de ARN y solo funcionan en presencia de estas otras moléculas.
  • La tasa de degradación de las proteínas juega un papel importante en el contenido de proteínas. [14]

Reproducibilidad. Un factor importante que afecta la reproducibilidad en los experimentos de proteómica es la elución simultánea de muchos más péptidos de los que pueden medir los espectrómetros de masas. Esto provoca diferencias estocásticas entre experimentos debido a la adquisición de péptidos trípticos dependiente de los datos. Aunque los primeros análisis de proteómica de escopeta a gran escala mostraron una variabilidad considerable entre los laboratorios, [15] [16] presumiblemente debido en parte a las diferencias técnicas y experimentales entre los laboratorios, la reproducibilidad se ha mejorado en los análisis de espectrometría de masas más recientes, particularmente en el nivel de proteínas y el uso de Espectrómetros de masas Orbitrap. [17] En particular, la proteómica dirigida muestra una mayor reproducibilidad y repetibilidad en comparación con los métodos de escopeta, aunque a expensas de la densidad y la eficacia de los datos. [18]

En proteómica, existen múltiples métodos para estudiar proteínas. Generalmente, las proteínas pueden detectarse usando anticuerpos (inmunoensayos) o espectrometría de masas. Si se analiza una muestra biológica compleja, se debe utilizar un anticuerpo muy específico en el análisis de transferencia de puntos cuantitativos (QDB), o se debe utilizar la separación bioquímica antes del paso de detección, ya que hay demasiados analitos en la muestra para realizar detección y cuantificación precisas.

Detección de proteínas con anticuerpos (inmunoensayos) Editar

Los anticuerpos contra proteínas particulares, o sus formas modificadas, se han utilizado en estudios de bioquímica y biología celular. Estas se encuentran entre las herramientas más comunes utilizadas por los biólogos moleculares en la actualidad. Existen varias técnicas y protocolos específicos que utilizan anticuerpos para la detección de proteínas. El ensayo inmunoabsorbente ligado a enzimas (ELISA) se ha utilizado durante décadas para detectar y medir cuantitativamente proteínas en muestras. El western blot puede usarse para la detección y cuantificación de proteínas individuales, donde en un paso inicial, una mezcla de proteínas compleja se separa usando SDS-PAGE y luego la proteína de interés se identifica usando un anticuerpo.

Las proteínas modificadas pueden estudiarse desarrollando un anticuerpo específico para esa modificación. Por ejemplo, existen anticuerpos que solo reconocen determinadas proteínas cuando están fosforiladas en tirosina, se conocen como anticuerpos fosfoespecíficos. Además, existen anticuerpos específicos para otras modificaciones. Estos pueden usarse para determinar el conjunto de proteínas que han sufrido la modificación de interés.

La detección de enfermedades a nivel molecular está impulsando la revolución emergente del diagnóstico y tratamiento precoces. Un desafío al que se enfrenta el campo es que los biomarcadores de proteínas para el diagnóstico temprano pueden estar presentes en muy poca abundancia. El límite inferior de detección con la tecnología de inmunoensayo convencional es el rango femtomolar superior (10-13 M). La tecnología de inmunoensayo digital ha mejorado la sensibilidad de detección en tres registros, hasta el rango attomolar (10 −16 M). Esta capacidad tiene el potencial de abrir nuevos avances en el diagnóstico y la terapéutica, pero estas tecnologías han sido relegadas a procedimientos manuales que no son adecuados para un uso rutinario eficiente. [19]

Detección de proteínas sin anticuerpos Editar

Si bien la detección de proteínas con anticuerpos sigue siendo muy común en biología molecular, también se han desarrollado otros métodos que no se basan en un anticuerpo. Estos métodos ofrecen varias ventajas, por ejemplo, a menudo pueden determinar la secuencia de una proteína o péptido, pueden tener un rendimiento más alto que los basados ​​en anticuerpos y, a veces, pueden identificar y cuantificar proteínas para las que no existen anticuerpos.

Métodos de detección Editar

Uno de los primeros métodos para el análisis de proteínas ha sido la degradación de Edman (introducida en 1967) donde un solo péptido se somete a múltiples pasos de degradación química para resolver su secuencia. Estos primeros métodos han sido reemplazados en su mayoría por tecnologías que ofrecen un mayor rendimiento.

Los métodos implementados más recientemente utilizan técnicas basadas en espectrometría de masas, un desarrollo que fue posible gracias al descubrimiento de métodos de "ionización suave" desarrollados en la década de 1980, como la desorción / ionización láser asistida por matriz (MALDI) y la ionización por electropulverización (ESI). Estos métodos dieron lugar a los flujos de trabajo de proteómica de arriba hacia abajo y de abajo hacia arriba, donde a menudo se realiza una separación adicional antes del análisis (ver más abajo).

Métodos de separación Editar

Para el análisis de muestras biológicas complejas, se requiere una reducción de la complejidad de la muestra. Esto puede realizarse fuera de línea mediante separación unidimensional o bidimensional. Más recientemente, se han desarrollado métodos en línea en los que péptidos individuales (en enfoques proteómicos ascendentes) se separan mediante cromatografía de fase inversa y luego, se ionizan directamente mediante ESI. El acoplamiento directo de separación y análisis explica el término "en línea". análisis.

Tecnologías híbridas Editar

Existen varias tecnologías híbridas que utilizan la purificación de analitos individuales basada en anticuerpos y luego realizan análisis espectrométricos de masas para su identificación y cuantificación. Ejemplos de estos métodos son el MSIA (inmunoensayo por espectrometría de masas), desarrollado por Randall Nelson en 1995, [20] y el método SISCAPA (Captura estándar de isótopos estables con anticuerpos antipéptidos), introducido por Leigh Anderson en 2004. [21]

Metodologías de investigación actuales Editar

La electroforesis en gel diferencial bidimensional de fluorescencia (2-D DIGE) [22] se puede utilizar para cuantificar la variación en el proceso 2-D DIGE y establecer umbrales estadísticamente válidos para asignar cambios cuantitativos entre muestras. [22]

El análisis proteómico comparativo puede revelar el papel de las proteínas en sistemas biológicos complejos, incluida la reproducción. Por ejemplo, el tratamiento con el insecticida triazofos provoca un aumento en el contenido de saltahojas marrón (Nilaparvata lugens (Stål)) proteínas de las glándulas accesorias masculinas (Acps) que pueden transferirse a las hembras a través del apareamiento, provocando un aumento de la fecundidad (es decir, la tasa de natalidad) de las hembras. [23] Para identificar cambios en los tipos de proteínas de las glándulas accesorias (Acps) y proteínas reproductivas que los saltaplantas hembras recibían de los saltaplantas macho, los investigadores realizaron un análisis proteómico comparativo de N. lugens hembras. [24] Los resultados indicaron que estas proteínas participan en el proceso reproductivo de N. lugens hembras y machos adultos. [24]

Análisis de proteoma de Peroxisomas de Arabidopsis [25] se ha establecido como el principal enfoque imparcial para identificar nuevas proteínas peroxisomales a gran escala. [25]

Existen muchos enfoques para caracterizar el proteoma humano, que se estima que contiene entre 20.000 y 25.000 proteínas no redundantes. El número de especies de proteínas únicas probablemente aumentará entre 50.000 y 500.000 debido al empalme de ARN y eventos de proteólisis, y cuando también se considera la modificación postraduccional, se estima que el número total de proteínas humanas únicas varía en los pocos millones. [26] [27]

Además, recientemente se ha informado de los primeros intentos prometedores de descifrar el proteoma de los tumores animales. [28] Este método se utilizó como método funcional en Macrobrachium rosenbergii perfil de proteínas. [29]

Tecnologías proteómicas de alto rendimiento Editar

La proteómica ha ido ganando impulso durante la última década con la evolución de varios enfoques. Pocos son nuevos y otros se basan en métodos tradicionales. Los métodos basados ​​en espectrometría de masas y las micromatrices son las tecnologías más comunes para el estudio de proteínas a gran escala.

Espectrometría de masas y perfiles de proteínas Editar

Hay dos métodos basados ​​en espectrometría de masas que se utilizan actualmente para la elaboración de perfiles de proteínas. El método más establecido y extendido utiliza electroforesis bidimensional de alta resolución para separar proteínas de diferentes muestras en paralelo, seguido de la selección y tinción de proteínas expresadas diferencialmente para ser identificadas por espectrometría de masas. A pesar de los avances en 2-DE y su madurez, también tiene sus límites. La preocupación central es la incapacidad de resolver todas las proteínas dentro de una muestra, dado su rango dramático en el nivel de expresión y las diferentes propiedades. [30]

El segundo enfoque cuantitativo utiliza etiquetas de isótopos estables para marcar diferencialmente proteínas de dos mezclas complejas diferentes. Aquí, las proteínas dentro de una mezcla compleja se marcan primero isotópicamente y luego se digieren para producir péptidos marcados. A continuación, se combinan las mezclas marcadas, se separan los péptidos mediante cromatografía líquida multidimensional y se analizan mediante espectrometría de masas en tándem. Los reactivos de etiqueta de afinidad codificada por isótopos (ICAT) son las etiquetas de isótopos más utilizadas. En este método, los residuos de cisteína de las proteínas se unen covalentemente al reactivo ICAT, reduciendo así la complejidad de las mezclas omitiendo los residuos que no son de cisteína.

La proteómica cuantitativa que utiliza el marcado isotópico estable es una herramienta cada vez más útil en el desarrollo moderno. En primer lugar, se han utilizado reacciones químicas para introducir etiquetas en sitios o proteínas específicos con el fin de sondear funcionalidades proteicas específicas. El aislamiento de péptidos fosforilados se ha logrado utilizando marcaje isotópico y químicas selectivas para capturar la fracción de proteína entre la mezcla compleja.En segundo lugar, la tecnología ICAT se utilizó para diferenciar entre complejos macromoleculares parcialmente purificados o purificados, como el complejo de preiniciación de ARN polimerasa II grande y las proteínas complejadas con el factor de transcripción de levadura. En tercer lugar, el etiquetado ICAT se combinó recientemente con el aislamiento de cromatina para identificar y cuantificar las proteínas asociadas a la cromatina. Finalmente, los reactivos ICAT son útiles para el perfil proteómico de orgánulos celulares y fracciones celulares específicas. [30]

Otro enfoque cuantitativo es el enfoque de etiqueta precisa de masa y tiempo (AMT) desarrollado por Richard D. Smith y sus compañeros de trabajo en el Laboratorio Nacional del Noroeste del Pacífico. En este enfoque, se logra un mayor rendimiento y sensibilidad al evitar la necesidad de espectrometría de masas en tándem y al hacer uso de información de tiempo de separación determinada con precisión y determinaciones de masa altamente precisas para identificaciones de péptidos y proteínas.

Chips de proteína Editar

Equilibrar el uso de espectrómetros de masas en proteómica y en medicina es el uso de micromatrices de proteínas. El objetivo de las micromatrices de proteínas es imprimir miles de características de detección de proteínas para el interrogatorio de muestras biológicas. Las matrices de anticuerpos son un ejemplo en el que se disponen una gran cantidad de anticuerpos diferentes para detectar sus respectivos antígenos a partir de una muestra de sangre humana. Otro enfoque es la ordenación de múltiples tipos de proteínas para el estudio de propiedades como las interacciones proteína-ADN, proteína-proteína y proteína-ligando. Idealmente, las matrices proteómicas funcionales contendrían el complemento completo de las proteínas de un organismo dado. La primera versión de tales matrices consistió en 5000 proteínas purificadas de levadura depositadas en portaobjetos microscópicos de vidrio. A pesar del éxito del primer chip, la implementación de matrices de proteínas fue un desafío mayor. Las proteínas son intrínsecamente mucho más difíciles de trabajar que el ADN. Tienen un amplio rango dinámico, son menos estables que el ADN y su estructura es difícil de conservar en portaobjetos de vidrio, aunque son esenciales para la mayoría de los ensayos. La tecnología ICAT global tiene ventajas sorprendentes sobre las tecnologías de chips de proteínas. [30]

Microarrays de proteínas en fase inversa Editar

Se trata de una nueva y prometedora aplicación de microarrays para el diagnóstico, estudio y tratamiento de enfermedades complejas como el cáncer. La tecnología fusiona la microdisección de captura por láser (LCM) con la tecnología de microarrays para producir microarrays de proteínas de fase inversa. En este tipo de micromatrices, toda la colección de proteínas en sí se inmoviliza con la intención de capturar varias etapas de la enfermedad dentro de un paciente individual. Cuando se usa con LCM, las matrices de fase inversa pueden monitorear el estado fluctuante del proteoma entre diferentes poblaciones de células dentro de un área pequeña de tejido humano. Esto es útil para perfilar el estado de las moléculas de señalización celular, entre una sección transversal de tejido que incluye tanto células normales como cancerosas. Este enfoque es útil para controlar el estado de factores clave en el epitelio de próstata normal y los tejidos del cáncer de próstata invasivo. A continuación, LCM diseca estos tejidos y los lisados ​​de proteínas se distribuyen en portaobjetos de nitrocelulosa, que se sondaron con anticuerpos específicos. Este método puede rastrear todo tipo de eventos moleculares y puede comparar tejidos sanos y enfermos dentro del mismo paciente, lo que permite el desarrollo de estrategias de tratamiento y diagnóstico. La capacidad de adquirir instantáneas proteómicas de poblaciones de células vecinas, utilizando microarrays de fase inversa junto con LCM tiene una serie de aplicaciones más allá del estudio de los tumores. El enfoque puede proporcionar información sobre la fisiología y patología normales de todos los tejidos y es invaluable para caracterizar los procesos y anomalías del desarrollo. [30]

Descubrimiento de nuevos fármacos Editar

Un avance importante derivado del estudio de genes y proteínas humanos ha sido la identificación de nuevos fármacos potenciales para el tratamiento de enfermedades. Esto se basa en la información del genoma y del proteoma para identificar proteínas asociadas con una enfermedad, que los programas informáticos pueden usar como objetivos para nuevos medicamentos. Por ejemplo, si una determinada proteína está implicada en una enfermedad, su estructura 3D proporciona la información para diseñar fármacos que interfieran con la acción de la proteína. Una molécula que se adapta al sitio activo de una enzima, pero que no puede ser liberada por la enzima, inactiva la enzima. Esta es la base de nuevas herramientas de descubrimiento de fármacos, cuyo objetivo es encontrar nuevos fármacos para inactivar proteínas implicadas en enfermedades. A medida que se encuentran diferencias genéticas entre individuos, los investigadores esperan utilizar estas técnicas para desarrollar medicamentos personalizados que sean más efectivos para el individuo. [31]

La proteómica también se usa para revelar complejas interacciones planta-insecto que ayudan a identificar genes candidatos involucrados en la respuesta defensiva de las plantas a la herbivoría. [32] [33] [34]

Interacción proteómica y redes de proteínas Editar

La proteómica de interacción es el análisis de interacciones de proteínas desde escalas de interacciones binarias hasta proteomas o en toda la red. La mayoría de las proteínas funcionan a través de interacciones proteína-proteína, y uno de los objetivos de la proteómica de interacción es identificar interacciones proteicas binarias, complejos proteicos e interactomas.

Hay varios métodos disponibles para sondear las interacciones proteína-proteína. Si bien el método más tradicional es el análisis de dos híbridos de levadura, un método emergente poderoso es la purificación por afinidad seguida de espectrometría de masas de proteínas utilizando cebos de proteínas etiquetadas. Otros métodos incluyen resonancia de plasmón de superficie (SPR), [35] [36] micromatrices de proteínas, interferometría de polarización dual, termoforesis a microescala y métodos experimentales como la visualización de fagos y en silico Métodos computacionales.

El conocimiento de las interacciones proteína-proteína es especialmente útil con respecto a las redes biológicas y la biología de sistemas, por ejemplo, en cascadas de señalización celular y redes reguladoras de genes (GRN, donde el conocimiento de las interacciones proteína-ADN también es informativo). El análisis de las interacciones de las proteínas en todo el proteoma y la integración de estos patrones de interacción en redes biológicas más grandes es crucial para comprender la biología a nivel de sistemas. [37] [38]

Proteómica de expresión Editar

La proteómica de expresión incluye el análisis de la expresión de proteínas a mayor escala. Ayuda a identificar las proteínas principales en una muestra en particular, y aquellas proteínas expresadas diferencialmente en muestras relacionadas, como tejido enfermo vs. tejido sano. Si una proteína se encuentra solo en una muestra enferma, entonces puede ser una diana de fármaco útil o un marcador de diagnóstico. Las proteínas con perfiles de expresión iguales o similares también pueden estar relacionadas funcionalmente. Existen tecnologías como 2D-PAGE y espectrometría de masas que se utilizan en proteómica de expresión. [39]

Biomarcadores Editar

Los Institutos Nacionales de Salud han definido un biomarcador como "una característica que se mide y evalúa objetivamente como un indicador de procesos biológicos normales, procesos patógenos o respuestas farmacológicas a una intervención terapéutica". [40] [41]

Comprender el proteoma, la estructura y función de cada proteína y las complejidades de las interacciones proteína-proteína es fundamental para desarrollar las técnicas de diagnóstico y los tratamientos de enfermedades más eficaces en el futuro. Por ejemplo, la proteómica es muy útil en la identificación de biomarcadores candidatos (proteínas en los fluidos corporales que son valiosas para el diagnóstico), la identificación de los antígenos bacterianos que son el objetivo de la respuesta inmune y la identificación de posibles marcadores inmunohistoquímicos de enfermedades infecciosas o neoplásicas. [42]

Un uso interesante de la proteómica es el uso de biomarcadores de proteínas específicos para diagnosticar enfermedades. Varias técnicas permiten analizar las proteínas producidas durante una enfermedad en particular, lo que ayuda a diagnosticar la enfermedad rápidamente. Las técnicas incluyen western blot, tinción inmunohistoquímica, ensayo inmunoabsorbente ligado a enzimas (ELISA) o espectrometría de masas. [28] [43] La secretómica, un subcampo de la proteómica que estudia las proteínas secretadas y las vías de secreción mediante enfoques proteómicos, ha surgido recientemente como una herramienta importante para el descubrimiento de biomarcadores de enfermedades. [44]

Proteogenómica Editar

En proteogenómica, se utilizan tecnologías proteómicas como la espectrometría de masas para mejorar las anotaciones de genes. El análisis paralelo del genoma y el proteoma facilita el descubrimiento de modificaciones postraduccionales y eventos proteolíticos, [45] especialmente cuando se comparan múltiples especies (proteogenómica comparativa). [46]

Proteómica estructural Editar

La proteómica estructural incluye el análisis de estructuras de proteínas a gran escala. Compara estructuras de proteínas y ayuda a identificar funciones de genes recién descubiertos. El análisis estructural también ayuda a comprender dónde se unen los medicamentos a las proteínas y también muestra dónde las proteínas interactúan entre sí. Este conocimiento se logra utilizando diferentes tecnologías como la cristalografía de rayos X y la espectroscopia de RMN. [39]

Gran parte de los datos de proteómica se recopilan con la ayuda de tecnologías de alto rendimiento, como la espectrometría de masas y microarrays. A menudo, se necesitarían semanas o meses para analizar los datos y realizar comparaciones a mano. Por esta razón, los biólogos y químicos están colaborando con científicos informáticos y matemáticos para crear programas y una tubería para analizar computacionalmente los datos de proteínas. Utilizando técnicas de bioinformática, los investigadores pueden realizar análisis y almacenamiento de datos más rápidos. Un buen lugar para encontrar listas de programas y bases de datos actuales es el portal de recursos bioinformáticos de ExPASy. Las aplicaciones de la proteómica basada en bioinformática incluyen medicina, diagnóstico de enfermedades, identificación de biomarcadores y muchas más.

Identificación de proteínas Editar

La espectrometría de masas y los microarrays producen información de fragmentación de péptidos pero no dan identificación de proteínas específicas presentes en la muestra original. Debido a la falta de identificación de proteínas específicas, los investigadores anteriores se vieron obligados a descifrar los propios fragmentos de péptidos. Sin embargo, actualmente hay programas disponibles para la identificación de proteínas. Estos programas toman la salida de secuencias de péptidos de espectrometría de masas y microarrays y devuelven información sobre proteínas similares o coincidentes. Esto se hace mediante algoritmos implementados por el programa que realizan alineaciones con proteínas de bases de datos conocidas como UniProt [47] y PROSITE [48] para predecir qué proteínas hay en la muestra con cierto grado de certeza.

Estructura de las proteínas Editar

La estructura biomolecular forma la configuración 3D de la proteína. Comprender la estructura de la proteína ayuda a identificar las interacciones y la función de la proteína. Solía ​​ser que la estructura 3D de las proteínas solo se podía determinar mediante cristalografía de rayos X y espectroscopia de RMN. A partir de 2017, la microscopía crioelectrónica es una técnica líder, que resuelve las dificultades con la cristalización (en cristalografía de rayos X) y la ambigüedad conformacional (en RMN). La resolución fue de 2.2Å en 2015. Ahora, a través de la bioinformática, hay programas de computadora que pueden en algunos casos, predicen y modelan la estructura de las proteínas. Estos programas utilizan las propiedades químicas de los aminoácidos y las propiedades estructurales de proteínas conocidas para predecir el modelo 3D de las proteínas de muestra. Esto también permite a los científicos modelar interacciones de proteínas a mayor escala. Además, los ingenieros biomédicos están desarrollando métodos para tener en cuenta la flexibilidad de las estructuras de las proteínas para hacer comparaciones y predicciones. [49]

Modificaciones postraduccionales Editar

La mayoría de los programas disponibles para el análisis de proteínas no están escritos para proteínas que han sufrido modificaciones postraduccionales. [50] Algunos programas aceptarán modificaciones postraduccionales para ayudar en la identificación de proteínas, pero luego ignorarán la modificación durante el análisis de proteínas posterior. Es importante tener en cuenta estas modificaciones, ya que pueden afectar la estructura de la proteína. A su vez, el análisis computacional de modificaciones postraduccionales ha atraído la atención de la comunidad científica. Los programas actuales de modificación postraduccional son solo predictivos. [51] Químicos, biólogos e informáticos están trabajando juntos para crear e introducir nuevas tuberías que permitan el análisis de modificaciones postraduccionales que han sido identificadas experimentalmente por su efecto sobre la estructura y función de la proteína.

Métodos computacionales en el estudio de biomarcadores de proteínas Editar

Un ejemplo del uso de la bioinformática y el uso de métodos computacionales es el estudio de biomarcadores de proteínas. Los modelos de predicción computacional [52] han demostrado que durante el embarazo se produce un tráfico de proteínas feto-materno extenso y diverso y que puede detectarse fácilmente de forma no invasiva en la sangre entera materna. Este enfoque computacional sorteó una limitación importante, la abundancia de proteínas maternas que interfieren con la detección de proteínas fetales, al análisis proteómico fetal de la sangre materna. Los modelos computacionales pueden usar transcripciones de genes fetales previamente identificadas en sangre completa materna para crear una red proteómica integral del término neonato. Este trabajo muestra que las proteínas fetales detectadas en la sangre de la mujer embarazada se originan en un grupo diverso de tejidos y órganos del feto en desarrollo. Las redes proteómicas contienen muchos biomarcadores que son sustitutos del desarrollo e ilustran la posible aplicación clínica de esta tecnología como una forma de controlar el desarrollo fetal normal y anormal.

También se ha introducido un marco teórico de la información para el descubrimiento de biomarcadores, que integra información de biofluidos y tejidos. [53] Este nuevo enfoque aprovecha la sinergia funcional entre ciertos biofluidos y tejidos con el potencial de resultados clínicamente significativos que no serían posibles si los tejidos y los biofluidos se consideraran individualmente. Al conceptualizar el biofluido tisular como canales de información, se pueden identificar importantes sustitutos de biofluidos y luego utilizarlos para el desarrollo guiado de diagnósticos clínicos. Los biomarcadores candidatos se predicen luego en función de los criterios de transferencia de información a través de los canales de biofluidos tisulares. Se pueden utilizar relaciones significativas biofluido-tejido para priorizar la validación clínica de biomarcadores. [ cita necesaria ]

Varios conceptos emergentes tienen el potencial de mejorar las características actuales de la proteómica. Obtener la cuantificación absoluta de proteínas y monitorear las modificaciones postraduccionales son las dos tareas que impactan en la comprensión de la función de las proteínas en células sanas y enfermas. Para muchos eventos celulares, las concentraciones de proteínas no cambian, sino que su función está modulada por modificaciones postraduccionales (PTM). Los métodos de monitoreo de PTM son un área subdesarrollada en proteómica. La selección de un subconjunto particular de proteína para el análisis reduce sustancialmente la complejidad de la proteína, lo que la hace ventajosa para fines de diagnóstico donde la sangre es el material de partida. Otro aspecto importante de la proteómica, que aún no se ha abordado, es que los métodos de proteómica deberían centrarse en el estudio de las proteínas en el contexto del medio ambiente. El uso cada vez mayor de reticuladores químicos, introducidos en las células vivas para fijar proteína-proteína, proteína-ADN y otras interacciones, puede mejorar parcialmente este problema. El desafío consiste en identificar métodos adecuados para preservar las interacciones relevantes. Otro objetivo del estudio de las proteínas es desarrollar métodos más sofisticados para obtener imágenes de proteínas y otras moléculas en células vivas y en tiempo real. [30]

Biología de sistemas Editar

Los avances en la proteómica cuantitativa permitirían claramente un análisis más profundo de los sistemas celulares. [37] [38] Los sistemas biológicos están sujetos a una variedad de perturbaciones (ciclo celular, diferenciación celular, carcinogénesis, medio ambiente (biofísico), etc.). Las respuestas transcripcionales y de traducción a estas perturbaciones dan como resultado cambios funcionales en el proteoma implicado en respuesta al estímulo. Por lo tanto, describir y cuantificar los cambios en la abundancia de proteínas en todo el proteoma es crucial para comprender el fenómeno biológico de manera más integral, a nivel de todo el sistema. De esta manera, la proteómica puede verse como complementaria a la genómica, la transcriptómica, la epigenómica, la metabolómica y otros enfoques de la ómica en los análisis integradores que intentan definir los fenotipos biológicos de manera más completa. Como ejemplo, Atlas del proteoma del cáncer proporciona datos cuantitativos de expresión de proteínas para

200 proteínas en más de 4000 muestras tumorales con datos transcriptómicos y genómicos coincidentes de The Cancer Genome Atlas. [54] Conjuntos de datos similares en otros tipos de células, tipos de tejidos y especies, particularmente usando espectrometría de masas de escopeta profunda, serán un recurso inmensamente importante para la investigación en campos como biología del cáncer, biología de células madre y del desarrollo, medicina y biología evolutiva.

Proteoma del plasma humano Editar

Caracterizar el proteoma del plasma humano se ha convertido en un objetivo importante en el campo de la proteómica, pero también es el proteoma más desafiante de todos los tejidos humanos. [55] Contiene inmunoglobulina, citocinas, hormonas proteicas y proteínas secretadas indicativas de infección además de proteínas hemostáticas residentes. También contiene proteínas de fuga tisular debido a la circulación sanguínea a través de diferentes tejidos del cuerpo. Por tanto, la sangre contiene información sobre el estado fisiológico de todos los tejidos y, combinado con su accesibilidad, hace que el proteoma sanguíneo sea invaluable para fines médicos. Se cree que caracterizar el proteoma del plasma sanguíneo es un desafío abrumador.

La profundidad del proteoma plasmático abarca un rango dinámico de más de 10 10 entre la proteína más abundante (albúmina) y la más baja (algunas citocinas) y se cree que es uno de los principales desafíos para la proteómica. [56] La dinámica temporal y espacial complica aún más el estudio del proteoma plasmático humano. El recambio de algunas proteínas es bastante más rápido que el de otras y el contenido de proteínas de una arteria puede variar sustancialmente del de una vena. Todas estas diferencias hacen que incluso la tarea proteómica más simple de catalogar el proteoma parezca fuera de alcance. Para abordar este problema, es necesario establecer prioridades. Capturar el subconjunto más significativo de proteínas entre todo el proteoma para generar una herramienta de diagnóstico es una de esas prioridades. En segundo lugar, dado que el cáncer está asociado con una glucosilación mejorada de proteínas, también serán útiles los métodos que se centren en esta parte de las proteínas. Nuevamente: el análisis multiparamétrico revela mejor un estado patológico. A medida que estas tecnologías mejoran, los perfiles de enfermedades deben estar continuamente relacionados con los respectivos cambios de expresión génica. [30] Debido a los problemas mencionados anteriormente, la proteómica plasmática siguió siendo un desafío. Sin embargo, los avances tecnológicos y los desarrollos continuos parecen dar como resultado un resurgimiento de la proteómica del plasma, como lo demostró recientemente una tecnología llamada perfil del proteoma del plasma.[57] Gracias a estas tecnologías, los investigadores pudieron investigar los procesos de inflamación en ratones, la heredabilidad de los proteomas plasmáticos y mostrar el efecto de un cambio de estilo de vida tan común como la pérdida de peso en el proteoma plasmático. [58] [59] [60]

Numerosas revistas están dedicadas al campo de la proteómica y áreas relacionadas. Tenga en cuenta que las revistas que tratan proteinas suelen centrarse más en la estructura y la función, mientras que proteómica las revistas se centran más en el análisis a gran escala de proteomas completos o al menos de grandes conjuntos de proteínas. Algunos de los más importantes [ según quien? ] se enumeran a continuación (con sus editores).


Identificación de complejos de proteínas a partir de datos AP-MS

7.2 Recopilación y procesamiento previo de datos

Los métodos de detección de complejos proteicos existentes se pueden dividir en dos categorías según los datos de entrada [1]. Primero, algunos métodos detectan complejos de proteínas a partir de una red PPI establecida, que se genera conectando pares de proteínas que interactúan entre sí. Aquí, la relación de interacción entre diferentes proteínas se obtiene a partir de los métodos de predicción de interacciones enumerados en el Capítulo 6. Alternativamente, otros métodos detectan directamente complejos a partir de datos AP-MS originales. Estos métodos suelen modelar los datos AP-MS como un gráfico bipartito en el que los dos conjuntos de vértices son el conjunto de cebos y el conjunto de presas, respectivamente.


La biotinilación de proximidad y la purificación por afinidad son enfoques complementarios para el mapeo del interactoma de complejos proteicos asociados a la cromatina.

El mapeo de las interacciones proteína-proteína para las proteínas asociadas a la cromatina sigue siendo un desafío. Aquí exploramos el uso de BioID, un enfoque de biotinilación de proximidad en el que una ligasa de biotina mutada (BirA *) se fusiona con un cebo de interés, lo que permite la activación local de biotina y la biotinilación posterior de proteínas en la vecindad del cebo. BioID permitió un mapeo interactivo exitoso de histonas centrales y miembros del complejo mediador. Exploramos la señal de fondo producida por el enfoque BioID y descubrimos que el uso de distintos tipos de controles aumentaba el rigor de nuestro análisis estadístico con SAINTexpress. Una comparación directa de BioID con nuestro protocolo AP-MS optimizado para complejos de proteínas asociadas a la cromatina reveló que los enfoques identificaron pocos socios de interacción compartidos y se enriquecieron para procesos biológicos distintos; sin embargo, ambos enfoques permitieron la recuperación de interacciones biológicamente significativas. Si bien no se pudo observar un sesgo claro para ninguna de las técnicas hacia complejos de proteínas de funciones particulares, BioID permitió la purificación de proteínas de menor abundancia celular. Finalmente, pudimos identificar una fuerte asociación de MED4 con el centrosoma por BioID y validamos este hallazgo por inmunofluorescencia. En resumen, BioID complementa AP-MS para el estudio de complejos proteicos asociados a cromatina.

Importancia biológica: Este manuscrito describe la aplicación de BioID, un enfoque de biotinilación de proximidad, a las proteínas asociadas a la cromatina, a saber, las histonas centrales y los miembros del complejo mediador. Observamos que BioID tuvo éxito en la identificación de socios de interacción conocidos para los cebos probados, pero también permitió identificar nuevos socios de interacción putativos. Al realizar una comparación detallada de BioID versus un método estándar para el mapeo del interactoma (purificación por afinidad acoplada a espectrometría de masas, AP-MS), mostramos que los enfoques eran complementarios, lo que permite la purificación de diferentes socios de interacción. Estos compañeros de interacción eran diferentes en los procesos biológicos con los que están asociados, pero también en su abundancia. BioID representa un desarrollo técnico significativo en el campo de la investigación de la cromatina al expandir el espacio de búsqueda para el mapeo de interactomas más allá de lo que es posible con AP-MS. Este artículo es parte de un número especial titulado: Dinámica de las proteínas en la salud y la enfermedad. Editores invitados: Pierre Thibault y Anne-Claude Gingras.

Palabras clave: Purificación por afinidad acoplada a espectrometría de masas Cromatina BioID Interacciones proteína-proteína Biología de sistemas de biotinilación de proximidad.


12 proteínas

Al final de esta sección, podrá hacer lo siguiente:

  • Describir las funciones que realizan las proteínas en la célula y en los tejidos.
  • Discutir la relación entre aminoácidos y proteínas.
  • Explicar los cuatro niveles de organización de las proteínas.
  • Describir las formas en que la forma y la función de las proteínas están relacionadas.

Las proteínas son una de las moléculas orgánicas más abundantes en los sistemas vivos y tienen la gama de funciones más diversa de todas las macromoléculas. Las proteínas pueden ser estructurales, reguladoras, contráctiles o protectoras. Pueden servir en transporte, almacenamiento o membranas o pueden ser toxinas o enzimas. Cada célula de un sistema vivo puede contener miles de proteínas, cada una con una función única. Sus estructuras, al igual que sus funciones, varían mucho. Sin embargo, todos son polímeros de aminoácidos dispuestos en una secuencia lineal.

Tipos y funciones de las proteínas

Las enzimas, que producen las células vivas, son catalizadores de reacciones bioquímicas (como la digestión) y suelen ser proteínas complejas o conjugadas. Cada enzima es específica del sustrato (un reactivo que se une a una enzima) sobre el que actúa. La enzima puede ayudar en las reacciones de descomposición, reordenamiento o síntesis. A las enzimas que descomponen sus sustratos las llamamos enzimas catabólicas. Aquellas que forman moléculas más complejas a partir de sus sustratos son las enzimas anabólicas, y las enzimas que afectan la velocidad de reacción son las enzimas catalíticas. Tenga en cuenta que todas las enzimas aumentan la velocidad de reacción y, por lo tanto, son catalizadores orgánicos. Un ejemplo de enzima es la amilasa salival, que hidroliza su sustrato amilosa, un componente del almidón.

Las hormonas son moléculas de señalización química, generalmente pequeñas proteínas o esteroides, secretadas por células endocrinas que actúan para controlar o regular procesos fisiológicos específicos, incluidos el crecimiento, el desarrollo, el metabolismo y la reproducción. Por ejemplo, la insulina es una hormona proteica que ayuda a regular el nivel de glucosa en sangre. (Figura) enumera los tipos y funciones primarios de las proteínas.

Tipos de proteínas y funciones
Escribe Ejemplos de Funciones
Enzimas digestivas Amilasa, lipasa, pepsina, tripsina Ayuda en los alimentos catabolizando los nutrientes en unidades monoméricas.
Transporte Hemoglobina, albúmina Transportan sustancias en la sangre o la linfa por todo el cuerpo.
Estructural Actina, tubulina, queratina Construye diferentes estructuras, como el citoesqueleto.
Hormonas Insulina, tiroxina Coordinar diferentes sistemas corporales y actividad # 8217
Defensa Inmunoglobulinas Protege el cuerpo de patógenos extraños.
Contractible Actina, miosina Efecto contracción muscular
Almacenamiento Proteínas de almacenamiento de leguminosas, clara de huevo (albúmina) Proporcionar nutrición en el desarrollo temprano del embrión y la plántula.

Las proteínas tienen diferentes formas y pesos moleculares. Algunas proteínas tienen forma globular, mientras que otras son de naturaleza fibrosa. Por ejemplo, la hemoglobina es una proteína globular, pero el colágeno, ubicado en nuestra piel, es una proteína fibrosa. La forma de la proteína es fundamental para su función, y muchos tipos diferentes de enlaces químicos mantienen esta forma. Los cambios en la temperatura, el pH y la exposición a productos químicos pueden provocar cambios permanentes en la forma de la proteína, lo que lleva a la pérdida de función o desnaturalización. Las diferentes disposiciones de los mismos 20 tipos de aminoácidos comprenden todas las proteínas. Recientemente se descubrieron dos nuevos aminoácidos raros (selenocisteína y pirrolisina), y es posible que se agreguen nuevos descubrimientos a la lista.

Aminoácidos

Los aminoácidos son los monómeros que componen las proteínas. Cada aminoácido tiene la misma estructura fundamental, que consiste en un átomo de carbono central, o el alfa (α) carbono, unido a un grupo amino (NH2), un grupo carboxilo (COOH) y un átomo de hidrógeno. Cada aminoácido también tiene otro átomo o grupo de átomos unidos al átomo central conocido como grupo R ((Figura)).


Los científicos usan el nombre & # 8220aminoácido & # 8221 porque estos ácidos contienen tanto el grupo amino como el grupo ácido carboxílico en su estructura básica. Como mencionamos, hay 20 aminoácidos comunes presentes en las proteínas. Nueve de estos son aminoácidos esenciales en el ser humano porque el cuerpo humano no puede producirlos y los obtenemos de nuestra dieta. Para cada aminoácido, el grupo R (o cadena lateral) es diferente ((Figura)).


¿Qué categorías de aminoácidos esperaría encontrar en una proteína soluble & # 8217s en la superficie y cuáles esperaría encontrar en el interior? ¿Qué distribución de aminoácidos esperaría encontrar en una proteína incrustada en una bicapa lipídica?

La naturaleza química de la cadena lateral determina la naturaleza del aminoácido (es decir, si es ácido, básico, polar o no polar). Por ejemplo, el aminoácido glicina tiene un átomo de hidrógeno como grupo R. Los aminoácidos como la valina, la metionina y la alanina son de naturaleza no polar o hidrófoba, mientras que los aminoácidos como la serina, la treonina y la cisteína son polares y tienen cadenas laterales hidrófilas. Las cadenas laterales de lisina y arginina están cargadas positivamente y, por lo tanto, estos aminoácidos también son aminoácidos básicos. La prolina tiene un grupo R que está unido al grupo amino, formando una estructura similar a un anillo. La prolina es una excepción a la estructura estándar de aminoácidos, ya que su grupo amino no está separado de la cadena lateral ((Figura)).

Una sola letra mayúscula o una abreviatura de tres letras representa los aminoácidos. Por ejemplo, la letra V o el símbolo val de tres letras representan valina. Así como algunos ácidos grasos son esenciales para una dieta, también son necesarios algunos aminoácidos. Estos aminoácidos esenciales en humanos incluyen isoleucina, leucina y cisteína. Los aminoácidos esenciales se refieren a los necesarios para construir proteínas en el cuerpo, pero no a los que produce el cuerpo. Los aminoácidos esenciales varían de un organismo a otro.

La secuencia y el número de aminoácidos determinan en última instancia la forma, el tamaño y la función de la proteína. Un enlace covalente, o enlace peptídico, se une a cada aminoácido, que forma una reacción de deshidratación. Un grupo carboxilo de aminoácidos y # 8217s y el grupo amino de aminoácidos entrantes se combinan, liberando una molécula de agua. El enlace resultante es el enlace peptídico ((Figura)).


Los productos que forman tales enlaces son péptidos. A medida que se unen más aminoácidos a esta cadena en crecimiento, la cadena resultante es un polipéptido. Cada polipéptido tiene un grupo amino libre en un extremo. Este extremo es el N terminal, o el amino terminal, y el otro extremo tiene un grupo carboxilo libre, también el C o carboxilo terminal. Si bien los términos polipéptido y proteína a veces se usan indistintamente, un polipéptido es técnicamente un polímero de aminoácidos, mientras que el término proteína se usa para un polipéptido o polipéptidos que se han combinado, a menudo tienen grupos prostéticos no peptídicos unidos, tienen una forma distinta. y tienen una función única. Después de la síntesis de proteínas (traducción), la mayoría de las proteínas se modifican. Estos se conocen como modificaciones postraduccionales. Pueden sufrir escisión, fosforilación o pueden requerir la adición de otros grupos químicos. Solo después de estas modificaciones la proteína es completamente funcional.

Haga clic en los pasos de la síntesis de proteínas en este tutorial interactivo.

El significado evolutivo del citocromo c El citocromo c es un componente importante de la cadena de transporte de electrones, una parte de la respiración celular, y normalmente se encuentra en el orgánulo celular, la mitocondria. Esta proteína tiene un grupo protésico hemo, y el ión central hemo & # 8217s se reduce y oxida alternativamente durante la transferencia de electrones. Debido a que el papel de esta proteína esencial en la producción de energía celular es crucial, ha cambiado muy poco durante millones de años. La secuenciación de proteínas ha demostrado que existe una cantidad considerable de homología de secuencia de aminoácidos del citocromo c entre diferentes especies. En otras palabras, podemos evaluar el parentesco evolutivo midiendo las similitudes o diferencias entre las secuencias de proteínas o ADN de varias especies.

Los científicos han determinado que el citocromo c humano contiene 104 aminoácidos. Para cada molécula de citocromo c de diferentes organismos que los científicos han secuenciado hasta la fecha, 37 de estos aminoácidos aparecen en la misma posición en todas las muestras de citocromo c. Esto indica que puede haber un ancestro común. Al comparar las secuencias de proteínas humanas y de chimpancés, los científicos no encontraron una diferencia de secuencia. Cuando los investigadores compararon las secuencias de humanos y monos rhesus, la única diferencia estaba en un aminoácido. En otra comparación, la secuenciación de humano a levadura muestra una diferencia en la posición 44.

Estructura proteica

Como comentamos anteriormente, la forma de una proteína es fundamental para su función. Por ejemplo, una enzima puede unirse a un sustrato específico en un sitio activo. Si este sitio activo se altera debido a cambios locales o cambios en la estructura general de la proteína, es posible que la enzima no pueda unirse al sustrato. Para comprender cómo la proteína adquiere su forma o conformación final, necesitamos comprender los cuatro niveles de estructura de la proteína: primario, secundario, terciario y cuaternario.

Estructura primaria

La secuencia única de aminoácidos # 8217 en una cadena polipeptídica es su estructura primaria. Por ejemplo, la hormona pancreática insulina tiene dos cadenas polipeptídicas, A y B, y están unidas por enlaces disulfuro. El aminoácido N terminal de la cadena A es glicina, mientras que el aminoácido C terminal es asparagina ((Figura)). Las secuencias de aminoácidos en las cadenas A y B son exclusivas de la insulina.


El gen que codifica la proteína determina en última instancia la secuencia única de cada proteína. Un cambio en la secuencia de nucleótidos de la región codificante del gen puede llevar a agregar un aminoácido diferente a la cadena polipeptídica en crecimiento, provocando un cambio en la estructura y función de la proteína. En la anemia de células falciformes, la hemoglobina β La cadena (una pequeña porción de la cual mostramos en la (Figura)) tiene una sustitución de un solo aminoácido, lo que provoca un cambio en la estructura y función de la proteína. Específicamente, la valina en el β la cadena sustituye al aminoácido glutámico. Lo más notable a tener en cuenta es que una molécula de hemoglobina se compone de dos cadenas alfa y dos beta, cada una de las cuales consta de unos 150 aminoácidos. La molécula, por tanto, tiene unos 600 aminoácidos. La diferencia estructural entre una molécula de hemoglobina normal y una molécula de células falciformes, que disminuye drásticamente la esperanza de vida, es un solo aminoácido de los 600. Lo que es aún más notable es que tres nucleótidos codifican cada uno esos 600 aminoácidos y una sola base cambia (mutación puntual), 1 en 1800 bases causa la mutación.


Debido a este cambio de un aminoácido en la cadena, las moléculas de hemoglobina forman fibras largas que distorsionan los glóbulos rojos bicóncavos, o en forma de disco, y hacen que adopten una forma de media luna o "hoz", que obstruye los vasos sanguíneos ((Figura )). Esto puede provocar una gran cantidad de problemas de salud graves, como dificultad para respirar, mareos, dolores de cabeza y dolor abdominal para los afectados por esta enfermedad.


Estructura secundaria

El plegamiento local del polipéptido en algunas regiones da lugar a la estructura secundaria de la proteína. Los más comunes son los α-hélice y β-Estructuras de láminas plegadas ((Figura)). Ambas estructuras se mantienen en forma mediante enlaces de hidrógeno. Los enlaces de hidrógeno se forman entre el átomo de oxígeno en el grupo carbonilo en un aminoácido y otro aminoácido que está cuatro aminoácidos más adelante en la cadena.


Cada giro de una hélice alfa tiene 3,6 residuos de aminoácidos. El polipéptido y los grupos R # 8217s (los grupos variantes) sobresalen del α-cadena de hélice. En el β-hoja plegada, enlace de hidrógeno entre átomos en la cadena polipeptídica & # 8217s de la estructura principal & # 8220pleats & # 8221. Los grupos R están unidos a los carbones y se extienden por encima y por debajo de los pliegues y pliegues. Los segmentos plegados se alinean paralelos o antiparalelos entre sí, y se forman enlaces de hidrógeno entre el átomo de nitrógeno parcialmente positivo en el grupo amino y el átomo de oxígeno parcialmente negativo en la estructura del péptido y el grupo carbonilo. los α-hélice y βLas estructuras de láminas plegadas se encuentran en la mayoría de las proteínas globulares y fibrosas y desempeñan un papel estructural importante.

Estructura terciaria

La estructura tridimensional única del polipéptido # 8217 es su estructura terciaria ((Figura)). Esta estructura se debe en parte a las interacciones químicas que actúan sobre la cadena polipeptídica. Principalmente, las interacciones entre los grupos R crean la estructura terciaria tridimensional compleja de la proteína. La naturaleza de los grupos R en los aminoácidos involucrados puede contrarrestar la formación de los enlaces de hidrógeno que describimos para las estructuras secundarias estándar. Por ejemplo, los grupos R con cargas similares se repelen entre sí y aquellos con cargas diferentes se atraen entre sí (enlaces iónicos). Cuando tiene lugar el plegamiento de proteínas, los aminoácidos no polares y los grupos R hidrófobos se encuentran en el interior de la proteína, mientras que los grupos R hidrófilos se encuentran en el exterior. Los científicos también denominan interacciones hidrofóbicas a los tipos de interacción anteriores. La interacción entre las cadenas laterales de cisteína forma enlaces disulfuro en presencia de oxígeno, el único enlace covalente que se forma durante el plegamiento de proteínas.


Todas estas interacciones, débiles y fuertes, determinan la forma tridimensional final de la proteína. Cuando una proteína pierde su forma tridimensional, es posible que ya no sea funcional.

Estructura cuaternaria

En la naturaleza, algunas proteínas se forman a partir de varios polipéptidos o subunidades, y la interacción de estas subunidades forma la estructura cuaternaria. Las interacciones débiles entre las subunidades ayudan a estabilizar la estructura general. Por ejemplo, la insulina (una proteína globular) tiene una combinación de enlaces de hidrógeno y disulfuro que hacen que se aglutine en su mayoría en forma de bola. La insulina comienza como un único polipéptido y pierde algunas secuencias internas en presencia de una modificación postraduccional después de formar los enlaces disulfuro que mantienen unidas las cadenas restantes. La seda (una proteína fibrosa), sin embargo, tiene β-estructura de hoja plegada que es el resultado del enlace de hidrógeno entre diferentes cadenas.

(Figura) ilustra los cuatro niveles de estructura proteica (primaria, secundaria, terciaria y cuaternaria).


Desnaturalización y plegamiento de proteínas

Cada proteína tiene su propia secuencia y forma únicas que las interacciones químicas mantienen unidas. Si la proteína está sujeta a cambios de temperatura, pH o exposición a sustancias químicas, la estructura de la proteína puede cambiar y perder su forma sin perder su secuencia primaria en lo que los científicos llaman desnaturalización.La desnaturalización es a menudo reversible porque la estructura primaria del polipéptido se conserva en el proceso si se elimina el agente desnaturalizante, lo que permite que la proteína reanude su función. A veces, la desnaturalización es irreversible y conduce a la pérdida de función. Un ejemplo de desnaturalización irreversible de proteínas es freír un huevo. La proteína de albúmina en la clara de huevo líquida se desnaturaliza cuando se coloca en una sartén caliente. No todas las proteínas se desnaturalizan a altas temperaturas. Por ejemplo, las bacterias que sobreviven en aguas termales tienen proteínas que funcionan a temperaturas cercanas al punto de ebullición. El estómago también es muy ácido, tiene un pH bajo y desnaturaliza las proteínas como parte del proceso de digestión, sin embargo, las enzimas digestivas del estómago retienen su actividad en estas condiciones.

El plegamiento de proteínas es fundamental para su función. Los científicos pensaron originalmente que las proteínas mismas eran responsables del proceso de plegado. Solo recientemente, los investigadores descubrieron que a menudo reciben ayuda en el proceso de plegado de los auxiliares de proteínas o chaperonas (o chaperoninas) que se asocian con la proteína objetivo durante el proceso de plegado. Actúan previniendo la agregación de polipéptidos que comprenden la estructura completa de la proteína y se disocian de la proteína una vez que se pliega la proteína diana.

Para obtener una perspectiva adicional sobre las proteínas, vea esta animación llamada "Biomoléculas: las proteínas".

Resumen de la sección

Las proteínas son una clase de macromoléculas que realizan una amplia gama de funciones para la célula. Ayudan en el metabolismo actuando como enzimas, portadores u hormonas y brindan apoyo estructural. Los componentes básicos de las proteínas (monómeros) son los aminoácidos. Cada aminoácido tiene un carbono central que se une a un grupo amino, un grupo carboxilo, un átomo de hidrógeno y un grupo R o cadena lateral. Hay 20 aminoácidos que ocurren comúnmente, cada uno de los cuales difiere en el grupo R. Un enlace peptídico une cada aminoácido a sus vecinos. Una cadena de aminoácidos larga es un polipéptido.

Las proteínas se organizan en cuatro niveles: primario, secundario, terciario y (opcional) cuaternario. La estructura primaria son los aminoácidos y la secuencia única # 8217. El polipéptido & # 8217s plegamiento local para formar estructuras como el α-hélice y β-La hoja plegada constituye la estructura secundaria. La estructura tridimensional general es la estructura terciaria. Cuando dos o más polipéptidos se combinan para formar la estructura proteica completa, la configuración es la estructura cuaternaria de la proteína. La forma y función de las proteínas están íntimamente ligadas. Cualquier cambio de forma causado por cambios de temperatura o pH puede provocar la desnaturalización de las proteínas y una pérdida de función.

Preguntas de conexión visual

(Figura) ¿Qué categorías de aminoácidos esperaría encontrar en la superficie de una proteína soluble y cuáles esperaría encontrar en el interior? ¿Qué distribución de aminoácidos esperaría encontrar en una proteína incrustada en una bicapa lipídica?


Un complejo proteico impactante

Se ha descubierto que las proteínas de choque térmico forman parte de un gran complejo proteico, llamado epichaperoma, que mejora la supervivencia de algunas células cancerosas. Este complejo podría ofrecer un nuevo objetivo para el tratamiento del cáncer. Ver carta p. 397

Las células tumorales están sujetas a diversas formas de estrés, como la escasez de oxígeno o nutrientes, cuando la formación de vasos sanguíneos del tumor no puede seguir el ritmo del crecimiento del tumor y, por lo tanto, las células deben tener estrategias efectivas de supervivencia al estrés. Las proteínas de choque térmico (HSP) suelen estar activas en las células expuestas a condiciones estresantes. En la página 397, Rodina et al. He investigado el papel de las HSP en el cáncer humano y he descubierto que las proteínas existen en un gran complejo en algunas células cancerosas.

El mantenimiento de la estructura 3D correcta de una proteína es esencial para su función, y las células tienen mecanismos dedicados al control de la calidad de las proteínas. Las proteínas con defectos estructurales se vuelven a doblar en la conformación correcta o, en el caso de una anomalía estructural grave, se dirigen a la degradación. El control de la calidad de las proteínas está regulado por las proteínas acompañantes, que a menudo participan en la facilitación del plegamiento. Las acompañantes incluyen HSP, que son activas en las células humanas tanto en condiciones normales como en condiciones estresantes como la inflamación y un estado de oxígeno reducido conocido como hipoxia.

Rodina y sus colegas investigaron las HSP en células cancerosas humanas mediante una técnica bioquímica que separa proteínas en muestras de proteínas celulares. Los autores encontraron que, en muestras de lo que ellos llaman células cancerosas "tipo 2", la proteína de choque térmico HSP90 se separó como se esperaba sobre la base de su estructura. Sin embargo, en otras muestras analizadas, HSP90 tuvo un patrón de separación inesperado que podría explicarse por su presencia en un gran complejo con otras HSP. Los autores utilizan el término células cancerosas "tipo 1" para describir las células que contienen este gran complejo proteico (Fig. 1).

Rodina et al. 1 he encontrado que, en ciertas células cancerosas (que los autores llaman células tipo 2), proteínas de choque térmico como HSP90 y otras proteínas asociadas con la respuesta al estrés celular, como las chaperonas, están presentes como proteínas solitarias o en pequeños complejos. . Sin embargo, otras células cancerosas (denominadas células tipo 1) muestran la formación de un gran complejo de proteínas llamado epichaperoma, que contiene HSP90 y otras proteínas, incluidas las chaperonas. El aumento de los niveles de proteína MYC en las células de tipo 2 indujo la formación del epichaperoma. Cuando las células de tipo 1 se trataron con el inhibidor de HSP90 PU-H71 in vitro, el epichaperoma se desintegró y las células murieron. Por tanto, el epichaperoma podría representar un objetivo para el tratamiento del cáncer.

Los investigadores encontraron que, en las células cancerosas tipo 1, HSP90 se asoció con docenas de otras proteínas, incluidas las proteínas de andamiaje y adaptador, que también participan en la regulación del plegamiento de proteínas. Los autores llamaron a esta estructura el epichaperome. Por el contrario, en las células cancerosas tipo 2 y las células no cancerosas, HSP90 se asoció con solo un pequeño conjunto de proteínas, y la mayoría de las HSP existían como proteínas solitarias o estaban ensambladas en pequeños complejos.

HSP90 requiere el nucleótido ATP esencial para funcionar. Por lo tanto, los autores apuntaron al epichaperoma utilizando la molécula PU-H71, que se une al bolsillo de unión de ATP de HSP90 e inhibe la función de la proteína. El inhibidor se unió más fuertemente cuando HSP90 estaba en el epichaperoma y mató más células cancerosas tipo 1 que las células tipo 2 o no cancerosas. Esta diferencia no se atribuyó únicamente a la inactivación química de HSP90, porque los autores encontraron que la regulación a la baja genética selectiva de otras HSP resultó en un aumento de la muerte de las células de tipo 1 en comparación con las de tipo 2, lo que sugiere que la supervivencia de las células de tipo 1 depende de un epicaperoma intacto.

Mediante técnicas de análisis de complejos de proteínas y tratamiento con PU-H71, Rodina y sus colegas investigaron el epichaperoma en diferentes tipos de células cancerosas. El epichaperoma se detectó en el 60-70% de las líneas celulares de mama, páncreas, pulmón, leucemia y otros cánceres, lo que indica la posible relevancia clínica de este complejo proteico como diana terapéutica. Sorprendentemente, el epichaperoma no se limitó a un subconjunto particular de cáncer caracterizado por la expresión de genes o proteínas específicos. Las células de tipo 1 también tenían niveles altos de la proteína MYC asociada al cáncer. Cuando MYC se reguló negativamente, el epichaperoma desapareció, mientras que la sobreexpresión de MYC en las células de tipo 2 indujo la formación del epichaperoma. Por tanto, MYC es un importante regulador del ensamblaje del epichaperoma.

Los tratamientos para el cáncer requieren un objetivo que esté presente en la mayoría de las células cancerosas pero ausente en las células normales. El hallazgo de Rodina y sus colegas de que las células cancerosas tipo 1 contienen HSP90 en el epichaperoma, pero que las células normales tienen HSP90 principalmente en una forma no compleja, sugiere que el epichaperoma podría ser un objetivo clínico.

A pesar de los alentadores resultados, los autores encontraron diferencias considerables en la dependencia de la formación del epichaperoma, tanto entre tipos de tumores como entre células tumorales del mismo tipo (por ejemplo, cáncer de mama), lo que podría permitir la aparición de variantes resistentes al tratamiento. Además, en muchos cánceres, como el de mama, la migración metastásica de las células cancerosas a otras ubicaciones del cuerpo es la principal causa de muerte, y las células metastásicas pueden diferir de los tumores primarios iniciales. Queda por determinar hasta qué punto las células metastásicas dependen de la formación del epichaperoma y cómo podrían responder dichas células a los fármacos que se dirigen al complejo.

Sin embargo, la obtención de tejido metastásico de un paciente mediante biopsia con aguja es un problema debido a la naturaleza invasiva del procedimiento y algunas lesiones (por ejemplo, en el pulmón, el hueso y el cerebro) son de difícil acceso. La "biopsia líquida" de las células tumorales circulantes en la sangre periférica podría ser una estrategia alternativa viable para evaluar el epichaperoma en las células metastásicas. El análisis de las células tumorales circulantes o las células tumorales que han migrado a la médula ósea en personas en las primeras etapas del cáncer también podría proporcionar información sobre los posibles precursores de las metástasis 2,3.

Los hallazgos de Rodina y sus colegas podrían tener implicaciones más amplias. Muchos programas celulares consisten en vías de señalización que dependen de una gran cantidad de proteínas, y estas pueden formar complejos estables de manera similar a como se forma el epichaperoma. Por ejemplo, la maquinaria chaperona en un orgánulo celular llamado retículo endoplásmico puede formar grandes complejos de proteínas 4, y la actividad de las chaperonas del retículo endoplásmico en condiciones de estrés celular afecta fuertemente la supervivencia de las células cancerosas 5. Además, los receptores ErbB asociados al cáncer podrían ensamblarse en complejos de receptores de orden superior 6. Por lo tanto, el descubrimiento de otros complejos proteicos grandes y específicos del cáncer podría abrir nuevas vías de investigación para comprender la biología del cáncer, con posibles implicaciones para el diseño de nuevas estrategias para la terapia del cáncer. Nota al pie 1


3.7: Proteínas, genes y evolución: ¿cuántas proteínas somos?

  • Contribución de Gerald Bergtrom
  • Profesor emérito (biociencias) en la Universidad de Wisconsin-Milwaukee

Si la evolución no tuviera que seleccionar proteínas totalmente nuevas para cada nueva función celular, ¿cuántos genes se necesitan para crear un organismo? La cantidad de genes en un organismo que codifican proteínas puede ser mucho menor que la cantidad de proteínas que realmente produce. Las estimaciones actuales sugieren que solo se necesitan 25,000 genes para producir y operar un ser humano y todas sus proteínas (consulte Pertea y Salzberg en Estimando el número de genes en el genoma humano). Sin embargo, nuestras células (y las de los eucariotas en general) pueden expresar hasta 100.000 proteínas diferentes. ¿Cómo es esto posible? ¿Hay formas más eficientes de desarrollar nuevas y útiles tareas celulares que la evolución de nuevos genes?


Kurzweil Seguimiento de la aceleración de la inteligencia.

Circuitos mineros de islas genómicas: la arquitectura de una puerta AND. Las interacciones proteína-proteína y proteína-ADN que pueden provocar diafonía entre puertas se muestran como rectángulos rojos. (Crédito: Tae Seok Moon et al./Naturaleza)

Christopher Voigt, profesor asociado de ingeniería biológica en el MIT, y sus estudiantes han desarrollado componentes de circuitos que no interfieren entre sí, lo que les permite producir el circuito sintético más complejo jamás construido.

El circuito integra cuatro sensores para diferentes moléculas. Dichos circuitos podrían usarse en células para monitorear con precisión sus entornos y responder de manera adecuada.

Trasfondo: el gran burrito

Utilizando genes como partes intercambiables, los biólogos sintéticos diseñan circuitos celulares que pueden realizar nuevas funciones, como detectar las condiciones ambientales. Sin embargo, la complejidad que se puede lograr en tales circuitos se ha visto limitada por un cuello de botella crítico: la dificultad de ensamblar componentes genéticos que no interfieran entre sí.

A diferencia de los circuitos electrónicos en un chip de silicio, los circuitos biológicos dentro de una célula no pueden aislarse físicamente entre sí. “La celda es una especie de burrito. Tiene todo mezclado ”, dice Voigt.

Debido a que toda la maquinaria celular para leer genes y sintetizar proteínas está mezclada, los investigadores deben tener cuidado de que las proteínas que controlan una parte de su circuito sintético no obstaculicen otras partes del circuito.

La evolución dirigida reduce la diafonía

"Es increíblemente complejo unir todas estas piezas", dice Voigt, codirector del Centro de Biología Sintética del MIT. Los circuitos más grandes requerirían programas de computadora que Voigt y sus estudiantes están desarrollando ahora, lo que debería permitirles combinar cientos de circuitos de formas nuevas y útiles.

Anteriormente, Voigt diseñó bacterias que pueden responder a la luz y capturar imágenes fotográficas, y otras que pueden detectar niveles bajos de oxígeno y alta densidad celular, condiciones que se encuentran a menudo en los tumores. Sin embargo, sin importar el resultado final, la mayoría de sus proyectos, y los de otros biólogos sintéticos, utilizan un pequeño puñado de partes genéticas conocidas. “Simplemente estábamos reempaquetando los mismos circuitos una y otra vez”, dice Voigt.

Para ampliar el número de circuitos posibles, los investigadores necesitaban componentes que no interfirieran entre sí. Comenzaron estudiando la bacteria que causa la salmonela, que tiene una vía celular que controla la inyección de proteínas en las células humanas. "Es un circuito muy estrictamente regulado, que es lo que lo convierte en un buen circuito sintético", dice Voigt.

Puerta AND de 4 entradas (crédito: Tae Seok Moon et al./Nature)

La vía consta de tres componentes: un activador, un promotor y un acompañante. Un promotor es una región de ADN donde las proteínas se unen para iniciar la transcripción de un gen. Un activador es una de esas proteínas. Algunos activadores también requieren una proteína acompañante antes de que puedan unirse al ADN para iniciar la transcripción.

Los investigadores encontraron 60 versiones diferentes de esta vía en otras especies de bacterias y encontraron que la mayoría de las proteínas involucradas en cada una eran lo suficientemente diferentes como para no interferir entre sí. Sin embargo, hubo una pequeña cantidad de diafonía entre algunos de los componentes del circuito, por lo que los investigadores utilizaron un enfoque llamado evolución dirigida para reducirla. La evolución dirigida es un proceso de prueba y error que implica la mutación de un gen para crear miles de variantes similares y luego probarlas para determinar el rasgo deseado. Los mejores candidatos son mutados y examinados nuevamente, hasta que se crea el gen óptimo.

Aindrila Mukhopadhyay, científica del personal del Laboratorio Nacional Lawrence Berkeley, dice que la cantidad de resolución de problemas que hicieron los investigadores para crear cada módulo funcional es impresionante. “Mucha gente está encantada con la idea de crear circuitos genéticos complejos. Este estudio proporciona valiosos ejemplos de los tipos de optimizaciones que pueden tener que hacer para lograr tales objetivos ”, dice Mukhopadhyay, que no formó parte del equipo de investigación.

Circuitos en capas

Para diseñar circuitos sintéticos de modo que puedan combinarse en capas, sus entradas y salidas deben engranar. Con un circuito eléctrico, las entradas y salidas son siempre electricidad. Con estos circuitos biológicos, las entradas y salidas son proteínas que controlan el siguiente circuito (activadores o acompañantes).

Estos componentes podrían ser útiles para crear circuitos que puedan detectar una variedad de condiciones ambientales. "Si una célula necesita encontrar el microambiente adecuado & # 8212 glucosa, pH, temperatura y osmolaridad [concentración de soluto] & # 8212 individualmente, no son muy específicas, pero obtener las cuatro cosas realmente lo reduce", dice Voigt. .

Los investigadores ahora están aplicando este trabajo para crear un sensor que permitirá a la levadura en un fermentador industrial monitorear su propio entorno y ajustar su producción en consecuencia.


Referencias

Harrison SC: una taxonomía estructural de dominios de unión al ADN. Naturaleza. 1991, 353: 715-719. 10.1038 / 353715a0.

Luisi BF: interacción ADN-proteína a alta resolución. En interacciones estructurales ADN-proteína. Editado por Lilley DMJ. Nueva York: Oxford University Press. 1995,: 1-48.

Frishman D, Mewes H-W: análisis del genoma PEDANTic. Trends Genet. 1997, 13: 415-416. 10.1016 / S0168-9525 (97) 01224-9.

Bernstein FC, Koetzler TF, Williams GJB, Meyer EF, Brice MD, Rogers JR, Kennard O, Shimanouchi T, Tasumi M: The Protein Data Bank: un archivo de datos basado en computadora para estructuras macromoleculares. J Mol Biol. 1977, 112: 535-542.

Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE: El banco de datos de proteínas. Ácidos nucleicos Res. 2000, 28: 235-242. 10.1093 / nar / 28.1.235.

Berman HM, Olson WK, Beveridge DL, Westbrook J, Gelbin, Demeny T, Hsieh S-H, Srinivasan AR, Schneider B: la base de datos de ácidos nucleicos. Una base de datos relacional completa de estructuras tridimensionales de ácidos nucleicos. Biophys J. 1992, 63: 751-759.

Sayle RA, Milner-White EJ: RasMol - Gráficos biomoleculares para todos. Trends Biochem Sci. 1995, 20: 374-376. 10.1016 / S0968-0004 (00) 89080-5.

Orengo CA, Taylor WR: SSAP: programa de alineación secuencial de estructuras para la comparación de estructuras de proteínas. Métodos Enzymol. 1996, 266: 617-635. 10.1016 / S0076-6879 (96) 66038-8.

Needleman SB, Wunsch CD: método general aplicable a la búsqueda de similitudes en las secuencias de aminoácidos de dos proteínas. J Mol Biol. 1970, 48: 443-453.

Orengo CA, Flores TP, Taylor WR, Thornton JM: Identificación y clasificación de familias de pliegues de proteínas. Protein Eng. 1993, 6: 485-500.

Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG: La interfaz de ventanas ClustalX: estrategias flexibles para la alineación de secuencias múltiples con la ayuda de herramientas de análisis de calidad. Ácidos nucleicos Res. 1997, 24: 4876-4882. 10.1093 / nar / 25.24.4876.

Brennan RG, Matthews BW: El motivo de unión al ADN de HTH. J Biol Chem. 1989, 264: 1903-1906.

Harrison SC, Aggarwal AK: reconocimiento de ADN por proteínas con el motivo hélice-vuelta-hélice. Annu Rev Biochem. 1990, 59: 933-969. 10.1146 / annurev.bi.59.070190.004441.

Pabo CO, Sauer RT: Factores de transcripción: familias estructurales y principios de reconocimiento del ADN. Annu Rev Biochem. 1992, 61: 1053-1095. 10.1146 / annurev.bi.61.070192.005201.

Steitz TA:. Interacciones proteína-ácido nucleico. Cambridge: Prensa de la Universidad de Cambridge. 1993,: -.

Bacon D, Anderson WF: un algoritmo rápido para representar imágenes de moléculas que llenan el espacio. J Mol Graph. 1988, 6: 219-220. 10.1016 / S0263-7855 (98) 80030-1.

Kraulis PJ: MolScript: un programa para producir gráficos detallados y esquemáticos de estructuras de proteínas. J Appl Cryst. 1991, 24: 946-950. 10.1107 / S0021889891004399.

Feng J-A, Johnson RC, Dickerson RE: Hin recombinasa unida al ADN: el origen de la especificidad en las interacciones de surcos mayores y menores. Ciencias. 1994, 263: 348-355.

Suzuki M, Yagi N, Gerstein MB: reconocimiento de ADN y formación de superestructuras por proteínas de hélice-vuelta-hélice. Protein Eng. 1995, 8: 329-338.

Lim WA, Hodel A, Sauer RT, Richards FM: La estructura cristalina de una proteína mutante con empaquetamiento de núcleo hidrófobo alterado pero mejorado. Proc Natl Acad Sci USA. 1994, 91: 423-427.

Schumacher MA, Glasfeld A, Zalkin H, Brennan RG: La estructura de rayos X del complejo operador PurR-guanina-PurF revela las contribuciones de superficies electrostáticas complementarias y un enlace de hidrógeno mediado por agua a la especificidad del correpresor y la afinidad de unión. J Biol Chem. 1997, 272: 22648-22653. 10.1074 / jbc.272.36.22648.

Suzuki M, Brenner SE, Gerstein MB, Yagi N: código de reconocimiento de ADN de factores de transcripción. Protein Eng. 1995, 8: 319-328.

Lawson CL, Carey J: Unión en tándem en cristales de un complejo de medio sitio del operador represor Trp. Naturaleza. 1993, 366: 178-182. 10.1038 / 366178a0.

Luisi BF: transcripción de ADN: estándar de zinc para la economía. Naturaleza. 1992, 356: 379-380. 10.1038 / 356379a0.

Mackay JP, Crossely M: Los dedos de zinc están pegados. Trends Biochem Sci. 1998, 23: 1-4. 10.1016 / S0968-0004 (97) 01168-7.

Jacobs GH: Determinación de las posiciones de reconocimiento de bases del dedo de zinc a partir del análisis de secuencia. EMBO J. 1992, 11: 4507-4517.

Pavletich NP, Pabo CO: reconocimiento de ADN-dedo de zinc: estructura cristalina de un complejo de ADN-Zif268 a 2,1 Å. Ciencias. 1991, 252: 809-817.

Suzuki M, Gerstein MB, Yagi N: Base estereoquímica del reconocimiento de ADN por dedos de Zn. Ácidos nucleicos Res. 1994, 22: 3397-3405.

Fairall L, Schwabe JWR, Chapman L, Finch JT, Rhodes D: La estructura cristalina de un péptido de dos dedos de zinc revela una extensión de las reglas del reconocimiento del ADN del dedo de zinc. Naturaleza. 1993, 366: 483-487. 10.1038 / 366483a0.

Choo Y, Klug A: La selección de sitios de unión de ADN para dedos de zinc utilizando ADN aleatorio racional revela interacciones codificadas. Proc Natl Acad Sci USA. 1994, 91: 11168-11172.

Pavletich NP, Pabo CO: Estructura cristalina de un complejo GLI-DNA de 5 dedos: nuevas perspectivas sobre los dedos de zinc. Ciencias. 1993, 261: 1701-1707.

Freedman LP, Luisi BF: Sobre el mecanismo de unión al ADN por los receptores de hormonas nucleares: una perspectiva estructural y funcional. J Cell Biochem. 1993, 51: 140-150.

Schwabe JW, Chapman L, Finch JT, Rhodes D: La estructura cristalina del dominio de unión al ADN del receptor de estrógeno unido al ADN: cómo los receptores discriminan entre sus elementos de respuesta. Celda. 1993, 75: 567-578. 10.1016 / 0092-8674 (93) 90390-C.

Cho Y, Gorina S, Jeffrey PD, Pavletich NP: Estructura cristalina de un complejo supresor-ADN tumoral p53: comprensión de las mutaciones tumorgénicas. Ciencias. 1994, 265: 346-355.

Marmorstein R, Carey M, Ptashne M, Harrison SC: reconocimiento de ADN por GAL4: estructura de un complejo proteína-ADN. Naturaleza. 1992, 356: 408-414. 10.1038 / 356408a0.

Ellenberger TE, Brandl CJ, Struhl K, Harrison SC: La cremallera de leucina de la región básica GCN4 se une al ADN como un dímero de hélices a ininterrumpidas: estructura cristalina del complejo proteína-ADN. Celda. 1992, 71: 1223-1237.

Ferre d’Amare AR, Prendergast GC, Ziff EB, Burley SK: reconocimiento por Max de su ADN afín a través de un dominio b / HLH / Z dimérico. Naturaleza. 1993, 363: 38-45. 10.1038 / 363038a0.

Phillips SEV: Construido por asociación: estructura y función de proteínas de unión a ADN de hélice-bucle-hélice. Estructura. 1994, 2: 1-4.

Rupert PB, Daughdrill GW, Bowerman B, Matthews BW: un nuevo motivo de unión a ADN en el complejo de ADN-dominio de unión de Skn-1. Nat Struct Biol. 1998, 5: 484-491.

Tan S, Richmond TJ: Estructura cristalina del complejo ternario de levadura Mata2 / MCM1 / ADN. Naturaleza. 1998, 391: 660-666. 10.1038 / 35563.

Hegde RS, Grossman SR, Laimins, Sigler PB: Estructura cristalina en 1,7 Å del dominio de unión al ADN del papilomavirus-1 E2 bovino unido a su ADN diana. Naturaleza. 1992, 359: 505-512. 10.1038 / 359505a0.

Bochkarev A, Bochkareva E, Edwards AM, Frappier L: la estructura de 2,2Å de un sitio de ADN sensible al permanganato unido por la proteína de unión al origen del virus de Epstein-Barr, Ebna 1. J Mol Biol. 1998, 284: 1273-1278. 10.1006 / jmbi.1998.2247.

Luger K, Mader AW, Richmod RK, Sargent DF, Richmod TJ: Estructura cristalina de la partícula del núcleo del nucleosoma a una resolución de 2,8 Å. Naturaleza. 1997, 389: 251-260. 10.1038 / 38444.

Murphy FV, Sweet RM, Churchill MEA: La estructura de un complejo de ADN-proteína de grupo de alta movilidad cromosómico revela mecanismos de secuencia neutra importantes para el reconocimiento de ADN no específico de secuencia. EMBO J. 1999, 18: 6610-6618. 10.1093 / emboj / 18.23.6610.

Guo F, Gopaul DN, van Dyke GD: Estructura de la recombinasa Cre complejada con ADN en una sinapsis de recombinación específica del sitio. Naturaleza . 1997, 389: 40-46. 10.1038 / 37925.

Kim Y, Geiger JH, Hahn S, Sigler PB: Estructura cristalina del complejo TBP / TATA-box de levadura. Naturaleza. 1993, 365: 512-520. 10.1038 / 365512a0.

Burley SK: la proteína de unión a la caja TATA. Curr Opin Struct Biol. 1996, 6: 69-75. 10.1016 / S0959-440X (96) 80097-2.

Somers WS, Phillips SEV: La estructura cristalina del complejo represor-operador de Met a una resolución de 2,8 Å revela el reconocimiento del ADN por las cadenas beta. Naturaleza. 1992, 359: 387-391. 10.1038 / 359387a0.

Raumann BE, Rould MA, Pabo CO, Sauer RT: reconocimiento de ADN por láminas ß en la estructura cristalina del represor-operador del arco. Naturaleza. 1994, 367: 754-757. 10.1038 / 367754a0.

Kamada K, Horiuchi T, Ohsumi K, Shimamoto N, Morikawa K: Estructura de una proteína terminadora de replicación complejada con ADN. Naturaleza. 1996, 383: 598-603. 10.1038 / 383598a0.

Muller CW, Herrmann BG: Estructura cristalográfica del complejo dominio T-ADN del factor de transcripción Brachyury. Naturaleza . 1997, 389: 884-888. 10.1038 / 39929.

Rice PA, Yang S-W, Mizuchi K, Nash HA: Estructura cristalina de un complejo IHF-ADN: un giro en U de ADN inducido por proteínas. Celda. 1996, 87: 1295-1306. 10.1016 / S0092-8674 (00) 81824-3.

Robinson H, Gao YG, McCrary BS, Edmondson SP, Shriver JW, Wang AHJ: La proteína cromosómica hipertermófila Sac7D retuerce bruscamente el ADN. Naturaleza. 1998, 392: 202-205. 10.1038 / 32455.

Ghosh G, Van Duyne G, Ghosh S, Sigler PB: Estructura del homodímero NF - kappa B p50 unido a un sitio kappa B. Naturaleza. 1995, 373: 303-310. 10.1038 / 373303a0.

Chen X, Vinkemeier U, Zhao Y, Jeruzalmi D, Darnell JE, Kuriyan J: Estructura cristalina de un dímero STAT-1 fosforilado en tirosina unido al ADN. Celda. 1998, 93: 827-839. 10.1016 / S0092-8674 (00) 81443-9.

Jones S, van Heyningen P, Berman HM, Thornton JM: Interacciones proteína-ADN: un análisis estructural. J Mol Biol. 1999, 287: 877-896. 10.1006 / jmbi.1999.2659.

Aggarwal AK: Estructura y función de las endonucleasas de restricción. Curr Opin Struct Biol. 1995, 5: 11-19. 10.1016 / 0959-440X (95) 80004-K.

Attwood TK, Croning MDR, Flower DR, Lewis AP, Mabey JE, Scordis P, Selley J, Wright W: PRINTS-S: la base de datos anteriormente conocida como PRINTS. Ácidos nucleicos Res. 2000, 28: 225-227. 10.1093 / nar / 28.1.225.

Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM: PDBsum: una base de datos basada en la web de resúmenes y análisis de todas las estructuras de PDB. Trends Biochem Sci. 1997, 22: 488-490. 10.1016 / S0968-0004 (97) 01140-7.

Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM: CATH: una clasificación jerárquica de estructuras de dominio de proteínas. Estructura. . 1997, 5: 1093-1108.

Laskowski RA, MacArthur MW, Moss DS, Thornton JM: PROCHECK: un programa para comprobar la calidad estereoquímica de las estructuras de las proteínas. J Appl Crystallogr. 1993, 26: 283-291. 10.1107 / S0021889892009944.

Hutchinson EG, Thornton JM: PROMOTIF: un programa para identificar y analizar motivos estructurales en proteínas. Protein Sci. 1996, 5: 212-220.

Murzin AG, Brenner SE, Hubbard T, Chothia C: SCOP: una base de datos de clasificación estructural de proteínas para la investigación de secuencias y estructuras. J Mol Biol. 1995, 247: 536-540. 10.1006 / jmbi.1995.0159.

Vriend G: ¿Y SI ?: un programa de diseño de fármacos de modelado molecular. J Mol Graph. 1990, 8: 52-56. 10.1016 / 0263-7855 (90) 80070-V.

Holm L, Sander C: Mapeo del universo de las proteínas. Ciencias . 1996, 273: 595-602.

Beamer LJ, Pabo CO: Estructura cristalina refinada de 1.8Å del complejo represor-operador lambda. J Mol Biol. 1992, 227: 177-196.

Schumacher MA, Choi KY, Zalkin H, Brennan RG: Estructura cristalina del miembro de la familia LacI, Purr, unido al ADN: unión de surco menor por hélices alfa. Ciencias. 1994, 266: 763-770.

Kercher MA, Lu P, Lewis M: Complejo represor-operador Lac. Curr Opin Struct Biol. 1997, 7: 76-85. 10.1016 / S0959-440X (97) 80010-3.

Pace HC, Kercher MA, Lu P, Markiewicz P, Miller JH, Chang G, Lewis M: Mapa genético del represor Lac en el espacio real. Trends Biochem Sci. 1997, 22: 334-339. 10.1016 / S0968-0004 (97) 01104-3.

Wah DA, Hirsch JA, Dorner LF, Schildkraut I, Aggarwal AK: Estructura de la endonucleasa multimodular FokI unida al ADN. Naturaleza. 1997, 388: 97-100. 10.1038 / 40446.

Yang W, Steitz TA: Estructura cristalina de la recombinasa gamma-delta resolvasa específica de sitio complejada con un sitio de escisión de 34 pb. Celda. 1995, 82: 193-207. 10.1016 / 0092-8674 (95) 90307-0.

Konig P, Giraldo R, Chapman L, Rhodes D: La estructura cristalina del dominio de unión al ADN de la levadura RAP1 en un complejo con ADN telomérico. Celda. 1996, 85: 125-136. 10.1016 / S0092-8674 (00) 81088-0.

Xu W, Rould MA, Jun S, Desplan C, Pabo CO: La estructura cristalina de un complejo de ADN de dominio emparejado a una resolución de 2.5Å revela la base estructural de las mutaciones del desarrollo de Pax. Celda. 1995, 80: 639-650. 10.1016 / 0092-8674 (95) 90518-9.

Van Pouderoyen G, Ketting RF, Perrakis A, Plasterk RHA, Sixma TK: Estructura cristalina del dominio de unión al ADN específico de la transposasa Tc3 de C. elegans en complejo con ADN de transposón. EMBO J. 1997, 16: 6044-6054. 10.1093 / emboj / 16.19.6044.

Schultz SC, Shields GC, Steitz TA: Estructura cristalina de un complejo CAP-ADN: el ADN se dobla 90 grados. Ciencias. 1991, 253: 1001-1007.

Suzuki GE, Gerstein M: Geometría de unión de hélices alfa que reconocen el ADN. Proteínas 1995, 23: 525-535.

Branden C, Tooze J:. Introducción a la estructura de las proteínas. Nueva York Garland Publishing. 1991

Choo Y, Klug A: Hacia un código para las interacciones de los dedos de zinc con el ADN: selección de dedos aleatorizados mostrados en fagos. Proc Natl Acad Sci USA. 1994, 91: 11163-11167.

Alber T: Estructura de la cremallera de leucina. Curr Opin Genet Dev. 1992, 2: 205-10.

Rice PA: Hacer que el ADN haga un cambio de sentido: IHF y proteínas relacionadas. Curr Opin Struct Biol. 1997, 7: 86-93. 10.1016 / S0959-440X (97) 80011-5.

Chytil M, Verdine GL: La familia Rel de factores de transcripción eucariotas. Curr Opin Struct Biol. 1996, 6: 91-100. 10.1016 / S0959-440X (96) 80100-X.

Klimasauskas S, Kumar S, Roberts RJ, Cheng X: JajaLa metiltransferasa saca su base objetivo de la hélice de ADN. Celda . 1994, 76: 357-369. 10.1016 / 0092-8674 (94) 90342-5.

Cheng X: modificación del ADN por metiltransferasas. Curr Opin Struct Biol. 1995, 5: 4-10. 10.1016 / 0959-440X (95) 80003-J.

Kostrewa D, Winkler FK: Unión de Mg 2+ al sitio activo de la endonucleasa EcoRV: un estudio cristalográfico de complejos con el sustrato y el ADN del producto a una resolución de 2Å. Bioquímica. 1995, 34: 683-696.

Cheng X, Balendiran K, Schildkraut I, Anderson JE: Estructura de la endonucleasa PvuII con ADN afín. EMBO J. 1994, 13: 3927-3935.

Kumar S, Duan Y, Kollman PA, Rosenberg JM: Las simulaciones de dinámica molecular sugieren que la torcedura Eco RI es un ejemplo de tensión molecular. J Biomol Struct Dyn. 1994, 12: 487-525.

Newman M, Strzelecka T, Dorner LF, Schildkraut I, Aggarwal AK: Estructura de la endonucleasa Bam HI unida al ADN: plegamiento y despliegue parcial en la unión del ADN. Ciencias. 1995, 269: 656-663.

Kim Y, Grable JC, Love R, Greene P, Rosenberg JM: Refinamiento de la estructura cristalina de la endonucleasa Eco RI: un trazado revisado de la cadena de proteínas. Ciencias. 1990, 249: 1307-1309.