Saltar ao contido

Proteína

Este é un dos 1000 artigos que toda Wikipedia debería ter
1000 12/16
Na Galipedia, a Wikipedia en galego.
(Redirección desde «Proteínas»)

Unha representación en 3D da estrutura da mioglobina. Esta proteína foi a primeira cuxa estrutura foi obtida mediante a cristalografía por raios X.

As proteínas (do grego πρωτεϊνη, primeiro) son unhas macromoléculas formadas por α-aminoácidos. Poden estar formadas por unha ou varias cadeas de aminoácidos. As proteínas son moléculas orgánicas esenciais na estrutura e función dos seres vivos (por exemplo, forman parte integral dos tecidos biolóxicos e moitas delas funcionan como encimas). Levan a cabo unha ampla gama de funcións nos organismos, como a catálise metabólica, replicación do ADN, resposta aos estímulos, transporte de moléculas etc. A súa función nutritiva fundamental é plástica, formadora de estruturas orgánicas. Tamén poden servir en determinados casos como fonte de enerxía, pero nunha alimentación equilibrada esta función é asumida polos carbohidratos e os lípidos.

As proteínas son substancias sólidas, incoloras, coloidais, insolubles en solventes orgánicos, unhas con algunha solubilidade en auga, e outras con algunha solubilidade en solucións acuosas diluídas de ácidos, bases ou sales. Quimicamente, son compostos cuaternarios de carbono (C), hidróxeno (H), osíxeno (O) e nitróxeno (N).

Unha cadea longa de aminoácidos denomínase polipéptido. O termo proteína dáse xeralmente cando o polipéptido ou un conxunto de varios ten unha función e conformación determinada. Porén, os termos péptido, polipéptido e proteína úsanse con frecuencia dun modo pouco específico, xa que ás veces non hai un límite claro entre eles. Nas proteínas normalmente hai 20 aminoácidos (ver aminoácido proteinoxénico), pero poden incorporar algúns máis en casos especiais. Os aminoácidos teñen grupos amino e carboxilo por medio dos que se enlazan por enlace peptídico formando a cadea polipeptídica. As proteínas difiren unhas das outras principalmente na súa secuencia de aminoácidos, que está determinada pola secuencia de nucleótidos dos seus xenes, e que xeralmente dá lugar a un pregamento tridimensional específico da proteína, que lle dá unha estrutura necesaria para a súa actividade. Cada posible combinación de tres nucleótidos (tripletes) que se suceden na secuencia dun xene codifica un determinado aminoácido, segundo as correspondencias do código xenético. En xeral, o código xenético só codifica os 20 aminoácidos proteinoxénicos normais, pero en certos organismos dito código pode codificar por un mecanismo especial a selenocisteína e, en certas arqueas a pirrolisina. Despois de rematada a síntese de proteínas ou mesmo durante a mesma, poden modificarse encimaticamente residuos de aminoácidos da proteína por modificación postraducional, o que altera as súas propiedades físicas e químicas, o pregamento, estabilidade, actividade e, finalmente, a función das proteínas. Ás veces as proteínas levan unidos grupos químicos que non son peptídicos, que se denominan grupos prostéticos ou cofactores. Distintas proteínas poden tamén funcionar en conxunto para realizaren unha determinada función, e a miúdo poden estar asociadas formando complexos proteicos estables.

As proteínas poden purificarse a partir doutros compoñentes celulares utilizando varias técnicas como a ultracentrifugación, precipitación, electroforese e cromatografía; a aparición das técnicas de enxeñaría xenética fixo posible aplicar diversos métodos que facilitan a purificación. Entre os métodos que se utilizan comunmente para estudar a estrutura e función das proteínas están a inmunohistoquímica, mutaxénese dirixida, resonancia magnética nuclear e espectrometría de masas.

Bioquímica

[editar | editar a fonte]
Artigo principal: Enlace peptídico.
Figura 2: Formas de resonancia do enlace peptídico. A forma neutra e con enlace simple (~60%) está á esquerda, e a forma cargada e con dobre enlace (~40%) está á dereita.
Estrutura química dunha cadea pept�dica.
Parte dunha cadea proteica mostrando as ligaz�ns pept�dicas.
Ribosoma sintetizando unha prote�na e usando o ARNm como molde.

O enlace pept�dico que enlaza os amino�cidos da prote�na establ�cese entre o grupo amino dun amino�cido e o grupo carboxilo do seguinte amino�cido. Nos extremos os grupos amino e carboxilo quedan libres, polo que se di que a prote�na ten un extremo amino terminal ou N-terminal (por onde por convenci�n se considera que empeza a prote�na) e un extremo carboxilo terminal ou C-terminal (por onde acaba). O enlace pept�dico ten d�as formas de resonancia (o dobre enlace pode estar no C=O ou no C=N), que lle dan certo car�cter de dobre enlace e inhiben a rotaci�n arredor do seu eixe, de modo que os carbonos alfa son coplanares. Os outros dous �ngulos diedros no enlace pept�dico determinan a forma local que adopta o esqueleto da prote�na.[1]

S�ntese

[editar | editar a fonte]

Bios�ntese

[editar | editar a fonte]

As prote�nas son compostos org�nicos de estrutura complexa e masa molecular elevada (entre 15.000 e 20.000.000 Da) e son sintetizadas polos organismos vivos nos ribosomas por medio da combinaci�n dun n�mero maior ou menor de mol�culas de amino�cidos, que se ligan por enlace pept�dico. Son, pois pol�meros formados pola uni�n de amino�cidos, que son os seus mon�meros. Poden ter centos de amino�cidos.

A secuencia de amino�cidos da prote�na est� determinada pola secuencia de nucle�tidos do xene que a codifica. O xene do ADNtranscrito a un ARNm, que madura (en eucariotas) e se dirixe aos ribosomas, �nese a eles e � traducido. A secuencia de nucle�tidos do ARNm, tomados de 3 en 3, formando cod�ns, � lida no ribosoma segundo as correspondencias do c�digo xen�tico. Neste c�digo cada cod�n determina un amino�cido.[2]. Os amino�cidos chegan ao ribosoma tra�dos por ARNts, que est�n entrando e sa�ndo do ribosoma continuamente. Os ARNts te�en unha secuencia anticod�n, complementaria dalg�n dos cod�ns. Hai ARNt espec�ficos para cada amino�cido, e uns encimas chamados aminoacil ARNt sintetases, enlazan cada amino�cido co ARNt correcto. No ribosoma os amino�cidos �nense por enlace pept�dico formando unha cadea de amino�cidos cada vez m�is longa, que permanece unida ao �ltimo ARNt que entra. O polip�ptido en crecemento denom�nase a mi�do cadea nacente. As prote�nas biosintet�zanse sempre empezando no extremo N-terminal e acabando no C-terminal.[2] O ARNm vai expo�endo sucesivamente todos os seus cod�ns no ribosoma. Cando se chega a unha secuencia de finalizaci�n do ARNm, a cadea polipept�dica lib�rase. A prote�na pr�gase e pode despois sufrir modificaci�ns postraducionais.

A taxa de s�ntese proteica en procariotas � m�is alta que en eucariotas e pode chegar a 20 amino�cidos por segundo.[3] O tama�o dunha prote�na sintetizada pode medirse poo n�mero de amino�cidos que cont�n e pola s�a masa molecular total en daltons, Da, (sin�nimo de unidade de masa at�mica), ou en kDa. Unha prote�na de l�vedo media ten uns 446 amino�cidos e uns 53 kDa.[4] A prote�na m�is longa co�ecida � a titina, que se encontra no sarc�mero muscular, cunha masa de 3.000 kDa e case 27.000 amino�cidos.[5]

S�ntese qu�mica

[editar | editar a fonte]

No laboratorio poden sintetizarse pequenas prote�nas por un conxunto de m�todos chamados s�ntese de p�ptidos, que dependen de t�cnicas de s�ntese org�nica para producir p�ptidos con alto rendemento.[6] A s�ntese qu�mica permite a introduci�n de amino�cidos non naturais nas cadeas polipept�dicas, como a uni�n de sondas flourescentes �s cadeas laterais de amino�cidos.[7] Estes m�todos son �tiles en bioqu�mica e biolox�a celular de investigaci�n, a�nda que xeralmente non para aplicaci�ns comerciais. A s�ntese qu�mica � ineficiente para producir polip�ptidos de m�is duns 300 amino�cidos, e as prote�nas sintetizadas poden non adoptar doadamente a s�a estrutura terciaria nativa. Os m�todos en s�ntese qu�mica avanzan dende o extremo C-terminal ao N-terminal, ao rev�s ca a s�ntese biol�xica nos ribosomas[8], se son en fase s�lida, mais os feitos en disoluci�n avanzan no mesmo sentido que o biol�xico.

Clasificaci�n

[editar | editar a fonte]

Composici�n

[editar | editar a fonte]

Canto � estrutura molecular, as prote�nas clasif�canse en:

Prote�nas fibrosas e globulares

[editar | editar a fonte]
  • Prote�nas fibrosas:

Son aquelas que presentan mol�culas distendidas e filamentosas, semellantes a longos f�os. col�xeno e fibrina son exemplos de prote�nas fibrosas. Son raras.

  • Prote�nas globulares:

Presentan as mol�culas enroladas como novelos, e son sol�beis na auga formando micelas. A maior�a das prote�nas presentan estrutura globular, como, por exemplo, os encimas, anticorpos, hemoglobina, prote�nas asociadas � clorofila e prote�nas estruturais.

Estrutura tridimensional

[editar | editar a fonte]
Artigo principal: Estrutura das prote�nas.
Estruturas tridimensionais das prote�nas
Superficie molecular de varias prote�nas a tama�o comparativo. De esquerda a dereita son: inmunoglobulina G (IgG, un anticorpo), hemoglobina, insulina (unha hormona), adenilato quinase (un encima) e glutamina sintetase (un encima).

As prote�nas presentan catro niveis de estudo ou de estrutura que dependen da configuraci�n espacial da cadea polipept�dica, do tama�o da cadea, e do tipo de amino�cidos que pos�e. As estruturas b�sicas son:

  • Estrutura primaria:

A estrutura primaria � a secuencia linear de amino�cidos unidos por enlaces pept�dicos. Dita estrutura v�n predeterminada polo secuencia do �cido nucleico que a codifica.

  • Estrutura secundaria:

Constitu�da por unha cadea de amino�cidos na que se estabelecen ligaz�ns por pontes de hidr�xeno entre os amino�cidos distantes da cadea. Estas ligaz�ns conf�renlle a forma en h�lice alfa, folla pregada beta. Esta estrutura depende, entre outros factores, do medio onde a prote�na se prega.

  • Estrutura terciaria:

Resulta do enrolamento da h�lice ou da folla pregada, e � mantido por pontes de hidr�xeno e disulfuro entre amino�cidos da mesma cadea. Esta estrutura confire a actividade biol�xica �s prote�nas. Pode ser globular ou filamentosa.

  • Estrutura cuaternaria:

Resulta da asociaci�n de varias subunidades pept�dicas con estrutura terciaria; estas permanecen unidas xeralmente a trav�s de ligaz�ns covalentes coma pontes disulfuro entre ciste�nas.

As prote�nas non son mol�culas totalmente r�xidas. Ademais de teren os seus niveis estruturais caracter�sticos, as prote�nas poden cambiar entre varias estruturas relacionadas mentres realizan as s�as funci�ns. No contexto desde rearranxos funcionais, estas estruturas terciarias e cuatrernarias son normalmente denominadas "conformaci�ns", e as transici�ns entre elas ch�manse cambios conformacionais. Tales cambios est�n a mi�do inducidos pola uni�n de mol�culas substrato ao sitio activo dun encima, ou � rexi�n f�sica da prote�na que participa na cat�lise qu�mica. En prote�nas en disoluci�n tam�n sofren a variaci�n na estrutura por vibraci�n t�rmica e a colisi�n con outras mol�culas.[10]

As prote�nas poden dividirse informalmente en tres clases principais, que se correlacionan con estruturas terciarias t�picas: prote�nas globulares, fibrosas e de membrana.[11]

Determinaci�n da estrutura

[editar | editar a fonte]

O descubrimento de cal � a estrutura terciaria dunha prote�na ou a cuaternaria dun complexo proteico pode proporcionar importantes indicios sobre como realiza a prote�na a s�a funci�n. Os m�todos experimentais m�is com�ns para a determinaci�n da estrutura son a cristalograf�a de raios X e a espectroscop�a de resonancia magn�tica nuclear (NMR), as cales poden fornecer informaci�n a resoluci�n at�mica. Por�n, os experimentos de NMR poden proporcionar informaci�n a partir da cal pode estimarse un conxunto de distancias entre pares de �tomos, e as posibles conformaci�ns finais dunha prote�na determ�nanse resolvendo a distancia xeom�trica problema. A interferometr�a de polarizaci�n dual � un m�todo anal�tico cuantitativo para medir a conformaci�n da prote�na total e os cambios conformacionais debidos a interacci�ns ou outros est�mulos. O dicro�smo circular � outra t�cnica de laboratorio para determinar a composici�n en folla beta ou helicoidal interna das prote�nas. A microscopia crioelectr�nica util�zase para producir informaci�n estrutural de baixa resoluci�n sobre complexos proteicos moi grandes, inclu�dos virus ensamblados;[12] unha variante co�ecida como cristalograf�a electr�nica pode tam�n producir informaci�n de alta resoluci�n nalg�ns casos, especialmente para cristais bidimensionais de prote�nas de membrana.[13]

As estruturas resoltas almac�nanse xeralmente en Protein Data Bank (PDB), unha fonte de acceso libre da que se poden obter datos de miles de prote�nas en forma de coordenadas cartesianas para cada �tomo da prote�na.[14] Co��cense moitas m�is secuencias que estruturas de prote�nas. Ademais, o conxunto de estruturas xa resoltas � predominantemente o de prote�nas que poden ser sometidas facilmente �s condici�ns requiridas na cristalograf�a de raios X, que � un dos principais m�todos de determinaci�n estrutural. En especial, as prote�nas globulares son comparativamente m�is doadas de cristalizar en preparaci�ns de cristalograf�a de raios X. As prote�nas de membrana, polo contrario, son dif�ciles de cristalizar e est�n subrepresentadas na PDB.[15] As iniciativas baseadas na xen�mica estrutural intentaron remediar estas deficiencias resolvendo sistematicamente estruturas representativas dos principais tipos de pregamento. Os m�todos de predici�n de estruturas das prote�nas tratan de proporcionar m�todos de xerar unha estrutura plausible de prote�nas cuxas estruturas non foron a�nda determinadas experimentalmente.[16]

Desnaturalizaci�n e renaturalizaci�n

[editar | editar a fonte]

As prote�nas poden desnaturalizar. Isto acontece cando, por acci�n de substancias qu�micas ou da calor as prote�nas sofren alteraci�n da estrutura terciaria ou a quebra das ligaz�ns non covalentes da estrutura cuaternaria.

As prote�nas perden a s�a conformaci�n e, consecuentemente, a s�a funcionalidade. A desnaturalizaci�n pode ser revers�bel ou irrevers�bel.

Dependendo da forma pola cal a prote�na foi desnaturalizada, a s�a conformaci�n nativa p�dese recuperar (renaturalizaci�n) retir�ndose lentamente o axente desnaturalizante, como por exemplo facer unha di�lise contra auga para retirar o axente desnaturalizante urea.

Funci�n biol�xica

[editar | editar a fonte]

As prote�nas son as principais mol�culas da c�lula, que levan a cabo as instruci�ns especificadas na informaci�n xen�tica.[4] Coa excepci�n de certos tipos de ARN, a maior�a das demais mol�culas biol�xicas son elementos relativamente inertes sobre as cales act�an as prote�nas. As prote�nas supo�en a metade do peso seco dunha c�lula de Escherichia coli, mentres que outras macromol�culas como o ADN e ARN supo�en s� o 3% e 20%, respectivamente.[17] O conxunto de prote�nas expresadas nunha determinada c�lula ou tipo celular denom�nase proteoma.

Igual que outras macromol�culas biol�xicas como os polisac�ridos e �cidos nucleicos, as prote�nas son partes esenciais do organismo e participan virtualmente en todos os procesos celulares. Moitas prote�nas son encimas que catalizan reacci�ns bioqu�micas e son esenciais no metabolismo. As prote�nas tam�n te�en funci�ns estruturais e mec�nicas, como a actina e miosina do m�sculo e as prote�nas do citoesqueleto, o cal forma un armaz�n que mant�n a forma celular. Outras prote�nas son importantes na sinalizaci�n celular, respostas inmunes, adhesi�n celular e o ciclo celular. As prote�nas son tam�n necesarias nas dietas dos animais, xa que os animais non poden sintetizar todos os amino�cidos que necesitan e deben obter os amino�cidos esenciais da dieta. Por medio do proceso da dixesti�n, os animais degradan as prote�nas a amino�cidos libres que son despois absorbidos no intestino e utilizados no metabolismo.

As prote�nas te�en as seguintes funci�ns:

Estrutural e motil

[editar | editar a fonte]

Son aquelas que participan dos tecidos d�ndolles rixidez, consistencia e elasticidade. Son prote�nas estruturais: col�xeno ( cartilaxes), elastina, fibro�na (ara�eiras), queratina (cabelo), resilina (moi el�stica, nas �s de insectos) e outras.

Algunhas prote�nas estruturais interve�en na motilidade celular ou de todo o organismo. Algunhas delas te�en propiedades contr�ctiles e interve�en nos movementos das c�lulas musculares e outras, como � o caso da actinae miosina. Outras prote�nas que interve�en na motilidade intracelular son a cinesina e dine�na. A prote�na tubulina non � contr�ctil, pero forma os flaxelos e cilios.

Regulatoria

[editar | editar a fonte]

Algunhas hormonas (substancias que exercen algunha funci�n espec�fica sobre alg�n �rgano ou estrutura dun organismo) son de natureza proteica, como por exemplo a insulina, hormona do crecemento ou hormona paratiroide. Outras interve�en na sinalizaci�n celular como receptores de mol�culas sinalizadoras eucariotas, ou son represores de xenes bacterianos. Moitos receptores te�en un sitio de uni�n exposto na superficie da c�lula e un dominio efector dentro da c�lula, o cal pode ter unha actividade encim�tica ou poden sufrir un cambio conformacional detectado por outras prote�nas do interior da c�lula.[18]

Os anticorpos son prote�nas (inmunoglobulinas) que participan na defensa do organismo contra microorganismos e todo tipo de substancias estra�as. A afinidade de uni�n dun anticorpo pola s�a mol�cula diana � extraordinariamente alta.[19] Tam�n te�en unha funci�n defensiva impedindo a perda de sangue nas hemorraxias, como o fibrin�xeno ou a trombina. Outras son t�xicas, como a ricina, que � unha forma de defensa das plantas. No plasma de peixes ant�rticos hai prote�nas anticonxelantes que os defenden da conxelaci�n.

Enerx�tica (nutrici�n e reserva)

[editar | editar a fonte]

Obtenci�n de enerx�a a partir dos amino�cidos que compo�en as prote�nas. Esta � unha funci�n de urxencia en organismos superiores, cando a indispo�ibilidade de �cidos graxos ou monosac�ridos as� o dita. Por�n, hai algunhas prote�nas que est�n especializadas na nutrici�n e reserva enerx�tica, como a case�na do leite, a ovoalbumina do ovo ou a gliadina das sementes de trigo.

Encim�tica

[editar | editar a fonte]
Artigo principal: Encima.

Posibilitan as reacci�ns bioqu�micas, permitindo reducir a enerx�a libre de Gibbs de activaci�n e acelerando as reacci�ns. Co��cense m�is de 4000 reacci�ns catalizadas por encimas. Os encimas son xeralmente moi espec�ficos e catalizan s� unha ou unhas poucas reacci�ns qu�micas. Os encimas levan a cabo a maior parte das reacci�ns do metabolismo, interve�en na replicaci�n do ADN, reparaci�n do ADN e transcrici�n xen�tica. Alg�ns encimas act�an sobre outras prote�nas par engadir ou quitar grupos qu�micos nun proceso chamado modificaci�n postraducional.[20] O grao de aceleraci�n proporcionado pola cat�lise encim�tica � xeralmente enorme, por exemplo, incrementando a velocidade de reacci�n arredor de 1017 veces con respecto a unha reacci�n non catalizada no caso da orotato descarboxilase.[21]

As mol�culas que se unen e sobre as que act�a o encima denom�nanse substratos. O substrato entra nunha rexi�n do encima denominada centro activo, onde ten lugar a reacci�n. A�nda que o encima pode estar formado por centos de amino�cidos, s� unha pequena fracci�n dos amino�cidos interaccionan co substrato, e na cat�lise adoitan estar implicados s� tres ou catro amino�cidos.[22]

Transporte

[editar | editar a fonte]

Algunhas prote�nas transportan substancias. Por exemplo, os gases respiratorios (os�xeno e di�xido de carbono) son transportados por prote�nas como a hemoglobina e hemocianina. A hemoglobina � un exemplo de prote�na que se une con alta afinidade a unha pequena mol�cula ligando cando o ligando est� presente en altas concentraci�ns (como ocorre nos pulmóns) e que liberan o ligando cando chegan a tecidos onde hai baixas concentracións deste.[23]

As lipoproteínas transportan lípidos polo sangue. Algunhas proteínas son transportadores de membrana, que levan moléculas dun lado a outro da membrana.

Unión a outras moléculas

[editar | editar a fonte]
Modelo do encima hexoquinase. A escala, na esquina superior dereita aparecen dous dos seus substratos, ATP e glicosa.

A principal característica das proteínas que lles permiten realizar o seu diverso conxunto de funcións é a súa capacidade de unirse a outras moléculas de forma específica e firme. A rexión das moléculas proteicas responsable da unión a outras moléculas denomínase sitio de unión e é xeralmente unha depresión na superficie da molécula ou "peto". Esta capacidade de unión está mediada pola súa estrutura terciaria, a cal define o peto do sitio de unión, e polas propiedades químicas das cadeas laterais dos aminoácidos que o rodean. A unión das proteínas a outras moléculas pode ser extraordinariamente forte e específica; por exemplo, a proteína inhibidora da ribonuclease únese á anxioxenina humana cunha constante de disociación subfemtomolar (<10−15 M) pero non se pode unir a ningún dos seus homólogos de anfibios, as onconases (>1 M). Cambios qu�micos extremadamente pequenos como a adici�n dun s� grupo metilo a unha mol�cula � que se debe unir a prote�na pode �s veces ser suficiente para case eliminar a uni�n; por exemplo, a aminoacil ARNt sintetase espec�fica do amino�cido valina distingue esta do amino�cido leucina de cadea lateral moi similar.[24]

As prote�nas poden unirse a outras prote�nas ou a pequenas mol�culas substrato. Cando as prote�nas se unen especificamente a outras copias da mesma mol�cula, poden oligomerizarse para formar fibrilas; este proceso ocorre a mi�do en prote�nas estruturais que constan de mon�meros globulares que se autoensamblan para formar fibras r�xidas. As interacci�ns prote�na-prote�na tam�n regulan a actividade encim�tica, o control do progreso do ciclo celular e permiten a ensamblaxe de grandes complexos proteicos que levan a cabo moitas reacci�ns moi relacionadas cunha funci�n biol�xica com�n. As prote�nas poden tam�n unirse ou mesmo integrarse nas membranas cellares. A capacidade de unirse a outras mol�culas para inducir cambios conformacionais nas prote�nas permite a formaci�n de redes de sinalizaci�n celular de enorme complexidade.[25] As interacci�ns entre prote�nas son reversibles, e dependen fortemente da dispo�ibilidade de diferentes grupos de prote�nas �s que se asocian para formar agregados que son capaces de realizar un determinado conxunto de funci�ns. O estudo da interacci�n entre prote�nas espec�ficas � fundamental para comprender aspectos importantes das funci�ns celulares, e finalmente as propiedades que distinguen os distintos tipos celulares.[26][27]

Diagrama de fitas dun anticorpo de rato contra o c�lera que se une a un ant�xeno carbohidrato.

M�todos de estudo

[editar | editar a fonte]

As estruturas e actividades das prote�nas foron estudadas in vitro e in vivo. Os estudos in vitro de prote�nas purificadas en condici�ns controladas son �tiles para descubrir como unha prote�na leva a cabo a s�a funci�n: por exemplo, os estudos de cin�tica encim�tica exploran os mecanismos qu�micos da actividade catal�tica dun encima e a s�a afinidade relativa por varios posibles substratos. Os experimentos in vivo estudan as actividades das prote�nas dentro das c�lulas ou dentro do organismo no seu conxunto, e poden proporcionar informaci�n complementaria sobre o lugar onde act�a a prote�na e como se regula.

Purificaci�n de prote�nas

[editar | editar a fonte]

Para realizar unha an�lise in vitro dunha prote�na, esta debe ser purificada e separada doutros compo�entes celulares. Este proceso xeralmente empeza coa lise da c�lula, na cal se destr�e a membrana celular e o contido da c�lula lib�rase formando unha soluci�n chamada lisado cru. A mestura resultante pode ser purificada utilizando ultracentrifugaci�n, a cal fracciona os diversos compo�entes celulares en fracci�ns que conte�en prote�nas solubles; l�pidos de membrana e prote�nas; org�nulos celulares e �cidos nucleicos. A precipitaci�n por un m�todo baseado en utilizar altas concentraci�ns salinas pode concentrar as prote�nas do lisado. Despois �sanse varios tipos de cromatograf�a para illar a prote�na ou prote�nas que interesan base�ndose en propiedades como a masa molecular, carga neta e afinidade de uni�n.[28] O nivel de purificaci�n pode ser monitorizado usando varios tipos de electroforese en xel se se co�ecen a masa molecular da prote�na desexada e o seu punto isoel�ctrico, ou por espectroscopia se a prote�na ten caracter�sticas espectrosc�picas distinguibles, ou por ensaios de encimas se a prote�na ten unha actividade encim�tica. Ademais, as prote�nas poden ser illadas segundo a s�a carga por medio do electroenfoque.[29]

Para as prote�nas naturais, pode ser necesario seguir unha serie de pasos de purificaci�n para obter prote�nas puras dabondo para as aplicaci�ns de laboratorio. Para simplificar este proceso, a m��do util�zase a enxe�ar�a xen�tica para engadir caracter�sticas qu�micas � prote�na que a fagan m�is f�cil de purificar sen afectar � s�a estrutura ou actividade. Por exemplo, �nese unha "etiqueta" consistente nunha secuencia de amino�cidos espec�fica, como unha serie de residuos de histidina (unha "etiqueta His"), que se enlaza a un extremo da prote�na. Como resultado, cando o lisado se fai pasar por unha columna de cromatograf�a que conte�a n�quel, os residuos de histidina l�ganse ao n�quel e quedan unidos � columna (xunto con toda a prote�na) mentres que os compo�entes non etiquetados do lisado escoan sen dificultade. Ide�ronse varias etiquetas diferentes para axudar aos investigadores a purificar prote�nas espec�ficas a partir de mesturas complexas.[30]

Localizaci�n celular

[editar | editar a fonte]
Prote�nas localizadas en distintos compartimentos celulares e estruturas etiquetadas con prote�na fluorescente verde (que aqu� se ve branca).

O estudo das prote�nas in vivo trata moitas veces de co�ecer cal � a localizaci�n e lugar de s�ntese da prote�na na c�lula. A�nda que moitas prote�nas intracelulares se sintetizan no citoplasma e as prote�nas unidas a membrana ou segregadas polo ret�culo endoplasm�tico, moitas veces non est�n tan claros os detalles de como as prote�nas se destinan a org�nulos espec�ficos ou estruturas celulares. Unha t�cnica �til para estimar a localizaci�n celular utiliza a enxe�ar�a xen�tica para expresar na c�lula unha prote�na de fusi�n ou quimera formada pola prote�na natural de interese unida a un "reporteiro" como a prote�na fluorescente verde (GFP).[31] A localizaci�n na c�lula da prote�na fusionada pode ser visualizada de forma clara e eficiente por microscop�a,[32] como se ve no exemplo da figura.

Outros m�todos para dilucidar a localizaci�n celular de prote�nas require o uso de marcadores de compartimento co�ecidos para rexi�ns como o ret�culo endoplasm�tico, o aparato de Golgi, lisosomas ou vac�olos, mitocondria, cloroplastos, membrana plasm�tica etc. Co uso de versi�ns etiquetadas fluorescentemente destes marcadores ou de anticorpos para marcadores co�ecidos, f�xose m�is sinxelo identificar a localizaci�n dunha prote�na de interese. Por exemplo, a inmunofluorescencia indirecta permite a colocalizaci�nn fluorescente e a demostraci�n da localizaci�n. As tinguiduras fluorescentes util�zanse para etiquetar compartimentos celulares para un prop�sito similar.[33]

Existen outras posibilidades. Por exemplo, a inmunohistoqu�mica xeralmente utiliza un anticorpo para unha ou m�is prote�nas de interese que est�n conxugadas a encimas producindo sinais luminescentes ou cromox�nicos que poden compararse entre mostras, o que permite a localizaci�n da informaci�n. Outra t�cnica aplicable � a cofraccionaci�n en gradientes de sacarosa (ou outro material) utilizando centrifugaci�n isop�cnica.[34] A�nda que esta t�cnica non proba a colocalizaci�n dun compartimento de densidade co�ecida e a prote�na de interese, incrementa a probabilidade, e é máis axeitado para estudos a grande escala.

Finalmente, o método estándar de localización celular é a microscopía inmunoelectrónica. Esta técnica tamén usa un anticorpo para a proteína de interese, xunto coas técnicas de microscopía electrónica clásicas. A mostra prepárase para o exame por microscopía electrónica normal, e despois é tratada cun anticorpo para a proteína de interese que é conxugada a un material extremadamente electrodenso, xeralmente ouro. Isto permite a localización tanto dos detalles estruturais coma da proteína procurada.[35]

Con outra aplicación de enxeñaría xenética chamada mutaxénese dirixida a sitio, pódese alterar a secuencia da proteína e, polo tanto, a súa estrutura, localización celular e susceptibilidade á regulación. Esta técnica mesmo permite a incorporación ás proteínas de aminoácidos, utilizando ARNts modificados,[36] e pode permitir o deseño de novas proteínas con novas propiedades.[37]

Proteómica e bioinformática

[editar | editar a fonte]
Artigos principais: Proteómica e Bioinformática.

O complemento proteico completo presente nun determinado momento nunha célula ou tipo celular denomínase proteoma, e o estudo de conxuntos de datos a grande escala define o campo da proteómica, denominado así por analoxía co campo relacionado da xenómica. Técnicas experimentais fundamentais en proteómica son a electroforese en xel bidimensional,[38] que posibilita a separación dun gran número de proteínas, a espectrometría de masas,[39] que permite unha rápida identificación de alto rendemento de proteínas e a secuenciación de péptidos (xeralmente despois dunha dixestión en xel), as micromatrices de proteínas,[40] coas que se poden detectar os niveis relativos de gran número de proteínas presentes na célula, e sistema de dobre híbrido, que permite s exploración sistemática das interaccións proteína-proteína.[41] O conxunto total de todas estas interaccións bioloxicamente posibles denomínase interactoma.[42] Un intento sistemático de determinar as estruturas de proteínas que inclúa todos os posibles pregamentos coñécese como xenómica estrutural.[43]

Disponse dunha gran cantidade de datos xenómicos e proteómicos de varios organismos, entre eles o do xenoma humano, que facilitan que os investigadores identifiquen eficientemente proteínas homologas mesmo en organismos escasamente relacionados por medio de aliñamento de secuencias. As ferramentas de perfilado de secuencias poden realizar manipulacións máis específicas de secuencia como os mapas de encimas de restrición, análises de marcos abertos de lectura de secuencias de nucleótidos e predición da estrutura secundaria. A partir destes datos poden construírse árbores filoxenéticas e desenvolverse hipóteses sobre a evolución utilizando un software especial como ClustalW en relación cos antepasados dos organismos modernos e os xenes que expresan. O eido da bioinformática trata de ensamblar, anotar e analizar datos proteómicos e xenómicos, aplicando técnicas computacionais a problemas biolóxicos como a procura de xenes e a cladística.

Predición da estrutura e simulación

[editar | editar a fonte]

A predición da estrutura das proteínas é unha área complementaria da xenómica estrutural, que trata de predicir as estruturas proteicas para elaborar modelos axeitados das proteínas cuxas estruturas non foron aínda determinadas experimentalmente.[44] O tipo máis exitoso de predición de estruturas, chamado modelado de homoloxía, baséase na existencia dunha estrutura "patrón" ou "molde" con semellanza de secuencia coa proteína que está a ser modelada; o obxectivo da xenómica estrutural é proporcionar unha representación suficiente das estruturas xa resoltas para modelar a maioría das que quedan.[45] Aínda que elaborar modelos axeitados segue a ser un reto cando só se dispón de estruturas "patrón" pouco relacionadas, suxeriuse que o aliñamento de secuencia é o punto crítico neste proceso, xa que poden producirse modelos bastante axeitados se se coñece un aliñamento de secuencia "perfecto".[46] Moitos métodos de predición de estruturas serviron para informar o campo emerxente da enxeñaría de proteínas, no cal foron xa deseñados os novos pregamentos de proteínas.[47] Un problema computacional máis complexo é a predición de interaccións intermoleculares, como no acoplamento molecular e a predición da interacción proteína–proteína.[48]

O proceso de pregamento de proteínas e a súa unión a outras moléculas poden ser simulados utilizando técnicas como a mecánica molecular, en especial, a dinámica molecular e o método Monte Carlo, que cada vez máis aproveitan a computación distribuída e en paralelo (proxecto Folding@home;[49] modelado molecular en GPU). O pregamento de pequenos dominios proteicos en hélice alfa como as "cabezas" da proteína vilina[50] e a proteína accesoria do VIH[51] simulouse con éxito en silicio (no PC), e os métodos híbridos que combinan a dinámica molecular estándar con cálculos de mecánica cuántica permitiron a exploración dos estados electrónicos das rodopsinas.[52]

As proteínas foron recoñecidas como unha clase distinta de moléculas biolóxicas no século XVIII por Antoine Fourcroy e outros, pola súa capacidade de coagular ou flocular cando se trataban con calor ou ácidos. Notables exemplos de proteínas recoñecidas naquel momento foron a albumina da clara dos ovos, a albumina sérica do sangue, a fibrina e o glute do trigo.

As proteínas foron descritas por primeira vez polo químico holandés Gerardus Johannes Mulder e nomeadas polo químico sueco Jöns Jacob Berzelius en 1838. Mulder levou a cabo a análise elemental de proteínas comúns e encontrou que case todas as proteínas tiñan a mesma fórmula empírica, C400H620N100O120P1S1.[53] Chegou á errada conclusión de que poderían estar compostas por un só tipo de molécula (moi grande). O termo "proteína" proposto por Berzelius deriva do grego πρωτεῖος (proteios), que significa "primario",[54] "á cabeza", ou "situado diante".[55] Mulder seguiu os seus traballos identificando os produtos da degradación das proteínas como o aminoácido leucina para a cal calculou un peso molecular (case correcto) de 131 Da.[53]

Os primeiros científicos da nutrición como o alemán Carl von Voit crían que as proteínas eran os nutrientes máis importantes para manter a estrutura do corpo, porque críase xeralmente que a "carne fai carne".[56] O papel fundamental das proteínas como encimas nos organismos vivos non foi totalmente apreciado ata 1926, cando James Batcheller Sumner mostrou que o encima urease era, de feito, unha proteína.[57]

A dificultade que ten purificar proteínas en grandes cantidades fixo que fose moi difícil o seu estudo polos primeiros bioquímicos. Por iso, os primeiros estudos centráronse en proteínas que podían ser purificadas en grandes cantidades, como as do sangue, clara de ovo, varias toxinas e encimas dixestivos ou metabólicos obtidos en matadeiros. Na década de 1950, a compañía Armour Hot Dog Co. purificou 1 kg de ribonuclease A pancreática bovina pura e púxoa a disposición dos científicos gratuitamente, o que contribuíu a que a ribonuclease A se convertese nun dos obxectivos principais dos estudos bioquímicos nos anos seguintes.[53]

John Kendrew preparando un modelo da mioglobina.

Linus Pauling predixo con éxito a estrutura secundaria dunha proteína regular baseándose na formación de enlaces de hidróxeno, unha idea que fora adiantada en 1933 por William Astbury.[58] Os traballos posteriores de Walter Kauzmann sobre a desnaturalización,[59][60] baseados en parte en estudos previos de Kaj Linderstrøm-Lang,[61] contribuíron ao coñecemento do pregamento das proteínas e das estruturas mediadas por interaccións hidrofóbicas.

A primeira proteína que foi secuenciada foi a insulina, por Frederick Sanger, en 1949. Sanger determinou correctamente a secuencia de aminoácidos da insulina, demostrando así concluíntemente que as proteínas consisten en polímeros liñais de aminoácidos en vez de cadeas ramificadas, coloides, ou ciclois.[62] Este descubrimento valeulle o premio Nobel en 1958.

As primeiras estruturas proteicas resoltas foron as da hemoglobina e mioglobina, por Max Perutz e Sir John Cowdery Kendrew, respectivamente, en 1958.[63][64] A primeira estrutura proteica resolta con resolución atómica por análise de difracción de raios X fíxose na década de 1960 (Perutz e Kendrew compartiron o premio Nobel de Química de 1962 por estes descubrimentos) e posteriormente por espectroscopía de resonancia magnética nuclear de proteínas (NMR) na década de 1980. En 2009,o Protein Data Bank contiña unhas 55.000 estruturas de proteínas con resolución atómica.[65] Recentemente, a microscopía crioelectrónica de grandes ensamblaxes macromoleculares[66] e a predición da estrutura de proteínas computacional de dominios de pequenas proteínas[67] son dous métodos con resolución atómica.

  1. Murray et al., p. 31.
  2. 2,0 2,1 van Holde and Mathews, pp. 1002–42.
  3. Dobson CM (2000). "The nature and significance of protein folding". En Pain RH (ed.). Mechanisms of Protein Folding. Oxford, Oxfordshire: Oxford University Press. pp. 1–28. ISBN 0-19-963789-X. 
  4. 4,0 4,1 Lodish H, Berk A, Matsudaira P, Kaiser CA, Krieger M, Scott MP, Zipurksy SL, Darnell J (2004). Molecular Cell Biology (5th ed.). New York, New York: WH Freeman and Company. 
  5. Fulton A, Isaacs W (1991). "Titin, a huge, elastic sarcomeric protein with a probable role in morphogenesis". BioEssays 13 (4): 157–61. PMID 1859393. doi:10.1002/bies.950130403. 
  6. Bruckdorfer T, Marder O, Albericio F (2004). "From production of peptides in milligram amounts for research to multi-tons quantities for drugs of the future". Current Pharmaceutical Biotechnology 5 (1): 29–43. PMID 14965208. doi:10.2174/1389201043489620. 
  7. Schwarzer D, Cole P (2005). "Protein semisynthesis and expressed protein ligation: chasing a protein's tail". Current Opinions in Chemical Biology 9 (6): 561–69. PMID 16226484. doi:10.1016/j.cbpa.2005.09.018. 
  8. Kent SB (2009). "Total chemical synthesis of proteins". Chemical Society Reviews 38 (2): 338–51. PMID 19169452. doi:10.1039/b700141j. 
  9. En España, na literatura en castelán, adoita utilizarse o termo holoproteína para denominar as proteínas simples. Pero, ao contrario, na literatura inglesa holoprotein significa heteroproteína (de modo análogo ao termo holoencima), e este significado está moi estendido polo mundo. Neste artigo evitouse usar o termo holoproteína debido á súa ambigüidade.
  10. van Holde and Mathews, pp. 368–75.
  11. van Holde and Mathews, pp. 165–85.
  12. Branden and Tooze, pp. 340–41.
  13. Gonen T, Cheng Y, Sliz P, Hiroaki Y, Fujiyoshi Y, Harrison SC, Walz T (2005). "Lipid-protein interactions in double-layered two-dimensional AQP0 crystals". Nature 438 (7068): 633–38. Bibcode:2005Natur.438..633G. PMC 1350984. PMID 16319884. doi:10.1038/nature04321. 
  14. Standley DM, Kinjo AR, Kinoshita K, Nakamura H (2008). "Protein structure databases with new web services for structural biology and biomedical research". Briefings in Bioinformatics 9 (4): 276–85. PMID 18430752. doi:10.1093/bib/bbn015. 
  15. Walian P, Cross TA, Jap BK (2004). "Structural genomics of membrane proteins". Genome Biology 5 (4): 215. PMC 395774. PMID 15059248. doi:10.1186/gb-2004-5-4-215. Arquivado dende o orixinal o 02 de xaneiro de 2016. Consultado o 27 de maio de 2013. 
  16. Sleator RD. (2012). "Prediction of protein functions". Methods in Molecular Biology 815: 15–24. doi:10.1007/978-1-61779-424-7_2. 
  17. Voet D, Voet JG. (2004). Biochemistry Vol 1 3rd ed. Wiley: Hoboken, NJ.
  18. Branden and Tooze, pp. 251–81.
  19. van Holde and Mathews, pp. 247–50.
  20. Bairoch A (2000). "The ENZYME database in 2000". Nucleic Acids Research 28 (1): 304–305. PMC 102465. PMID 10592255. doi:10.1093/nar/28.1.304. 
  21. Radzicka A, Wolfenden R (1995). "A proficient enzyme". Science 267 (5194): 90–93. Bibcode:1995Sci...267...90R. PMID 7809611. doi:10.1126/science.7809611. 
  22. EBI External Services (2010-01-20). "The Catalytic Site Atlas at The European Bioinformatics Institute". Ebi.ac.uk. Arquivado dende o orixinal o 03 de agosto de 2013. Consultado o 2011-01-16. 
  23. van Holde and Mathews, pp. 220–29.
  24. Sankaranarayanan R, Moras D (2001). "The fidelity of the translation of the genetic code". Acta Biochimica Polonica 48 (2): 323–35. PMID 11732604. 
  25. van Holde and Mathews, pp. 830–49.
  26. Copland JA, Sheffield-Moore M, Koldzic-Zivanovic N, Gentry S, Lamprou G, Tzortzatou-Stathopoulou F, Zoumpourlis V, Urban RJ, Vlahopoulos SA (2009). "Sex steroid receptors in skeletal differentiation and epithelial neoplasia: is tissue-specific intervention possible?". BioEssays: news and reviews in molecular, cellular and developmental biology 31 (6): 629–41. PMID 19382224. doi:10.1002/bies.200800138. 
  27. Samarin S, Nusrat A (2009). "Regulation of epithelial apical junctional complex by Rho family GTPases". Frontiers in bioscience: a journal and virtual library 14 (14): 1129–42. PMID 19273120. doi:10.2741/3298. 
  28. Murray et al., pp. 21–24.
  29. Hey J, Posch A, Cohen A, Liu N, Harbers A (2008). "Fractionation of complex protein mixtures by liquid-phase isoelectric focusing". Methods in Molecular Biology. Methods in Molecular Biology™ 424: 225–39. ISBN 978-1-58829-722-8. PMID 18369866. doi:10.1007/978-1-60327-064-9_19. 
  30. Terpe K (2003). "Overview of tag protein fusions: from molecular and biochemical fundamentals to commercial systems". Applied Microbiology and Biotechnology 60 (5): 523–33. PMID 12536251. doi:10.1007/s00253-002-1158-6. 
  31. Stepanenko OV, Verkhusha VV, Kuznetsova IM, Uversky VN, Turoverov KK (2008). "Fluorescent proteins as biomarkers and biosensors: throwing color lights on molecular and cellular processes". Current Protein & Peptide Science 9 (4): 338–69. PMC 2904242. PMID 18691124. doi:10.2174/138920308785132668. 
  32. Yuste R (2005). "Fluorescence microscopy today". Nature Methods 2 (12): 902–904. PMID 16299474. doi:10.1038/nmeth1205-902. 
  33. Margolin W (2000). "Green fluorescent protein as a reporter for macromolecular localization in bacterial cells". Methods (San Diego, Calif.) 20 (1): 62–72. PMID 10610805. doi:10.1006/meth.1999.0906. 
  34. Walker JH, Wilson K (2000). Principles and Techniques of Practical Biochemistry. Cambridge, UK: Cambridge University Press. pp. 287–89. ISBN 0-521-65873-X. 
  35. Mayhew TM, Lucocq JM (2008). "Developments in cell biology for quantitative immunoelectron microscopy based on thin sections: a review". Histochemistry and Cell Biology 130 (2): 299–313. PMC 2491712. PMID 18553098. doi:10.1007/s00418-008-0451-6. 
  36. Hohsaka T, Sisido M (2002). "Incorporation of non-natural amino acids into proteins". Current Opinion in Chemical Biology 6 (6): 809–15. PMID 12470735. doi:10.1016/S1367-5931(02)00376-9. 
  37. Cedrone F, Ménez A, Quéméneur E (2000). "Tailoring new enzyme functions by rational redesign". Current Opinion in Structural Biology 10 (4): 405–10. PMID 10981626. doi:10.1016/S0959-440X(00)00106-8. 
  38. Görg A, Weiss W, Dunn MJ (2004). "Current two-dimensional electrophoresis technology for proteomics". Proteomics 4 (12): 3665–85. PMID 15543535. doi:10.1002/pmic.200401031. 
  39. Conrotto P, Souchelnytskyi S (2008). "Proteomic approaches in biological and medical sciences: principles and applications". Experimental Oncology 30 (3): 171–80. PMID 18806738. 
  40. Joos T, Bachmann J (2009). "Protein microarrays: potentials and limitations". Frontiers in Bioscience 14 (14): 4376–85. PMID 19273356. doi:10.2741/3534. 
  41. Koegl M, Uetz P (2007). "Improving yeast two-hybrid screening systems". Briefings in Functional Genomics & Proteomics 6 (4): 302–12. PMID 18218650. doi:10.1093/bfgp/elm035. Arquivado dende o orixinal o 15 de abril de 2013. Consultado o 27 de maio de 2013. 
  42. Plewczyński D, Ginalski K (2009). "The interactome: predicting the protein–protein interactions in cells". Cellular & Molecular Biology Letters 14 (1): 1–22. PMID 18839074. doi:10.2478/s11658-008-0024-7. 
  43. Zhang C, Kim SH (2003). "Overview of structural genomics: from structure to function". Current Opinion in Chemical Biology 7 (1): 28–32. PMID 12547423. doi:10.1016/S1367-5931(02)00015-7. 
  44. Zhang Y (2008). "Progress and challenges in protein structure prediction". Current Opinions in Structural Biology 18 (3): 342–48. PMC 2680823. PMID 18436442. doi:10.1016/j.sbi.2008.02.004. 
  45. Xiang Z (2006). "Advances in homology protein structure modeling". Current Protein and Peptide Science 7 (3): 217–27. PMC 1839925. PMID 16787261. doi:10.2174/138920306777452312. 
  46. Zhang Y, Skolnick J (2005). "The protein structure prediction problem could be solved using the current PDB library". Proceedings of the National Academy of Sciences U.S.A. 102 (4): 1029–34. Bibcode:2005PNAS..102.1029Z. PMC 545829. PMID 15653774. doi:10.1073/pnas.0407152101. 
  47. Kuhlman B, Dantas G, Ireton GC, Varani G, Stoddard BL, Baker D (2003). "Design of a novel globular protein fold with atomic-level accuracy". Science 302 (5649): 1364–68. Bibcode:2003Sci...302.1364K. PMID 14631033. doi:10.1126/science.1089427. 
  48. Ritchie DW (2008). "Recent progress and future directions in protein–protein docking". Current Protein and Peptide Science 9 (1): 1–15. PMID 18336319. doi:10.2174/138920308783565741. 
  49. Scheraga HA, Khalili M, Liwo A (2007). "Protein-folding dynamics: overview of molecular simulation techniques". Annual Review of Physical Chemistry 58: 57–83. Bibcode:2007ARPC...58...57S. PMID 17034338. doi:10.1146/annurev.physchem.58.032806.104614. 
  50. Zagrovic B, Snow CD, Shirts MR, Pande VS (2002). "Simulation of folding of a small alpha-helical protein in atomistic detail using worldwide-distributed computing". Journal of Molecular Biology 323 (5): 927–37. PMID 12417204. doi:10.1016/S0022-2836(02)00997-X. 
  51. Herges T, Wenzel W (2005). "In silico folding of a three helix protein and characterization of its free-energy landscape in an all-atom force field". Physical Review Letters 94 (1): 018101. Bibcode:2005PhRvL..94a8101H. PMID 15698135. doi:10.1103/PhysRevLett.94.018101. 
  52. Hoffmann M, Wanko M, Strodel P, König PH, Frauenheim T, Schulten K, Thiel W, Tajkhorshid E, Elstner M (2006). "Color tuning in rhodopsins: the mechanism for the spectral shift between bacteriorhodopsin and sensory rhodopsin II". Journal of the American Chemical Society 128 (33): 10808–18. PMID 16910676. doi:10.1021/ja062082i. 
  53. 53,0 53,1 53,2 Perrett D (2007). "From 'protein' to the beginnings of clinical proteomics". Proteomics – Clinical Applications 1 (8): 720–38. PMID 21136729. doi:10.1002/prca.200700525. 
  54. New Oxford Dictionary of English
  55. Reynolds JA, Tanford C (2003). Nature's Robots: A History of Proteins (Oxford Paperbacks). New York, New York: Oxford University Press. p. 15. ISBN 0-19-860694-X. 
  56. Bischoff TLW, Voit, C (1860). Die Gesetze der Ernaehrung des Pflanzenfressers durch neue Untersuchungen festgestellt (en German). Leipzig, Heidelberg. 
  57. Sumner JB (1926). "The isolation and crystallization of the enzyme urease. Preliminary paper" (PDF). Journal of Biological Chemistry 69 (2): 435–41. 
  58. Pauling L, Corey RB, Branson HR (1951). "The structure of proteins: two hydrogen-bonded helical configurations of the polypeptide chain" (PDF). Proceedings of the National Academy of Sciences U.S.A. 37 (5): 235–40. Bibcode:1951PNAS...37..235P. PMC 1063348. PMID 14834145. doi:10.1073/pnas.37.5.235. 
  59. Kauzmann W (1956). "Structural factors in protein denaturation". Journal of Cellular Physiology. Supplement 47 (Suppl 1): 113–31. PMID 13332017. doi:10.1002/jcp.1030470410. 
  60. Kauzmann W (1959). "Some factors in the interpretation of protein denaturation". Advances in Protein Chemistry. Advances in Protein Chemistry 14: 1–63. ISBN 978-0-12-034214-3. PMID 14404936. doi:10.1016/S0065-3233(08)60608-7. 
  61. Kalman SM, Linderstrom-Lang K, Ottesen M, Richards FM (1955). "Degradation of ribonuclease by subtilisin". Biochimica et Biophysica Acta 16 (2): 297–99. PMID 14363272. doi:10.1016/0006-3002(55)90224-9. 
  62. Sanger F (1949). "The terminal peptides of insulin". Biochemical Journal 45 (5): 563–74. PMC 1275055. PMID 15396627. 
  63. Muirhead H, Perutz M (1963). "Structure of hemoglobin. A three-dimensional fourier synthesis of reduced human hemoglobin at 5.5 Å resolution". Nature 199 (4894): 633–38. Bibcode:1963Natur.199..633M. PMID 14074546. doi:10.1038/199633a0. 
  64. Kendrew J, Bodo G, Dintzis H, Parrish R, Wyckoff H, Phillips D (1958). "A three-dimensional model of the myoglobin molecule obtained by X-ray analysis". Nature 181 (4610): 662–66. Bibcode:1958Natur.181..662K. PMID 13517261. doi:10.1038/181662a0. 
  65. "RCSB Protein Data Bank". Arquivado dende o orixinal o 27 de decembro de 2012. Consultado o 2009-04-14. 
  66. Zhou ZH (2008). "Towards atomic resolution structural determination by single-particle cryo-electron microscopy". Current Opinion in Structural Biology 18 (2): 218–28. PMC 2714865. PMID 18403197. doi:10.1016/j.sbi.2008.03.004. 
  67. Keskin O, Tuncbag N, Gursoy A (2008). "Characterization and prediction of protein interfaces to infer protein-protein interaction networks". Current Pharmaceutical Biotechnology 9 (2): 67–76. PMID 18393863. doi:10.2174/138920108783955191.