SlideShare a Scribd company logo
1
1. Introduzione
1.1. Stabilità enzimatica
Le proteine hanno svariati ruoli biologici e pertanto possono essere divise in varie classi funzionali:
proteine di trasporto, recettori/regolatori, proteine strutturali, proteine di riserva, proteine
contrattili, proteine protettive, enzimi.
La classe funzionale oggetto di questo lavoro di tesi è quella degli enzimi, in particolare
l’attenzione è stata focalizzata sulla classe enzimatica delle lipasi.
Gli enzimi hanno un grosso ruolo nel mondo industriale. Vengono utilizzati come catalizzatori per
velocizzare le reazioni ma anche perché hanno un’alta specificità ed eco-compatibilità. Il loro
utilizzo è però limitato da parametri quali la temperatura (temperature elevate), il pH (troppo
acido o basico), pressione (pressioni estreme), radiazioni da microonde, utilizzo di solventi organici
o sali. Nelle industrie, tantissimi processi vengono condotti ad alte temperature, per molteplici
vantaggi che si ottengono rispetto alle basse temperature, quali ad esempio: maggiore velocità
delle reazioni, aumento della solubilità dei substrati, riduzione del rischio di contaminazione o
diminuzione della viscosità.1
Gli enzimi, se sottoposti a condizioni estreme, vedono diminuita l’efficacia o addirittura viene
annullata del tutto. Questo è il motivo principale per il quale le industrie investono moltissimo in
termini di tempo e denaro nel cercare di stabilizzare questi biocatalizzatori per poterli sfruttare al
meglio nelle condizioni più svariate, cercando anche di ridurre il più possibile i costi. Gli approcci
utilizzati sono di tipo tradizionale (immobilizzazione, modificazione chimica, ecc.) oppure di
ingegneria proteica, che vanno a modificare la struttura proteica dell’enzima, sfruttando anche
informazioni ottenute tramite tecniche computazionali.
1.1.1 Folding e unfolding delle proteine
La struttura delle proteine può essere suddivisa in quattro livelli di organizzazione:
1. La struttura primaria: rappresenta la sequenza di amminoacidi che compongono la proteina.
2. La struttura secondaria: struttura nella quale sono indicate le conformazioni dei singoli
residui lungo la catena primaria; se essi hanno una conformazione regolare distingueremo ad
esempio α-eliche e β-foglietti.
1
Jeong Chan Joo, Young Je Yoo, Wiley Enciclopedia of Industrial Biotechnology, 2008, 2c1ed-d-08-0043.
2
3. La struttura terziaria: si ha una collocazione precisa di tutti gli atomi della catena nello spazio
e la formazione di una struttura tridimensionale ben definita.
4. La struttura quaternaria: considera l’organizzazione degli oligomeri, cioè l’associazione di
diverse catene polipeptidiche.
La struttura finale della proteina (la struttura folded o nativa) sarà quella con l’energia interna
minore. Ogni tappa del ripiegamento porta a una riduzione dell’energia. Esistono anche stati di
folding intermedio, che hanno raggiunto un minimo energetico, ma non un minimo assoluto bensì
un minimo locale sulla superfice energetica delle varie conformazioni accessibili alla proteina
(Figura 1.1).
Figura 1.1 Visualizzazione del profilo energetico per il ripiegamento di proteine
Il peptide deve raggiungere la conformazione più stabile che non è necessariamente quella con
energia minima (Figura 1.2).
3
Figura 1.2 Rappresentazione schematica del processo di folding delle
proteine:http://folding.stanford.edu/Italian/Science
Una volta formata, la struttura nativa della proteina (e quindi la sua conformazione spaziale) è
mantenuta da varie forze non-covalenti quali: legami a idrogeno, interazioni idrofobiche e forze di
van der Waals. A causa di cambiamenti chimici (solventi organici, cambio della salinità, pH, ecc.) o
fisici (cambiamento drastico di temperatura) la struttura della proteina cambia, perde cioè la sua
struttura secondaria. Questo processo viene chiamato unfolding della proteina o denaturazione.
Il processo di unfolding può avvenire in due modi:
1. Unfolding reversibile: di solito concerne le piccole proteine (100-150 amminoacidi), che, dopo
essersi denaturate, sono in grado di riacquistare spontaneamente la loro struttura nativa quando
vengono riportate nelle condizioni fisiologiche, ad esempio in seguito a raffreddamento (Figura
1.3). Ciò succede perché la stabilità della proteina è data dalla differenza di energia libera
(∆G=GD-GN) tra lo stato nativo (N) e lo stato denaturato (D).
4
K1
N ⇌ D
K-1
La differenza di energia tra i due stati è molto piccola (<20kcal/mol)2
.
2. Unfolding irreversibile: Le proteine di dimensioni maggiori, dopo esposizione a condizioni
denaturanti non riescono a ritornare allo stato nativo ma tendono ad aggregare e precipitare in
soluzione anche quando le condizioni fisiologiche sono state ripristinate.
K1 K2
N ⇌ I ⇌ D
K-1 K-2
Dove:
N = Struttura nativa
I = Struttura di transizione (enzima parzialmente denaturato)
D = Struttura denaturata
Figura 1.3 visualizzazione della renaturazione spontanea delle proteine
2
C. N. Pace, G. R. Grimsley. December 1999, Encyclopedia of Life Sciences, 8(7): 1500–1504
5
Se le proteine sono di piccole dimensioni ma la loro concentrazione è sufficientemente alta, è
stato dimostrato che tenderanno comunque a aggregare ed andare in contro al misfolding
(riavvolgimento sbagliato) durante il processo di rinaturazione.3
Il processo di unfolding delle proteine può essere seguito con diverse tecniche a seconda della
struttura della proteina di interessa. Per osservare l’unfolding della struttura terziaria si può usare
la spettrofluorimetria). Per la struttura secondaria in genere si utilizza la spettroscopia infrarossa o
il dicroismo circolare.4
Il meccanismo di folding delle proteine è tuttora una delle questioni irrisolte nella biochimica.
Nonostante tutti gli sforzi e i progressi della ricerca non è ancora esattamente chiaro come una
catena polipeptidica si ripieghi spontaneamente in una proteina strutturata, biologicamente
attiva.8
Si ipotizza che nel ripiegamento sia coinvolto il solvente che circonda la molecola, ossia
l’acqua. Sono quindi state fatte tantissime ricerche dove venivano usati altri solventi per studiare il
comportamento delle proteine ed il processo di folding. 5 ,6
Lo scopo di questa tesi è stato proprio
quello di vedere come le proteine si denaturano variando le condizioni di temperatura e variando i
solventi nei quali sono immerse.
1.1.2 Enzimi termostabili
Gli enzimi estratti da organismi termofili (vivono a temperature di 50-80°C) e ipertermofili
(crescono a 80-110°C), grazie alla loro stabilità e l’ottima attività ad alte temperature, offrono
maggiori vantaggi biotecnologici rispetto agli enzimi da mesofili (25-50°C) o psicrofili (5-25°C).7
È stato dimostrato che, tranne per differenze filogenetiche, enzimi da ipertermofili e mesofili sono
molto simili: le sequenze di proteine ipertermofiliche e delle equivalenti mesofiliche hanno
generalmente un grado di omologia che varia dal 40-85%;8
le loro strutture tridimensionali sono
sovrapponibili9
e hanno gli stessi meccanismi catalitici.10
Studi comparativi hanno dimostrato che
3
E.I. Sharkhnovich, Biol 1999,. 6, 99-102
4
R. L. Baldwin, C. Frieden, G. D. Rose, PubMed, 2010, 78( 13), 2725–2737
5
R. V. Rariy and A. M. Klibanov, PCCP, 1997, 94, 13520-13523
6
C. R. Reichardt, VCH Weinheim Germany, Solvents and Solvent Effects in Organic Chemistry, 1988
7
C. Vielle, G. J. Zeikus, Microbiology and Molecular Biology Reviews, 2001,. 65 (1), 1-43.
8
G. J. Davies, S. J. Gamblin, J. A. Littlechild, and H. C. Watson. Proteins Struct. Funct. Genet., PubMed, 1993. 15,
283–289.
9
V. I. Chi, L. A. Martinez-Cruz, J. Jancarik, R. V. Swanson, D. E. Robertson, and S. H. Kim. FEBS Letters, 1999, 445,
375–383.
6
la maggiore termostabilità degli enzimi da microorganismi termofili e ipertermofili è dovuta a un
insieme di piccole e specifiche differenze strutturali, ad esempio: maggior numero di coppie
ioniche presenti sulla superficie, aumento degli amminoacidi non polari, residui carichi
positivamente o negativamente, aromatici11
e riduzione della flessibilità, soprattutto nel core
proteico.1
1.1.3 Influenza dei solventi sulla stabilità enzimatica
Diversi studi hanno dimostrato che la catalisi enzimatica in solvente organico porta ad alcuni
miglioramenti, rispetto alla catalisi in ambiente acquoso, ad esempio: maggiore solubilità del
substrato, prevenzione della proteolisi (nel caso delle proteasi), variazione della selettività
enzimatica e l’aumento della termostabilità. Si ha così un link diretto fra solventi utilizzati e
termostabilità, infatti, gli enzimi in solventi organici possono svolgere la propria attività catalitica a
temperature superiori a quelle che ne causano la denaturazione in ambiente acquoso. Un altro
parametro che influenza l’attività enzimatica in soluzioni acquose è il pH che invece non ha un
ruolo importante nei solventi organici.12
Studi su vari enzimi hanno però mostrato una significativa
perdita dell’attività in presenza di solventi organici polari, rispetto all’attività mostrata in soluzione
acquosa.13
Cambiando il solvente, quindi, possiamo cambiare le caratteristiche enzimatiche. Ad esempio, in
acqua, numerose lipasi esterasi e proteasi catalizzano l’idrolisi di esteri ai corrispondenti acidi e
alcoli. Ma se il solvente in soluzione è anidro, ovviamente questa reazione non avverrà. Tuttavia se
viene aggiunto un nucleofilo come ad esempio alcol, ammina o tiolo si avrà rispettivamente
transesterificazione, amminolisi e tiotransesterificazione, reazioni che non si avrebbero in
ambiente acquoso.14
1.1.4 Fattori che contribuiscono alla stabilità enzimatica
La proteina, una volta raggiunta la sua struttura nativa, è tenuta insieme da varie forze che ne
garantiscono il mantenimento della struttura. Per quanto riguarda i contributi entalpici si tratta di
10
M. W. Bauer, R. M. Kelly. Biochemistry, 1998, 37, 17170-17178.
11
X. X. Zhou, Y. B. Wang, Y.J. Pan, W. F. Li. Amino Acids, 2008, 34, 25-33.
12
B. Castillo, V. Bansal, A. Ganesan, P. Halling, F. Secundo, A. Ferrer, K. Griebenow and G. Barletta. BMC
Biotechnology, 2006,. 6 (51).
13
B. Castillo, Y. Pacheco, W. Al-Azzam, K. Griebenow, M. Devi, A. Ferrer, and G. Barletta. J. Mol. Catal. B: Enzymatic,
2005, 35, 147-153.
14
A. M. Klibanov, Nature, 2001, 409, 241-246
7
legami idrogeno, interazioni elettrostatiche, e interazioni di van der Waals.1
I contributi entropici
sono dati ad esempio da ponti disolfuro che introducono dei legami covalenti e da residui di
prolina. Ci sono poi le interazioni aromatico-aromatico e catione-π, ed infine il legame metallico.15
Tutti questi termini contribuiscono in maniera diversa alla stabilità enzimatica e non si può
attribuire la stabilizzazione delle proteine a nessuno in particolare. Per questo motivo verranno
analizzarli singolarmente.
1.1.4.1 Interazioni idrofobiche
Non a caso proprio le interazioni idrofobiche sono posizionate al primo posto tra i fattori che
contribuiscono alla stabilità enzimatica, esse sono infatti considerate la forza maggiore che guida il
folding di una proteina e quindi sono fondamentali per la sua stabilità.
Le proteine sono costituite da amminoacidi idrofilici e idrofobici. Durante il ripiegamento delle
proteine i residui idrofobici tenderanno a stare il più lontano possibile dal solvente (acqua) e si
concentreranno nel cosiddetto core della proteina.
Nel processo di folding, dunque, le molecole di acqua vengono ridistribuite dai residui idrofobici
con un aumento di entropia che risulterà in una diminuzione dell’energia libera di Gibbs (∆G < 0) e
quindi in una maggiore stabilità della proteina (figura 1.4).
Figura 1.4 Schema del ripiegamento proteico in base al tipo di amminoacidi
1.1.4.2 Legame idrogeno
Il legame a idrogeno è una forza molto debole, non covalente, ma la sua importanza è cruciale se
pensiamo che una proteina ha tantissimi di questi legami che esercitano una forza risultante non
indifferente. Il suo ruolo è cruciale nel determinare la struttura di una proteina e modulare le sue
15
R. Jaenicke, G. Böhm, Curr. Op. Struct. Biol., 1998, 8(6), 738–748
8
interazioni con l’acqua. Ad esempio le α-eliche ed i β-foglietti nella struttura secondaria delle
proteine sono stabilizzati proprio dalle forze esercitate dai numerosi legami a idrogeno.
Vogot e Argons16
hanno confrontato 16 famiglie di proteine diverse, dimostrando che la
termostabilità delle proteine migliora notevolmente all’aumentare del numero di legami idrogeno
e con l’incremento della frazione polare della superfice. I legami a idrogeno sono caratterizzati da
una distanza tra donatore di H e l’accettore minore di 3Å. La forza di legame dipende
dall’elettronegatività del donatore di H, dall’angolo di legame e dal solvente in cui si forma (una
costante dielettrica elevata diminuisce l’interazione).
1.1.4.3 Interazioni elettrostatiche
Le interazioni elettrostatiche sono tipiche interazioni tra residui con carica opposta, la cui energia
è data dalla legge di Coulomb:
dove: q1 e q2 sono le cariche dei due atomi, r è la distanza tra i due atomi ed ε la costante
dielettrica del mezzo.
Interazioni elettrostatiche con r inferiore a 4Å sono chiamate coppie ioniche o ponti salini. Molti
ricercatori17
,18
hanno confrontato proteine omologhe da mesofili, termofili ed ipertermofili e
hanno osservato che le proteine termostabili hanno un maggior numero di coppie ioniche o ponti
salini.
1.1.4.4 Entropia conformazionale
Ogni amminoacido può avere diverse conformazioni all’interno di una proteina, tuttavia questa
adotta una conformazione specifica, dovuta alla perdita di entropia conformazionale, che
permette il ripiegamento della proteina nell’esatta struttura nativa immediatamente e
specificamente.1
Come riportato da Matthews et al.19
, è possibile migliorare la stabilità di una
proteina con la sostituzione di alcuni amminoacidi. Nello stato di unfolding i residui di Gly, privi di
un carbonio in β, hanno la maggiore entropia conformazionale, mentre i residui di Pro, che
possono assumere solo poche conformazioni, hanno la minore entropia conformazionale.
Sostituendo Gly con residui più rigidi, come Ala o introducendo residui di Pro al posto di altri
16
G. Vogt and P. Argon, Fold Des 1997, 2, S40-S46.
17
M. Sadeghi, H. Naderi-Manesh, M. Zarrabi, and B. Ranjbar. Biophysical Chemistry, 2006, 119, 256-270
18
M. Robinson-Rechavi, A. Alibés, and A. Godzik. J. Mol. Biol., 2006, 356 (2), 547-557
19
B. W. Matthews, H. Nicholson, and W.J. Becktel. Proc. Natl. Acad. Sci. U.S.A., 1987, 84, 6663-6667
9
residui più mobili, è possibile ridurre l’entropia conformazionale e quindi aumentare la stabilità
della proteina.
1.1.4.5 Ponti disolfuro
I ponti disolfuro si formano per ossidazione di due residui di Cys e possono essere intramolecolari
o intermolecolari. È ben noto che i ponti disolfuro stabilizzano le proteine principalmente grazie
ad un effetto entropico, diminuendo l’entropia conformazionale dello stato di unfolding.
Chakraborty et al.20
hanno osservato che l’introduzione di ponti disolfuro in siti non di legame
idrogeno può significativamente stabilizzare la struttura proteica. Inoltre i ponti disolfuro possono
anche aumentare la stabilità cinetica rafforzando le regioni instabili.
1.1.4.6 Interazioni aromatico-aromatico e catione-π
In una proteina molti residui aromatici (Phe, Tyr e Trp) sono accoppiati con altri residui aromatici,
dando luogo alla cosiddetta interazione aromatico-aromatico. Inoltre i residui aromatici
reagiscono con residui carichi positivamente (Arg, Lys e His) nelle interazioni catione-π.1
Anche se
queste interazioni non sono così importanti come le altre forze, come l’interazione idrofobica, la
cooperazione di tutti i meccanismi è molto importante nel ripiegamento delle proteine.
1.1.4.7 Legame metallico
I legami metallici sono noti per stabilizzare e attivare le proteine. Gli ioni metallici coinvolti nei
legami di coordinazione con residui proteici come Cys, His, Asp e Glu, sono Cu(II), Ca(II), Co(II),
Mn(II), Mg(II), Cd(II), Zn(II) e Ni(II). Come riportato da Rodriguez et al.21
nello studio della
bromoperossidasi da Corallina pilulifera, la presenza di uno ione vanadio nel sito catalitico
aumenta la termostabilità dell’enzima, mentre la presenza di uno ione in ogni subunità aumenta la
stabilità dell’enzima in presenza di solventi organici, rendendolo più facilmente utilizzabile nella
biocatalisi.
1.1.5 Come migliorare la stabilità enzimatica
Si conoscono molti metodi per migliorare la stabilità di una proteina, i più importanti sono elencati
in figura 1.5. L’introduzione di queste tecniche negli ultimi decenni ha permesso di migliorare
notevolmente alcune caratteristiche enzimatiche, quali la termostabilità, la stabilità in solvente
organico, l’enantioselettività, la specificità per il substrato e l’optimum di attività a determinati
pH.1,11
20
K. Chakraborty, S. Thakurela, R. S. Prajapati, S. Indu, P. S. Ali, C. Ramakrishnan, and R. Varadarajan. Biochemistry,
2005, 44, 14638-14646.
21
E. Garcia-Rodriguez, T. Ohshiro T. Aibara, Y. Izumi, J. Littlechild. J. Biol. Inorg. Chem., 2005, 10, 275–282.
10
Metodi tradizionali Metodi ingegneristici
-Modificazioni chimiche -Design razionale
-Immobilizzazione -Direct Evolution
-Liofilizzazione -Design computazionale
-Aggiunta di additive
stabilizzanti
Figura 1.5 Principali metodi utilizzati per migliorare la stabilità degli enzimi per fini industriali
La combinazione di più metodi tra quelli elencati, può essere vantaggiosa rispetto all’utilizzo di
una singola tecnica.
1.1.5.1 Metodi tradizionali
Prima dello sviluppo della tecnologia del DNA-ricombinante, i metodi tradizionali sono stati gli
strumenti più efficaci per migliorare la stabilità enzimatica. Le modificazioni chimiche aumentano
non solo la termostabilità, ma anche la stabilità nei solventi organici: ad esempio modificazioni
con polietilenglicole riducono la perdita di attività enzimatica in vari solventi organici.2
Come riportato da Esposito et al.22
, è stato dimostrato che l’aggiunta di additivi stabilizzanti, quali
glicerolo o saccarosio, ad una soluzione proteica, stabilizza la conformazione nativa prevenendo la
denaturazione termica. In particolare, la presenza di cosolventi come zuccheri o polioli in sistemi
acquosi può stabilizzare la proteina sia contro la denaturazione termica che fisica. Il meccanismo
di questo processo è in continuo sviluppo. L’uso di additivi però ha lo svantaggio di doverli
separare dal prodotto finale.
L’immobilizzazione su supporti solidi, oltre ad aumentare la stabilità termica e nei solventi
organici, permette di separare e riutilizzare l’enzima immobilizzato, riducendo notevolmente i
costi di produzione.1
Tra le tecniche tradizionali va ricordato anche il processo di liofilizzazione. Con questa tecnica si
può migliorare la stabilità rispetto ad una formulazione liquida; le proteine liofilizzate sono meno
predisposte a de-amidazione e idrolisi, e si previene la denaturazione.
22
A. Esposito, L. Comez, S. Cinelli, F. Scarponi, G. Onori. , J. Phys. Chem., 2009, 113, 16420-16424.
11
1.1.5.2 Metodi ingegneristici
Il design razionale è stato il primo metodo ingegneristico usato per rielaborare le sequenze
proteiche. Utilizza vari strumenti bioinformatici per predire quali sono le mutazioni responsabili
della maggiore stabilità di una proteina rispetto alle omologhe meno stabili.
L’elevata conservazione del core proteico sia negli enzimi termofilici che negli omologhi mesofilici,
suggerisce che le mutazioni responsabili della maggiore stabilità dei primi siano da ricercare sulla
superficie proteica.11
Infatti, le più promettenti strategie per la termostabilizzazione che usano la
Site-Directed Mutagenesis (SDM) si concentrano sulle aree superficiali, soprattutto nei loops e
turns, con l’obiettivo di aumentarne la rigidità, realizzando, come già visto, con la sostituzione di
residui amminoacidici, l’introduzione di coppie ioniche o ponti disolfuro.
Negli ultimi anni è stata posta maggiore attenzione al design computazionale, che con adeguati
algoritmi calcola la sequenza ottimale, la più stabile e compatibile con la struttura tridimensionale
proteica. La dinamica molecolare (MD) viene usata per simulare l’unfolding proteico e identificare
le regioni target per la stabilizzazione.11
La directed evolution consiste nel mimare le mutazioni spontanee che avvengono in natura, col
passare del tempo, nella replicazione del DNA proteico. Vengono selezionate e introdotte le
mutazioni che conferiscono caratteristiche più favorevoli alla stabilità enzimatica. Vari enzimi
utilizzati in industria, come proteasi e laccasi, sono stati modificati grazie a tecniche di directed
evolution, per migliorarne la termostabilità.23-24
Come riportato da Eijsink et al.25
, ci sono numerosi
modi per generare diversità genetiche in vitro: introdurre mutazioni puntiformi, a volte delezioni o
inserzioni, in modo casuale; provocare mutazioni casuali ma in una regione limitata del gene;
utilizzare tecniche di ricombinazione applicate ad un gruppo di geni. Si procede poi verificando la
stabilità della proteina in condizionidenaturanti.
1.2 Lipasi
I lipidi sono gli elementi chiave nella chimica della vita. Molte piante ed animali immagazzinano
l’energia chimica sotto forma di trigliceridi, scarsamente solubili in acqua. Per il turnover
metabolico di queste molecole essi producono esterasi, enzimi che idrolizzano legami di esteri. Le
23
T. Kaper, S. J. J. Brouns, A. C. M. Geerling, W. M. De Vos, J. Van der Oost. Biochemical J., 2002, 368, 461-470.
24
T. Bulter, M. Alcalde, V. Sieber, P. Meinhold, S. Schlachtbauer, F. H. Arnold. Appl.Environ. Microb., 2003,. 69 (2),
987–995.
25
V. Eijsink, S. Gaseidnes, T. Borchert, B. van der Burg. Biomol. Eng., 2005, 22, 21-30.
12
esterasi che idrolizzano trigliceridi all’interfaccia acqua-olio sono dette lipasi.26
Le lipasi
appartengono alla famiglia delle idrolasi. In ambiente acquoso il loro ruolo fisiologico è catalizzare
l’idrolisi dei trigliceridi a digliceridi, monogliceridi, acidi grassi e glicerolo. La reazione è reversibile
e questi enzimi possono catalizzare la reazione di esterificazione del glicerolo per formare
monogliceridi, digliceridi e trigliceridi anche in solventi organici.27
Differiscono dalle comuni
esterasi per la loro proprietà di attivazione interfacciale, che consiste in un aumento dell'attività
idrolitica quando l'enzima viene a trovarsi all’interfaccia acqua/olio. Questo comportamento è
stato spiegato sulla base dell’analisi delle strutture cristallografiche, che ha permesso di
individuare la presenza di un’α-elica posta esattamente sopra il sito catalitico come un coperchio
(lid): quando la proteina si trova all’interfaccia acqua/olio questo lid va incontro a delle
modificazioni conformazionali tali da rendere il sito catalitico accessibile al substrato. In
particolare, l’apertura di tale lid fa sì che venga esposta un’ampia superficie idrofobica, che
corrisponde al sito attivo dell’enzima con cui poi va ad interagire il substrato. L’attivazione
interfacciale può essere anche dovuta ad altri fattori diversi dal cambiamento conformazionale del
dominio lid.28
(Figura 1.6)
Figura 1.6 Schema della conformazione a) attiva, inattiva delle lipasi e b) del lid.
26
Rolf D. Schmid e Robert Verger, Angew. Chem. Int. Ed., 1998 , 37, 1608-1633.
27
M. Noel, D. Combes. J. Biotechnol., 2003, 102, 23-32.
28
V.Ferrario, C. Ebert, L. Knapic, D. Fattor, L.Gardossi, Adv. Synth. Catal , 2011, 353, 2466-2480.
13
Le lipasi sono enzimi ubiquitari e sono stati trovati nella maggior parte degli organismi della
microbica, delle piante e del regno animale, come si può osservare nella figura 1.7.
Origine: Nome: Applicazione:
Da mammiferi Lipasi gastrica umana
Da funghi Humicola lanuginosa Sintesi organica
Candida antartica B Detergente
Rhizopus oryzae Oleochimica
Da batteri Pseudomonans
glumae
Detergente enzimatico,
sintesi organica
Figura 1.7 esempio di lipasi a livello commerciale
Nel 1856, Claude Bernard scoprì per primo la lipasi nel liquido pancreatico, un enzima che
idrolizzava gocce insolubili di olio e le trasformava in prodotti solubili.29
Nel 1958, Sandra e
Desnuelle definirono le lipasi in termini cinetici, basandosi sul fenomeno dell’attivazione
interfacciale. Soltanto nel 1990 fu resa nota la struttura cristallografica a raggi X di due lipasi. Fu
allora che si ipotizzò la teoria del lid o flap nel sito attivo. Da allora in poi le lipasi sono state
ampiamente studiate ipotizzando diversi meccanismi d’azione. Si è anche visto che molte lipasi
hanno strutture e disposizioni di amminoacidi molto simili e presentano meccanismi d’azione
identici, ma non tutte le lipasi presentano il fenomeno dell’attivazione interfacciale (es. Candida
Antartica di tipo B, è provvista del lid anfifilico che copre il sito attivo ma non presenta attivazione
interfacciale)28
.
Tutte le dodici lipasi delle quali è stata chiarita la struttura, sono membri della cosiddetta famiglia
delle α/β idrolasi, caratterizzate da un’architettura comune con sequenze specifiche di α-eliche e
β-foglietti. Catalizzano l’idrolisi di esteri grazie alla cosiddetta triade catalitica, composta da una
serina nucleofila attivata da un legame a idrogeno in relé con l’istidina e aspartato (o
glutammato). Le serino proteasi hanno esattamente lo stesso meccanismo catalitico. Come già
detto, la maggior parte delle lipasi ha un lid o flap composto da una sequenza peptidica di α-eliche
anfifiliche che presentano una conformazione chiusa del sito attivo in assenza dell’interfase o di
un solvente organico, che impedisce al substrato l’accesso nel sito catalitico. Una volta che il lid è
aperto, la vasta zona idrofobica del sito attivo viene esposta al substrato. Questa teoria è stata
29
A. A. Hasan, S. A. Hamee,. Enzyme Microb. Tech., 2006, 39, 235-251.
14
provata grazie alla struttura ai raggi X di una lipasi con un substrato legato in modo covalente al
sito attivo.28
Dal punto di vista commerciale il più importante campo di applicazione delle lipasi è sicuramente
quello dei detergenti, dove vengono addizionate al prodotto per aumentarne il potere sgrassante.
Vengono aggiunte anche ai cibi, ad esempio sono impiegate nell’industria casearia, al fine di
produrre sapori caratteristici, in quanto catalizzano la sintesi di esteri tra alcoli e acidi grassi a
catena corta, componenti di aromi e fragranze. Le lipasi, grazie alla loro enantioselettività, sono
utilizzate anche per la produzione di composti chirali e nella risoluzione di racemi.28
Altri impieghi
di grande impatto commerciale vedono il loro utilizzo nell’industria cosmetica, tessile, della carta e
del cuoio.29
I più recenti impieghi proposti per le lipasi sono per la sintesi di polimeri (poliesteri) biodegradabili
ottenuti da fonti naturali rinnovabili, oppure del biodiesel, sempre da fonti naturali rinnovabili,
mediante la conversione enzimatica di oli vegetali in esteri di alcoli a catena corta.
1.2.1 Lipasi B da Candida antartica (CalB)
1.2.1.1 Origine e struttura della CalB
La Candida antarctica (figura 1.8) è un lievito alcalino scoperto nei fondali del lago Vanda in
Antartide. Il lago ha un’interessante composizione delle acque, essendo formato da due fasi con
spiccate differenze l’una dall’altra. La zona sottostante la superficie è formata da acqua fredda e
priva di sale, mentre lo strato a profondità maggiore di 50 metri è formato da acqua
estremamente alcalina. Un fatto interessante è che la temperatura di quest’acqua alcalina oscilla
tra 25 e 43°C, mentre l’acqua di superficie non supera mai i 5°C, toccando picchi di -50°C. Questo
straordinario effetto avviene grazie allo spesso strato di ghiaccio che quasi costantemente ricopre
il lago. Il ghiaccio funziona come un pannello solare che converge la luce solare in energia termica
che a sua volta rimane accumulata nelle profondità perché il flusso termico verso gli strati
superiori è minimo.
La Candida antarctica produce due tipi di lipasi, la lipasi A e la lipasi B.
15
La lipasi B (CalB) (figura 1.9) è una proteina globulare formata da un’unica catena polipeptidica di
317 amminoacidi, del peso molecolare di 33016Da e il folding caratteristico delle α/β idrolasi,
proteine composte da sette β-foglietti centrali affiancati su entrambi i lati da 10 α-eliche.30
Figura 1.8 Coltura di Candida antarctica
Può tollerare temperature di reazione elevate (fino a 70°C), soprattutto se immobilizzata su una
resina di supporto. Originariamente scoperta nel lievito Candida antartica, oggi la forma nativa
dell’enzima viene prodotta grazie alla clonazione e sovra-espressione del gene in cellule di lievito
Aspergillus oryzae.
30
M. Skjøt, L. De Maria, R. Chatterjee, A. Svendsen, S. A. Patkar, P. R. Østergaard, J. Brask. ChemBioChem, 2009, 10,
520-527
16
Figura 1.9 Struttura cristallografica della CALB (PDB, codice 1-TCA
31
). In evidenza la “triade catalitica”, costituita dai
residui Ser105, Asp187 e His 224.
Il sito attivo dell'enzima è sepolto in una cavità profonda e relativamente piccola se comparata al
volume totale dell'enzima; il sito di legame del substrato ha una forma a imbuto, il che
contribuisce ad incanalare il substrato all’interno del sito attivo garantendone il corretto
orientamento. Come tutte le lipasi, anche la CalB presenta un sito catalitico formato da una triade
amminoacidica Ser105-His224-Asp187. La cosiddetta catalitic machinery è completata dal sito
ossianionico (Thr40, Gln106), il quale rende possibile la formazione dell'intermedio tetraedrico,
grazie alla sua geometria spaziale che gli permette di formare tre legami idrogeno con l'ossigeno
carbonilico del substrato, che nell’intermedio tetraedrico si carica negativamente (figura 1.10).
31
J. Uppenberg , M.T. Hansen , S. Patkar , T.A. Jones, PubMed, 1994, structure 2: 293-308
17
Figura 1.10 Vista laterale del sito attivo della CalB nello stato di transizione con 2-octilesanoato (sono state omesse le
cariche)
Nella CalB non è presente un vero e proprio lid, ma la piccola α-elica (α5) costituita dai residui
140-146, che mostra grande mobilità, è in grado di limitare solo parzialmente l’accesso al sito
catalitico;30
questo è in accordo con il dato sperimentale grazie al quale è stato accertato che la
CalB, a differenza delle altre lipasi, non presenta attivazione interfacciale.29
1.2.1.2 Meccanismo d’azione della CalB
Il meccanismo d’azione della CalB è comune a molte idrolasi. La Ser105 è il vero e proprio
amminoacido catalitico, in quanto il suo gruppo ossidrilico esegue l’attacco nucleofilo al carbonile
del substrato, mentre l’His224 e l’Asp187 hanno lo specifico ruolo di potenziare il carattere
nucleofilo dell’ossigeno serinico. L’azoto in posizione ε- del gruppo imidazolico dell’istidina accetta
il protone ossidrilico della serina ed assume una carica positiva stabilizzata dall’interazione con il
residuo di acido aspartico adiacente: questo produce un orientamento del gruppo imidazolico,
nonché un aumento della basicità del suddetto atomo di azoto, che accetta così con minor
difficoltà il protone serinico. In seguito all’attacco nucleofilo si forma quindi un intermedio
tetraedrico, carico negativamente, che viene stabilizzato dai legami idrogeno con i residui
amminoacidi formanti il sito ossianionico, due con Thr40 e uno con Gly106. Si libera poi una
molecola di alcol mentre l’enzima rimane ancora nella forma acilata; successivamente tale
18
complesso si scinde liberando l’acido carbossilico e ripristinando la situazione di partenza per
l’enzima (figura 1.11).
Paktar et al.32
hanno dimostrato che l’optimum di attivazione dell’enzima è a pH 7.0 mentre cala
rapidamente sotto i pH 6.0 e sopra pH 8.0. Questo definisce l’importanza dello stato di
ionizzazione dell’aspartato e dell’istidina del sito catalitico.
Figura 1.11 Meccanismo d’azione della CalB. L’esterificazione o la trans-esterificazione coinvolgono due stati di
transizione (ST1 e ST2) e uno intermedio a enzima acilato.
1.2.1.3 Applicazioni industriali della CalB
La CalB è un ottimo biocatalizzatore che catalizza reazioni di idrolisi in ambiente acquoso e di
esterificazione in solvente organico. Questo enzima viene impiegato in numerosi campi industriali,
grazie alla sua elevata enantioselettività, buona stabilità termica, ampia gamma di substrati e
stabilità in diversi solventi organici e liquidi ionici.33
La CalB mostra versatilità nella biocatalisi
32
S. A. Paktar, F. Bjorkling, M. Zyndel, M. Schulein, A. Svendsen, E. Gormsen; Indian J. Chem., 1993, 32, 76–80.
33
P. Todler, J. Pleiss. Structural Biol., 2008,. Vol.8, pg.9
19
asimmetrica: tipicamente è usata per risolvere miscele racemiche o per produrre building blocks
chirali. Recentemente sono state usate modificazioni chimiche e tecniche di ingegneria molecolare
per migliorare la termostabilità e l’attività specifica dellaCalB.34
1.2.2 Pseudomonas cepacia lipasi (PcL)
La lipasi da Pseudomonas cepacia è espressa da un organismo procariotico. Come la maggior parte
delle lipasi subisce ampie variazioni conformazionali all’interfaccia olio-acqua. La cristallografia a
raggi X ha mostrato che questa lipasi è una α/β idrolasi e la triade catalitica è rappresentata da
Ser87, His286 e Asp264. La PcL rivela anche un sito d’azione accessibile al solvente per via della
sua conformazione molto aperta. Una struttura di questo tipo suggerisce che l’attivazione
interfacciale di questa proteina sia seguita da una riorganizzazione della struttura secondaria e da
un forte spostamento del lid che libera il sito attivo.
La PcL dimostra un’ottima attività nell’idrolisi di trigliceroli con lunghe catene.
Questo enzima è impiegato largamente per sintesi organiche e idrolasi per via della sua
enantioselettività.35
La sequenza degli amminoacidi che la compongono è stata dedotta dalla sequenza
complementare del DNA. La struttura polipeptidica matura comprende 320 residui amminoacidici
con una massa calcolata di 33128 Da. La PcL è un enzima globulare con dimensioni approssimate
di 30Åx40Åx50Å, e la sua struttura può venir suddivisa in un dominio più grande e due piccoli
domini, come schematizzato nella figura 1.12.
34
K. S. Siddiqui, R. Cavicchioli. Extremophiles, 2005, 9, 471-476.
35
Kyeong Kyu Kim, Hyun Kyu Song, Dong Hae Shin, Kwang Yeon Hwang and Se Won Suh, Triacylglycerol lipase,
Biophisical Journal,1997, 5(2), 187-202.
20
Figura 1.12 struttura secondaria della PcL
La PcL presenta nella sua struttura cristallografica lo ione Ca++
ritenuto importante per la stabilità
della proteina. Questo aspetto della PcL è stato studiato nel paragrafo 3.2.1, dove è stata messa a
confronto la stabilità della PcL dopo variazione termica, con e senza lo ione Ca++
.
Lo ione Ca2+
(Figura 1.13 forma sei legami di
coordinazione, interagendo con quattro
atomi di ossigeno della proteina e con due
molecole d’acqua. I quattro atomi proteici
che coordinano il Ca2+
includono l’atomo di
ossigeno del carbonile di Gln292 e Val296 e
l’Oδ2 di Asp242 e Asp288.
Il calcio è situato a 14.5Å dalla serina della
triade catalitica, quindi, il suo ruolo è
strutturale, con funzione principale di
stabilizzare la proteina.36
Figura 1.13 Rappresentazione a nastro della PcL (in
giallo lo ione Ca
++
)
36
Joseph D Schrag, Yunge Li, Miroslaw Cygler, Pseudomonas cepacia lipase structure, Biomed Experts, February
1997, 5:187–202
21
1.2.3 Lipasi da Rhizopus oryzae (Rol)
La lipasi da Rhizopus oryzae è una lipasi fungina. Viene sintetizzata come precursore che consiste
di 26 amminoacidi di presequenza, 97 amminoacidi di prosequenza e 269 amminoacidi che
formano una lipasi matura di 30kDa37
, come schematizzato in figura 1.14:
Figura 1.14 Schema della struttura della Rol
Il meccanismo d’azione della Rol è simile a quello delle altre lipasi27
, figura 1.15:
Figura 1.15 Meccanismo d’azione della Rol
37
Mitsuyoshi Ueda, Shouji Takahashi, Motohisa Washida, J. Mol. Catal. B:Enzymatic 17, 2002, 113-124
22
In letteratura non è presente la struttura cristallografica della Rol.
Recentemente è stato riportato che la Rol viene espressa in diversi ospiti quali: Escherichia coli,
Pichia pastoris, Saccharomyces cerevisiae, e Aspergillus oryzae.
Un’altra scoperta importante è la tossicità della Rol matura, dovuta a un basso livello di attività
della fosfolipasi C. Questa attività viene comunque mascherata dalla prosequenza evitando
danni38
.
1.3 Modellismo molecolare
La possibilità di simulare sistemi reali, di predirne le proprietà e riuscire a spiegare i dati
sperimentali, rende il modellismo molecolare uno strumento complementare alla ricerca
sperimentale.
Esso è in grado di offrire indicazioni su nuove vie di ricerca, migliorare l’attività di composti già
conosciuti o ridurre il numero di fallimenti. Il modellismo molecolare è una tecnica che permette
di costruire, facendo ricorso a complessi algoritmi di calcolo, dei modelli tridimensionali, di
ottimizzare la geometria delle molecole e di calcolarne le proprietà fisiche come ad esempio
l’energia, la distribuzione delle cariche, le interazioni intra- e intermolecolari.
Questo spiega il crescente interesse verso queste tecniche dovuto alla mancanza di tecniche
sperimentali di routine che permettano di osservare direttamente singoli atomi e molecole.
Con l’aumento della potenza di calcolo dei processori le tecniche computazionali sono diventate
sempre più sofisticate ed hanno permesso un ampliamento dei campi in cui è possibile applicare la
chimica computazionale. Nonostante la sempre maggior potenza dei moderni processori i calcoli
necessari a risolvere gli algoritmi richiedono tempi anche molto lunghi, e questi aumentano
proporzionalmente al numero di atomi del sistema, e quindi di variabili da considerare.
I metodi impiegati nel modellismo molecolare possono essere distinti in due gruppi:
- metodi quantomeccanici (ab initio o semiempirici);
- metodi di meccanica molecolare o metodo dei campi di forza.
38
Tigran V. Yuzbashev , Evgeniya Y. Yuzbasheva, Tatiana V. Vibornaya, Protein Expres. Purif. 82, 2012, 83-89
23
1.4 Meccanica quantistica e meccanica molecolare
La costruzione di un modello che possa essere in grado di descrivere accuratamente tutti gli
aspetti energetici e geometrici di una molecola, necessita, in primo luogo, di un processo di
“matematizzazione” della struttura. Per procedere in questo senso dovrebbe, prima di tutto,
essere perso il concetto di legame chimico così com’è conosciuto a favore di una visione della
molecola come insieme di atomi posti in un sistema di assi cartesiani; in questo modo è possibile
associare ad ogni atomo una terna di valori (coordinate spaziali) senza perdere alcuna
informazione geometrica come, ad esempio, la distanza di legame. Obiettivo primario del
modellismo molecolare è la correlazione dell’energia della molecola con la sua struttura e la sua
disposizione nello spazio.
Fin qui si è parlato spesso di energia, ma a questo punto si rende necessario definire cosa si
intende con questo termine, di che tipo è questa energia e qual è la natura della funzione che la
mette in relazione alla struttura.
L’energia ha due componenti, l’energia potenziale e l’energia cinetica, pertanto viene chiamata
energia dinamica:
Se la molecola è completamente ferma (0 K) o se si considera un sistema relativistico in cui ci
muoviamo insieme ad essa, l’energia cinetica è nulla; in questo caso l’energia totale deriva dal
solo contributo dell’energia potenziale e viene detta energia meccanica.
Ai fini della costruzione di un modello è utile, quindi, ottenere una funzione che metta in relazione
l’energia della molecola con la sua struttura:
Per fare questo è necessario ricorrere all’applicazione di alcuni principi:
- Leggi della meccanica quantistica: complicate e dispendiose in termini di tempo e risorse,
comprendono la meccanica quantistica (QM) e la dinamica quantistica (QD);
- Leggi della meccanica classica o Newtoniana: semplicistiche e non sempre sufficienti a
spiegare tutte le proprietà molecolari di interesse, comprendono la meccanica molecolare classica
(MM) e la dinamica molecolare classica (MD).
Una molecola piccola, come può essere un substrato, possiede un numero ristretto di atomi ed è
quindi facile e veloce eseguire i calcoli in modo quantistico, ma se la molecola in questione è una
24
macromolecola proteica costituita da migliaia di atomi, tutto diventa molto più lento e
complicato. E’ possibile unire i vantaggi dei due metodi ricorrendo ad un sistema ibrido (MM/QM),
un compromesso che permetta di definire una parte della molecola, solitamente la più importante
(es. il sito attivo), in modo “quantistico” e la parte rimanente, meno importante, in modo
“classico”. Va precisato che i sistemi MM/QM sono complicati dalla necessità di parametrizzare
adeguatamente l’interfaccia tra la parte QM e quella MM e quindi non sempre costituiscono la
migliore soluzione.
Non entreremo nei dettagli della meccanica quantistica ma ci occuperemo della meccanica
molecolare.
1.4.1 Meccanica molecolare: atom types e campi di forza
In meccanica molecolare (MM) l’atomo perde completamente la sua descrizione
quantomeccanica e viene semplicemente descritto come una sfera dotata di una massa, un
volume e una carica elettrica puntiforme in relazione al tipo di atomo che rappresenta. Per
recuperare il concetto di valenza associato ad ogni atomo, che viene perso con questa
approssimazione, si introduce il cosiddetto atom type che associa ad ogni sfera tutte le proprietà
descritte per ogni atomo, appunto, dalla sua valenza (numero di legami, ibridizzazione, ecc). Nella
meccanica molecolare, esistono tanti atom types quante sono le possibili situazioni chimiche in cui
ogni atomo può venirsi a trovare nel formare le differenti strutture molecolari.
Per descrivere le interazioni tra i vari atomi che costituiscono la nostra molecola, si utilizza, quindi,
una funzione matematica chiamata campo di forze o force field basata sulle leggi della meccanica
classica. Il campo di forze deve essere descritto da una funzione matematica semplice, continua e
differenziabile che descrive l’energia potenziale associata alla molecola in funzione delle
coordinate di tutti gli atomi che la costituiscono.
E’ fondamentale per la sua applicazione che la funzione dell’energia potenziale associata al campo
di forze bilanci opportunamente la semplicità della sua forma analitica con l’accuratezza nella
descrizione delle proprietà energetiche e strutturali delle diverse molecole analizzate. Si assiste
quindi ad una specializzazione che permette di utilizzare campi di forze differenti per ogni tipo di
molecola e di applicazione. In figura 1.16 sono riportati alcuni esempi dei campi di forze più
utilizzati.
25
MM2, MM3, MM4
(Allinger, 1977, 1988, 1989, 1996, 1997; Lii, 1989a, 1989b,
1989c, 1991, 1998; Nevins, 1996; Hay, 1998)
CFF93
(“Central Force Field”, Levy, 1979)
MMFF
(“Merck Molecular Force Field”, Halgren, 1992, 1996a,
1996b, 1996c, 1996d, 1996e)
Piccole
molecole
organiche
PEF95SAC
(Rasmussen, 1997)
Polisaccaridi
SHAPES
(Allured, 1991)
Complessi
Metallici
ECEPP
(“Empirical Conformational Energy Program for Peptides”,
Momany, 1975; Nemethy, 1983; Sippl, 1984)
CHARm
(“Chemistry at Harvard Macromolecular Mechanics”,
Brooks, 1983; MacKerell, 1998, 2004)
AMBER
(“Assisted Model Building with Energy Refinement”,
Weiner, P.K. 1981; Weiner, S.J. 1984; Kollman, 1986, 1995;
Pearlman, 1991; Ponder, 2003) OPLS (“Optimised
Potentials for Liquid Simulations”, Jorgensen, 1988, 1996;
Kaminski, 1994; Damm, 1997)
GROMOS
(“Groningen Molecular Simulation”, Hermans, 1984; Ott,
1996)
Proteine e
nucleotidi
Figura 1.16 Esempi di specializzazione del campo di forze
26
La meccanica molecolare, però, presenta, alcuni limiti intrinseci alle teorie stesse su cui si basa:
- l’eliminazione dalla trattazione matematica della struttura intima di ogni atomo e, quindi la
rappresentazione esplicita della sua configurazione elettronica limita l’applicazione
principalmente allo studio degli stati fondamentali delle strutture molecolari, in quanto risulta
impedita la descrizione accurata di ogni processo che implica scissione o formazione di legami;
- i risultati ottenuti sono rigorosamente legati alla bontà della funzione dell’energia potenziale
(force field) e dall’insieme dei parametri associati ad ogni atom type;
- la funzione dell’energia potenziale descritta dal campo di forze ha scarso significato chimico,
ad eccezione delle strutture associate a conformazioni termodinamicamente stabili e, in alcuni
casi, alle barriere energetiche rotazionali.
Il campo di forze è, quindi, una funzione empirica dell’energia potenziale; l’origine di questi “force
fields methods”, nati per essere applicati principalmente allo studio dell’analisi conformazionale, è
contemporanea allo sviluppo delle applicazioni dei metodi quantomeccanici (anni ’60). Essi
derivano dalla spettroscopia vibrazionale in cui è necessario costruire delle particolari funzioni
dell’energia potenziale per poter utilizzare le informazioni spettroscopiche nella descrizione del
comportamento complessivo di una molecola. In questo campo, la funzione dell’energia
potenziale usata per descrivere le vibrazioni molecolari è simulata da:
- una funzione matematica che è la sommatoria di tutte le interazioni tra atomi, senza una
precisa correlazione alla struttura covalente della molecola39
;
- una funzione matematica legata ai valori delle distanze e degli angoli interatomici40
; a
differenza del modello CFF, questo modello è strettamente dipendente dalla molecola.
Da questi differenti approcci si è sviluppata l’odierna meccanica molecolare basata sul concetto
del campo di forze; i calcoli che questa metodica permette sono di notevole importanza per la
chimica organica moderna, trovando impiego nel calcolo delle conformazioni molecolari, delle
proprietà termodinamiche e degli spettri vibrazionali.
Queste metodiche, come già visto, trattano la molecola come un insieme di particelle tenute
insieme da semplici forze armoniche che possono essere descritte, in termini di energia
potenziale, sommando tutti i fattori sterici che vi contribuiscono. Ne risulta la seguente
equazione41
39
J. Maple, M. Hwang, T. Stockfish, U. Dinur, M Waldman, C. Ewig, A. Adler, J. Comput. Chem., 1994, 15, 161
40
J. Martins, A. Zunger, Phys. Rev., 1984, 30, 6217
41
P. Cox, J. Chem. Educ., 1982, 59, 275
27
dove Estr è l’energia dovuta alla deformazione dei legami lungo l’asse (stiramento o compressione),
Ebend è l’energia dovuta al piegamento, Etors è l’energia dovuta alla torsione dei legami, Enb è
l’energia dovuta a interazioni di non legame quali quelle elettrostatiche e quelle di van der Waals,
EH-bonds è l’energia dovuta alla formazione di legami idrogeno ed Ei è un termine che include gli
effetti del solvente o altri termini particolari. Ognuno di questi termini rappresenta una
deformazione della molecola da un’ipotetica geometria di riferimento. Ad esempio se la lunghezza
di un legame Csp3- Csp3 libero da tensioni è di circa 1.5-2.0 Å, ogni deviazione da tale valore causa
un incremento dell’energia potenziale.
Il fattore che descrive la deformazione del legame può essere espresso con la seguente formula:
dove Kl (kcal/mol・Å2
) è la costante elastica della forza, l è la lunghezza del legame (Å), l0 è la
lunghezza dello stesso legame libero da tensioni e la sommatoria si intende per tutti i legami della
molecola.
L’energia potenziale riferita agli angoli di valenza, θ, è descritta dalla formula:
dove Kθ è la costante di bending [kcal/mol・(°)2
], θ è il valore dell’angolo tra due legami adiacenti
(°) e θ0 corrispondente al valore dello stesso angolo libero da tensioni.
Per quel che riguarda gli angoli di torsione, il contributo energetico è dato dalla seguente formula:
dove Kω è una costante di forza che esprime, nello specifico, l’impedimento energetico alla
rotazione libera (kcal/mol), ω rappresenta l’angolo di torsione (°), n è la periodicità di Kω ed s può
assumere i valori +1 (energia minima, conformazione sfalsata) o -1 (energia massima,
conformazione eclissata).
L’energia potenziale dovuta alle interazioni di non legame (elettrostatiche e van der Waals)
dipendenti dalla distanza r, può essere espressa con la formula:
28
dove Aij è il coefficiente che descrive le interazioni repulsive atomiche (AiAj)1/2
, Bij è il coefficiente
che descrive le interazioni attrattive atomiche (BiBj)1/2
, qi e qj sono le cariche nette sugli atomi i e j,
ε è la costante dielettrica del mezzo e Rij è la distanza tra i due atomi i e j (Å).
Infine, il contributo apportato dalla formazione di legami idrogeno è espresso mediante la
formula:
in cui Cij è il coefficiente che descrive le interazioni repulsive tra atomi di idrogeno e accettore
(CiCj)1/2
, Dij è il coefficiente che descrive le interazioni attrattive tra atomi di idrogeno e accettore
(DiDj)1/2
e Rij è la distanza tra i due atomi (Å).
Possono essere usati, ove necessario, altri fattori aggiuntivi che tengono conto delle deformazioni
fuori dal piano e delle interazioni di Coulomb e del solvente.
Per costruire un campo di forze sono necessari molti parametri come le costanti di forza e i valori
geometrici in assenza di tensioni. Essi possono essere determinati mediante esperimenti
termodinamici e di diffrazione eseguiti su un numero elevato di molecole opportune. I valori
iniziali così ottenuti spesso sono solo una stima grossolana e devono essere perfezionati da
metodi “per tentativi” o con il più razionale metodo dei “minimi quadrati”. La qualità del campo di
forze che ne deriva è definita dalla sua capacità di riprodurre i dati con un’accuratezza maggiore o
uguale a quella dei metodi sperimentali33
.
Per un uso ottimale è necessario essere in possesso di un set di coordinate tridimensionali degli
atomi della molecola in esame, il quale sarà progressivamente modificato durante i calcoli
effettuati per minimizzare l’energia sterica. E’ possibile assumere che, di tutti i vari isomeri
conformazionali possibili per la nostra molecola, quello che possiede il più basso valore di energia
rappresenti la conformazione più favorevole per la molecola isolata.
E’ importante sottolineare che la meccanica molecolare è fondamentalmente un metodo empirico
e il modello che si ottiene con essa è riferito ad un ipotetico stato di immobilità allo zero assoluto.
Differenze tra campi di forza diversi sono illustrati in figura 1.17:
29
Figura 1.17 illustrazione schematica di differenti campi di forza
Il campo di forza Martini42
è un coarse grained cioè un campo di forza a grana grossa. Si sceglie di
utilizzare questo campo di forza per diminuire i tempi di calcolo, perché la definizione degli atomi
è ridotta, cioè i gruppi funzionali sono rappresentati come particelle grossolane piuttosto che
descritte atomo per atomo (come succede nei campi di forza all-atom o united-atom). Quindi il
campo di forza Martini si utilizza quando non c’è necessità di analizzare legami idrogeno o altri
fenomeni fini. Viene così aumentata l’efficienza computazionale.
Il campo di forza GROMOS 96 53a643
, invece, è un campo di forza United-Atom, cioè un campo di
forza che non include gli atomi di idrogeno non polari.
Infine il campo di forza OPSL44
, è un campo di forza All-Atom. Questo significa che riconosce tutti
gli atomi, idrogeni compresi. Il tempo di calcolo diventa più lungo proprio per questo motivo.
In base alle necessità computazionali, si sceglie di usare un opportuno campo di forza, come
vedremo anche più avanti nella discussione della tesi.
42
S. J. Marrink , H. J. Risselada ,S. Yefimov , D. P. Tieleman , A. H. de Vries, J. Phys. Chem. B, 2007, 111 (27), 7812–
7824
43
C. Oostenbrink, T. A. Soares, N. F. A. van der Vegt, W. F. van Gunsteren,EBJ, 2005,34(4), 273-284
44
W. L. Jorgensen, J. T.Rivers, JACS, 1988, 110 (6), 1657–1666
30
1.4.2 Analisi conformazionale
Le trasformazioni conformazionali cui una molecola può andare incontro sono principalmente
determinate da variazioni negli angoli di torsione, in quanto cambiamenti delle lunghezze e degli
angoli dei legami avvengono in misura molto minore.
I cambiamenti della conformazione di una molecola possono essere considerati come movimenti
all’interno di una superficie multidimensionale che descrive le relazioni esistenti tra l’energia
potenziale e la geometria della molecola stessa. Ogni punto appartenente a questa superficie
rappresenta l’energia potenziale della conformazione corrispondente assunta dalla molecola.
Conformazioni energeticamente stabili corrispondono a minimi locali su questa superficie.
La popolazione relativa di una determinata conformazione dipende dal suo “peso” statistico che è
a sua volta influenzato non solo dall’energia potenziale, ma anche dall’entropia.
Di conseguenza, il minimo assoluto nella superficie dell’energia potenziale, che caratterizza la
conformazione dotata della minore energia potenziale, non corrisponde sempre alla struttura che
presenta la maggiore incidenza statistica38
.
Le tecniche sperimentali, come la spettroscopia NMR, sono in grado di fornire informazioni riferite
solo ad una o a poche conformazioni per ogni molecola. Un’analisi completa di tutte le
conformazioni potenziali per una struttura può essere ottenuta solo con metodi teorici.
Per questo motivo, sono stati sviluppati numerosi metodi teorici per l’analisi conformazionale.
I più generali sono in grado di identificare tutti i minimi sulla superficie dell’energia potenziale, ma
aumentando il numero di legami singoli in grado di ruotare, aumenta il numero di minimi relativi,
per cui un’analisi esaustiva diventa un lavoro che necessita di tempi elevati. Il tempo richiesto per
un’analisi conformazionale dipende, inoltre, dal tipo di metodo utilizzato per il calcolo
dell’energia. I metodi basati sulle leggi della quantomeccanica sono molto dispendiosi in questo
senso, di conseguenza la maggior parte dei programmi per la ricerca conformazionale utilizza
metodi basati sulla meccanica molecolare per il calcolo delle energie.
1.4.2.1 Procedure di ricerca conformazionale sistematica
La ricerca sistematica rappresenta, forse, il metodo più semplice e naturale tra quelli oggi utilizzati
per la ricerca conformazionale, in quanto genera le possibili conformazioni attraverso la
variazione, appunto, sistematica di ogni angolo di torsione presente in una molecola.
31
Se il valore scelto per l’incremento di ogni singolo angolo preso in esame da questa metodica è
sufficientemente piccolo, può essere ottenuta un’esplorazione completa dello spazio
conformazionale di una molecola45
.
Il numero di conformeri generati dipende, quindi, dal valore dell’angolo di incremento scelto, ma
anche dal numero di legami rotabili: se n è il numero di questi legami, il numero di conformazioni
cresce con la n-esima potenza, come si può facilmente intuire dalla formula seguente in cui N è il
numero di conformeri generati e δ è l’angolo di incremento.
In alcuni casi, il risultato in termini di differenti conformazioni è talmente elevato da non poter
essere analizzato facilmente. Si rende quindi necessaria l’applicazione di alcuni artifici per la
riduzione del numero di conformeri ottenibili. Il primo passo in questo senso, viene effettuato
prima del calcolo dell’energia potenziale analizzando le strutture e scartando quelle in cui si
verificano sovrapposizioni del volume occupato da atomi non direttamente legati tra loro (“van
der Waals screening” o “bump check”).
I conformeri rimanenti sono sottoposti al calcolo dell’energia potenziale utilizzando metodi di
meccanica molecolare, con la possibilità di “scremare” ulteriormente le strutture utilizzando un
intervallo di energia che elimina le conformazioni dotate di valori di energia esterni ad esso.
Le conformazioni risultanti da questi “filtri” rappresentano un insieme completo dei conformeri
energeticamente accessibili per la molecola in esame46
.
1.4.2.2 Metodo “Monte Carlo” o “random search”
Il metodo Monte Carlo38
, così chiamato dal suo ideatore von Neumann alludendo alla capitale del
Principato di Monaco, esegue la ricerca delle possibili conformazioni di una struttura utilizzando
tecniche statistiche. Ad ogni passo della ricerca, l’ultima conformazione generata viene modificata
in maniera casuale per ottenerne un’altra. La ricerca deve iniziare da una struttura già ottimizzata,
essendo questo un requisito fondamentale per incrementare la bontà dei risultati.
Ad ogni iterazione, i nuovi angoli di torsione e/o le nuove coordinate cartesiane sono assegnati
casualmente. Le conformazioni risultanti sono quindi minimizzate con metodi che utilizzano la
45
Höltje, G. Folkers, Molecular Modeling, Basic Principles and Applications, 1997, Wiley.VCH ed., Weinheim,
Germany.
46
W. Hastings, Biometrika, 1970, 57, 97.
32
meccanica molecolare e il processo di ricerca casuale viene ripetuto. Ogni conformazione
generata viene confrontata con le precedenti e conservata solo se differente da esse.
Questo processo garantisce, in teoria, un’esplorazione completa di tutte le regioni dello spazio
conformazionale, ma, praticamente, questo è possibile solo se il processo viene eseguito per un
tempo sufficiente, che potrebbe diventare molto lungo in quanto la probabilità di trovare una
conformazione nuova e unica decresce drasticamente con l’aumentare del numero di conformeri
già scoperti. In realtà, se una conformazione è stata trovata per un numero n di volte, la
probabilità che tutte le conformazioni ricercate siano state trovate è [1-(1/2)n
]. Numericamente
parlando, l’algoritmo utilizzato da questo metodo arresta la ricerca quando la stessa struttura è
stata ottenuta otto volte, garantendo così l’esplorazione del 99.6% circa dello spazio
conformazionale.
Il vantaggio maggiore di questa tecnica consiste nella teorica possibilità di trattare con successo
strutture di qualsiasi dimensione, anche se, in pratica, molecole dotate di elevata flessibilità
raramente danno risultati convergenti a causa dell’ampiezza del loro spazio conformazionale.
Un altro vantaggio è la possibilità di analisi di sistemi ciclici che risultano generalmente difficili da
trattare mediante ricerca sistematica.
Riguardo questa tecnica, è utile sottolineare che essa è in grado di eseguire ricerche
conformazionali di ottima qualità per diversi tipi di molecole, ma potrebbe richiedere tempi di
calcolo troppo elevati per assicurare un’analisi completa di tutto lo spazio conformazionale.
1.4.2.3 Dinamica molecolare
Questo metodo è in grado di studiare il moto ed esplorare le possibilità conformazionali di una
struttura molecolare, anche dotata di particolare complessità, senza essere affetto dalle
limitazioni tipiche della Ricerca Sistematica e degli elevati tempi di calcolo che caratterizzano il
metodo Monte Carlo. Il principio di questo metodo si basa sull’integrazione delle classiche
equazioni del moto che derivano dalla Seconda Legge di Newton38
:
in cui Fi è la forza agente sull’atomo i al tempo t, mi è la massa dell’atomo i e ai è l’accelerazione
dell’atomo i al tempo t.
La forza agente sull’atomo i può essere calcolata direttamente derivando la funzione dell'energia
potenziale E rispetto alle sue coordinate ri:
33
Questa equazione classica del moto permette di determinare le coordinate e la velocità dopo un
certo tempo (traiettoria). Il gradiente dell’energia potenziale, calcolato dal campo di forze, viene
usato per determinare le forze che agiscono su ogni singolo atomo mentre le velocità iniziali degli
atomi vengono generate in maniera casuale all’inizio della simulazione. Questa simulazione, la cui
durata può essere stabilita inizialmente, genera un insieme di conformazioni energeticamente
accessibili per la molecola in esame.
Rispetto alle altre metodiche di analisi conformazionale, la dinamica molecolare presenta un
vantaggio che consiste nell’automatica eliminazione dei conformeri energeticamente non
accessibili, ma anche un limite costituito dalla possibilità che le barriere energetiche che separano
le diverse conformazioni del sistema possano essere troppo elevate per essere superate,
escludendo dall’esplorazione alcune regioni dello spazio conformazionale. Quest’ultimo
inconveniente può essere superato impostando nella simulazione delle temperature adeguate che
permettono il superamento di tali barriere.
I calcoli del moto degli atomi vengono effettuati ad intervalli discreti (time steps) la cui entità può
essere definita. Lo spostamento di un atomo nel time step è calcolato con il metodo di Verlet47
che utilizza la velocità nel punto medio dell’intervallo di tempo, dato che la velocità non è
costante all’interno di esso; questa velocità viene estrapolata dai valori di velocità e accelerazione
dello step precedente, secondo il seguente algoritmo:
dove F(t + Δt), forza che agisce sull’atomo, è calcolata derivando la funzione dell’energia
potenziale rispetto alla posizione r(t+ Δt).
Per garantire una corretta integrazione delle equazioni del moto e ridurre, quindi, l’errore nel
calcolo dell’energia del sistema, è necessario che l’intervallo di integrazione sia compreso tra
1/100 e 1/20 del tempo associato al moto più veloce a cui il nostro sistema molecolare è
sottoposto.
47
L. Verlet, Phys. Rev., 1968, 165, 201.
34
In dinamica molecolare classica il moto più veloce è associato proprio alla vibrazione del legame
(10÷100 fs). Se i time steps sono troppo elevati, ne deriva uno spostamento atomico troppo
elevato; d’altro canto, intervalli di tempo di piccole dimensioni comportano l’analisi di un maggior
numero di conformazioni con conseguente aumento dei tempi di calcolo.
Un ottimo compromesso può essere ottenuto mediante l’utilizzo dell’algoritmo Shake48
, che
permette di congelare i moti vibrazionali dei legami con gli atomi di idrogeno (C-H, N-H, O-H, etc.).
Questo algoritmo va, comunque, utilizzato impostandone i parametri con cautela in quanto un
numero troppo elevato delle iterazioni che potrebbero derivarne annullerebbe il vantaggio
derivante dall’utilizzo di time steps più grandi. Solitamente, nello studio di interazioni tra un
ligando e una molecola proteica vengono preimpostate durate dell’ordine delle unità di ps49
,
mentre gli intervalli di tempo utilizzati vanno da 1 fs fino ad un massimo di 5 fs, utilizzando
l’algoritmo Shake. In una simulazione di dinamica molecolare, la temperatura viene inizialmente
portata da 0 K alla temperatura predeterminata per la simulazione stessa (equilibration stage);
una volta raggiunta, questa temperatura viene mantenuta per tutta la durata preimpostata della
dinamica.
Nella fase di equilibratura della temperatura (equilibration stage), la velocità di tutti gli atomi
viene modificata in modo uniforme per mantenere delle popolazioni cineticamente omogenee:
dove T0 rappresenta la temperatura di esperimento e T è la temperatura del sistema.
Dopo l'equilibratura, il sistema è mantenuto a temperatura costante mediante l’utilizzo del
metodo di Berendsen50
, con il quale la velocità viene messa in relazione con le piccole oscillazioni
di temperatura attraverso un fattore λ, dato dalla formula:
dove Δt è l'ampiezza del time step, τ è il tempo di rilassamento, T0 è la temperatura della
simulazione e T è la temperatura istantanea. La temperatura che viene raggiunta dopo la fase
iniziale di equilibratura, va incontro a delle oscillazioni e va, pertanto, mantenuta il più possibile
costante operando continui aggiustamenti; queste oscillazioni nei valori della temperatura sono
48
J. Ryckaert, G. Cicciotti, H. Berendsen, J. Comput. Phys., 1977, 23, 327.
49
M. Norin, K. Hult, Biocatalysis, 1993a, 7, 131.
50
H. Berendsen, J. Postma, W. van Gunsteren, A. Di Nola, J. Haak, J. Chem. Phys., 1984, 81, 3684.
35
imputabili al fatto che l'energia del sistema varia anche in funzione della posizione degli atomi,
riflettendosi in un’ulteriore variazione della temperatura.
Per quanto riguarda la pressione, la trattazione che viene utilizzata è del tutto analoga a quella
appena vista per la temperatura. Una tecnica che viene spesso utilizzata consiste nella definizione
degli aggregati, cioè di gruppi di atomi le cui posizioni vengono mantenute costanti nel corso della
simulazione, ma il cui contributo energetico viene calcolato e tenuto in considerazione nel calcolo
totale.
Questa strategia è maggiormente impiegata nella valutazione dell’interazione tra enzima e
substrato, in cui risultano di particolare interesse solo gli amminoacidi vicini al sito attivo. Il
principale vantaggio che ne deriva è, ovviamente, la riduzione dei tempi di calcolo. I fenomeni
chimico-fisici che si verificano a livello atomico e molecolare possono richiedere periodi di tempo
estremamente vari, da pochi femtosecondi a diverse decine di secondi.
In figura 1.18 è riportata la scala temporale dei movimenti atomici e molecolari. E’ possibile
osservare che:
- il trasferimento di elettroni è il fenomeno più rapido ed avviene in pochi femtosecondi (1 fs =
10-15
sec). Per poter descrivere accuratamente tale fenomeno è necessario ricorrere alle equazioni
della meccanica quantistica, estremamente dispendiose da un punto di vista computazionale.
Tuttavia, se il sistema è costituito da un numero limitato di atomi, dal momento che il fenomeno
avviene in un periodo estremamente breve, può essere simulato al computer in tempi
sufficientemente brevi;
- il movimento delle catene amminoacidiche di una proteina avviene in un periodo di tempo
superiore, nell’ordine dei picosecondi (1 ps = 10-12
sec). Per simulare con estrema precisione
questo fenomeno sarebbe necessario ricorrere alle leggi della meccanica quantistica, ma l’elevata
complessità del sistema e il periodo di tempo eccessivamente lungo, renderebbero la simulazione
irrealizzabile. Per questo motivo il sistema dev’essere semplificato e si ricorre alla meccanica
molecolare. Con tali approssimazioni un moderno computer è in grado di simulare il sistema senza
troppe difficoltà nell’arco di alcune ore;
- i cambiamenti conformazionali sono fenomeni complessi e richiedono decine o centinaia di
nanosecondi (1 ns = 10-9
sec). Per poter essere simulati è spesso necessario ricorrere
approssimazioni maggiori rispetto al punto precedente. I tempi di calcolo aumentano
considerevolmente fino richiedere diverse settimane o alcuni mesi;
36
- il folding di peptidi, enzimi o acidi nucleici è il fenomeno più difficile da simulare e la sua
durata è proporzionale al numero di atomi che costituiscono il sistema. Sequenze di alcune
centinaia di amminoacidi si ripiegano normalmente in alcuni microsecondi (1 μs = 10-6
sec) o
millisecondi (1 ms = 10-3
sec), mentre il folding di sistemi complessi, come gli enzimi o il DNA,
avviene in diversi secondi. Per simulare questo fenomeno è necessario disporre di potenti
macchine da calcolo costituite da migliaia di processori.
Figura 1.18: Scala temporale dei movimenti atomici e molecolari.
1.4.2.4 Metodi di minimizzazione
L’energia potenziale di una molecola è direttamente correlata alle sue caratteristiche chimiche e
alla sua geometria. Il processo di minimizzazione consiste nell’applicazione di metodi matematici
iterativi allo scopo di ottimizzare geometricamente la struttura e di raggiungere la situazione
spaziale (set di coordinate atomiche) corrispondente al minimo energetico.
Nell’analisi della funzione dell’energia potenziale effettuata con questi metodi iterativi, sono
presenti tre problematiche computazionali principali:
- la scelta della direzione iniziale di ottimizzazione, particolarmente critica se ci troviamo in
spazi multidimensionali;
37
- la ricerca della massima riduzione del numero di steps per il raggiungimento della situazione
di minimo più vicina. Va ricordato che, ad ogni variazione delle coordinate, il campo di forze deve
essere riapplicato per il calcolo dell’energia potenziale;
- la scelta del criterio matematico per la determinazione dell’avvenuto raggiungimento del
minimo (criterio di convergenza).
Un cenno a parte merita anche il problema dell’evasione da eventuali minimi relativi e locali
sull’ipersuperficie dell’energia potenziale. I tradizionali metodi di minimizzazione sono, infatti, in
grado di individuare solo i minimi più prossimi al punto di partenza. Fattore determinante in
questo senso è la conformazione di partenza: l’unico modo per trovare il minimo assoluto consiste
nell’applicazione delle metodiche per la ricerca conformazionale descritte in precedenza al fine di
ottenere un insieme di conformazioni di partenza da analizzare, in seguito, con i processi di
minimizzazione.
I metodi utilizzati per questi processi possono essere divisi in due categorie in base al tipo di
algoritmi matematici che utilizzano:
- metodi non derivativi: il più utilizzato tra questi è il “Simplex method”51
basato su un
algoritmo matematico molto leggero in termini di complessità di calcolo, ma che risulta anche
scarsamente efficiente; il suo utilizzo è ristretto ai casi in cui vengono modellate superfici di
energia potenziale a topologia estremamente complessa (strutture ad elevato grado di distorsione
che presentano una funzione dell’energia potenziale e la sua derivata non continue). Questo
metodo agisce su ogni atomo finché le forze su di esso non scendono sotto un determinato valore
soglia.
- metodi derivativi: come già visto, tra i requisiti fondamentali che una funzione che descrive
un campo di forze deve possedere, troviamo la continuità e la differenziabilità in ogni suo punto;
infatti, dall’analisi delle derivate prima e seconda di queste funzioni matematiche possiamo
ottenere informazioni sulla topologia della superficie dell’energia potenziale. Tra questi metodi
sono presenti tre approcci fondamentali, denominati Steepest descent, Conjugated gradient e
Truncated Newton52
.
Il metodo Steepest descent ricerca la situazione di minimo individuando e scendendo lungo una
direzione associata alla maggior pendenza della superficie dell’energia potenziale. Il metodo
utilizzato è quello definito “line searching” che prevede cambi di direzione sempre perpendicolari
51
T. Darden, D. York, L. Pedersen, J. Chem. Phys., 1993, 98, 10089.
52
W. Press, B. Flannery, S. Teukolski, W. Vetterling, The Art of Scientific Computing, 1988, Cambridge University
Press, Cambridge, UK.
38
tra loro. Questo metodo non rappresenta il miglior algoritmo di ottimizzazione, risultando
grossolano nella convergenza, ma può essere comunque utilizzato nella consapevolezza di trovarsi
molto lontani dal possibile minimo. Può per questo essere definito un “algoritmo di
avvicinamento”.
Il Conjugated gradient è un’evoluzione del metodo precedente che utilizza ancora il metodo del
gradiente nella scelta della direzione e il metodo “line searching” per l’ottimizzazione del
percorso, ma in questo caso ogni step viene conservato (memorizzato) in modo da evitare che sia
ripercorso una seconda volta. Questo processo è decisamente più dispendioso, in termini
computazionali, poiché la scelta del percorso ad ogni nuovo step segue l’analisi dei percorsi già
effettuati. D’altro canto, l’aumento dell’efficienza di convergenza ne giustifica l’impiego.
Infine, nel metodo Truncated Newton, per identificare la direzione di ricerca, oltre al gradiente
viene usata la funzione di curvatura (derivata seconda). Questo metodo viene applicato quando il
minimo è vicino al punto di partenza, quando la funzione è “quasi” un’armonica, altrimenti sono
possibili divergenze (allontanamento dal minimo rispetto al punto di partenza).
Per quanto riguarda la determinazione del raggiungimento del minimo, vengono presi in
considerazione un criterio geometrico (la variazione di coordinate spaziali tra due step successivi
deve essere uguale a zero) e uno energetico (la variazione di energia potenziale tra due step
successivi deve essere uguale a zero) per poi analizzare il gradiente che ne deriva; quando il valore
di questo gradiente è uguale a zero, la situazione di minimo è stata raggiunta.
Per il raggiungimento teorico dei criteri di convergenza (0), sarebbe necessario un numero di step
molto elevato; per questo motivo si preferisce impostare un valore per la convergenza del
gradiente vicino allo zero (es. 0.01).
1.4.3 Gromacs
GROMACS è l’acronimo di GROningen MAchine for Chemical Simulations48,53
. E’ un software
sviluppato dal gruppo di ricerca del prof. Berendsen e del prof. Van Gunsteren del Dipartimento di
Chimica dell’Università di Groningen a partire dalla seconda metà degli anni ’80.
53
L. Verlet, Phys. Rev., 1968, 165, 201.
39
E’ una collezione di programmi e librerie per la
simulazione di dinamiche molecolari (MD) e le analisi
dei dati delle traiettorie. Sebbene sia stata
primariamente progettato per molecole biologiche
con complesse interazioni di legame,
l’implementazione dei calcoli delle forze di non-
legame lo rende adatto per ogni genere di
simulazione di dinamica molecolare.
E’ essenzialmente basato sul pacchetto sequenziale
GROMOS, che è stato sviluppato per simulare
bio(macro)molecole in soluzione.
Le scelte progettuali che sono state scelte per la
realizzazione di GROMACS sono le seguenti:
- ci sono tre tipi di forze: forze di legame basate su delle liste prefissate che includono
interazioni four-body che permettono di descrivere in maniera più appropriata gli angoli di
torsione, forze di non legame basate su liste dinamiche di coppie di particelle, e forze esterne che
tengono conto delle forze di non equilibrio.
- il calcolo delle forze di non legame è basato su una lista di coppie che viene aggiornata ogni n
steps. Le particelle sono suddivise in gruppi carichi che contengono una o alcune particelle. Il
criterio di inclusione nella lista dipende se il centro del gruppo carico è contenuto in un dato
raggio di cut-off. Questa procedura evita la creazione di cariche da gruppi neutri applicando un
criterio di cut-off ad ogni coppia di atomi parzialmente carichi.
- facoltativamente può essere usata anche una twin-range cut-off: mentre viene fatta una lista
di coppie per ogni gruppo di atomi con un raggio di cut-off Rshort, vengono calcolate le forze di
Coulomb tra le particelle e gruppi carichi alle distanze comprese tra Rshort e Rlons, accumulate
per ogni atomo e memorizzate. Queste forze long-range sono mantenute costanti per n time steps
e aggiunte alle forze short-range.
- l’algoritmo leap-frog, che è equivalente all’algoritmo Verlet54
, è usato per risolvere
l’equazione di moto. Questo coinvolge la posizione a intervalli discreti di tempo, misurati in time
steps, e le velocità. Il sistema viene mantenuto a valori costanti di temperatura e pressione.
54
S. Miyamoto, Kollman, J. Comput. Chem., 1992, 13, 952.
40
- la lunghezza dei legami covalenti e degli angoli può essere limitata. Le risultanti equazioni con
dei dati parametri di constrain vengono risolte mediante l’algoritmo Shake55
che cambia la
configurazione priva di constrain in una configurazione con constrain, con lo spostamento dei
vettori verso una nuova direzione basata su una configurazione di riferimento.
E’ utile a questo punto considerare i limiti delle simulazioni delle MD. E’ necessario infatti
effettuare delle conferme sperimentali delle proprietà del sistema per verificare l’accuratezza
delle simulazioni.
1. Le simulazioni sono classiche
L’utilizzo dell’equazione di moto di Newton implica necessariamente l’uso della meccanica classica
per descrivere il moto degli atomi. Questo approccio è sufficientemente accurato per la maggior
parte degli atomi alle temperature normali, ma esistono alcune eccezioni. Gli atomi di idrogeno
sono abbastanza leggeri e il moto dei protoni è talvolta di carattere essenzialmente quanto-
meccanico. Per esempio un protone può attraversare una barriera di potenziale durante un
trasferimento su un legame idrogeno. Un altro esempio è dato dall’elio liquido a basse
temperature dove le leggi della meccanica classica falliscono nuovamente. La meccanica statistica
di un classico oscillatore armonico differisce in modo significativo da quello di un reale oscillatore
quantico, quando l’energia di risonanza υ si avvicina o eccede KBT/h. A temperatura ambiente il
numero d’onda σ = 1/λ = υ/c dove hυ = kBT/h è approssimativamente 200 cm-1
. Così tutte le
frequenze maggiori di 100 cm-1
non possono essere trattate nelle simulazioni classiche. Questo
significa che in pratica tutte le vibrazioni di legame, degli angoli di legame e i legami idrogeno
vanno oltre i limiti della meccanica classica.
Esempi di lunghezze d’onda a cui cadono alcuni legami sono riportate in figura 1.19:
Quindi cosa si può fare?
Oltre a reali simulazioni quanto-dinamiche, è possibile procedere in due modi diversi:
55
W. van Gunsteren, H. Berendsen, Mol. Phys., 1977, 34, 1311.
41
tipo di legame tipo di vibrazione lunghezza d’onda (cm-1
)
C-H, O-H, N-H stretching 3000-3500
C=C, C=O stretching 1700-2000
HOH bending 1600
C-C stretching 1400-1600
H2CX scissoring, rocking 1000-1500
CCC bending 800-1000
O-H...O libration 400-700
O-H...O stretching 50-200
Figura1.19 Esempi di frequenze vibrazionali di legame
- se si impiegano delle simulazioni di MD usando degli oscillatori armonici per i legami, si
dovrebbero effettuare delle correzioni all’energia interna totale U = Ekin + Epot e alla specifica Cv
(e all’entropia S e all’energia libera A o G se sono state calcolate). Le correzioni all’energia e alla
specifica capacità termica di un oscillatore monodimensionale con frequenza υ sono:
dove x = h/KT. L’oscillatore armonico assorbe infatti troppa energia (KT), mentre l’oscillatore
quantico ad alta frequenza è nel suo stato fondamentale al livello energetico zero di ½ h.
- è possibile trattare i legami, e gli angoli di legame, come constraints (ovvero vincoli)
nell’equazione di moto. Il ragionamento all’origine di tale scelta è che un oscillatore quantico nel
suo stato fondamentale è simile a un legame strettamente vincolato di un oscillatore classico. Di
conseguenza l’algoritmo può impiegare un maggior numero di time steps quando le alte frequenze
sono state rimosse e il time step può essere calcolato un numero di volte maggiore quando i
legami sono vincolati rispetto a quando sono oscillatori56
.
56
M. Born, J. Oppenheimer, Ann. Phys, 1927, 84, 457.
42
2. Gli elettroni sono nello stato fondamentale
Nelle MD si usa un force field conservativo che è una funzione della posizione dei soli atomi.
Questo significa che il moto degli elettroni non è considerato: si presuppone infatti che gli
elettroni modifichino la propria traiettoria istantaneamente quando mutano le posizioni degli
atomi (approssimazione di Born-Oppenheimer57
), e rimangano nel loro stato fondamentale.
Questo è corretto nella maggior parte delle situazioni. Naturalmente i processi di trasferimento
degli elettroni e gli stati eccitati degli elettroni non possono essere trattati.
3. I force fields sono approssimati
I force fields tengono conto delle forze. Non fanno realmente parte del metodo della simulazione
e i loro parametri possono essere modificati a seconda delle circostanze, ma devono sottostare a
determinate limitazioni. Il force field presente nella versione 4.0.2 di GROMACS è additivo dalle
forze di Coulomb long-range), non può incorporare polarizzazioni e non contiene le interazioni di
legame finemente modulate.
4. Il force field è somma delle interazioni dei doppietti
Questo significa che tutte le forze di non-legame sono il risultato della somma delle coppie di non
legame. Solo la media di tali contributi è incorporata nel force field. Questo significa che non sono
valide per long pairs isolate o per situazioni che sono apprezzabilmente differenti da quelle per le
quali il modello è stato parametrizzato. L’omissione della polarizzazione significa inoltre che gli
elettroni nell’atomo non contribuiscono alla costante dielettrica come dovrebbero. Ad esempio,
nei liquidi reali gli alcani hanno una costante dielettrica poco superiore a 2 che riduce le
interazioni elettrostatiche tra cariche parziali. Di conseguenza le simulazioni tendono a
sovrastimare i termini di Coulomb long-range. Fortunatamente il prossimo parametro tende a
compensare in parte questo effetto.
5. Le interazioni long-range sono cut-off
Viene usato un raggio di cut-off per le interazioni di Lennard-Jones58
e alcune volte anche per le
interazioni di Coulomb. A causa della convenzione della minima immagine (solo un’unica
immagine di ciascuna particella nelle condizioni delle period boundary conditions viene
57
J. Lennard-Jones, Proceedings of the Physical Society, 1931, 43, 461.
58
T. Darden, D. York, L. Pedersen, J. Chem. Phys., 1993, 98, 10089
43
considerata per una coppia di interazioni) il range di cut-off non può superare la metà della
larghezza del box. Questo è sufficiente per grandi sistemi, ma possono presentarsi difficoltà per
sistemi contenenti particelle cariche. In tal caso è necessario implementare uno degli algoritmi
long-range, come il reticolo di particelle di Ewald52
.
6. Le periodic boundary conditions non sono naturali
Il classico metodo per minimizzare gli effetti che si verificano sul bordo di un sistema finito è
l’applicazione delle periodic boundary conditions. Gli atomi del sistema simulati sono posizionati in
un box che è circondato da copie traslate di se stesso. In tal modo non ci sono limiti al sistema. Se
si desidera simulare un sistema non periodico, come liquidi o soluzioni, la periodicità può
provocare di per sé stessa errori. Gli errori possono essere valutati comparando sistemi di varie
dimensioni e ci si aspetta che siano meno gravi rispetto agli errori di un innaturale confine con il
vuoto.
44
1.6 “Protein Data Bank” (PDB)
Come accennato in precedenza, è importante disporre delle strutture tridimensionali delle
molecole in esame. Queste strutture sono un indispensabile punto di partenza per molti studi
computazionali. La loro definizione ha un ruolo fondamentale per la riuscita della ricerca
intrapresa, quindi vengono comunemente utilizzate le strutture risolte mediante tecniche di
cristallografia a raggi X unite ad altre tecniche, quali 2D- e 3D-NMR e modellazione per omologia.
A tale scopo, esiste una banca dati, la Protein Data Bank59
che raccoglie le strutture 3D delle
proteine derivanti da studi cristallografici di diffrazione ai raggi X e di NMR. E’ sostenuta dal
Research Collaboratory for Structural Bioinformatics (RCSB), un consorzio no-profit che si prefigge
lo scopo di migliorare la comprensione dei sistemi biologici mediante lo studio delle strutture
tridimensionali delle macromolecole appartenenti agli organismi viventi. Sono disponibili,
attualmente, 81369 strutture liberamente prelevabili.
59
H. Berman, J. Westbrook, Z. Feng, G. Gilliland, T. Bhat, H. Weissig, I. Shindyalov, P. Bourne, Nucleic Acids Res.,
2000, 28, 235
45
2.0 Scopo della tesi
Gli enzimi hanno un ottimo potenziale a livello industriale, dovuto alla loro capacità di catalizzare
reazioni presentando notevoli vantaggi rispetto alla classica catalisi chimica. Per questo motivo,
durante gli ultimi anni, molti ricercatori hanno focalizzato la loro attenzione sullo studio delle
proprietà enzimatiche, in modo da poterle sfruttare al meglio e rendere questi biocatalizzatori più
adatti alle applicazioni industriali.
Il primo requisito che un biocatalizzatore deve avere per una sua applicabilità industriale è
certamente la stabilità nelle condizioni operative. Spesso un processo industriale avviene in
condizioni di pressione e temperatura che non sono quelle ottimali per un enzima; inoltre, in molti
processi industriali, i reagenti sono solubilizzati in solventi diversi dall’acqua. Come ci si potrebbe
aspettare, queste condizioni possono provocare la denaturazione e quindi l’inattivazione del
biocatalizzatore, che quindi non risulta più adatto a catalizzare il processo in tali condizioni.60
Per quanto riguarda la stabilità delle proteine nei solventi, sono stati fatti molti studi. Non è quindi
una novità che alcuni enzimi possano essere più attivi in solventi organici piuttosto che in acqua.61
Lo scopo di questa tesi è proprio quello di analizzare il comportamento di tre lipasi di interesse
industriale, la Calb (Lipasi B da Candida antartica), PcL (lipasi da Pseudomonas cepacia) e Rol (lipasi
da Rhizopus oryzae) in diverse miscele di solventi (acqua e n-propanolo) e condizioni estreme di
temperatura (fino a 360K).
Queste analisi sono state condotte sia da un punto di vista computazionale, utilizzando delle
dinamiche molecolari, e i risultati sono stati confrontati con l’attività dell’enzima posto nelle stesse
condizioni sperimentali delle simulazioni. con il fine ultimo di individuare dei parametri facilmente
calcolabili che siano in grado di prevedere la stabilità di un enzima posto in determinate condizioni
sperimentali.
60
Joo, Jeong Chan, Yoo, Young Je, Wiley Encyclopedia of Industrial Biotechnology, April 2008, 2c1ed-d-08-004,
61
Alexander M. Klibanov, Nature, 2001, 409, 241-246.
46
3.0 Risultati e discussione
3.1 Introduzione
Lo studio oggetto di questa tesi si è concentrato su tre proteine: CalB (lipasi B da Candida
antartica), PcL (lipasi da Pseudomonas cepacia) e Rol (lipasi da Rhizopus oryzae). Queste lipasi sono
state scelte accuratamente prendendo in considerazione la loro applicazione pratica. Esse si
distinguono per specie, taxa e caratteristiche strutturali. La CalB è prodotta da un lievito ed è
caratterizzata da un lid piccolo che non è in grado di coprire il sito catalitico. Questa lipasi non
presenta distinti fenomeni di attivazione interfacciale. La PcL, invece, deriva da un organismo
procariotico e presenta un lid molto ampio. Essa subisce significative variazioni conformazionali
all’interfaccia acqua/lipide che tendono a distorcere la geometria spaziale dei residui catalitici
inattivando la lipasi. Infine, la Rol è una lipasi fungina che presenta un lid molto più piccolo della PcL
e conserva l’attivazione interfacciale acqua/lipide data dal cambiamento conformazionale del lid.
Dati sperimentali e computazionali sono stati raccolti e analizzati per comprendere i fattori che
influenzano sia la stabilità di queste proteine che i cambiamenti strutturali responsabili della
perdita di attività delle stesse.62
Queste tre proteine sono state scelte proprio per la loro
eterogeneicità. Esse hanno origini completamente diverse, presentano tre meccanismi di
attivazione interfacciale diversi e non hanno omologia di sequenza o di struttura.
Gli obiettivi da raggiungere sono stati divisi in due parti. La prima parte di questo lavoro di tesi
tratta la stabilità delle proteine in solventi diversi, più specificatamente in acqua, n-propanolo e
miscele dei due. I risultati di questa parte computazionale della tesi sono stati confrontati con i dati
ottenuti in laboratorio dalla Dr. Diana Fattor per le stesse proteine poste nelle medesime
condizioni. La seconda parte del lavoro invece si concentra sulla stabilità termica delle proteine. Si è
voluto vedere come le proteine prese in considerazione si comportano in seguito a un aumento di
temperatura.
Il punto di partenza di questo lavoro di tesi è stato acquisire la struttura cristallografica delle lipasi
fra quelle disponibili nella Protein Data Bank57
. La struttura cristallografica della CalB (Figura 3.1) è
stata depositata nel febbraio 1994 con il codice 1TCA e ha una risoluzione di 1.55Å.
62
Skjot M., De Maria L., Chatterjee R., Svendsen A., Patkar S.A., Ostergaard P. R., Brask J., ChemBioChem, 2009, 10,
520-527
47
Figura 3.1: Struttura cristallografica di Calb (PDB-1TCA
31
), risoluzione 1.55Å; in verde è evidenziata la triade catalitica
(Ser105, Asp187 e His 224.)
La PcL con il codice 1YS163
è stata depositata nella PDB nel febbraio 2005 e ha risoluzione di 1.1Å.
(Figura 3.2)
Figura 3.2 Struttura cristallografica della PcL (PDB-1YS1), risoluzione 1.1Å; sono evidenziati in verde la triade catalitica
Ser87, His286 e Asp264 e lo ione Ca
++
63
A. Mezzetti , J.D. Schrag , C.S. Cheong , R.J. Kazlauskas., Chem.Biol 2005, 12, 427-437
48
Infine, non essendo disponibile nella Protein Data Bank la struttura della Rol (lipasi da Rhizopus
oryzae), questa è stata ottenuta per omologia dalla lipasi II della Rhizopus niveus, avente codice pdb
1LGY, che risale al maggio 1996 e ha risoluzione 2.20Å. Queste due lipasi sono molto simili tra loro,
e differiscono solo per due residui amminoacidici; quindi, utilizzando il software Pymol sono stati
mutati due amminoacidi: l’istidina (H) in posizione 134 è stata sostituita da un’asparagina (N), e in
posizione 200 la valina (V) è stata sostituita dall’alanina (A). In questo modo è stata ottenuta la
struttura della Rol (Figura 3.3) che è stata utilizzata come punto di partenza per questo lavoro di
tesi.
Figura 3.3 Struttura cristallografica della Rol (PDB-1LGY
64
), risoluzione 2.20Å; in verde evidenziata la triade catalitica
Asp204, His257 e Ser144
64
M. Kohno, J. Funatsu, B. Mikami, W. Kugimiya, T . Matsuo, Y. Morita, J.Biochem 1996, 120, 505-510
49
3.2 Stabilità delle proteine in miscele acqua/n-propanolo
In questa parte della tesi si è voluto studiare con metodi computazionali il comportamento dalle
proteine in miscele di solvente, più specificatamente in miscele di acqua e n-propanolo in rapporti
ben definiti.
Lo studio computazionale, basato su simulazioni di dinamiche molecolari, è stato realizzato con il
software Gromacs. Le dinamiche delle proteine sono state calcolate definendole nel campo di forza
Martini42
, che, come spiegato nell’introduzione (paragrafo 1.4.1) è un campo di forze di tipo coarse-
grained, cioè a grana grossa. In questo modo le particelle sono simulate in maniera limitata e i
tempi di calcolo vengono notevolmente ridotti. Questa scelta è stata possibile poiché l’obiettivo di
queste simulazioni non era quello di studiare nel dettaglio il comportamento di singoli residui
proteici, ma di osservare il comportamento dinamico delle strutture proteiche nelle diverse miscele
di solventi.
Una volta individuate le strutture proteiche di partenza (vedi figure 3.1-3.3), queste sono state
elaborate con il software pymol in modo da eliminare le molecole d’acqua, eventuali residui di
glicosilazione, e ioni non strettamente associati alla struttura proteica. Le strutture così
“pretrattate” sono state quindi definite nel campo di forze Martini.
In Martini l’acqua viene segnalata e letta come W, mentre il propanolo viene segnalato e letto
come POL.
Le proteine sono state poste al centro di uno spazio cubico di 343nm3
; ogni sistema è stato
solvatato con solvente esplicito in modo da ottenere la miscela acqua/n-propanolo alla
composizione desiderata. Le condizioni simulate sono le seguenti: acqua 100%; acqua 75% n-
propanolo 25%, acqua 50% n-propanolo 50%, acqua 25% n-propanolo 75% e propanolo 100%.
Le percentuali dei solventi utilizzati nella simulazione si riferiscono a percentuali v/v; in base alla
densità sperimentale della miscela sono state calcolate le frazioni molari corrispondenti e quindi il
numero di moli di ciascun solvente della miscela. Le simulazioni sono state eseguite in modo da
rispettare le frazioni molari tra i due solventi e mantenere costante il numero totale di particelle
simulate. Per una descrizione più dettagliata di come queste miscele sono state definite
computazionalmente si veda in materiali e metodi (paragrafo 5.4).
50
Ogni sistema è stato equilibrato in più passaggi successivi, ad iniziare dal solvente. Sono stati posti
dei vincoli di movimento alla proteina in modo che solo il solvente fosse libero di muoversi durante
una dinamica di equilibratura di 10 ns. Successivamente, le strutture proteiche sono state liberate
dai vincoli imposti precedentemente, il sistema è stato minimizzato e si è proceduto con una
dinamica produttiva di 100ns. Ognuna delle tre proteine oggetto di questo studio è stata simulata
nelle diverse miscele di acqua/n-propanolo .
Analizzando le dinamiche produttive di ogni proteina, in ogni condizioni simulata, si sono valutate le
RMSD (root-mean-square deviation) delle traiettorie. L’RMSD si valuta calcolando lo scarto
quadratico medio delle coordinate degli atomi delle proteine per ogni snapshots, e rappresenta la
media dello spostamento degli atomi rispetto a uno stato iniziale (RMSD proteina-proteina). Viene
cosi analizzata la distorsione della struttura proteica nel tempo. Il movimento medio della proteina
può essere considerato un indice della distorsione della struttura proteica e quindi indicare una
possibile denaturazione dell’enzima. I dati riguardanti le RMSD delle traiettorie sono indicati nelle
figure 3.4, 3.5 e 3.6.
Figura 3.4 Variazione di RMSD della struttura della CalB durante una dinamica di 100 ns a concentrazioni crescenti di POL.
51
Figura 3.5 Variazione di RMSD della struttura della PcL durante una dinamica di 100 ns a concentrazioni crescenti di POL.
Figura 3.6 Variazione di RMSD della struttura della Rol durante una dinamica di 100 ns a concentrazioni crescenti di POL.
52
Analizzando l’andamento dei valori di RMSD delle varie traiettorie si possono trarre alcuni
indicazioni riguardo la rigidità delle strutture proteiche. La CalB risulta essere rigida in acqua al
100%. E’ interessante osservare che la proteina immersa nel propanolo al 100%, non genera il
valore di RMSD maggiore, che si osserva invece nella simulazione della CalB in acqua 25% POL 75%.
Durante la simulazione in 100% POL, dopo bruschi movimenti nei primi 20ns, l’incremento della
RMSD diminuisce bruscamente, e negli ultimi 40 ns di simulazione la rigidità della proteina risulta
essere maggiore rispetto a quello della proteina posta in acqua 25% POL 75%. Nella miscela 50%W
50% POL la proteina sembra avere una rigidità maggiore che in acqua 75% POL 25%; il valore di
RMSD per quest’ultima condizione è comparabile a quello ottenuto in 100% POL.
La PcL risulta avere una rigidità molto limitata quando si trova in 100% POL e sembra anche avere
una mobilità maggiore rispetto alle altri lipasi nel solvente puro. Molto interessante è il dato
riguardante la miscela acqua 75% POL 25%: in queste condizioni la PcL sembra essere più rigida che
in acqua 100%. Questo tipo di comportamento non è riscontrabile nelle altre lipasi di questo studio.
La Rol possiede movimenti molecolari abbastanza prevedibili: all’aumentare delle concentrazioni di
n–propanolo diminuisce la sua rigidità; fa eccezione soltanto la soluzione composta al 75% POL
nella quale le molecole sembrano meno mobili rispetto alle aspettative per una concentrazione così
elevata di propanolo, la rigidità della proteina in queste condizioni è paragonabile a quella ottenuta
con acqua 75% POL 25%.
Per quanto riguarda la condizione acqua 100% PcL e Rol hanno valori finali di RMSD intorno agli
0.75 nm, mentre il valore della CalB è leggermente più alto, superando di poco gli 0.8 nm; ciò
suggerisce che in acqua la CalB sia leggermente più flessibile delle altre due proteine. Il minimo
della rigidità strutturale si distingue in 100% POL per PcL e Rol, mentre la CalB raggiunge il massimo
RMSD in acqua 25% POL 75%. Queste osservazioni ci indicano come queste tre proteine possano
avere dei comportamenti diversi se poste nella stessa miscela di solventi. Poiché, come anticipato
precedentemente, la rigidità di una proteina sembra essere inversamente correlata alla sua
stabilità, una maggiore o minore rigidità strutturale potrebbe anche indicare una maggiore o
minore tendenza alla denaturazione della struttura proteica.
Lo scopo ultimo di questa parte di tesi è quella di cercare qualche tipo di correlazione tra il
movimento molecolare delle proteine e l’attività residua misurata sperimentalmente delle proteine
poste nelle stesse condizioni. Per fare ciò è stato scelto come parametro univoco la RMSD media
53
degli ultimi 10ns di simulazione. Questa scelta è motivata dal fatto che in quel range temporale la
RMSD raggiunge un valore pressoché costante, indice di un avvicinamento ad una situazione di
equilibrio del sistema, per lo meno per quello che riguarda la rigidità strutturale.
I valori di questi parametri così definiti sono elencati nella tabella seguente (Tabella 3.1) e il loro
andamento visualizzato in figura 3.7.
Tabella 3.1 RMSD media, calcolato sugli ultimi 10ns di simulazione, nelle diverse miscele acqua/n-propanolo
.
Figura 3.7 Andamento della RMSD al variare della composizione della miscela solvente per le lipasi CalB, PcL, RoL
RMSD medio
(nm)
0% POL 25% POL 50% POL 75% POL 100% POL
CalB 0.916 1.058 0.972 1.124 1.056
PcL 0.823 0.754 0.889 0.841 1.028
Rol 0.841 0.920 0.960 0.910 1.097
54
La figura 3.7 evidenzia come le tre lipasi abbiano un andamento globale di mobilità/rigidità molto
diverso tra di loro, ma è interessante osservare che a 0%, 50% e 100% POL tendono ad avere una
mobilità abbastanza simile nella miscela solvente.
3.2.1. Confronto con i dati sperimentali
La parte sperimentale dello studio di stabilità delle lipasi CalB, PcL e Rol, nelle medesime condizioni
operative in cui si sono effettuate le simulazioni precedenti, è stata eseguita dalla Dott. Diana
Fattor65
.
La stabilità delle proteine è stata saggiata valutando la loro attività residua dopo incubazione in
diverse miscele di acqua e n-propanolo. Gli enzimi sono stati incubati alla temperatura di 27°C,
sotto agitazione orbitalica, per 48h. Il sistema “ acqua” in realtà consisteva di un tampone fosfato
0.01M a pH 7.0, dializzato alla temperatura 2-8°C. I sistemi utilizzati per l’incubazione sono:
100% tampone 0.01M pH 7
75% tampone / 25% n-propanolo
50% tampone / 50% n-propanolo
25% tampone / 75% n-propanolo
100% n-propanolo
L’attività idrolitica delle proteine native è stata valutata misurando l’idrolisi della tributirrina (Figura
3.8). Il substrato è un trigliceride puro dell’acido butirrico. La lipasi idrolizza il legame estereo
liberando acido butirrico che viene titolato con una soluzione 0.1M di NaOH. Un’unità corrisponde
alla quantità di acido butirrico rilasciato da 1mg di enzima al minuto. L’attività misurata
immediatamente dopo la dialisi in tampone K-fosfato 0.01M e pH 7.0 è stata considerata come il
100%. L’attività residua è stata misurata a tempi diversi: 1min, 1, 5, 8, 24 e 48 ore, prelevando un
campione dal sistema. Le attività residue sono state espresse come percentuale di attività misurata
65
Diana Fattor, 2012, Tesi di dottorato, XXIV ciclo di Dottorato in Scienze e Tecnologie Chimiche e Farmaceutiche,
Settore scientifico-disciplinare CHIM/06
55
nelle diverse miscele tampone/n-propanolo rispetto all’attività iniziale misurata sulla proteina
dializzata.
O
O
O + H2O
OH
OH
OH +
Tributyrin Water
Lipase
Glycerol Butyric Acid
O
(CH2)2 CH3
O
(CH2)2 CH3
O
(CH2)2 CH3
HO
O
(CH2)2 CH3
Figura 3.8 Idrolisi della tributirrina catalizzata da lipasi.
I dati di attività residua cosi ottenuti per le tre proteine sono illustrati nelle seguenti figure 3.9,
3.10, e 3.11.
Figura 3.9 Attività residua della Calb in miscele a diverse concentrazioni di acqua/n-propanolo
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma
Tesi-Emma

More Related Content

What's hot

Epigenetics: psiconeuroendocrinology and lamarckian-like evolution
Epigenetics: psiconeuroendocrinology and lamarckian-like evolutionEpigenetics: psiconeuroendocrinology and lamarckian-like evolution
Epigenetics: psiconeuroendocrinology and lamarckian-like evolution
Haskell Lambda
 
Regolazione espressione 01.02.2010
Regolazione espressione 01.02.2010Regolazione espressione 01.02.2010
Regolazione espressione 01.02.2010Nicola Toma
 
Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...
Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...
Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...
Hidan87
 
18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...
18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...
18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...
DYD MEDICINA INTEGRATIVA di Diana Yedid
 

What's hot (6)

Epigenetics: psiconeuroendocrinology and lamarckian-like evolution
Epigenetics: psiconeuroendocrinology and lamarckian-like evolutionEpigenetics: psiconeuroendocrinology and lamarckian-like evolution
Epigenetics: psiconeuroendocrinology and lamarckian-like evolution
 
Regolazione espressione 01.02.2010
Regolazione espressione 01.02.2010Regolazione espressione 01.02.2010
Regolazione espressione 01.02.2010
 
TESI triennale COMPLETA
TESI triennale COMPLETATESI triennale COMPLETA
TESI triennale COMPLETA
 
Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...
Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...
Lezione 4 - Biologia Applicata (28/10/2013) Scienze Psicologiche Applicate - ...
 
18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...
18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...
18 GIUGNO 2016 Milano Nutraceutica in andrologia: fertilita’ e sessualita’. D...
 
9 P Self Ass
9   P  Self Ass9   P  Self Ass
9 P Self Ass
 

Similar to Tesi-Emma

Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...
Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...
Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...
Hidan87
 
Ilmetabolismo
IlmetabolismoIlmetabolismo
Ilmetabolismo
genialhealth srl
 
Pagine da biochimica sport
Pagine da biochimica sportPagine da biochimica sport
Pagine da biochimica sport
Calzetti & Mariucci Editori
 
Fasi microgruppo
Fasi microgruppoFasi microgruppo
Fasi microgruppo
Camilla D'agostino
 
Un mare di colori
Un mare di coloriUn mare di colori
Un mare di colori
Camilla D'agostino
 
Bianchino Ii Ianno D
Bianchino Ii Ianno DBianchino Ii Ianno D
Bianchino Ii Ianno Dlab13unisa
 

Similar to Tesi-Emma (9)

Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...
Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...
Lezione 5 - Biologia Applicata (04/11/2013) Scienze Psicologiche Applicate - ...
 
Icom lez 1 intro enzimi bioenergetica
Icom lez 1 intro enzimi bioenergeticaIcom lez 1 intro enzimi bioenergetica
Icom lez 1 intro enzimi bioenergetica
 
1.proteins
1.proteins1.proteins
1.proteins
 
Ilmetabolismo
IlmetabolismoIlmetabolismo
Ilmetabolismo
 
Pagine da biochimica sport
Pagine da biochimica sportPagine da biochimica sport
Pagine da biochimica sport
 
Fasi microgruppo
Fasi microgruppoFasi microgruppo
Fasi microgruppo
 
Un mare di colori
Un mare di coloriUn mare di colori
Un mare di colori
 
V I I° Lezione
V I I°  LezioneV I I°  Lezione
V I I° Lezione
 
Bianchino Ii Ianno D
Bianchino Ii Ianno DBianchino Ii Ianno D
Bianchino Ii Ianno D
 

Tesi-Emma

  • 1. 1 1. Introduzione 1.1. Stabilità enzimatica Le proteine hanno svariati ruoli biologici e pertanto possono essere divise in varie classi funzionali: proteine di trasporto, recettori/regolatori, proteine strutturali, proteine di riserva, proteine contrattili, proteine protettive, enzimi. La classe funzionale oggetto di questo lavoro di tesi è quella degli enzimi, in particolare l’attenzione è stata focalizzata sulla classe enzimatica delle lipasi. Gli enzimi hanno un grosso ruolo nel mondo industriale. Vengono utilizzati come catalizzatori per velocizzare le reazioni ma anche perché hanno un’alta specificità ed eco-compatibilità. Il loro utilizzo è però limitato da parametri quali la temperatura (temperature elevate), il pH (troppo acido o basico), pressione (pressioni estreme), radiazioni da microonde, utilizzo di solventi organici o sali. Nelle industrie, tantissimi processi vengono condotti ad alte temperature, per molteplici vantaggi che si ottengono rispetto alle basse temperature, quali ad esempio: maggiore velocità delle reazioni, aumento della solubilità dei substrati, riduzione del rischio di contaminazione o diminuzione della viscosità.1 Gli enzimi, se sottoposti a condizioni estreme, vedono diminuita l’efficacia o addirittura viene annullata del tutto. Questo è il motivo principale per il quale le industrie investono moltissimo in termini di tempo e denaro nel cercare di stabilizzare questi biocatalizzatori per poterli sfruttare al meglio nelle condizioni più svariate, cercando anche di ridurre il più possibile i costi. Gli approcci utilizzati sono di tipo tradizionale (immobilizzazione, modificazione chimica, ecc.) oppure di ingegneria proteica, che vanno a modificare la struttura proteica dell’enzima, sfruttando anche informazioni ottenute tramite tecniche computazionali. 1.1.1 Folding e unfolding delle proteine La struttura delle proteine può essere suddivisa in quattro livelli di organizzazione: 1. La struttura primaria: rappresenta la sequenza di amminoacidi che compongono la proteina. 2. La struttura secondaria: struttura nella quale sono indicate le conformazioni dei singoli residui lungo la catena primaria; se essi hanno una conformazione regolare distingueremo ad esempio α-eliche e β-foglietti. 1 Jeong Chan Joo, Young Je Yoo, Wiley Enciclopedia of Industrial Biotechnology, 2008, 2c1ed-d-08-0043.
  • 2. 2 3. La struttura terziaria: si ha una collocazione precisa di tutti gli atomi della catena nello spazio e la formazione di una struttura tridimensionale ben definita. 4. La struttura quaternaria: considera l’organizzazione degli oligomeri, cioè l’associazione di diverse catene polipeptidiche. La struttura finale della proteina (la struttura folded o nativa) sarà quella con l’energia interna minore. Ogni tappa del ripiegamento porta a una riduzione dell’energia. Esistono anche stati di folding intermedio, che hanno raggiunto un minimo energetico, ma non un minimo assoluto bensì un minimo locale sulla superfice energetica delle varie conformazioni accessibili alla proteina (Figura 1.1). Figura 1.1 Visualizzazione del profilo energetico per il ripiegamento di proteine Il peptide deve raggiungere la conformazione più stabile che non è necessariamente quella con energia minima (Figura 1.2).
  • 3. 3 Figura 1.2 Rappresentazione schematica del processo di folding delle proteine:http://folding.stanford.edu/Italian/Science Una volta formata, la struttura nativa della proteina (e quindi la sua conformazione spaziale) è mantenuta da varie forze non-covalenti quali: legami a idrogeno, interazioni idrofobiche e forze di van der Waals. A causa di cambiamenti chimici (solventi organici, cambio della salinità, pH, ecc.) o fisici (cambiamento drastico di temperatura) la struttura della proteina cambia, perde cioè la sua struttura secondaria. Questo processo viene chiamato unfolding della proteina o denaturazione. Il processo di unfolding può avvenire in due modi: 1. Unfolding reversibile: di solito concerne le piccole proteine (100-150 amminoacidi), che, dopo essersi denaturate, sono in grado di riacquistare spontaneamente la loro struttura nativa quando vengono riportate nelle condizioni fisiologiche, ad esempio in seguito a raffreddamento (Figura 1.3). Ciò succede perché la stabilità della proteina è data dalla differenza di energia libera (∆G=GD-GN) tra lo stato nativo (N) e lo stato denaturato (D).
  • 4. 4 K1 N ⇌ D K-1 La differenza di energia tra i due stati è molto piccola (<20kcal/mol)2 . 2. Unfolding irreversibile: Le proteine di dimensioni maggiori, dopo esposizione a condizioni denaturanti non riescono a ritornare allo stato nativo ma tendono ad aggregare e precipitare in soluzione anche quando le condizioni fisiologiche sono state ripristinate. K1 K2 N ⇌ I ⇌ D K-1 K-2 Dove: N = Struttura nativa I = Struttura di transizione (enzima parzialmente denaturato) D = Struttura denaturata Figura 1.3 visualizzazione della renaturazione spontanea delle proteine 2 C. N. Pace, G. R. Grimsley. December 1999, Encyclopedia of Life Sciences, 8(7): 1500–1504
  • 5. 5 Se le proteine sono di piccole dimensioni ma la loro concentrazione è sufficientemente alta, è stato dimostrato che tenderanno comunque a aggregare ed andare in contro al misfolding (riavvolgimento sbagliato) durante il processo di rinaturazione.3 Il processo di unfolding delle proteine può essere seguito con diverse tecniche a seconda della struttura della proteina di interessa. Per osservare l’unfolding della struttura terziaria si può usare la spettrofluorimetria). Per la struttura secondaria in genere si utilizza la spettroscopia infrarossa o il dicroismo circolare.4 Il meccanismo di folding delle proteine è tuttora una delle questioni irrisolte nella biochimica. Nonostante tutti gli sforzi e i progressi della ricerca non è ancora esattamente chiaro come una catena polipeptidica si ripieghi spontaneamente in una proteina strutturata, biologicamente attiva.8 Si ipotizza che nel ripiegamento sia coinvolto il solvente che circonda la molecola, ossia l’acqua. Sono quindi state fatte tantissime ricerche dove venivano usati altri solventi per studiare il comportamento delle proteine ed il processo di folding. 5 ,6 Lo scopo di questa tesi è stato proprio quello di vedere come le proteine si denaturano variando le condizioni di temperatura e variando i solventi nei quali sono immerse. 1.1.2 Enzimi termostabili Gli enzimi estratti da organismi termofili (vivono a temperature di 50-80°C) e ipertermofili (crescono a 80-110°C), grazie alla loro stabilità e l’ottima attività ad alte temperature, offrono maggiori vantaggi biotecnologici rispetto agli enzimi da mesofili (25-50°C) o psicrofili (5-25°C).7 È stato dimostrato che, tranne per differenze filogenetiche, enzimi da ipertermofili e mesofili sono molto simili: le sequenze di proteine ipertermofiliche e delle equivalenti mesofiliche hanno generalmente un grado di omologia che varia dal 40-85%;8 le loro strutture tridimensionali sono sovrapponibili9 e hanno gli stessi meccanismi catalitici.10 Studi comparativi hanno dimostrato che 3 E.I. Sharkhnovich, Biol 1999,. 6, 99-102 4 R. L. Baldwin, C. Frieden, G. D. Rose, PubMed, 2010, 78( 13), 2725–2737 5 R. V. Rariy and A. M. Klibanov, PCCP, 1997, 94, 13520-13523 6 C. R. Reichardt, VCH Weinheim Germany, Solvents and Solvent Effects in Organic Chemistry, 1988 7 C. Vielle, G. J. Zeikus, Microbiology and Molecular Biology Reviews, 2001,. 65 (1), 1-43. 8 G. J. Davies, S. J. Gamblin, J. A. Littlechild, and H. C. Watson. Proteins Struct. Funct. Genet., PubMed, 1993. 15, 283–289. 9 V. I. Chi, L. A. Martinez-Cruz, J. Jancarik, R. V. Swanson, D. E. Robertson, and S. H. Kim. FEBS Letters, 1999, 445, 375–383.
  • 6. 6 la maggiore termostabilità degli enzimi da microorganismi termofili e ipertermofili è dovuta a un insieme di piccole e specifiche differenze strutturali, ad esempio: maggior numero di coppie ioniche presenti sulla superficie, aumento degli amminoacidi non polari, residui carichi positivamente o negativamente, aromatici11 e riduzione della flessibilità, soprattutto nel core proteico.1 1.1.3 Influenza dei solventi sulla stabilità enzimatica Diversi studi hanno dimostrato che la catalisi enzimatica in solvente organico porta ad alcuni miglioramenti, rispetto alla catalisi in ambiente acquoso, ad esempio: maggiore solubilità del substrato, prevenzione della proteolisi (nel caso delle proteasi), variazione della selettività enzimatica e l’aumento della termostabilità. Si ha così un link diretto fra solventi utilizzati e termostabilità, infatti, gli enzimi in solventi organici possono svolgere la propria attività catalitica a temperature superiori a quelle che ne causano la denaturazione in ambiente acquoso. Un altro parametro che influenza l’attività enzimatica in soluzioni acquose è il pH che invece non ha un ruolo importante nei solventi organici.12 Studi su vari enzimi hanno però mostrato una significativa perdita dell’attività in presenza di solventi organici polari, rispetto all’attività mostrata in soluzione acquosa.13 Cambiando il solvente, quindi, possiamo cambiare le caratteristiche enzimatiche. Ad esempio, in acqua, numerose lipasi esterasi e proteasi catalizzano l’idrolisi di esteri ai corrispondenti acidi e alcoli. Ma se il solvente in soluzione è anidro, ovviamente questa reazione non avverrà. Tuttavia se viene aggiunto un nucleofilo come ad esempio alcol, ammina o tiolo si avrà rispettivamente transesterificazione, amminolisi e tiotransesterificazione, reazioni che non si avrebbero in ambiente acquoso.14 1.1.4 Fattori che contribuiscono alla stabilità enzimatica La proteina, una volta raggiunta la sua struttura nativa, è tenuta insieme da varie forze che ne garantiscono il mantenimento della struttura. Per quanto riguarda i contributi entalpici si tratta di 10 M. W. Bauer, R. M. Kelly. Biochemistry, 1998, 37, 17170-17178. 11 X. X. Zhou, Y. B. Wang, Y.J. Pan, W. F. Li. Amino Acids, 2008, 34, 25-33. 12 B. Castillo, V. Bansal, A. Ganesan, P. Halling, F. Secundo, A. Ferrer, K. Griebenow and G. Barletta. BMC Biotechnology, 2006,. 6 (51). 13 B. Castillo, Y. Pacheco, W. Al-Azzam, K. Griebenow, M. Devi, A. Ferrer, and G. Barletta. J. Mol. Catal. B: Enzymatic, 2005, 35, 147-153. 14 A. M. Klibanov, Nature, 2001, 409, 241-246
  • 7. 7 legami idrogeno, interazioni elettrostatiche, e interazioni di van der Waals.1 I contributi entropici sono dati ad esempio da ponti disolfuro che introducono dei legami covalenti e da residui di prolina. Ci sono poi le interazioni aromatico-aromatico e catione-π, ed infine il legame metallico.15 Tutti questi termini contribuiscono in maniera diversa alla stabilità enzimatica e non si può attribuire la stabilizzazione delle proteine a nessuno in particolare. Per questo motivo verranno analizzarli singolarmente. 1.1.4.1 Interazioni idrofobiche Non a caso proprio le interazioni idrofobiche sono posizionate al primo posto tra i fattori che contribuiscono alla stabilità enzimatica, esse sono infatti considerate la forza maggiore che guida il folding di una proteina e quindi sono fondamentali per la sua stabilità. Le proteine sono costituite da amminoacidi idrofilici e idrofobici. Durante il ripiegamento delle proteine i residui idrofobici tenderanno a stare il più lontano possibile dal solvente (acqua) e si concentreranno nel cosiddetto core della proteina. Nel processo di folding, dunque, le molecole di acqua vengono ridistribuite dai residui idrofobici con un aumento di entropia che risulterà in una diminuzione dell’energia libera di Gibbs (∆G < 0) e quindi in una maggiore stabilità della proteina (figura 1.4). Figura 1.4 Schema del ripiegamento proteico in base al tipo di amminoacidi 1.1.4.2 Legame idrogeno Il legame a idrogeno è una forza molto debole, non covalente, ma la sua importanza è cruciale se pensiamo che una proteina ha tantissimi di questi legami che esercitano una forza risultante non indifferente. Il suo ruolo è cruciale nel determinare la struttura di una proteina e modulare le sue 15 R. Jaenicke, G. Böhm, Curr. Op. Struct. Biol., 1998, 8(6), 738–748
  • 8. 8 interazioni con l’acqua. Ad esempio le α-eliche ed i β-foglietti nella struttura secondaria delle proteine sono stabilizzati proprio dalle forze esercitate dai numerosi legami a idrogeno. Vogot e Argons16 hanno confrontato 16 famiglie di proteine diverse, dimostrando che la termostabilità delle proteine migliora notevolmente all’aumentare del numero di legami idrogeno e con l’incremento della frazione polare della superfice. I legami a idrogeno sono caratterizzati da una distanza tra donatore di H e l’accettore minore di 3Å. La forza di legame dipende dall’elettronegatività del donatore di H, dall’angolo di legame e dal solvente in cui si forma (una costante dielettrica elevata diminuisce l’interazione). 1.1.4.3 Interazioni elettrostatiche Le interazioni elettrostatiche sono tipiche interazioni tra residui con carica opposta, la cui energia è data dalla legge di Coulomb: dove: q1 e q2 sono le cariche dei due atomi, r è la distanza tra i due atomi ed ε la costante dielettrica del mezzo. Interazioni elettrostatiche con r inferiore a 4Å sono chiamate coppie ioniche o ponti salini. Molti ricercatori17 ,18 hanno confrontato proteine omologhe da mesofili, termofili ed ipertermofili e hanno osservato che le proteine termostabili hanno un maggior numero di coppie ioniche o ponti salini. 1.1.4.4 Entropia conformazionale Ogni amminoacido può avere diverse conformazioni all’interno di una proteina, tuttavia questa adotta una conformazione specifica, dovuta alla perdita di entropia conformazionale, che permette il ripiegamento della proteina nell’esatta struttura nativa immediatamente e specificamente.1 Come riportato da Matthews et al.19 , è possibile migliorare la stabilità di una proteina con la sostituzione di alcuni amminoacidi. Nello stato di unfolding i residui di Gly, privi di un carbonio in β, hanno la maggiore entropia conformazionale, mentre i residui di Pro, che possono assumere solo poche conformazioni, hanno la minore entropia conformazionale. Sostituendo Gly con residui più rigidi, come Ala o introducendo residui di Pro al posto di altri 16 G. Vogt and P. Argon, Fold Des 1997, 2, S40-S46. 17 M. Sadeghi, H. Naderi-Manesh, M. Zarrabi, and B. Ranjbar. Biophysical Chemistry, 2006, 119, 256-270 18 M. Robinson-Rechavi, A. Alibés, and A. Godzik. J. Mol. Biol., 2006, 356 (2), 547-557 19 B. W. Matthews, H. Nicholson, and W.J. Becktel. Proc. Natl. Acad. Sci. U.S.A., 1987, 84, 6663-6667
  • 9. 9 residui più mobili, è possibile ridurre l’entropia conformazionale e quindi aumentare la stabilità della proteina. 1.1.4.5 Ponti disolfuro I ponti disolfuro si formano per ossidazione di due residui di Cys e possono essere intramolecolari o intermolecolari. È ben noto che i ponti disolfuro stabilizzano le proteine principalmente grazie ad un effetto entropico, diminuendo l’entropia conformazionale dello stato di unfolding. Chakraborty et al.20 hanno osservato che l’introduzione di ponti disolfuro in siti non di legame idrogeno può significativamente stabilizzare la struttura proteica. Inoltre i ponti disolfuro possono anche aumentare la stabilità cinetica rafforzando le regioni instabili. 1.1.4.6 Interazioni aromatico-aromatico e catione-π In una proteina molti residui aromatici (Phe, Tyr e Trp) sono accoppiati con altri residui aromatici, dando luogo alla cosiddetta interazione aromatico-aromatico. Inoltre i residui aromatici reagiscono con residui carichi positivamente (Arg, Lys e His) nelle interazioni catione-π.1 Anche se queste interazioni non sono così importanti come le altre forze, come l’interazione idrofobica, la cooperazione di tutti i meccanismi è molto importante nel ripiegamento delle proteine. 1.1.4.7 Legame metallico I legami metallici sono noti per stabilizzare e attivare le proteine. Gli ioni metallici coinvolti nei legami di coordinazione con residui proteici come Cys, His, Asp e Glu, sono Cu(II), Ca(II), Co(II), Mn(II), Mg(II), Cd(II), Zn(II) e Ni(II). Come riportato da Rodriguez et al.21 nello studio della bromoperossidasi da Corallina pilulifera, la presenza di uno ione vanadio nel sito catalitico aumenta la termostabilità dell’enzima, mentre la presenza di uno ione in ogni subunità aumenta la stabilità dell’enzima in presenza di solventi organici, rendendolo più facilmente utilizzabile nella biocatalisi. 1.1.5 Come migliorare la stabilità enzimatica Si conoscono molti metodi per migliorare la stabilità di una proteina, i più importanti sono elencati in figura 1.5. L’introduzione di queste tecniche negli ultimi decenni ha permesso di migliorare notevolmente alcune caratteristiche enzimatiche, quali la termostabilità, la stabilità in solvente organico, l’enantioselettività, la specificità per il substrato e l’optimum di attività a determinati pH.1,11 20 K. Chakraborty, S. Thakurela, R. S. Prajapati, S. Indu, P. S. Ali, C. Ramakrishnan, and R. Varadarajan. Biochemistry, 2005, 44, 14638-14646. 21 E. Garcia-Rodriguez, T. Ohshiro T. Aibara, Y. Izumi, J. Littlechild. J. Biol. Inorg. Chem., 2005, 10, 275–282.
  • 10. 10 Metodi tradizionali Metodi ingegneristici -Modificazioni chimiche -Design razionale -Immobilizzazione -Direct Evolution -Liofilizzazione -Design computazionale -Aggiunta di additive stabilizzanti Figura 1.5 Principali metodi utilizzati per migliorare la stabilità degli enzimi per fini industriali La combinazione di più metodi tra quelli elencati, può essere vantaggiosa rispetto all’utilizzo di una singola tecnica. 1.1.5.1 Metodi tradizionali Prima dello sviluppo della tecnologia del DNA-ricombinante, i metodi tradizionali sono stati gli strumenti più efficaci per migliorare la stabilità enzimatica. Le modificazioni chimiche aumentano non solo la termostabilità, ma anche la stabilità nei solventi organici: ad esempio modificazioni con polietilenglicole riducono la perdita di attività enzimatica in vari solventi organici.2 Come riportato da Esposito et al.22 , è stato dimostrato che l’aggiunta di additivi stabilizzanti, quali glicerolo o saccarosio, ad una soluzione proteica, stabilizza la conformazione nativa prevenendo la denaturazione termica. In particolare, la presenza di cosolventi come zuccheri o polioli in sistemi acquosi può stabilizzare la proteina sia contro la denaturazione termica che fisica. Il meccanismo di questo processo è in continuo sviluppo. L’uso di additivi però ha lo svantaggio di doverli separare dal prodotto finale. L’immobilizzazione su supporti solidi, oltre ad aumentare la stabilità termica e nei solventi organici, permette di separare e riutilizzare l’enzima immobilizzato, riducendo notevolmente i costi di produzione.1 Tra le tecniche tradizionali va ricordato anche il processo di liofilizzazione. Con questa tecnica si può migliorare la stabilità rispetto ad una formulazione liquida; le proteine liofilizzate sono meno predisposte a de-amidazione e idrolisi, e si previene la denaturazione. 22 A. Esposito, L. Comez, S. Cinelli, F. Scarponi, G. Onori. , J. Phys. Chem., 2009, 113, 16420-16424.
  • 11. 11 1.1.5.2 Metodi ingegneristici Il design razionale è stato il primo metodo ingegneristico usato per rielaborare le sequenze proteiche. Utilizza vari strumenti bioinformatici per predire quali sono le mutazioni responsabili della maggiore stabilità di una proteina rispetto alle omologhe meno stabili. L’elevata conservazione del core proteico sia negli enzimi termofilici che negli omologhi mesofilici, suggerisce che le mutazioni responsabili della maggiore stabilità dei primi siano da ricercare sulla superficie proteica.11 Infatti, le più promettenti strategie per la termostabilizzazione che usano la Site-Directed Mutagenesis (SDM) si concentrano sulle aree superficiali, soprattutto nei loops e turns, con l’obiettivo di aumentarne la rigidità, realizzando, come già visto, con la sostituzione di residui amminoacidici, l’introduzione di coppie ioniche o ponti disolfuro. Negli ultimi anni è stata posta maggiore attenzione al design computazionale, che con adeguati algoritmi calcola la sequenza ottimale, la più stabile e compatibile con la struttura tridimensionale proteica. La dinamica molecolare (MD) viene usata per simulare l’unfolding proteico e identificare le regioni target per la stabilizzazione.11 La directed evolution consiste nel mimare le mutazioni spontanee che avvengono in natura, col passare del tempo, nella replicazione del DNA proteico. Vengono selezionate e introdotte le mutazioni che conferiscono caratteristiche più favorevoli alla stabilità enzimatica. Vari enzimi utilizzati in industria, come proteasi e laccasi, sono stati modificati grazie a tecniche di directed evolution, per migliorarne la termostabilità.23-24 Come riportato da Eijsink et al.25 , ci sono numerosi modi per generare diversità genetiche in vitro: introdurre mutazioni puntiformi, a volte delezioni o inserzioni, in modo casuale; provocare mutazioni casuali ma in una regione limitata del gene; utilizzare tecniche di ricombinazione applicate ad un gruppo di geni. Si procede poi verificando la stabilità della proteina in condizionidenaturanti. 1.2 Lipasi I lipidi sono gli elementi chiave nella chimica della vita. Molte piante ed animali immagazzinano l’energia chimica sotto forma di trigliceridi, scarsamente solubili in acqua. Per il turnover metabolico di queste molecole essi producono esterasi, enzimi che idrolizzano legami di esteri. Le 23 T. Kaper, S. J. J. Brouns, A. C. M. Geerling, W. M. De Vos, J. Van der Oost. Biochemical J., 2002, 368, 461-470. 24 T. Bulter, M. Alcalde, V. Sieber, P. Meinhold, S. Schlachtbauer, F. H. Arnold. Appl.Environ. Microb., 2003,. 69 (2), 987–995. 25 V. Eijsink, S. Gaseidnes, T. Borchert, B. van der Burg. Biomol. Eng., 2005, 22, 21-30.
  • 12. 12 esterasi che idrolizzano trigliceridi all’interfaccia acqua-olio sono dette lipasi.26 Le lipasi appartengono alla famiglia delle idrolasi. In ambiente acquoso il loro ruolo fisiologico è catalizzare l’idrolisi dei trigliceridi a digliceridi, monogliceridi, acidi grassi e glicerolo. La reazione è reversibile e questi enzimi possono catalizzare la reazione di esterificazione del glicerolo per formare monogliceridi, digliceridi e trigliceridi anche in solventi organici.27 Differiscono dalle comuni esterasi per la loro proprietà di attivazione interfacciale, che consiste in un aumento dell'attività idrolitica quando l'enzima viene a trovarsi all’interfaccia acqua/olio. Questo comportamento è stato spiegato sulla base dell’analisi delle strutture cristallografiche, che ha permesso di individuare la presenza di un’α-elica posta esattamente sopra il sito catalitico come un coperchio (lid): quando la proteina si trova all’interfaccia acqua/olio questo lid va incontro a delle modificazioni conformazionali tali da rendere il sito catalitico accessibile al substrato. In particolare, l’apertura di tale lid fa sì che venga esposta un’ampia superficie idrofobica, che corrisponde al sito attivo dell’enzima con cui poi va ad interagire il substrato. L’attivazione interfacciale può essere anche dovuta ad altri fattori diversi dal cambiamento conformazionale del dominio lid.28 (Figura 1.6) Figura 1.6 Schema della conformazione a) attiva, inattiva delle lipasi e b) del lid. 26 Rolf D. Schmid e Robert Verger, Angew. Chem. Int. Ed., 1998 , 37, 1608-1633. 27 M. Noel, D. Combes. J. Biotechnol., 2003, 102, 23-32. 28 V.Ferrario, C. Ebert, L. Knapic, D. Fattor, L.Gardossi, Adv. Synth. Catal , 2011, 353, 2466-2480.
  • 13. 13 Le lipasi sono enzimi ubiquitari e sono stati trovati nella maggior parte degli organismi della microbica, delle piante e del regno animale, come si può osservare nella figura 1.7. Origine: Nome: Applicazione: Da mammiferi Lipasi gastrica umana Da funghi Humicola lanuginosa Sintesi organica Candida antartica B Detergente Rhizopus oryzae Oleochimica Da batteri Pseudomonans glumae Detergente enzimatico, sintesi organica Figura 1.7 esempio di lipasi a livello commerciale Nel 1856, Claude Bernard scoprì per primo la lipasi nel liquido pancreatico, un enzima che idrolizzava gocce insolubili di olio e le trasformava in prodotti solubili.29 Nel 1958, Sandra e Desnuelle definirono le lipasi in termini cinetici, basandosi sul fenomeno dell’attivazione interfacciale. Soltanto nel 1990 fu resa nota la struttura cristallografica a raggi X di due lipasi. Fu allora che si ipotizzò la teoria del lid o flap nel sito attivo. Da allora in poi le lipasi sono state ampiamente studiate ipotizzando diversi meccanismi d’azione. Si è anche visto che molte lipasi hanno strutture e disposizioni di amminoacidi molto simili e presentano meccanismi d’azione identici, ma non tutte le lipasi presentano il fenomeno dell’attivazione interfacciale (es. Candida Antartica di tipo B, è provvista del lid anfifilico che copre il sito attivo ma non presenta attivazione interfacciale)28 . Tutte le dodici lipasi delle quali è stata chiarita la struttura, sono membri della cosiddetta famiglia delle α/β idrolasi, caratterizzate da un’architettura comune con sequenze specifiche di α-eliche e β-foglietti. Catalizzano l’idrolisi di esteri grazie alla cosiddetta triade catalitica, composta da una serina nucleofila attivata da un legame a idrogeno in relé con l’istidina e aspartato (o glutammato). Le serino proteasi hanno esattamente lo stesso meccanismo catalitico. Come già detto, la maggior parte delle lipasi ha un lid o flap composto da una sequenza peptidica di α-eliche anfifiliche che presentano una conformazione chiusa del sito attivo in assenza dell’interfase o di un solvente organico, che impedisce al substrato l’accesso nel sito catalitico. Una volta che il lid è aperto, la vasta zona idrofobica del sito attivo viene esposta al substrato. Questa teoria è stata 29 A. A. Hasan, S. A. Hamee,. Enzyme Microb. Tech., 2006, 39, 235-251.
  • 14. 14 provata grazie alla struttura ai raggi X di una lipasi con un substrato legato in modo covalente al sito attivo.28 Dal punto di vista commerciale il più importante campo di applicazione delle lipasi è sicuramente quello dei detergenti, dove vengono addizionate al prodotto per aumentarne il potere sgrassante. Vengono aggiunte anche ai cibi, ad esempio sono impiegate nell’industria casearia, al fine di produrre sapori caratteristici, in quanto catalizzano la sintesi di esteri tra alcoli e acidi grassi a catena corta, componenti di aromi e fragranze. Le lipasi, grazie alla loro enantioselettività, sono utilizzate anche per la produzione di composti chirali e nella risoluzione di racemi.28 Altri impieghi di grande impatto commerciale vedono il loro utilizzo nell’industria cosmetica, tessile, della carta e del cuoio.29 I più recenti impieghi proposti per le lipasi sono per la sintesi di polimeri (poliesteri) biodegradabili ottenuti da fonti naturali rinnovabili, oppure del biodiesel, sempre da fonti naturali rinnovabili, mediante la conversione enzimatica di oli vegetali in esteri di alcoli a catena corta. 1.2.1 Lipasi B da Candida antartica (CalB) 1.2.1.1 Origine e struttura della CalB La Candida antarctica (figura 1.8) è un lievito alcalino scoperto nei fondali del lago Vanda in Antartide. Il lago ha un’interessante composizione delle acque, essendo formato da due fasi con spiccate differenze l’una dall’altra. La zona sottostante la superficie è formata da acqua fredda e priva di sale, mentre lo strato a profondità maggiore di 50 metri è formato da acqua estremamente alcalina. Un fatto interessante è che la temperatura di quest’acqua alcalina oscilla tra 25 e 43°C, mentre l’acqua di superficie non supera mai i 5°C, toccando picchi di -50°C. Questo straordinario effetto avviene grazie allo spesso strato di ghiaccio che quasi costantemente ricopre il lago. Il ghiaccio funziona come un pannello solare che converge la luce solare in energia termica che a sua volta rimane accumulata nelle profondità perché il flusso termico verso gli strati superiori è minimo. La Candida antarctica produce due tipi di lipasi, la lipasi A e la lipasi B.
  • 15. 15 La lipasi B (CalB) (figura 1.9) è una proteina globulare formata da un’unica catena polipeptidica di 317 amminoacidi, del peso molecolare di 33016Da e il folding caratteristico delle α/β idrolasi, proteine composte da sette β-foglietti centrali affiancati su entrambi i lati da 10 α-eliche.30 Figura 1.8 Coltura di Candida antarctica Può tollerare temperature di reazione elevate (fino a 70°C), soprattutto se immobilizzata su una resina di supporto. Originariamente scoperta nel lievito Candida antartica, oggi la forma nativa dell’enzima viene prodotta grazie alla clonazione e sovra-espressione del gene in cellule di lievito Aspergillus oryzae. 30 M. Skjøt, L. De Maria, R. Chatterjee, A. Svendsen, S. A. Patkar, P. R. Østergaard, J. Brask. ChemBioChem, 2009, 10, 520-527
  • 16. 16 Figura 1.9 Struttura cristallografica della CALB (PDB, codice 1-TCA 31 ). In evidenza la “triade catalitica”, costituita dai residui Ser105, Asp187 e His 224. Il sito attivo dell'enzima è sepolto in una cavità profonda e relativamente piccola se comparata al volume totale dell'enzima; il sito di legame del substrato ha una forma a imbuto, il che contribuisce ad incanalare il substrato all’interno del sito attivo garantendone il corretto orientamento. Come tutte le lipasi, anche la CalB presenta un sito catalitico formato da una triade amminoacidica Ser105-His224-Asp187. La cosiddetta catalitic machinery è completata dal sito ossianionico (Thr40, Gln106), il quale rende possibile la formazione dell'intermedio tetraedrico, grazie alla sua geometria spaziale che gli permette di formare tre legami idrogeno con l'ossigeno carbonilico del substrato, che nell’intermedio tetraedrico si carica negativamente (figura 1.10). 31 J. Uppenberg , M.T. Hansen , S. Patkar , T.A. Jones, PubMed, 1994, structure 2: 293-308
  • 17. 17 Figura 1.10 Vista laterale del sito attivo della CalB nello stato di transizione con 2-octilesanoato (sono state omesse le cariche) Nella CalB non è presente un vero e proprio lid, ma la piccola α-elica (α5) costituita dai residui 140-146, che mostra grande mobilità, è in grado di limitare solo parzialmente l’accesso al sito catalitico;30 questo è in accordo con il dato sperimentale grazie al quale è stato accertato che la CalB, a differenza delle altre lipasi, non presenta attivazione interfacciale.29 1.2.1.2 Meccanismo d’azione della CalB Il meccanismo d’azione della CalB è comune a molte idrolasi. La Ser105 è il vero e proprio amminoacido catalitico, in quanto il suo gruppo ossidrilico esegue l’attacco nucleofilo al carbonile del substrato, mentre l’His224 e l’Asp187 hanno lo specifico ruolo di potenziare il carattere nucleofilo dell’ossigeno serinico. L’azoto in posizione ε- del gruppo imidazolico dell’istidina accetta il protone ossidrilico della serina ed assume una carica positiva stabilizzata dall’interazione con il residuo di acido aspartico adiacente: questo produce un orientamento del gruppo imidazolico, nonché un aumento della basicità del suddetto atomo di azoto, che accetta così con minor difficoltà il protone serinico. In seguito all’attacco nucleofilo si forma quindi un intermedio tetraedrico, carico negativamente, che viene stabilizzato dai legami idrogeno con i residui amminoacidi formanti il sito ossianionico, due con Thr40 e uno con Gly106. Si libera poi una molecola di alcol mentre l’enzima rimane ancora nella forma acilata; successivamente tale
  • 18. 18 complesso si scinde liberando l’acido carbossilico e ripristinando la situazione di partenza per l’enzima (figura 1.11). Paktar et al.32 hanno dimostrato che l’optimum di attivazione dell’enzima è a pH 7.0 mentre cala rapidamente sotto i pH 6.0 e sopra pH 8.0. Questo definisce l’importanza dello stato di ionizzazione dell’aspartato e dell’istidina del sito catalitico. Figura 1.11 Meccanismo d’azione della CalB. L’esterificazione o la trans-esterificazione coinvolgono due stati di transizione (ST1 e ST2) e uno intermedio a enzima acilato. 1.2.1.3 Applicazioni industriali della CalB La CalB è un ottimo biocatalizzatore che catalizza reazioni di idrolisi in ambiente acquoso e di esterificazione in solvente organico. Questo enzima viene impiegato in numerosi campi industriali, grazie alla sua elevata enantioselettività, buona stabilità termica, ampia gamma di substrati e stabilità in diversi solventi organici e liquidi ionici.33 La CalB mostra versatilità nella biocatalisi 32 S. A. Paktar, F. Bjorkling, M. Zyndel, M. Schulein, A. Svendsen, E. Gormsen; Indian J. Chem., 1993, 32, 76–80. 33 P. Todler, J. Pleiss. Structural Biol., 2008,. Vol.8, pg.9
  • 19. 19 asimmetrica: tipicamente è usata per risolvere miscele racemiche o per produrre building blocks chirali. Recentemente sono state usate modificazioni chimiche e tecniche di ingegneria molecolare per migliorare la termostabilità e l’attività specifica dellaCalB.34 1.2.2 Pseudomonas cepacia lipasi (PcL) La lipasi da Pseudomonas cepacia è espressa da un organismo procariotico. Come la maggior parte delle lipasi subisce ampie variazioni conformazionali all’interfaccia olio-acqua. La cristallografia a raggi X ha mostrato che questa lipasi è una α/β idrolasi e la triade catalitica è rappresentata da Ser87, His286 e Asp264. La PcL rivela anche un sito d’azione accessibile al solvente per via della sua conformazione molto aperta. Una struttura di questo tipo suggerisce che l’attivazione interfacciale di questa proteina sia seguita da una riorganizzazione della struttura secondaria e da un forte spostamento del lid che libera il sito attivo. La PcL dimostra un’ottima attività nell’idrolisi di trigliceroli con lunghe catene. Questo enzima è impiegato largamente per sintesi organiche e idrolasi per via della sua enantioselettività.35 La sequenza degli amminoacidi che la compongono è stata dedotta dalla sequenza complementare del DNA. La struttura polipeptidica matura comprende 320 residui amminoacidici con una massa calcolata di 33128 Da. La PcL è un enzima globulare con dimensioni approssimate di 30Åx40Åx50Å, e la sua struttura può venir suddivisa in un dominio più grande e due piccoli domini, come schematizzato nella figura 1.12. 34 K. S. Siddiqui, R. Cavicchioli. Extremophiles, 2005, 9, 471-476. 35 Kyeong Kyu Kim, Hyun Kyu Song, Dong Hae Shin, Kwang Yeon Hwang and Se Won Suh, Triacylglycerol lipase, Biophisical Journal,1997, 5(2), 187-202.
  • 20. 20 Figura 1.12 struttura secondaria della PcL La PcL presenta nella sua struttura cristallografica lo ione Ca++ ritenuto importante per la stabilità della proteina. Questo aspetto della PcL è stato studiato nel paragrafo 3.2.1, dove è stata messa a confronto la stabilità della PcL dopo variazione termica, con e senza lo ione Ca++ . Lo ione Ca2+ (Figura 1.13 forma sei legami di coordinazione, interagendo con quattro atomi di ossigeno della proteina e con due molecole d’acqua. I quattro atomi proteici che coordinano il Ca2+ includono l’atomo di ossigeno del carbonile di Gln292 e Val296 e l’Oδ2 di Asp242 e Asp288. Il calcio è situato a 14.5Å dalla serina della triade catalitica, quindi, il suo ruolo è strutturale, con funzione principale di stabilizzare la proteina.36 Figura 1.13 Rappresentazione a nastro della PcL (in giallo lo ione Ca ++ ) 36 Joseph D Schrag, Yunge Li, Miroslaw Cygler, Pseudomonas cepacia lipase structure, Biomed Experts, February 1997, 5:187–202
  • 21. 21 1.2.3 Lipasi da Rhizopus oryzae (Rol) La lipasi da Rhizopus oryzae è una lipasi fungina. Viene sintetizzata come precursore che consiste di 26 amminoacidi di presequenza, 97 amminoacidi di prosequenza e 269 amminoacidi che formano una lipasi matura di 30kDa37 , come schematizzato in figura 1.14: Figura 1.14 Schema della struttura della Rol Il meccanismo d’azione della Rol è simile a quello delle altre lipasi27 , figura 1.15: Figura 1.15 Meccanismo d’azione della Rol 37 Mitsuyoshi Ueda, Shouji Takahashi, Motohisa Washida, J. Mol. Catal. B:Enzymatic 17, 2002, 113-124
  • 22. 22 In letteratura non è presente la struttura cristallografica della Rol. Recentemente è stato riportato che la Rol viene espressa in diversi ospiti quali: Escherichia coli, Pichia pastoris, Saccharomyces cerevisiae, e Aspergillus oryzae. Un’altra scoperta importante è la tossicità della Rol matura, dovuta a un basso livello di attività della fosfolipasi C. Questa attività viene comunque mascherata dalla prosequenza evitando danni38 . 1.3 Modellismo molecolare La possibilità di simulare sistemi reali, di predirne le proprietà e riuscire a spiegare i dati sperimentali, rende il modellismo molecolare uno strumento complementare alla ricerca sperimentale. Esso è in grado di offrire indicazioni su nuove vie di ricerca, migliorare l’attività di composti già conosciuti o ridurre il numero di fallimenti. Il modellismo molecolare è una tecnica che permette di costruire, facendo ricorso a complessi algoritmi di calcolo, dei modelli tridimensionali, di ottimizzare la geometria delle molecole e di calcolarne le proprietà fisiche come ad esempio l’energia, la distribuzione delle cariche, le interazioni intra- e intermolecolari. Questo spiega il crescente interesse verso queste tecniche dovuto alla mancanza di tecniche sperimentali di routine che permettano di osservare direttamente singoli atomi e molecole. Con l’aumento della potenza di calcolo dei processori le tecniche computazionali sono diventate sempre più sofisticate ed hanno permesso un ampliamento dei campi in cui è possibile applicare la chimica computazionale. Nonostante la sempre maggior potenza dei moderni processori i calcoli necessari a risolvere gli algoritmi richiedono tempi anche molto lunghi, e questi aumentano proporzionalmente al numero di atomi del sistema, e quindi di variabili da considerare. I metodi impiegati nel modellismo molecolare possono essere distinti in due gruppi: - metodi quantomeccanici (ab initio o semiempirici); - metodi di meccanica molecolare o metodo dei campi di forza. 38 Tigran V. Yuzbashev , Evgeniya Y. Yuzbasheva, Tatiana V. Vibornaya, Protein Expres. Purif. 82, 2012, 83-89
  • 23. 23 1.4 Meccanica quantistica e meccanica molecolare La costruzione di un modello che possa essere in grado di descrivere accuratamente tutti gli aspetti energetici e geometrici di una molecola, necessita, in primo luogo, di un processo di “matematizzazione” della struttura. Per procedere in questo senso dovrebbe, prima di tutto, essere perso il concetto di legame chimico così com’è conosciuto a favore di una visione della molecola come insieme di atomi posti in un sistema di assi cartesiani; in questo modo è possibile associare ad ogni atomo una terna di valori (coordinate spaziali) senza perdere alcuna informazione geometrica come, ad esempio, la distanza di legame. Obiettivo primario del modellismo molecolare è la correlazione dell’energia della molecola con la sua struttura e la sua disposizione nello spazio. Fin qui si è parlato spesso di energia, ma a questo punto si rende necessario definire cosa si intende con questo termine, di che tipo è questa energia e qual è la natura della funzione che la mette in relazione alla struttura. L’energia ha due componenti, l’energia potenziale e l’energia cinetica, pertanto viene chiamata energia dinamica: Se la molecola è completamente ferma (0 K) o se si considera un sistema relativistico in cui ci muoviamo insieme ad essa, l’energia cinetica è nulla; in questo caso l’energia totale deriva dal solo contributo dell’energia potenziale e viene detta energia meccanica. Ai fini della costruzione di un modello è utile, quindi, ottenere una funzione che metta in relazione l’energia della molecola con la sua struttura: Per fare questo è necessario ricorrere all’applicazione di alcuni principi: - Leggi della meccanica quantistica: complicate e dispendiose in termini di tempo e risorse, comprendono la meccanica quantistica (QM) e la dinamica quantistica (QD); - Leggi della meccanica classica o Newtoniana: semplicistiche e non sempre sufficienti a spiegare tutte le proprietà molecolari di interesse, comprendono la meccanica molecolare classica (MM) e la dinamica molecolare classica (MD). Una molecola piccola, come può essere un substrato, possiede un numero ristretto di atomi ed è quindi facile e veloce eseguire i calcoli in modo quantistico, ma se la molecola in questione è una
  • 24. 24 macromolecola proteica costituita da migliaia di atomi, tutto diventa molto più lento e complicato. E’ possibile unire i vantaggi dei due metodi ricorrendo ad un sistema ibrido (MM/QM), un compromesso che permetta di definire una parte della molecola, solitamente la più importante (es. il sito attivo), in modo “quantistico” e la parte rimanente, meno importante, in modo “classico”. Va precisato che i sistemi MM/QM sono complicati dalla necessità di parametrizzare adeguatamente l’interfaccia tra la parte QM e quella MM e quindi non sempre costituiscono la migliore soluzione. Non entreremo nei dettagli della meccanica quantistica ma ci occuperemo della meccanica molecolare. 1.4.1 Meccanica molecolare: atom types e campi di forza In meccanica molecolare (MM) l’atomo perde completamente la sua descrizione quantomeccanica e viene semplicemente descritto come una sfera dotata di una massa, un volume e una carica elettrica puntiforme in relazione al tipo di atomo che rappresenta. Per recuperare il concetto di valenza associato ad ogni atomo, che viene perso con questa approssimazione, si introduce il cosiddetto atom type che associa ad ogni sfera tutte le proprietà descritte per ogni atomo, appunto, dalla sua valenza (numero di legami, ibridizzazione, ecc). Nella meccanica molecolare, esistono tanti atom types quante sono le possibili situazioni chimiche in cui ogni atomo può venirsi a trovare nel formare le differenti strutture molecolari. Per descrivere le interazioni tra i vari atomi che costituiscono la nostra molecola, si utilizza, quindi, una funzione matematica chiamata campo di forze o force field basata sulle leggi della meccanica classica. Il campo di forze deve essere descritto da una funzione matematica semplice, continua e differenziabile che descrive l’energia potenziale associata alla molecola in funzione delle coordinate di tutti gli atomi che la costituiscono. E’ fondamentale per la sua applicazione che la funzione dell’energia potenziale associata al campo di forze bilanci opportunamente la semplicità della sua forma analitica con l’accuratezza nella descrizione delle proprietà energetiche e strutturali delle diverse molecole analizzate. Si assiste quindi ad una specializzazione che permette di utilizzare campi di forze differenti per ogni tipo di molecola e di applicazione. In figura 1.16 sono riportati alcuni esempi dei campi di forze più utilizzati.
  • 25. 25 MM2, MM3, MM4 (Allinger, 1977, 1988, 1989, 1996, 1997; Lii, 1989a, 1989b, 1989c, 1991, 1998; Nevins, 1996; Hay, 1998) CFF93 (“Central Force Field”, Levy, 1979) MMFF (“Merck Molecular Force Field”, Halgren, 1992, 1996a, 1996b, 1996c, 1996d, 1996e) Piccole molecole organiche PEF95SAC (Rasmussen, 1997) Polisaccaridi SHAPES (Allured, 1991) Complessi Metallici ECEPP (“Empirical Conformational Energy Program for Peptides”, Momany, 1975; Nemethy, 1983; Sippl, 1984) CHARm (“Chemistry at Harvard Macromolecular Mechanics”, Brooks, 1983; MacKerell, 1998, 2004) AMBER (“Assisted Model Building with Energy Refinement”, Weiner, P.K. 1981; Weiner, S.J. 1984; Kollman, 1986, 1995; Pearlman, 1991; Ponder, 2003) OPLS (“Optimised Potentials for Liquid Simulations”, Jorgensen, 1988, 1996; Kaminski, 1994; Damm, 1997) GROMOS (“Groningen Molecular Simulation”, Hermans, 1984; Ott, 1996) Proteine e nucleotidi Figura 1.16 Esempi di specializzazione del campo di forze
  • 26. 26 La meccanica molecolare, però, presenta, alcuni limiti intrinseci alle teorie stesse su cui si basa: - l’eliminazione dalla trattazione matematica della struttura intima di ogni atomo e, quindi la rappresentazione esplicita della sua configurazione elettronica limita l’applicazione principalmente allo studio degli stati fondamentali delle strutture molecolari, in quanto risulta impedita la descrizione accurata di ogni processo che implica scissione o formazione di legami; - i risultati ottenuti sono rigorosamente legati alla bontà della funzione dell’energia potenziale (force field) e dall’insieme dei parametri associati ad ogni atom type; - la funzione dell’energia potenziale descritta dal campo di forze ha scarso significato chimico, ad eccezione delle strutture associate a conformazioni termodinamicamente stabili e, in alcuni casi, alle barriere energetiche rotazionali. Il campo di forze è, quindi, una funzione empirica dell’energia potenziale; l’origine di questi “force fields methods”, nati per essere applicati principalmente allo studio dell’analisi conformazionale, è contemporanea allo sviluppo delle applicazioni dei metodi quantomeccanici (anni ’60). Essi derivano dalla spettroscopia vibrazionale in cui è necessario costruire delle particolari funzioni dell’energia potenziale per poter utilizzare le informazioni spettroscopiche nella descrizione del comportamento complessivo di una molecola. In questo campo, la funzione dell’energia potenziale usata per descrivere le vibrazioni molecolari è simulata da: - una funzione matematica che è la sommatoria di tutte le interazioni tra atomi, senza una precisa correlazione alla struttura covalente della molecola39 ; - una funzione matematica legata ai valori delle distanze e degli angoli interatomici40 ; a differenza del modello CFF, questo modello è strettamente dipendente dalla molecola. Da questi differenti approcci si è sviluppata l’odierna meccanica molecolare basata sul concetto del campo di forze; i calcoli che questa metodica permette sono di notevole importanza per la chimica organica moderna, trovando impiego nel calcolo delle conformazioni molecolari, delle proprietà termodinamiche e degli spettri vibrazionali. Queste metodiche, come già visto, trattano la molecola come un insieme di particelle tenute insieme da semplici forze armoniche che possono essere descritte, in termini di energia potenziale, sommando tutti i fattori sterici che vi contribuiscono. Ne risulta la seguente equazione41 39 J. Maple, M. Hwang, T. Stockfish, U. Dinur, M Waldman, C. Ewig, A. Adler, J. Comput. Chem., 1994, 15, 161 40 J. Martins, A. Zunger, Phys. Rev., 1984, 30, 6217 41 P. Cox, J. Chem. Educ., 1982, 59, 275
  • 27. 27 dove Estr è l’energia dovuta alla deformazione dei legami lungo l’asse (stiramento o compressione), Ebend è l’energia dovuta al piegamento, Etors è l’energia dovuta alla torsione dei legami, Enb è l’energia dovuta a interazioni di non legame quali quelle elettrostatiche e quelle di van der Waals, EH-bonds è l’energia dovuta alla formazione di legami idrogeno ed Ei è un termine che include gli effetti del solvente o altri termini particolari. Ognuno di questi termini rappresenta una deformazione della molecola da un’ipotetica geometria di riferimento. Ad esempio se la lunghezza di un legame Csp3- Csp3 libero da tensioni è di circa 1.5-2.0 Å, ogni deviazione da tale valore causa un incremento dell’energia potenziale. Il fattore che descrive la deformazione del legame può essere espresso con la seguente formula: dove Kl (kcal/mol・Å2 ) è la costante elastica della forza, l è la lunghezza del legame (Å), l0 è la lunghezza dello stesso legame libero da tensioni e la sommatoria si intende per tutti i legami della molecola. L’energia potenziale riferita agli angoli di valenza, θ, è descritta dalla formula: dove Kθ è la costante di bending [kcal/mol・(°)2 ], θ è il valore dell’angolo tra due legami adiacenti (°) e θ0 corrispondente al valore dello stesso angolo libero da tensioni. Per quel che riguarda gli angoli di torsione, il contributo energetico è dato dalla seguente formula: dove Kω è una costante di forza che esprime, nello specifico, l’impedimento energetico alla rotazione libera (kcal/mol), ω rappresenta l’angolo di torsione (°), n è la periodicità di Kω ed s può assumere i valori +1 (energia minima, conformazione sfalsata) o -1 (energia massima, conformazione eclissata). L’energia potenziale dovuta alle interazioni di non legame (elettrostatiche e van der Waals) dipendenti dalla distanza r, può essere espressa con la formula:
  • 28. 28 dove Aij è il coefficiente che descrive le interazioni repulsive atomiche (AiAj)1/2 , Bij è il coefficiente che descrive le interazioni attrattive atomiche (BiBj)1/2 , qi e qj sono le cariche nette sugli atomi i e j, ε è la costante dielettrica del mezzo e Rij è la distanza tra i due atomi i e j (Å). Infine, il contributo apportato dalla formazione di legami idrogeno è espresso mediante la formula: in cui Cij è il coefficiente che descrive le interazioni repulsive tra atomi di idrogeno e accettore (CiCj)1/2 , Dij è il coefficiente che descrive le interazioni attrattive tra atomi di idrogeno e accettore (DiDj)1/2 e Rij è la distanza tra i due atomi (Å). Possono essere usati, ove necessario, altri fattori aggiuntivi che tengono conto delle deformazioni fuori dal piano e delle interazioni di Coulomb e del solvente. Per costruire un campo di forze sono necessari molti parametri come le costanti di forza e i valori geometrici in assenza di tensioni. Essi possono essere determinati mediante esperimenti termodinamici e di diffrazione eseguiti su un numero elevato di molecole opportune. I valori iniziali così ottenuti spesso sono solo una stima grossolana e devono essere perfezionati da metodi “per tentativi” o con il più razionale metodo dei “minimi quadrati”. La qualità del campo di forze che ne deriva è definita dalla sua capacità di riprodurre i dati con un’accuratezza maggiore o uguale a quella dei metodi sperimentali33 . Per un uso ottimale è necessario essere in possesso di un set di coordinate tridimensionali degli atomi della molecola in esame, il quale sarà progressivamente modificato durante i calcoli effettuati per minimizzare l’energia sterica. E’ possibile assumere che, di tutti i vari isomeri conformazionali possibili per la nostra molecola, quello che possiede il più basso valore di energia rappresenti la conformazione più favorevole per la molecola isolata. E’ importante sottolineare che la meccanica molecolare è fondamentalmente un metodo empirico e il modello che si ottiene con essa è riferito ad un ipotetico stato di immobilità allo zero assoluto. Differenze tra campi di forza diversi sono illustrati in figura 1.17:
  • 29. 29 Figura 1.17 illustrazione schematica di differenti campi di forza Il campo di forza Martini42 è un coarse grained cioè un campo di forza a grana grossa. Si sceglie di utilizzare questo campo di forza per diminuire i tempi di calcolo, perché la definizione degli atomi è ridotta, cioè i gruppi funzionali sono rappresentati come particelle grossolane piuttosto che descritte atomo per atomo (come succede nei campi di forza all-atom o united-atom). Quindi il campo di forza Martini si utilizza quando non c’è necessità di analizzare legami idrogeno o altri fenomeni fini. Viene così aumentata l’efficienza computazionale. Il campo di forza GROMOS 96 53a643 , invece, è un campo di forza United-Atom, cioè un campo di forza che non include gli atomi di idrogeno non polari. Infine il campo di forza OPSL44 , è un campo di forza All-Atom. Questo significa che riconosce tutti gli atomi, idrogeni compresi. Il tempo di calcolo diventa più lungo proprio per questo motivo. In base alle necessità computazionali, si sceglie di usare un opportuno campo di forza, come vedremo anche più avanti nella discussione della tesi. 42 S. J. Marrink , H. J. Risselada ,S. Yefimov , D. P. Tieleman , A. H. de Vries, J. Phys. Chem. B, 2007, 111 (27), 7812– 7824 43 C. Oostenbrink, T. A. Soares, N. F. A. van der Vegt, W. F. van Gunsteren,EBJ, 2005,34(4), 273-284 44 W. L. Jorgensen, J. T.Rivers, JACS, 1988, 110 (6), 1657–1666
  • 30. 30 1.4.2 Analisi conformazionale Le trasformazioni conformazionali cui una molecola può andare incontro sono principalmente determinate da variazioni negli angoli di torsione, in quanto cambiamenti delle lunghezze e degli angoli dei legami avvengono in misura molto minore. I cambiamenti della conformazione di una molecola possono essere considerati come movimenti all’interno di una superficie multidimensionale che descrive le relazioni esistenti tra l’energia potenziale e la geometria della molecola stessa. Ogni punto appartenente a questa superficie rappresenta l’energia potenziale della conformazione corrispondente assunta dalla molecola. Conformazioni energeticamente stabili corrispondono a minimi locali su questa superficie. La popolazione relativa di una determinata conformazione dipende dal suo “peso” statistico che è a sua volta influenzato non solo dall’energia potenziale, ma anche dall’entropia. Di conseguenza, il minimo assoluto nella superficie dell’energia potenziale, che caratterizza la conformazione dotata della minore energia potenziale, non corrisponde sempre alla struttura che presenta la maggiore incidenza statistica38 . Le tecniche sperimentali, come la spettroscopia NMR, sono in grado di fornire informazioni riferite solo ad una o a poche conformazioni per ogni molecola. Un’analisi completa di tutte le conformazioni potenziali per una struttura può essere ottenuta solo con metodi teorici. Per questo motivo, sono stati sviluppati numerosi metodi teorici per l’analisi conformazionale. I più generali sono in grado di identificare tutti i minimi sulla superficie dell’energia potenziale, ma aumentando il numero di legami singoli in grado di ruotare, aumenta il numero di minimi relativi, per cui un’analisi esaustiva diventa un lavoro che necessita di tempi elevati. Il tempo richiesto per un’analisi conformazionale dipende, inoltre, dal tipo di metodo utilizzato per il calcolo dell’energia. I metodi basati sulle leggi della quantomeccanica sono molto dispendiosi in questo senso, di conseguenza la maggior parte dei programmi per la ricerca conformazionale utilizza metodi basati sulla meccanica molecolare per il calcolo delle energie. 1.4.2.1 Procedure di ricerca conformazionale sistematica La ricerca sistematica rappresenta, forse, il metodo più semplice e naturale tra quelli oggi utilizzati per la ricerca conformazionale, in quanto genera le possibili conformazioni attraverso la variazione, appunto, sistematica di ogni angolo di torsione presente in una molecola.
  • 31. 31 Se il valore scelto per l’incremento di ogni singolo angolo preso in esame da questa metodica è sufficientemente piccolo, può essere ottenuta un’esplorazione completa dello spazio conformazionale di una molecola45 . Il numero di conformeri generati dipende, quindi, dal valore dell’angolo di incremento scelto, ma anche dal numero di legami rotabili: se n è il numero di questi legami, il numero di conformazioni cresce con la n-esima potenza, come si può facilmente intuire dalla formula seguente in cui N è il numero di conformeri generati e δ è l’angolo di incremento. In alcuni casi, il risultato in termini di differenti conformazioni è talmente elevato da non poter essere analizzato facilmente. Si rende quindi necessaria l’applicazione di alcuni artifici per la riduzione del numero di conformeri ottenibili. Il primo passo in questo senso, viene effettuato prima del calcolo dell’energia potenziale analizzando le strutture e scartando quelle in cui si verificano sovrapposizioni del volume occupato da atomi non direttamente legati tra loro (“van der Waals screening” o “bump check”). I conformeri rimanenti sono sottoposti al calcolo dell’energia potenziale utilizzando metodi di meccanica molecolare, con la possibilità di “scremare” ulteriormente le strutture utilizzando un intervallo di energia che elimina le conformazioni dotate di valori di energia esterni ad esso. Le conformazioni risultanti da questi “filtri” rappresentano un insieme completo dei conformeri energeticamente accessibili per la molecola in esame46 . 1.4.2.2 Metodo “Monte Carlo” o “random search” Il metodo Monte Carlo38 , così chiamato dal suo ideatore von Neumann alludendo alla capitale del Principato di Monaco, esegue la ricerca delle possibili conformazioni di una struttura utilizzando tecniche statistiche. Ad ogni passo della ricerca, l’ultima conformazione generata viene modificata in maniera casuale per ottenerne un’altra. La ricerca deve iniziare da una struttura già ottimizzata, essendo questo un requisito fondamentale per incrementare la bontà dei risultati. Ad ogni iterazione, i nuovi angoli di torsione e/o le nuove coordinate cartesiane sono assegnati casualmente. Le conformazioni risultanti sono quindi minimizzate con metodi che utilizzano la 45 Höltje, G. Folkers, Molecular Modeling, Basic Principles and Applications, 1997, Wiley.VCH ed., Weinheim, Germany. 46 W. Hastings, Biometrika, 1970, 57, 97.
  • 32. 32 meccanica molecolare e il processo di ricerca casuale viene ripetuto. Ogni conformazione generata viene confrontata con le precedenti e conservata solo se differente da esse. Questo processo garantisce, in teoria, un’esplorazione completa di tutte le regioni dello spazio conformazionale, ma, praticamente, questo è possibile solo se il processo viene eseguito per un tempo sufficiente, che potrebbe diventare molto lungo in quanto la probabilità di trovare una conformazione nuova e unica decresce drasticamente con l’aumentare del numero di conformeri già scoperti. In realtà, se una conformazione è stata trovata per un numero n di volte, la probabilità che tutte le conformazioni ricercate siano state trovate è [1-(1/2)n ]. Numericamente parlando, l’algoritmo utilizzato da questo metodo arresta la ricerca quando la stessa struttura è stata ottenuta otto volte, garantendo così l’esplorazione del 99.6% circa dello spazio conformazionale. Il vantaggio maggiore di questa tecnica consiste nella teorica possibilità di trattare con successo strutture di qualsiasi dimensione, anche se, in pratica, molecole dotate di elevata flessibilità raramente danno risultati convergenti a causa dell’ampiezza del loro spazio conformazionale. Un altro vantaggio è la possibilità di analisi di sistemi ciclici che risultano generalmente difficili da trattare mediante ricerca sistematica. Riguardo questa tecnica, è utile sottolineare che essa è in grado di eseguire ricerche conformazionali di ottima qualità per diversi tipi di molecole, ma potrebbe richiedere tempi di calcolo troppo elevati per assicurare un’analisi completa di tutto lo spazio conformazionale. 1.4.2.3 Dinamica molecolare Questo metodo è in grado di studiare il moto ed esplorare le possibilità conformazionali di una struttura molecolare, anche dotata di particolare complessità, senza essere affetto dalle limitazioni tipiche della Ricerca Sistematica e degli elevati tempi di calcolo che caratterizzano il metodo Monte Carlo. Il principio di questo metodo si basa sull’integrazione delle classiche equazioni del moto che derivano dalla Seconda Legge di Newton38 : in cui Fi è la forza agente sull’atomo i al tempo t, mi è la massa dell’atomo i e ai è l’accelerazione dell’atomo i al tempo t. La forza agente sull’atomo i può essere calcolata direttamente derivando la funzione dell'energia potenziale E rispetto alle sue coordinate ri:
  • 33. 33 Questa equazione classica del moto permette di determinare le coordinate e la velocità dopo un certo tempo (traiettoria). Il gradiente dell’energia potenziale, calcolato dal campo di forze, viene usato per determinare le forze che agiscono su ogni singolo atomo mentre le velocità iniziali degli atomi vengono generate in maniera casuale all’inizio della simulazione. Questa simulazione, la cui durata può essere stabilita inizialmente, genera un insieme di conformazioni energeticamente accessibili per la molecola in esame. Rispetto alle altre metodiche di analisi conformazionale, la dinamica molecolare presenta un vantaggio che consiste nell’automatica eliminazione dei conformeri energeticamente non accessibili, ma anche un limite costituito dalla possibilità che le barriere energetiche che separano le diverse conformazioni del sistema possano essere troppo elevate per essere superate, escludendo dall’esplorazione alcune regioni dello spazio conformazionale. Quest’ultimo inconveniente può essere superato impostando nella simulazione delle temperature adeguate che permettono il superamento di tali barriere. I calcoli del moto degli atomi vengono effettuati ad intervalli discreti (time steps) la cui entità può essere definita. Lo spostamento di un atomo nel time step è calcolato con il metodo di Verlet47 che utilizza la velocità nel punto medio dell’intervallo di tempo, dato che la velocità non è costante all’interno di esso; questa velocità viene estrapolata dai valori di velocità e accelerazione dello step precedente, secondo il seguente algoritmo: dove F(t + Δt), forza che agisce sull’atomo, è calcolata derivando la funzione dell’energia potenziale rispetto alla posizione r(t+ Δt). Per garantire una corretta integrazione delle equazioni del moto e ridurre, quindi, l’errore nel calcolo dell’energia del sistema, è necessario che l’intervallo di integrazione sia compreso tra 1/100 e 1/20 del tempo associato al moto più veloce a cui il nostro sistema molecolare è sottoposto. 47 L. Verlet, Phys. Rev., 1968, 165, 201.
  • 34. 34 In dinamica molecolare classica il moto più veloce è associato proprio alla vibrazione del legame (10÷100 fs). Se i time steps sono troppo elevati, ne deriva uno spostamento atomico troppo elevato; d’altro canto, intervalli di tempo di piccole dimensioni comportano l’analisi di un maggior numero di conformazioni con conseguente aumento dei tempi di calcolo. Un ottimo compromesso può essere ottenuto mediante l’utilizzo dell’algoritmo Shake48 , che permette di congelare i moti vibrazionali dei legami con gli atomi di idrogeno (C-H, N-H, O-H, etc.). Questo algoritmo va, comunque, utilizzato impostandone i parametri con cautela in quanto un numero troppo elevato delle iterazioni che potrebbero derivarne annullerebbe il vantaggio derivante dall’utilizzo di time steps più grandi. Solitamente, nello studio di interazioni tra un ligando e una molecola proteica vengono preimpostate durate dell’ordine delle unità di ps49 , mentre gli intervalli di tempo utilizzati vanno da 1 fs fino ad un massimo di 5 fs, utilizzando l’algoritmo Shake. In una simulazione di dinamica molecolare, la temperatura viene inizialmente portata da 0 K alla temperatura predeterminata per la simulazione stessa (equilibration stage); una volta raggiunta, questa temperatura viene mantenuta per tutta la durata preimpostata della dinamica. Nella fase di equilibratura della temperatura (equilibration stage), la velocità di tutti gli atomi viene modificata in modo uniforme per mantenere delle popolazioni cineticamente omogenee: dove T0 rappresenta la temperatura di esperimento e T è la temperatura del sistema. Dopo l'equilibratura, il sistema è mantenuto a temperatura costante mediante l’utilizzo del metodo di Berendsen50 , con il quale la velocità viene messa in relazione con le piccole oscillazioni di temperatura attraverso un fattore λ, dato dalla formula: dove Δt è l'ampiezza del time step, τ è il tempo di rilassamento, T0 è la temperatura della simulazione e T è la temperatura istantanea. La temperatura che viene raggiunta dopo la fase iniziale di equilibratura, va incontro a delle oscillazioni e va, pertanto, mantenuta il più possibile costante operando continui aggiustamenti; queste oscillazioni nei valori della temperatura sono 48 J. Ryckaert, G. Cicciotti, H. Berendsen, J. Comput. Phys., 1977, 23, 327. 49 M. Norin, K. Hult, Biocatalysis, 1993a, 7, 131. 50 H. Berendsen, J. Postma, W. van Gunsteren, A. Di Nola, J. Haak, J. Chem. Phys., 1984, 81, 3684.
  • 35. 35 imputabili al fatto che l'energia del sistema varia anche in funzione della posizione degli atomi, riflettendosi in un’ulteriore variazione della temperatura. Per quanto riguarda la pressione, la trattazione che viene utilizzata è del tutto analoga a quella appena vista per la temperatura. Una tecnica che viene spesso utilizzata consiste nella definizione degli aggregati, cioè di gruppi di atomi le cui posizioni vengono mantenute costanti nel corso della simulazione, ma il cui contributo energetico viene calcolato e tenuto in considerazione nel calcolo totale. Questa strategia è maggiormente impiegata nella valutazione dell’interazione tra enzima e substrato, in cui risultano di particolare interesse solo gli amminoacidi vicini al sito attivo. Il principale vantaggio che ne deriva è, ovviamente, la riduzione dei tempi di calcolo. I fenomeni chimico-fisici che si verificano a livello atomico e molecolare possono richiedere periodi di tempo estremamente vari, da pochi femtosecondi a diverse decine di secondi. In figura 1.18 è riportata la scala temporale dei movimenti atomici e molecolari. E’ possibile osservare che: - il trasferimento di elettroni è il fenomeno più rapido ed avviene in pochi femtosecondi (1 fs = 10-15 sec). Per poter descrivere accuratamente tale fenomeno è necessario ricorrere alle equazioni della meccanica quantistica, estremamente dispendiose da un punto di vista computazionale. Tuttavia, se il sistema è costituito da un numero limitato di atomi, dal momento che il fenomeno avviene in un periodo estremamente breve, può essere simulato al computer in tempi sufficientemente brevi; - il movimento delle catene amminoacidiche di una proteina avviene in un periodo di tempo superiore, nell’ordine dei picosecondi (1 ps = 10-12 sec). Per simulare con estrema precisione questo fenomeno sarebbe necessario ricorrere alle leggi della meccanica quantistica, ma l’elevata complessità del sistema e il periodo di tempo eccessivamente lungo, renderebbero la simulazione irrealizzabile. Per questo motivo il sistema dev’essere semplificato e si ricorre alla meccanica molecolare. Con tali approssimazioni un moderno computer è in grado di simulare il sistema senza troppe difficoltà nell’arco di alcune ore; - i cambiamenti conformazionali sono fenomeni complessi e richiedono decine o centinaia di nanosecondi (1 ns = 10-9 sec). Per poter essere simulati è spesso necessario ricorrere approssimazioni maggiori rispetto al punto precedente. I tempi di calcolo aumentano considerevolmente fino richiedere diverse settimane o alcuni mesi;
  • 36. 36 - il folding di peptidi, enzimi o acidi nucleici è il fenomeno più difficile da simulare e la sua durata è proporzionale al numero di atomi che costituiscono il sistema. Sequenze di alcune centinaia di amminoacidi si ripiegano normalmente in alcuni microsecondi (1 μs = 10-6 sec) o millisecondi (1 ms = 10-3 sec), mentre il folding di sistemi complessi, come gli enzimi o il DNA, avviene in diversi secondi. Per simulare questo fenomeno è necessario disporre di potenti macchine da calcolo costituite da migliaia di processori. Figura 1.18: Scala temporale dei movimenti atomici e molecolari. 1.4.2.4 Metodi di minimizzazione L’energia potenziale di una molecola è direttamente correlata alle sue caratteristiche chimiche e alla sua geometria. Il processo di minimizzazione consiste nell’applicazione di metodi matematici iterativi allo scopo di ottimizzare geometricamente la struttura e di raggiungere la situazione spaziale (set di coordinate atomiche) corrispondente al minimo energetico. Nell’analisi della funzione dell’energia potenziale effettuata con questi metodi iterativi, sono presenti tre problematiche computazionali principali: - la scelta della direzione iniziale di ottimizzazione, particolarmente critica se ci troviamo in spazi multidimensionali;
  • 37. 37 - la ricerca della massima riduzione del numero di steps per il raggiungimento della situazione di minimo più vicina. Va ricordato che, ad ogni variazione delle coordinate, il campo di forze deve essere riapplicato per il calcolo dell’energia potenziale; - la scelta del criterio matematico per la determinazione dell’avvenuto raggiungimento del minimo (criterio di convergenza). Un cenno a parte merita anche il problema dell’evasione da eventuali minimi relativi e locali sull’ipersuperficie dell’energia potenziale. I tradizionali metodi di minimizzazione sono, infatti, in grado di individuare solo i minimi più prossimi al punto di partenza. Fattore determinante in questo senso è la conformazione di partenza: l’unico modo per trovare il minimo assoluto consiste nell’applicazione delle metodiche per la ricerca conformazionale descritte in precedenza al fine di ottenere un insieme di conformazioni di partenza da analizzare, in seguito, con i processi di minimizzazione. I metodi utilizzati per questi processi possono essere divisi in due categorie in base al tipo di algoritmi matematici che utilizzano: - metodi non derivativi: il più utilizzato tra questi è il “Simplex method”51 basato su un algoritmo matematico molto leggero in termini di complessità di calcolo, ma che risulta anche scarsamente efficiente; il suo utilizzo è ristretto ai casi in cui vengono modellate superfici di energia potenziale a topologia estremamente complessa (strutture ad elevato grado di distorsione che presentano una funzione dell’energia potenziale e la sua derivata non continue). Questo metodo agisce su ogni atomo finché le forze su di esso non scendono sotto un determinato valore soglia. - metodi derivativi: come già visto, tra i requisiti fondamentali che una funzione che descrive un campo di forze deve possedere, troviamo la continuità e la differenziabilità in ogni suo punto; infatti, dall’analisi delle derivate prima e seconda di queste funzioni matematiche possiamo ottenere informazioni sulla topologia della superficie dell’energia potenziale. Tra questi metodi sono presenti tre approcci fondamentali, denominati Steepest descent, Conjugated gradient e Truncated Newton52 . Il metodo Steepest descent ricerca la situazione di minimo individuando e scendendo lungo una direzione associata alla maggior pendenza della superficie dell’energia potenziale. Il metodo utilizzato è quello definito “line searching” che prevede cambi di direzione sempre perpendicolari 51 T. Darden, D. York, L. Pedersen, J. Chem. Phys., 1993, 98, 10089. 52 W. Press, B. Flannery, S. Teukolski, W. Vetterling, The Art of Scientific Computing, 1988, Cambridge University Press, Cambridge, UK.
  • 38. 38 tra loro. Questo metodo non rappresenta il miglior algoritmo di ottimizzazione, risultando grossolano nella convergenza, ma può essere comunque utilizzato nella consapevolezza di trovarsi molto lontani dal possibile minimo. Può per questo essere definito un “algoritmo di avvicinamento”. Il Conjugated gradient è un’evoluzione del metodo precedente che utilizza ancora il metodo del gradiente nella scelta della direzione e il metodo “line searching” per l’ottimizzazione del percorso, ma in questo caso ogni step viene conservato (memorizzato) in modo da evitare che sia ripercorso una seconda volta. Questo processo è decisamente più dispendioso, in termini computazionali, poiché la scelta del percorso ad ogni nuovo step segue l’analisi dei percorsi già effettuati. D’altro canto, l’aumento dell’efficienza di convergenza ne giustifica l’impiego. Infine, nel metodo Truncated Newton, per identificare la direzione di ricerca, oltre al gradiente viene usata la funzione di curvatura (derivata seconda). Questo metodo viene applicato quando il minimo è vicino al punto di partenza, quando la funzione è “quasi” un’armonica, altrimenti sono possibili divergenze (allontanamento dal minimo rispetto al punto di partenza). Per quanto riguarda la determinazione del raggiungimento del minimo, vengono presi in considerazione un criterio geometrico (la variazione di coordinate spaziali tra due step successivi deve essere uguale a zero) e uno energetico (la variazione di energia potenziale tra due step successivi deve essere uguale a zero) per poi analizzare il gradiente che ne deriva; quando il valore di questo gradiente è uguale a zero, la situazione di minimo è stata raggiunta. Per il raggiungimento teorico dei criteri di convergenza (0), sarebbe necessario un numero di step molto elevato; per questo motivo si preferisce impostare un valore per la convergenza del gradiente vicino allo zero (es. 0.01). 1.4.3 Gromacs GROMACS è l’acronimo di GROningen MAchine for Chemical Simulations48,53 . E’ un software sviluppato dal gruppo di ricerca del prof. Berendsen e del prof. Van Gunsteren del Dipartimento di Chimica dell’Università di Groningen a partire dalla seconda metà degli anni ’80. 53 L. Verlet, Phys. Rev., 1968, 165, 201.
  • 39. 39 E’ una collezione di programmi e librerie per la simulazione di dinamiche molecolari (MD) e le analisi dei dati delle traiettorie. Sebbene sia stata primariamente progettato per molecole biologiche con complesse interazioni di legame, l’implementazione dei calcoli delle forze di non- legame lo rende adatto per ogni genere di simulazione di dinamica molecolare. E’ essenzialmente basato sul pacchetto sequenziale GROMOS, che è stato sviluppato per simulare bio(macro)molecole in soluzione. Le scelte progettuali che sono state scelte per la realizzazione di GROMACS sono le seguenti: - ci sono tre tipi di forze: forze di legame basate su delle liste prefissate che includono interazioni four-body che permettono di descrivere in maniera più appropriata gli angoli di torsione, forze di non legame basate su liste dinamiche di coppie di particelle, e forze esterne che tengono conto delle forze di non equilibrio. - il calcolo delle forze di non legame è basato su una lista di coppie che viene aggiornata ogni n steps. Le particelle sono suddivise in gruppi carichi che contengono una o alcune particelle. Il criterio di inclusione nella lista dipende se il centro del gruppo carico è contenuto in un dato raggio di cut-off. Questa procedura evita la creazione di cariche da gruppi neutri applicando un criterio di cut-off ad ogni coppia di atomi parzialmente carichi. - facoltativamente può essere usata anche una twin-range cut-off: mentre viene fatta una lista di coppie per ogni gruppo di atomi con un raggio di cut-off Rshort, vengono calcolate le forze di Coulomb tra le particelle e gruppi carichi alle distanze comprese tra Rshort e Rlons, accumulate per ogni atomo e memorizzate. Queste forze long-range sono mantenute costanti per n time steps e aggiunte alle forze short-range. - l’algoritmo leap-frog, che è equivalente all’algoritmo Verlet54 , è usato per risolvere l’equazione di moto. Questo coinvolge la posizione a intervalli discreti di tempo, misurati in time steps, e le velocità. Il sistema viene mantenuto a valori costanti di temperatura e pressione. 54 S. Miyamoto, Kollman, J. Comput. Chem., 1992, 13, 952.
  • 40. 40 - la lunghezza dei legami covalenti e degli angoli può essere limitata. Le risultanti equazioni con dei dati parametri di constrain vengono risolte mediante l’algoritmo Shake55 che cambia la configurazione priva di constrain in una configurazione con constrain, con lo spostamento dei vettori verso una nuova direzione basata su una configurazione di riferimento. E’ utile a questo punto considerare i limiti delle simulazioni delle MD. E’ necessario infatti effettuare delle conferme sperimentali delle proprietà del sistema per verificare l’accuratezza delle simulazioni. 1. Le simulazioni sono classiche L’utilizzo dell’equazione di moto di Newton implica necessariamente l’uso della meccanica classica per descrivere il moto degli atomi. Questo approccio è sufficientemente accurato per la maggior parte degli atomi alle temperature normali, ma esistono alcune eccezioni. Gli atomi di idrogeno sono abbastanza leggeri e il moto dei protoni è talvolta di carattere essenzialmente quanto- meccanico. Per esempio un protone può attraversare una barriera di potenziale durante un trasferimento su un legame idrogeno. Un altro esempio è dato dall’elio liquido a basse temperature dove le leggi della meccanica classica falliscono nuovamente. La meccanica statistica di un classico oscillatore armonico differisce in modo significativo da quello di un reale oscillatore quantico, quando l’energia di risonanza υ si avvicina o eccede KBT/h. A temperatura ambiente il numero d’onda σ = 1/λ = υ/c dove hυ = kBT/h è approssimativamente 200 cm-1 . Così tutte le frequenze maggiori di 100 cm-1 non possono essere trattate nelle simulazioni classiche. Questo significa che in pratica tutte le vibrazioni di legame, degli angoli di legame e i legami idrogeno vanno oltre i limiti della meccanica classica. Esempi di lunghezze d’onda a cui cadono alcuni legami sono riportate in figura 1.19: Quindi cosa si può fare? Oltre a reali simulazioni quanto-dinamiche, è possibile procedere in due modi diversi: 55 W. van Gunsteren, H. Berendsen, Mol. Phys., 1977, 34, 1311.
  • 41. 41 tipo di legame tipo di vibrazione lunghezza d’onda (cm-1 ) C-H, O-H, N-H stretching 3000-3500 C=C, C=O stretching 1700-2000 HOH bending 1600 C-C stretching 1400-1600 H2CX scissoring, rocking 1000-1500 CCC bending 800-1000 O-H...O libration 400-700 O-H...O stretching 50-200 Figura1.19 Esempi di frequenze vibrazionali di legame - se si impiegano delle simulazioni di MD usando degli oscillatori armonici per i legami, si dovrebbero effettuare delle correzioni all’energia interna totale U = Ekin + Epot e alla specifica Cv (e all’entropia S e all’energia libera A o G se sono state calcolate). Le correzioni all’energia e alla specifica capacità termica di un oscillatore monodimensionale con frequenza υ sono: dove x = h/KT. L’oscillatore armonico assorbe infatti troppa energia (KT), mentre l’oscillatore quantico ad alta frequenza è nel suo stato fondamentale al livello energetico zero di ½ h. - è possibile trattare i legami, e gli angoli di legame, come constraints (ovvero vincoli) nell’equazione di moto. Il ragionamento all’origine di tale scelta è che un oscillatore quantico nel suo stato fondamentale è simile a un legame strettamente vincolato di un oscillatore classico. Di conseguenza l’algoritmo può impiegare un maggior numero di time steps quando le alte frequenze sono state rimosse e il time step può essere calcolato un numero di volte maggiore quando i legami sono vincolati rispetto a quando sono oscillatori56 . 56 M. Born, J. Oppenheimer, Ann. Phys, 1927, 84, 457.
  • 42. 42 2. Gli elettroni sono nello stato fondamentale Nelle MD si usa un force field conservativo che è una funzione della posizione dei soli atomi. Questo significa che il moto degli elettroni non è considerato: si presuppone infatti che gli elettroni modifichino la propria traiettoria istantaneamente quando mutano le posizioni degli atomi (approssimazione di Born-Oppenheimer57 ), e rimangano nel loro stato fondamentale. Questo è corretto nella maggior parte delle situazioni. Naturalmente i processi di trasferimento degli elettroni e gli stati eccitati degli elettroni non possono essere trattati. 3. I force fields sono approssimati I force fields tengono conto delle forze. Non fanno realmente parte del metodo della simulazione e i loro parametri possono essere modificati a seconda delle circostanze, ma devono sottostare a determinate limitazioni. Il force field presente nella versione 4.0.2 di GROMACS è additivo dalle forze di Coulomb long-range), non può incorporare polarizzazioni e non contiene le interazioni di legame finemente modulate. 4. Il force field è somma delle interazioni dei doppietti Questo significa che tutte le forze di non-legame sono il risultato della somma delle coppie di non legame. Solo la media di tali contributi è incorporata nel force field. Questo significa che non sono valide per long pairs isolate o per situazioni che sono apprezzabilmente differenti da quelle per le quali il modello è stato parametrizzato. L’omissione della polarizzazione significa inoltre che gli elettroni nell’atomo non contribuiscono alla costante dielettrica come dovrebbero. Ad esempio, nei liquidi reali gli alcani hanno una costante dielettrica poco superiore a 2 che riduce le interazioni elettrostatiche tra cariche parziali. Di conseguenza le simulazioni tendono a sovrastimare i termini di Coulomb long-range. Fortunatamente il prossimo parametro tende a compensare in parte questo effetto. 5. Le interazioni long-range sono cut-off Viene usato un raggio di cut-off per le interazioni di Lennard-Jones58 e alcune volte anche per le interazioni di Coulomb. A causa della convenzione della minima immagine (solo un’unica immagine di ciascuna particella nelle condizioni delle period boundary conditions viene 57 J. Lennard-Jones, Proceedings of the Physical Society, 1931, 43, 461. 58 T. Darden, D. York, L. Pedersen, J. Chem. Phys., 1993, 98, 10089
  • 43. 43 considerata per una coppia di interazioni) il range di cut-off non può superare la metà della larghezza del box. Questo è sufficiente per grandi sistemi, ma possono presentarsi difficoltà per sistemi contenenti particelle cariche. In tal caso è necessario implementare uno degli algoritmi long-range, come il reticolo di particelle di Ewald52 . 6. Le periodic boundary conditions non sono naturali Il classico metodo per minimizzare gli effetti che si verificano sul bordo di un sistema finito è l’applicazione delle periodic boundary conditions. Gli atomi del sistema simulati sono posizionati in un box che è circondato da copie traslate di se stesso. In tal modo non ci sono limiti al sistema. Se si desidera simulare un sistema non periodico, come liquidi o soluzioni, la periodicità può provocare di per sé stessa errori. Gli errori possono essere valutati comparando sistemi di varie dimensioni e ci si aspetta che siano meno gravi rispetto agli errori di un innaturale confine con il vuoto.
  • 44. 44 1.6 “Protein Data Bank” (PDB) Come accennato in precedenza, è importante disporre delle strutture tridimensionali delle molecole in esame. Queste strutture sono un indispensabile punto di partenza per molti studi computazionali. La loro definizione ha un ruolo fondamentale per la riuscita della ricerca intrapresa, quindi vengono comunemente utilizzate le strutture risolte mediante tecniche di cristallografia a raggi X unite ad altre tecniche, quali 2D- e 3D-NMR e modellazione per omologia. A tale scopo, esiste una banca dati, la Protein Data Bank59 che raccoglie le strutture 3D delle proteine derivanti da studi cristallografici di diffrazione ai raggi X e di NMR. E’ sostenuta dal Research Collaboratory for Structural Bioinformatics (RCSB), un consorzio no-profit che si prefigge lo scopo di migliorare la comprensione dei sistemi biologici mediante lo studio delle strutture tridimensionali delle macromolecole appartenenti agli organismi viventi. Sono disponibili, attualmente, 81369 strutture liberamente prelevabili. 59 H. Berman, J. Westbrook, Z. Feng, G. Gilliland, T. Bhat, H. Weissig, I. Shindyalov, P. Bourne, Nucleic Acids Res., 2000, 28, 235
  • 45. 45 2.0 Scopo della tesi Gli enzimi hanno un ottimo potenziale a livello industriale, dovuto alla loro capacità di catalizzare reazioni presentando notevoli vantaggi rispetto alla classica catalisi chimica. Per questo motivo, durante gli ultimi anni, molti ricercatori hanno focalizzato la loro attenzione sullo studio delle proprietà enzimatiche, in modo da poterle sfruttare al meglio e rendere questi biocatalizzatori più adatti alle applicazioni industriali. Il primo requisito che un biocatalizzatore deve avere per una sua applicabilità industriale è certamente la stabilità nelle condizioni operative. Spesso un processo industriale avviene in condizioni di pressione e temperatura che non sono quelle ottimali per un enzima; inoltre, in molti processi industriali, i reagenti sono solubilizzati in solventi diversi dall’acqua. Come ci si potrebbe aspettare, queste condizioni possono provocare la denaturazione e quindi l’inattivazione del biocatalizzatore, che quindi non risulta più adatto a catalizzare il processo in tali condizioni.60 Per quanto riguarda la stabilità delle proteine nei solventi, sono stati fatti molti studi. Non è quindi una novità che alcuni enzimi possano essere più attivi in solventi organici piuttosto che in acqua.61 Lo scopo di questa tesi è proprio quello di analizzare il comportamento di tre lipasi di interesse industriale, la Calb (Lipasi B da Candida antartica), PcL (lipasi da Pseudomonas cepacia) e Rol (lipasi da Rhizopus oryzae) in diverse miscele di solventi (acqua e n-propanolo) e condizioni estreme di temperatura (fino a 360K). Queste analisi sono state condotte sia da un punto di vista computazionale, utilizzando delle dinamiche molecolari, e i risultati sono stati confrontati con l’attività dell’enzima posto nelle stesse condizioni sperimentali delle simulazioni. con il fine ultimo di individuare dei parametri facilmente calcolabili che siano in grado di prevedere la stabilità di un enzima posto in determinate condizioni sperimentali. 60 Joo, Jeong Chan, Yoo, Young Je, Wiley Encyclopedia of Industrial Biotechnology, April 2008, 2c1ed-d-08-004, 61 Alexander M. Klibanov, Nature, 2001, 409, 241-246.
  • 46. 46 3.0 Risultati e discussione 3.1 Introduzione Lo studio oggetto di questa tesi si è concentrato su tre proteine: CalB (lipasi B da Candida antartica), PcL (lipasi da Pseudomonas cepacia) e Rol (lipasi da Rhizopus oryzae). Queste lipasi sono state scelte accuratamente prendendo in considerazione la loro applicazione pratica. Esse si distinguono per specie, taxa e caratteristiche strutturali. La CalB è prodotta da un lievito ed è caratterizzata da un lid piccolo che non è in grado di coprire il sito catalitico. Questa lipasi non presenta distinti fenomeni di attivazione interfacciale. La PcL, invece, deriva da un organismo procariotico e presenta un lid molto ampio. Essa subisce significative variazioni conformazionali all’interfaccia acqua/lipide che tendono a distorcere la geometria spaziale dei residui catalitici inattivando la lipasi. Infine, la Rol è una lipasi fungina che presenta un lid molto più piccolo della PcL e conserva l’attivazione interfacciale acqua/lipide data dal cambiamento conformazionale del lid. Dati sperimentali e computazionali sono stati raccolti e analizzati per comprendere i fattori che influenzano sia la stabilità di queste proteine che i cambiamenti strutturali responsabili della perdita di attività delle stesse.62 Queste tre proteine sono state scelte proprio per la loro eterogeneicità. Esse hanno origini completamente diverse, presentano tre meccanismi di attivazione interfacciale diversi e non hanno omologia di sequenza o di struttura. Gli obiettivi da raggiungere sono stati divisi in due parti. La prima parte di questo lavoro di tesi tratta la stabilità delle proteine in solventi diversi, più specificatamente in acqua, n-propanolo e miscele dei due. I risultati di questa parte computazionale della tesi sono stati confrontati con i dati ottenuti in laboratorio dalla Dr. Diana Fattor per le stesse proteine poste nelle medesime condizioni. La seconda parte del lavoro invece si concentra sulla stabilità termica delle proteine. Si è voluto vedere come le proteine prese in considerazione si comportano in seguito a un aumento di temperatura. Il punto di partenza di questo lavoro di tesi è stato acquisire la struttura cristallografica delle lipasi fra quelle disponibili nella Protein Data Bank57 . La struttura cristallografica della CalB (Figura 3.1) è stata depositata nel febbraio 1994 con il codice 1TCA e ha una risoluzione di 1.55Å. 62 Skjot M., De Maria L., Chatterjee R., Svendsen A., Patkar S.A., Ostergaard P. R., Brask J., ChemBioChem, 2009, 10, 520-527
  • 47. 47 Figura 3.1: Struttura cristallografica di Calb (PDB-1TCA 31 ), risoluzione 1.55Å; in verde è evidenziata la triade catalitica (Ser105, Asp187 e His 224.) La PcL con il codice 1YS163 è stata depositata nella PDB nel febbraio 2005 e ha risoluzione di 1.1Å. (Figura 3.2) Figura 3.2 Struttura cristallografica della PcL (PDB-1YS1), risoluzione 1.1Å; sono evidenziati in verde la triade catalitica Ser87, His286 e Asp264 e lo ione Ca ++ 63 A. Mezzetti , J.D. Schrag , C.S. Cheong , R.J. Kazlauskas., Chem.Biol 2005, 12, 427-437
  • 48. 48 Infine, non essendo disponibile nella Protein Data Bank la struttura della Rol (lipasi da Rhizopus oryzae), questa è stata ottenuta per omologia dalla lipasi II della Rhizopus niveus, avente codice pdb 1LGY, che risale al maggio 1996 e ha risoluzione 2.20Å. Queste due lipasi sono molto simili tra loro, e differiscono solo per due residui amminoacidici; quindi, utilizzando il software Pymol sono stati mutati due amminoacidi: l’istidina (H) in posizione 134 è stata sostituita da un’asparagina (N), e in posizione 200 la valina (V) è stata sostituita dall’alanina (A). In questo modo è stata ottenuta la struttura della Rol (Figura 3.3) che è stata utilizzata come punto di partenza per questo lavoro di tesi. Figura 3.3 Struttura cristallografica della Rol (PDB-1LGY 64 ), risoluzione 2.20Å; in verde evidenziata la triade catalitica Asp204, His257 e Ser144 64 M. Kohno, J. Funatsu, B. Mikami, W. Kugimiya, T . Matsuo, Y. Morita, J.Biochem 1996, 120, 505-510
  • 49. 49 3.2 Stabilità delle proteine in miscele acqua/n-propanolo In questa parte della tesi si è voluto studiare con metodi computazionali il comportamento dalle proteine in miscele di solvente, più specificatamente in miscele di acqua e n-propanolo in rapporti ben definiti. Lo studio computazionale, basato su simulazioni di dinamiche molecolari, è stato realizzato con il software Gromacs. Le dinamiche delle proteine sono state calcolate definendole nel campo di forza Martini42 , che, come spiegato nell’introduzione (paragrafo 1.4.1) è un campo di forze di tipo coarse- grained, cioè a grana grossa. In questo modo le particelle sono simulate in maniera limitata e i tempi di calcolo vengono notevolmente ridotti. Questa scelta è stata possibile poiché l’obiettivo di queste simulazioni non era quello di studiare nel dettaglio il comportamento di singoli residui proteici, ma di osservare il comportamento dinamico delle strutture proteiche nelle diverse miscele di solventi. Una volta individuate le strutture proteiche di partenza (vedi figure 3.1-3.3), queste sono state elaborate con il software pymol in modo da eliminare le molecole d’acqua, eventuali residui di glicosilazione, e ioni non strettamente associati alla struttura proteica. Le strutture così “pretrattate” sono state quindi definite nel campo di forze Martini. In Martini l’acqua viene segnalata e letta come W, mentre il propanolo viene segnalato e letto come POL. Le proteine sono state poste al centro di uno spazio cubico di 343nm3 ; ogni sistema è stato solvatato con solvente esplicito in modo da ottenere la miscela acqua/n-propanolo alla composizione desiderata. Le condizioni simulate sono le seguenti: acqua 100%; acqua 75% n- propanolo 25%, acqua 50% n-propanolo 50%, acqua 25% n-propanolo 75% e propanolo 100%. Le percentuali dei solventi utilizzati nella simulazione si riferiscono a percentuali v/v; in base alla densità sperimentale della miscela sono state calcolate le frazioni molari corrispondenti e quindi il numero di moli di ciascun solvente della miscela. Le simulazioni sono state eseguite in modo da rispettare le frazioni molari tra i due solventi e mantenere costante il numero totale di particelle simulate. Per una descrizione più dettagliata di come queste miscele sono state definite computazionalmente si veda in materiali e metodi (paragrafo 5.4).
  • 50. 50 Ogni sistema è stato equilibrato in più passaggi successivi, ad iniziare dal solvente. Sono stati posti dei vincoli di movimento alla proteina in modo che solo il solvente fosse libero di muoversi durante una dinamica di equilibratura di 10 ns. Successivamente, le strutture proteiche sono state liberate dai vincoli imposti precedentemente, il sistema è stato minimizzato e si è proceduto con una dinamica produttiva di 100ns. Ognuna delle tre proteine oggetto di questo studio è stata simulata nelle diverse miscele di acqua/n-propanolo . Analizzando le dinamiche produttive di ogni proteina, in ogni condizioni simulata, si sono valutate le RMSD (root-mean-square deviation) delle traiettorie. L’RMSD si valuta calcolando lo scarto quadratico medio delle coordinate degli atomi delle proteine per ogni snapshots, e rappresenta la media dello spostamento degli atomi rispetto a uno stato iniziale (RMSD proteina-proteina). Viene cosi analizzata la distorsione della struttura proteica nel tempo. Il movimento medio della proteina può essere considerato un indice della distorsione della struttura proteica e quindi indicare una possibile denaturazione dell’enzima. I dati riguardanti le RMSD delle traiettorie sono indicati nelle figure 3.4, 3.5 e 3.6. Figura 3.4 Variazione di RMSD della struttura della CalB durante una dinamica di 100 ns a concentrazioni crescenti di POL.
  • 51. 51 Figura 3.5 Variazione di RMSD della struttura della PcL durante una dinamica di 100 ns a concentrazioni crescenti di POL. Figura 3.6 Variazione di RMSD della struttura della Rol durante una dinamica di 100 ns a concentrazioni crescenti di POL.
  • 52. 52 Analizzando l’andamento dei valori di RMSD delle varie traiettorie si possono trarre alcuni indicazioni riguardo la rigidità delle strutture proteiche. La CalB risulta essere rigida in acqua al 100%. E’ interessante osservare che la proteina immersa nel propanolo al 100%, non genera il valore di RMSD maggiore, che si osserva invece nella simulazione della CalB in acqua 25% POL 75%. Durante la simulazione in 100% POL, dopo bruschi movimenti nei primi 20ns, l’incremento della RMSD diminuisce bruscamente, e negli ultimi 40 ns di simulazione la rigidità della proteina risulta essere maggiore rispetto a quello della proteina posta in acqua 25% POL 75%. Nella miscela 50%W 50% POL la proteina sembra avere una rigidità maggiore che in acqua 75% POL 25%; il valore di RMSD per quest’ultima condizione è comparabile a quello ottenuto in 100% POL. La PcL risulta avere una rigidità molto limitata quando si trova in 100% POL e sembra anche avere una mobilità maggiore rispetto alle altri lipasi nel solvente puro. Molto interessante è il dato riguardante la miscela acqua 75% POL 25%: in queste condizioni la PcL sembra essere più rigida che in acqua 100%. Questo tipo di comportamento non è riscontrabile nelle altre lipasi di questo studio. La Rol possiede movimenti molecolari abbastanza prevedibili: all’aumentare delle concentrazioni di n–propanolo diminuisce la sua rigidità; fa eccezione soltanto la soluzione composta al 75% POL nella quale le molecole sembrano meno mobili rispetto alle aspettative per una concentrazione così elevata di propanolo, la rigidità della proteina in queste condizioni è paragonabile a quella ottenuta con acqua 75% POL 25%. Per quanto riguarda la condizione acqua 100% PcL e Rol hanno valori finali di RMSD intorno agli 0.75 nm, mentre il valore della CalB è leggermente più alto, superando di poco gli 0.8 nm; ciò suggerisce che in acqua la CalB sia leggermente più flessibile delle altre due proteine. Il minimo della rigidità strutturale si distingue in 100% POL per PcL e Rol, mentre la CalB raggiunge il massimo RMSD in acqua 25% POL 75%. Queste osservazioni ci indicano come queste tre proteine possano avere dei comportamenti diversi se poste nella stessa miscela di solventi. Poiché, come anticipato precedentemente, la rigidità di una proteina sembra essere inversamente correlata alla sua stabilità, una maggiore o minore rigidità strutturale potrebbe anche indicare una maggiore o minore tendenza alla denaturazione della struttura proteica. Lo scopo ultimo di questa parte di tesi è quella di cercare qualche tipo di correlazione tra il movimento molecolare delle proteine e l’attività residua misurata sperimentalmente delle proteine poste nelle stesse condizioni. Per fare ciò è stato scelto come parametro univoco la RMSD media
  • 53. 53 degli ultimi 10ns di simulazione. Questa scelta è motivata dal fatto che in quel range temporale la RMSD raggiunge un valore pressoché costante, indice di un avvicinamento ad una situazione di equilibrio del sistema, per lo meno per quello che riguarda la rigidità strutturale. I valori di questi parametri così definiti sono elencati nella tabella seguente (Tabella 3.1) e il loro andamento visualizzato in figura 3.7. Tabella 3.1 RMSD media, calcolato sugli ultimi 10ns di simulazione, nelle diverse miscele acqua/n-propanolo . Figura 3.7 Andamento della RMSD al variare della composizione della miscela solvente per le lipasi CalB, PcL, RoL RMSD medio (nm) 0% POL 25% POL 50% POL 75% POL 100% POL CalB 0.916 1.058 0.972 1.124 1.056 PcL 0.823 0.754 0.889 0.841 1.028 Rol 0.841 0.920 0.960 0.910 1.097
  • 54. 54 La figura 3.7 evidenzia come le tre lipasi abbiano un andamento globale di mobilità/rigidità molto diverso tra di loro, ma è interessante osservare che a 0%, 50% e 100% POL tendono ad avere una mobilità abbastanza simile nella miscela solvente. 3.2.1. Confronto con i dati sperimentali La parte sperimentale dello studio di stabilità delle lipasi CalB, PcL e Rol, nelle medesime condizioni operative in cui si sono effettuate le simulazioni precedenti, è stata eseguita dalla Dott. Diana Fattor65 . La stabilità delle proteine è stata saggiata valutando la loro attività residua dopo incubazione in diverse miscele di acqua e n-propanolo. Gli enzimi sono stati incubati alla temperatura di 27°C, sotto agitazione orbitalica, per 48h. Il sistema “ acqua” in realtà consisteva di un tampone fosfato 0.01M a pH 7.0, dializzato alla temperatura 2-8°C. I sistemi utilizzati per l’incubazione sono: 100% tampone 0.01M pH 7 75% tampone / 25% n-propanolo 50% tampone / 50% n-propanolo 25% tampone / 75% n-propanolo 100% n-propanolo L’attività idrolitica delle proteine native è stata valutata misurando l’idrolisi della tributirrina (Figura 3.8). Il substrato è un trigliceride puro dell’acido butirrico. La lipasi idrolizza il legame estereo liberando acido butirrico che viene titolato con una soluzione 0.1M di NaOH. Un’unità corrisponde alla quantità di acido butirrico rilasciato da 1mg di enzima al minuto. L’attività misurata immediatamente dopo la dialisi in tampone K-fosfato 0.01M e pH 7.0 è stata considerata come il 100%. L’attività residua è stata misurata a tempi diversi: 1min, 1, 5, 8, 24 e 48 ore, prelevando un campione dal sistema. Le attività residue sono state espresse come percentuale di attività misurata 65 Diana Fattor, 2012, Tesi di dottorato, XXIV ciclo di Dottorato in Scienze e Tecnologie Chimiche e Farmaceutiche, Settore scientifico-disciplinare CHIM/06
  • 55. 55 nelle diverse miscele tampone/n-propanolo rispetto all’attività iniziale misurata sulla proteina dializzata. O O O + H2O OH OH OH + Tributyrin Water Lipase Glycerol Butyric Acid O (CH2)2 CH3 O (CH2)2 CH3 O (CH2)2 CH3 HO O (CH2)2 CH3 Figura 3.8 Idrolisi della tributirrina catalizzata da lipasi. I dati di attività residua cosi ottenuti per le tre proteine sono illustrati nelle seguenti figure 3.9, 3.10, e 3.11. Figura 3.9 Attività residua della Calb in miscele a diverse concentrazioni di acqua/n-propanolo