Domanda:
Che cos'è la randomizzazione mendeliana e come viene utilizzata per inferire la causalità in epidemiologia?
Luke
2012-08-14 20:15:19 UTC
view on stackexchange narkive permalink

Gli studi sui tratti umani e sulle malattie sono intrinsecamente limitati agli studi osservazionali, noti come studi epidemiologici. Ciò può rendere molto difficile determinare che cosa effettivamente causa una particolare malattia o tratto e cosa sia solo un sottoprodotto o un biomarcatore della malattia.

La randomizzazione mendeliana è una statistica tecnica utilizzata dagli epidemiologi genetici per determinare gli effetti causali , ad esempio se un biomarcatore influenza effettivamente il rischio di malattia o se si tratta solo di un'associazione statistica.

Dalle basi, come può essere la genetica utilizzato per determinare le associazioni causali tra i tratti (come i marcatori del sangue) e l'aumento del rischio di malattia e su quali presupposti si basa?

Non dovrebbero essere i trigger ~ SNP per la triangolazione?
Una risposta:
#1
+17
Luke
2012-08-15 19:35:49 UTC
view on stackexchange narkive permalink

Studi epidemiologici analizzano i dati di coorte osservazionali umani per cercare di collegare statisticamente il rischio di malattia e i biomarcatori. Ad esempio, è risaputo che il fumo aumenta il rischio di cancro ai polmoni, ma prima degli anni '50 era ampiamente considerato il contrario fino a quando le prove osservative non si dimostrarono inconfutabili ( Levin, 1950).

Confondendo

Tuttavia, inferire la causalità utilizzando dati osservativi può essere complicato. Ad esempio, esiste un'associazione statistica molto forte tra le vendite di gelati e il rischio di annegamento nel Regno Unito. In questo esempio è abbastanza chiaro che l'associazione è confusa , ovvero c'è una variabile "nascosta" di cui non abbiamo tenuto conto che collega il 2. È facile dedurre che le vendite di gelato non aumentate il rischio di annegamento, ma i 2 sono correlati perché aumentano sia le vendite di gelato che il rischio di annegamento nello stesso periodo dell'anno; entrambi sono positivamente correlati con i tratti del "bel tempo".

Nell'esempio sopra è facile dire che la relazione è confusa. Tuttavia, in uno studio ipotetico sul diabete di tipo 2 che rileva che un ematocrito ematico più elevato (% volume di sangue costituito da globuli rossi) è associato a maggiori probabilità di essere diabetico, è meno chiaro se un ematocrito più elevato aumenti la suscettibilità / rischio di contrarre diabetico o se il diabete aumenta l'ematocrito. Studi longitudinali che seguono gli stessi individui per molti anni aiutano a determinare quale è venuto prima - questo si basa sul presupposto che se l'ematocrito elevato è associato a un aumento del rischio di diabete 5 anni dopo, è più probabile che l'ematocrito è causale e hai un biomarcatore per il rischio di diabete (anche se non puoi ancora dire che è causale, potrebbe essere solo un proxy per un altro tratto "nascosto" o l'effetto può essere mediato da un altro indicatore non misurato).

Causalità

Gli studi dell'associazione genome-wide (GWA) sono diventati sempre più popolari dal completamento del progetto sul genoma umano e attualmente (15 agosto 2012) sono disponibili 7039 varianti genetiche (SNP, polimorfismi a singolo nucleotide) documentate nel catalogo dei Studi GWA ( www.genome.gov/gwastudies). Questi SNP sono stati fortemente associati a tratti come "rischio di diabete di tipo 2" o "livelli di adiponectina nel sangue", da ampi studi epidemiologici genetici, di solito con molte migliaia di partecipanti campionati.

Il punto chiave delle associazioni SNP è che la direzione dell'effetto è sempre nota; un particolare SNP può influenzare i tuoi livelli di adiponectina, ma l'adiponectina non influenza gli SNP che erediti.

randomizzazione mendeliana

In uno studio osservazionale che trova un'associazione tra (per esempio) trigliceridi circolanti livelli e diabete di tipo 2 (utilizzando glucosio a digiuno e insulina come "proxy") non è possibile determinare la direzione causale; i trigliceridi aumentano il rischio di diabete o viceversa? (Questo è un vero caso di studio di De Silva, et al . 2011).

Utilizzando l'ipotesi che l'ereditarietà degli SNP sia essenzialmente casuale ( cioè non influenzato dal tratto che stai misurando - in questo esempio i trigliceridi) è possibile determinare l'effetto causale dei trigliceridi sul rischio di diabete. Nota: questo è possibile solo per i tratti (come i livelli sierici di trigliceridi) che hanno SNP identificati da studi GWA.

Prima di tutto, hai già calcolato l'associazione tra i livelli di trigliceridi (in questo studio uno standard 1 -aumento della deviazione (SD) dei trigliceridi è stato associato, con un Odds Ratio (OR) di 2,68, al diabete di tipo 2 in quasi 10.000 partecipanti umani). Poiché si tratta di uno studio trasversale, viene riportata solo un'associazione, senza implicazioni causali ... ancora!

Inserisci gli SNP

Dopo aver identificato gli SNP che aumentano i livelli di trigliceridi (al momento dello studio, 10 erano riportati in letteratura), il genotipo di ciascun partecipante per questi SNP deve essere misurato o dedotto (generalmente questo viene eseguito in ampi studi di coorte, che vengono quindi utilizzati per molti progetti individuali diversi).

Viene quindi derivato un "punteggio" combinato per ogni individuo. Questo è concettualmente molto semplice; se un individuo ha 4 dei 10 alleli che aumentano i trigliceridi, gli viene assegnato un punteggio o 4, e così via. Ciò è complicato dal fatto che gli SNP hanno effetti diversi sui trigliceridi, quindi viene invece derivato un "punteggio allele ponderato" (in poche parole, il coefficiente dell'associazione SNP ~ trigliceridi viene preso in considerazione quando si aggiungono i punteggi degli alleli di rischio). Utilizzando questo tipo di punteggio, è possibile stimare una stima 'per allele' degli effetti;

Viene quindi determinata l'associazione tra i livelli di trigliceridi e il punteggio allelico (mediante analisi di regressione lineare - aggiustata per età e sesso, poiché è noto che influenzano i trigliceridi). In realtà ci sono 2 modi per eseguire l'analisi successiva, il primo dei quali è concettualmente più semplice, ma il secondo dei quali è più robusto.

Metodo 1: l'approccio della "triangolazione"

Le due associazioni osservate calcolate finora (i livelli di trigonometria per DS sono associati al diabete e il punteggio SNP per allele sono associati ai livelli di trigonometria per DS) possono quindi essere utilizzate per calcolare un atteso associazione. Questo è semplicemente derivato moltiplicando i 2 coefficienti insieme. Di seguito è riportata la rappresentazione di "triangolazione" di questo;

Triangulation approach for Mendelian Randomization

Questa attesa associazione tra gli SNP che aumentano i trigliceridi e il rischio di diabete è vera solo se l'aumento dei trigliceridi aumenta il rischio di diabete. È quindi possibile calcolare l'associazione osservata tra il punteggio SNP e il diabete. Se le stime attese e osservate sono simili, i trigliceridi aumentano il rischio di diabete e sono un biomarcatore causale. Se l'associazione osservata è nulla (o, almeno, molto più piccola), è probabile che i trigliceridi siano secondari.

Metodo 2: l'analisi della variabile strumentale

Questo metodo è per il statistici più resistenti. Le variabili strumentali sono variabili derivate e rappresentano un intermedio tra una "causa" proposta e l '"effetto", o risultato (in questo caso si propone che gli alleli che aumentano i trigliceridi "causino" il diabete e questo è mediato dai livelli di trigliceridi stessi) .

Utilizzando una regressione lineare, vengono estratti i "valori adattati" da un modello con i livelli di trigliceridi come risultato e il punteggio SNP ponderato come unica variabile indipendente. Questi valori adattati rappresentano la varianza dei trigliceridi prevista dal punteggio SNP. Stiamo usando gli SNP come strumento qui, poiché influenzano direttamente il biomarcatore (esposizione, ad es. Trigliceridi) e non sono influenzati né dall'esposizione né dal risultato (diabete). Il presupposto importante qui è che l'effetto degli SNP sul risultato non è confuso e può essere mediato solo dall'esposizione - questo è vero per i genotipi ( Lawlor, et al . 2008) .

Determinando quindi l'associazione tra la variabile derivata e il diabete, saprai se la proporzione della varianza dei trigliceridi prevista dagli SNP è associata al diabete - in tal caso, i trigliceridi aumentano il rischio di diabete.

Risultati

Lo studio ha eseguito entrambi i tipi di analisi della randomizzazione mendeliana e non ha trovato prove che suggeriscano un'associazione causale tra trigliceridi e fenotipi del diabete.

Quindi la randomizzazione mendeliana è uno strumento utile per inferire la causalità con i biomarcatori. Non è necessariamente una prova conclusiva, ma può aiutare a distinguere biomarcatori di particolare importanza e interesse (per quanto riguarda gli interventi) da quelli che sono solo marcatori della malattia.

Bel tempo? Nel Regno Unito? Ridicolo.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...