Domanda:
Quante proteine ​​umane hanno una struttura 3D risolta?
Gergana Vandova
2011-12-23 10:27:46 UTC
view on stackexchange narkive permalink

Mi chiedevo quante proteine ​​umane hanno una struttura 3D risolta. Esiste un database con solo proteine ​​umane? Ho guardato pdb ma non sono riuscito a trovare un filtro.

Penso che avrai molti problemi con la ridondanza, soprattutto se vuoi conoscere il numero di proteine ​​uniche.
@GWW Immagino che scrivere un piccolo script possa eliminare la ridondanza.
Potresti avere più fortuna a porre questa domanda su [biostar] (http://biostar.stackexchange.com).
Notare che "risolto" è molto soggettivo. Non tutte le strutture sono di alta qualità e alcune di esse sono semplicemente errate a causa di errori sperimentali.
Questa è una domanda molto soggettiva per due ragioni: la banca dati delle proteine ​​accetta NMR e strutture cristalline di proteine ​​che offrono diversi gradi di risoluzione e accuratezza. Queste strutture sono anche in qualche modo soggettive perché la proteina può adottare diverse conformazioni a seconda del suo contesto biologico rilevante. In terzo luogo, le estrazioni con solventi possono imporre una struttura errata.
molte di queste proteine ​​hanno solo uno o due domini risolti come strutture. le proteine ​​animali sono dure in questo modo. ecco dove questa domanda diventa un po 'difficile imho.
Quattro risposte:
#1
+19
Michael Kuhn
2011-12-23 17:17:45 UTC
view on stackexchange narkive permalink

6405 proteine ​​mappate su 5220 geni, secondo Ensembl.

Nel BioMart di Ensembl, puoi selezionare l'ID PDB come riferimento esterno. Esporta i risultati e conta le proteine ​​/ geni univoci che hanno un ID PDB.

#2
+12
Aleksandra Zalcman
2012-01-15 06:06:53 UTC
view on stackexchange narkive permalink

PDB è una buona risorsa per rispondere a tali domande, poiché ti consente di filtrare i risultati in base a molti parametri aggiuntivi. Per contare ed estrarre strutture 3D di proteine ​​umane:

  1. Apri la scheda di ricerca Avanzata del sito Web PDB.
  2. Seleziona Biology -> Source organism dal menu.
  3. Digita Homo sapiens (human) .
  4. Puoi ridurre la ridondanza di selezionando Rimuovi sequenze simili in n% identity sotto.
  5. Invia query.

Per aggiungere ulteriori filtri, fai clic su Affina query con Ricerca avanzata . Qui puoi estrarre le strutture per data di deposizione, qualità (ad es. Risoluzione o fattori R per strutture risolte mediante diffrazione di raggi X), ligandi, classificazione enzimatica, ecc. (Selezionando Aggiungi criteri di ricerca )

Ricerca di proteine ​​umane con rimozione di omologhi con limite di identità del 90% recupera strutture 7117. Il numero di strutture proteiche a raggi X di buona qualità (risoluzione < 2.5A) è attualmente 3964 (con lo stesso limite di identità).

È quindi possibile scaricare l'elenco recuperato o creare rapporti personalizzati (menu di seguito).

Un buon strumento (utilizzato anche da PDB) per generare set di dati di proteine ​​non ridondanti è cd-hit.

#3
+3
GWW
2011-12-23 10:45:18 UTC
view on stackexchange narkive permalink

Dai tuoi commenti non sembra che tu sia contrario alla scrittura di alcuni script personalizzati, quindi un'opzione sarebbe quella di sfruttare il database NCBI Structure. Puoi filtrarlo per organismo e quindi scaricare i risultati come file di testo / XML. Se è necessario accedere ai dati PDB grezzi, è possibile scaricare l'archivio PDB ed esaminare quelli nell'elenco filtrato.

#4
  0
PDB annotator
2015-04-19 10:53:55 UTC
view on stackexchange narkive permalink

Il nuovo sistema di ricerca di PDBe è progettato per rispondere solo a queste domande http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules

mostra che ci sono 6964 macromolecole umane uniche con dati di struttura nel PDB.

Naturalmente, molte saranno frammenti di proteine ​​piuttosto che l'intera molecola.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...