sasava

Metaproteomics örvera: frá úrvinnslu sýna, gagnasöfnun til gagnagreiningar

Wu Enhui, Qiao Liang*

Efnafræðideild, Fudan University, Shanghai 200433, Kína

 

 

 

Örverur eru náskyldar sjúkdómum og heilsu manna. Hvernig á að skilja samsetningu örverusamfélaga og virkni þeirra er stórt mál sem þarf að rannsaka brýn. Á undanförnum árum hefur metaproteomics orðið mikilvæg tæknileg leið til að rannsaka samsetningu og virkni örvera. Hins vegar, vegna margbreytileika og mikils misleitni örverusamfélagssýna, hefur úrvinnsla sýna, gagnaöflun fjöldarófsmælinga og gagnagreining orðið að þremur helstu áskorunum sem metaproteomics standa frammi fyrir. Í metaproteomics greiningu er oft nauðsynlegt að hámarka formeðferð mismunandi tegunda sýna og taka upp mismunandi aðskilnað, auðgun, útdrátt og leysingu örvera. Svipað og prótein í einni tegund, eru massarófsmælingar gagnaöflunaraðferðir í metaproteomics meðal annars gagnaháð öflun (DDA) háttur og gagnaóháður öflun (DIA) háttur. DIA gagnaöflunarhamurinn getur alveg safnað peptíðupplýsingum sýnisins og hefur mikla þróunarmöguleika. Hins vegar, vegna þess hversu flókið metaproteome sýni eru, hefur DIA gagnagreining þess orðið stórt vandamál sem hindrar djúpa umfjöllun um metaproteomics. Hvað varðar gagnagreiningu er mikilvægasta skrefið bygging próteinraðgagnagrunns. Stærð og heilleiki gagnagrunnsins hefur ekki aðeins mikil áhrif á fjölda auðkenninga heldur hefur hún einnig áhrif á greininguna á tegundum og virknistigi. Sem stendur er gullstaðallinn fyrir byggingu metapróteómagagnagrunns próteinraðgagnagrunnur byggður á metagenominu. Á sama tíma hefur opinbera gagnagrunnssíuaðferðin sem byggir á endurtekinni leit einnig reynst hafa sterkt hagnýtt gildi. Frá sjónarhóli sérstakra gagnagreiningaraðferða hafa peptíðmiðaðar DIA gagnagreiningaraðferðir verið alger meginstraumur. Með þróun djúpnáms og gervigreindar mun það ýta undir nákvæmni, umfjöllun og greiningarhraða gagnagreiningar á stórpróteinum. Hvað varðar niðurstreymis lífupplýsingagreiningu hefur röð skýringaverkfæra verið þróuð á undanförnum árum, sem geta framkvæmt tegundaskýringar á próteinstigi, peptíðstigi og genastigi til að fá samsetningu örverusamfélaga. Í samanburði við aðrar omics aðferðir er virknigreining á örverusamfélögum einstakur eiginleiki macroproteomics. Macroproteomics er orðinn mikilvægur hluti af multi-omics greiningu á örverusamfélögum og hefur enn mikla þróunarmöguleika hvað varðar dýpt umfangs, greiningarnæmi og heilleika gagnagreiningar.

 

01 Sýnishorn af formeðferð

Sem stendur hefur metaproteomics tækni verið mikið notuð við rannsóknir á örverum manna, jarðvegi, mat, haf, virkri seyru og öðrum sviðum. Samanborið við próteómagreiningu á einni tegund, stendur sýnisformeðferð á metapróteómi úr flóknum sýnum frammi fyrir fleiri áskorunum. Örverusamsetningin í raunverulegum sýnum er flókin, kraftmikil gnægð er stór, frumuveggbygging mismunandi tegunda örvera er mjög mismunandi og sýnin innihalda oft mikið magn af hýsilpróteinum og öðrum óhreinindum. Þess vegna, við greiningu á metapróteómi, er oft nauðsynlegt að fínstilla mismunandi tegundir sýna og samþykkja mismunandi aðskilnað, auðgun, útdrátt og leysingu örvera.

Útdráttur örverumetapróteóma úr mismunandi sýnum hefur ákveðna líkindi auk nokkurs munar, en eins og er skortir sameinað forvinnsluferli fyrir mismunandi gerðir af metapróteómsýnum.

 

02 Gagnaöflun massarófsmælinga

Í haglabyssupróteómagreiningu er peptíðblandan eftir formeðferð fyrst aðskilin í litskiljunarsúlunni og fer síðan í massarófsmælirinn til gagnaöflunar eftir jónun. Svipað og eins konar próteingreiningu, innihalda massarófsmælingar gagnaöflunaraðferðir í macroproteome greiningu DDA háttur og DIA ham.

 

Með stöðugri endurtekningu og uppfærslu á massagreiningartækjum er massagreiningartækjum með hærra næmni og upplausn beitt á metaproteome og þekjudýpt metaproteome greiningar er einnig stöðugt bætt. Í langan tíma hefur röð háupplausnar massagreiningartækja undir forystu Orbitrap verið mikið notuð í metaproteome.

 

Tafla 1 í frumtextanum sýnir nokkrar dæmigerðar rannsóknir á metaproteomics frá 2011 til dagsins í dag með tilliti til sýnistegundar, greiningarstefnu, massagreiningartækis, öflunaraðferðar, greiningarhugbúnaðar og fjölda auðkenninga.

 

03Gagnagreining massarófsmælinga

3.1 Stefna DDA gagnagreiningar

3.1.1 Gagnagrunnsleit

3.1.2de novoraðgreiningarstefnu

3.2 DIA gagnagreiningarstefna

 

04Tegundaflokkun og virkniskýring

Samsetning örverusamfélaga á mismunandi flokkunarfræðilegum stigum er eitt af lykilrannsóknarsviðum í rannsóknum á örverum. Á undanförnum árum hefur röð af skýringartólum verið þróuð til að gera athugasemdir við tegundir á próteinstigi, peptíðstigi og genastigi til að fá samsetningu örverusamfélaga.

 

Kjarninn í hagnýtri skýringu er að bera saman markpróteinröðina við gagnagrunninn fyrir hagnýtur próteinröð. Með því að nota genavirkni gagnagrunna eins og GO, COG, KEGG, eggNOG, osfrv., er hægt að framkvæma mismunandi hagnýtar skýringargreiningar á próteinum sem auðkennd eru af stórpróteómum. Skýringarverkfæri eru Blast2GO, DAVID, KOBAS o.s.frv.

 

05Samantekt og horfur

Örverur gegna mikilvægu hlutverki í heilsu manna og sjúkdómum. Á undanförnum árum hefur metaproteomics orðið mikilvæg tæknileg leið til að rannsaka virkni örverusamfélaga. Greiningarferli metaproteomics er svipað því sem er í eintegunda próteomics, en vegna þess hversu flókið rannsóknarhlutur metaproteomics er, þarf að taka upp sérstakar rannsóknaraðferðir í hverju greiningarþrepi, frá formeðferð sýna, gagnaöflun til gagnagreiningar. Sem stendur, þökk sé endurbótum á formeðferðaraðferðum, stöðugri nýsköpun massagreiningartækni og hraðri þróun lífupplýsingafræði, hefur metaproteomics náð miklum framförum í auðkenningardýpt og notkunarsviði.

 

Við formeðferð á makrópróteómsýnum þarf fyrst að huga að eðli sýnisins. Hvernig á að aðskilja örverur frá umhverfisfrumum og próteinum er ein af lykiláskorunum sem stórprótein standa frammi fyrir og jafnvægið milli skilvirkni aðskilnaðar og örverutaps er brýnt vandamál sem þarf að leysa. Í öðru lagi verður próteinútdráttur örvera að taka tillit til mismunar sem orsakast af mismunandi burðarvirki mismunandi baktería. Macroproteome sýni á snefilsviðinu krefjast einnig sérstakra formeðferðaraðferða.

 

Að því er varðar massagreiningartæki hafa almenn massagreiningartæki gengið í gegnum umskipti frá massagreiningartækjum byggðum á Orbitrap massagreiningartækjum eins og LTQ-Orbitrap og Q Exactive yfir í massagreiningartæki sem byggjast á jónahreyfanleika tengdum massagreiningartækjum á flugtíma eins og timsTOF Pro . TimsTOF röð tækja með upplýsingar um hreyfanleika jóna hefur mikla greiningarnákvæmni, lág greiningarmörk og góða endurtekningarnákvæmni. Þau hafa smám saman orðið mikilvæg tæki á ýmsum rannsóknarsviðum sem krefjast greiningar á massarófsmælingum, svo sem próteóm, metapróteóm og umbrot einstakrar tegundar. Þess má geta að í langan tíma hefur kraftmikið svið fjöldagreiningatækja takmarkað próteinþekjudýpt rannsókna á metapróteómum. Í framtíðinni geta massagreiningartæki með stærra hreyfisviði bætt næmni og nákvæmni próteinagreiningar í metapróteómum.

 

Fyrir fjöldarófsmælingar gagnaöflun, þó að DIA gagnaöflunarhamurinn hafi verið almennt notaður í próteómi einnar tegundar, nota flestar núverandi macroproteome greiningar enn DDA gagnaöflunarhaminn. DIA gagnaöflunarhamurinn getur að fullu fengið brotajónaupplýsingar sýnisins og samanborið við DDA gagnaöflunarhaminn hefur það tilhneigingu til að fá að fullu peptíðupplýsingar makrópróteómsýnisins. Hins vegar, vegna þess hversu flókið DIA gögn eru, er greining á DIA macroproteome gögnum enn í miklum erfiðleikum. Gert er ráð fyrir að þróun gervigreindar og djúpnáms muni bæta nákvæmni og heilleika DIA gagnagreiningar.

 

Í gagnagreiningu á metaproteomics er eitt af lykilskrefunum bygging próteinraðgagnagrunns. Fyrir vinsæl rannsóknarsvið eins og þarmaflóru er hægt að nota örverugagnagrunna í þörmum eins og IGC og HMP og góður auðkenningarniðurstaða hefur náðst. Fyrir flestar aðrar metaproteomics greiningar er árangursríkasta gagnagrunnsbyggingaraðferðin enn að koma á sýnissértækum próteinraðagagnagrunni sem byggir á metagenomic raðgreiningargögnum. Fyrir örverusamfélagssýni með mikið flókið og stórt breytilegt svið er nauðsynlegt að auka raðgreiningardýpt til að auka auðkenningu tegunda sem eru í litlu magni og bæta þar með umfang próteinraðagagnagrunnsins. Þegar raðgreiningu gagna vantar er hægt að nota endurtekna leitaraðferð til að fínstilla opinbera gagnagrunninn. Hins vegar getur endurtekin leit haft áhrif á FDR gæðastýringu og því þarf að athuga leitarniðurstöðurnar vandlega. Að auki er enn þess virði að skoða nothæfi hefðbundinna FDR gæðaeftirlitslíkana í metaproteomics greiningu. Hvað varðar leitarstefnu getur blendingur litrófsbókasafnsáætlunin bætt umfangsdýpt DIA metaproteomics. Á undanförnum árum hefur spáð litrófssafnið sem er búið til á grundvelli djúpnáms sýnt yfirburða árangur í DIA próteomics. Hins vegar innihalda metaproteome gagnagrunnar oft milljónir próteinfærslna, sem leiðir af sér stóran mælikvarða spáðra litrófssafna, eyðir miklum tölvuauðlindum og leiðir til stórs leitarrýmis. Að auki er líkindin á milli próteinaraða í metapróteómum mjög mismunandi, sem gerir það að verkum að erfitt er að tryggja nákvæmni spálíkans litrófssafns, svo spáð litrófssöfn hafa ekki verið mikið notuð í metaproteomics. Að auki þarf að þróa nýjar próteinályktunar- og flokkunarskýringaraðferðir til að eiga við um metaproteomics greiningu á mjög raðlíkum próteinum.

 

Í stuttu máli, sem ný örverurannsóknartækni, hefur metaproteomics tækni náð umtalsverðum rannsóknarniðurstöðum og hefur einnig mikla þróunarmöguleika.


Birtingartími: 30. ágúst 2024