Kategorie Forschungsprojekt
  • Mikrobiologie

Schnellnachweis und vor-Ort-Testung antimikrobieller Resistenz und mobiler genetischer Elemente in Human- und Tierproben mittels Metagenomik

Projektstatus
Abgeschlossen
Projektstart
Jan 2020
Projektende
Dec 2022
Kurztitel
EJP FARMED
Abteilung
Biologische Sicherheit

Beschreibung und Zielstellung

Das FARMED-Projekt strebt eine Verbesserung der Antibiotikaresistenz (AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen))-Erkennung an, indem es aktuelle Einschränkungen in der Erregeridentifizierung überwindet. Der Fokus liegt auf Echtzeit-Tools, die unabhängig von konventioneller mikrobieller Kultivierung sind, was besonders entscheidend bei Ausbrüchen ist. Die metagenomische Sequenzierung mit kurzer Readlänge ist zwar ein wertvolles Diagnoseinstrument, aber die Zuordnung von Genen zu bestimmten Organismen ist nur eingeschränkt möglich und schränkt damit den AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Nachweis bei Krankheitserregern ein. Hauptziele des FARMED-Projekts: 1. Nutzung der Long-Read Technologie: Einsatz von ONT MinION und Vergleich mit anderen metagenomischen Sequenzierungstechnologien zur Bewertung des diagnostischen Potenzials. 2. Genetischer Kontext von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen: Nutzung von Long-Read-Metagenom-Sequenzierung zur Ableitung des genetischen Kontexts von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen und Zuordnung zu Spezies und Plasmiden. 3. Harmonisierte Vor-Ort-Protokolle: Erstellung von Protokollen für metagenomische DNA-Extraktion und MinION-Sequenzierung in Labors und im Feld. 4. Effiziente Echtzeit-Auswertung: Entwicklung von Strategien zur Identifizierung des genetischen Kontexts von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen und der bakteriellen Wirtsspezies. 5. "Off-Site"-Plasmid-Analyse: Untersuchung von Methoden für die "Off-Site"-Plasmidsequenzanalyse durch Vergleich mit Isolaten und Nutzung verschiedener Sequenzierungstechnologien. 6. Interaktiver Workshop: Vermittlung von Labor- und bioinformatischer Expertise. 7. Breite Anwendbarkeit: Angestrebt wird eine breite Anwendbarkeit der entwickelten Methoden, besonders in Ländern mit begrenztem Zugang zu spezialisierten Laborgeräten für die Diagnose von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen) in Krankheitserregern.

Ergebnis

Dieser Bericht enthält nur die Ergebnisse der spezifischen Experimente und Analysen, an denen das BfRkurz fürBundesinstitut für Risikobewertung beteiligt war. Der vollständige Bericht über die Ergebnisse aller Institute ist beigefügt. WP1 - Bewertung der Durchführbarkeit der Long-read-Metagenom-Sequenzierung an Beispielmatrizen. Untersuchung des Einsatzes von Hi-C-Metagenomik.
WP1 wurde von Sciensano und dem BfRkurz fürBundesinstitut für Risikobewertung geleitet, mit Beiträgen von allen Mitgliedern des Konsortiums.JRP12-WP1-T1 - Bewertung der Durchführbarkeit / Durchführung von Long-Read-Metagenomik mit MinION aus "definierten" mikrobiellen Gemeinschaften.Im Rahmen einer Umfrage innerhalb des Konsortiums wurden die unterschiedlichen Methoden und Erfahrungen von Instituten mit Short- und Long-Read-Sequenzierungstechnologien ermittelt. Dabei wurden die verschiedenen Matrices aus einer Vielzahl von menschlichen, tierischen und umweltrelevanten Proben, die DNA-Extraktionsmethoden und die Bioinformatik-Tools, die zum Nachweis von Bakterienspezies und/oder AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen) verwendet werden, berücksichtigt. Der entscheidende Schritt in jedem Sequenzierungsprozess ist die Extraktion und Isolierung der DNA aus den Proben, wobei sichergestellt werden muss, dass sie die Kriterien der Qualität, Quantität und Reinheit erfüllt. Andernfalls können Long-Read-Metagenome verzerrte Ergebnisse liefern und Bakterien oder Plasmide nicht genau mit AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen in Verbindung gebracht werden. WP1 begann mit einer Bewertung der DNA-Extraktionsmethoden innerhalb des Konsortiums, wobei Teichwasser- und Wasserbüffelkotproben verwendet wurden, die mit sechs Bakterienarten in verschiedenen Konzentrationen inokuliert waren, sowie Kontrollproben ohne Kontamination. Die gewählten Probenmatrices, Wasserbüffelkot (eine komplexe Matrix) und Teichwasser (eine einfache Matrix), wurden aufgrund ihrer PrävalenzPrävalenzZum Glossareintrag innerhalb des Konsortiums ausgewählt.Das BfRkurz fürBundesinstitut für Risikobewertung erstellte eine definierte mikrobielle Gemeinschaft (DMC), die vier gramnegative Isolate und zwei grampositive Isolate mit bekannten vollständigen Genomsequenzen und unterschiedlichen AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Profilen umfasste. Zwei unterschiedlich zusammengesetzte Gemeinschaften mit einer festen Konzentration von 105 KBE/mlkurz fürMilliliter oder einem Bereich von 103 bis 107 KBE/mlkurz fürMilliliter wurden als Inokulate für die beiden Matrizes verwendet. Die Matrizen wurden auf Salmonellen, ESBL- und/oder Carbapenemase-produzierende Enterobacteriaceae sowie auf PCR-Isolate mit den Genen mcr-1 bis mcr-9 untersucht, um ihre Negativität und Eignung für die DMC-Analyse sicherzustellen. Um die Integrität der DNA zu erhalten, wurden die Proben innerhalb der definierten Mock-Community und die Matrizen selbst mit der kommerziellen Nukleinsäure-Konservierungslösung DNA/RNA Shield (Zymo Research) vorbereitet.Die DNA-Extraktionsprotokolle, bei denen in erster Linie handelsübliche Kits zum Einsatz kamen, wurden von jedem Partner in seinen Labors angewandt, wobei Methoden wie Bead Beating, enzymatische Lyse oder eine Kombination davon zum Einsatz kamen. Die mit den verschiedenen Methoden erhaltene DNA-Konzentration lag zwischen 1 und 60 ng/μl, mit einem zufriedenstellenden 260/280-Verhältnis (1,6-1,8). Die Größe der DNA-Fragmente (3-50kb) variierte zwischen den Methoden. Die Projektpartner verwendeten einheitliche Long-Read-Sequenzierungskits (ONT Ligation Sequencing Kit (SQK-LSK109) und native Barcoding Expansion), um vergleichbare Sequenzierungsergebnisse innerhalb des Konsortiums zu gewährleisten. Für die Sequenzierung wurden Illumina Short-Read- (im Konsortium unterschiedlich) und ONT-MinION (Flow Cell R9) Long-Read-Technologien verwendet, wobei ein Ziel von ~5 Gbp pro Probe angestrebt wurde.Es wurde eine Bewertung der Short-Read- (Illumina) und Long-Read-Sequenzierung (ONT) an einer definierten Mock-Community (DMC) von 6 Arten durchgeführt, die in Wasserbüffelkot oder Teichwasser in unterschiedlichen Konzentrationen inokuliert wurden. Die Long-Read-Sequenzierung mit der ONT-Technologie identifizierte einige bakterielle Spezies in der DMC, abhängig von der DNA-Extraktionsmethode. Die mikrobiellen Profile wiesen je nach verwendeter Datenbank (SILVA/16S oder vollständige Genome) eine unterschiedliche Clusterbildung auf. Illumina-Daten wurden mit der 16S-SILVA-Datenbank nach Instituten geclustert, während die FARMED_db (vollständige Genome) zu einer Clusterbildung auf der Grundlage des Probentyps führte. Bei MinION-Daten, die die FARMED_db verwenden, war die Clusterbildung weniger eindeutig und trennte die Proben im Allgemeinen auf der Grundlage von Leerproben (FB) oder gemischten Konzentrationen (FM). Die Analyse des AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Gehalts wurde weniger durch das Institut oder die DNA-Extraktionsmethode beeinflusst. Die Variationen in der bakteriellen Zusammensetzung wurden auf die Sequenzierungstiefe und die DNA-Extraktionsmethode zurückgeführt. Trotz der Unterschiede bei der Sequenzierung wurden die meisten der aufgestockten Bakterienarten in DMC-Proben identifiziert.Die Long-Read-Sequenzierung von PacBio, die auf der zirkulären Konsenssequenzierung (CCS) basiert, verspricht >10kb lange High-Fidelity-Reads (HiFi) für die Erstellung von Metagenomprofilen und die Assemblierung. Parallel zur Illumina- und ONT-Sequenzierung verwendete das BfRkurz fürBundesinstitut für Risikobewertung PacBio für DMC-Proben, die mit Wasserbüffelkot versetzt waren. Trotz erfolgreicher Identifizierung von DMC-Mitgliedern und der Wasserbüffelmatrix verhinderten niedrige Lesezahlen die Assemblierung durch verschiedene Programme. Die umfangreiche Optimierung, die für PacBio erforderlich ist, sowie die Unfähigkeit, Proben effizient zu multiplexen, und die daraus resultierenden hohen Kosten pro Probe führten zu der Entscheidung, sich auf die effizientere ONT-Methode zu konzentrieren. Die hohen Eingangs-DNA-Konzentrationen und die lange Bibliotheksvorbereitungszeit von PacBio machten es als Long-Read-Alternative ungeeignet, da seine Datenqualität den zusätzlichen Arbeitsaufwand und die höheren Kosten im metagenomischen Kontext nicht kompensierte.Drei vielversprechende, kommerziell erhältliche DNA-Extraktionskits wurden für die weitere Evaluierung ausgewählt, wobei jedes Kit von mindestens zwei Instituten verwendet wurde. Von den jeweiligen Instituten wurden "einfache" (WP1-T2) und "komplexe" (WP1-T3) Matrizen aus der Praxis ausgewählt.
JRP12-WP1-T3- Bewertung der Durchführbarkeit/Durchführung von Long-Read-Metagenomik mit MinION aus "komplexen" Probenmatrizes.Über die deutschen Nationalen Referenzlaboratorien für Salmonellen und Escherichia coli wurden der Sequenziereinheit des BfRkurz fürBundesinstitut für Risikobewertung zwei komplexe Probenmatrices mit bakterieller Kontamination zur Verfügung gestellt: gemahlenes Insektenpulver (Grille) und Sesampaste (Tahini). Ausschlaggebend für die Auswahl der Matrices waren ihre Relevanz im Hinblick auf die EU-Verordnung 2015/2283 und aktuelle internationale Ausbrüche mit Salmonella-Serovaren. Die DNA-Extraktion aus 200 mgkurz fürMilligramm dieser Proben erfolgte mit dem ZymoBiomics HMW DNA Kit. Trotz Herausforderungen wie niedriger DNA-Konzentrationen im Insektenpulver aufgrund des hohen Salzgehalts und der Lagerbedingungen lieferten beide Probentypen ausreichend DNA für die ONT-Sequenzierung. Vier komplexe Matrixproben wurden mit der ONT-Technologie sequenziert: Mit Salmonellen kontaminiertes Tahini, nicht kontaminiertes Tahini, Bacillus-positives Grillenpulver und Salmonella-positives Grillenpulver.Für die Sequenzierung wurden das ONT Rapid Kit und das Native Barcoding kit verwendet, wobei ersteres einen kürzeren Arbeitsablauf im Labor ermöglichte. Die Analyse der Sequenzierungsdaten aus der Bacillus-kontaminierten Insektenprobe identifizierte die Pathogen-Kontamination korrekt und ermöglichte die Zusammenstellung von Contigs, die Zuordnung zu einer Bacillus-Klade und die Identifizierung von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen. Die Sequenzierung der mit Salmonellen kontaminierten Tahin- und Insektenproben ergab jedoch nur eine geringe Anzahl von Salmonella-Reads. Die Salmonella-positive Tahiniprobe wies vier klassifizierte Salmonella-Reads auf, konnte aber weder assembliert noch einem bestimmten Serovar zugeordnet werden. Die Diskrepanz zwischen Salmonellen- und Bacillus-Kontamination kann auf unterschiedliche Kontaminationsgrade zurückgeführt werden, wobei die Salmonellen-Kontamination erwartungsgemäß sehr gering ist.Für die Sequenzierung dieser Proben wurde auch die Short-Read-Technologie von Illumina verwendet. Vergleiche mit Long-Read-Sequenzierungsdaten ergaben, dass der Prozentsatz der klassifizierten Long-Read-Sequenzierungs-Reads weit über dem der Short-Read-Sequenzierungs-Reads lag. Die Long-Read-Technologie erwies sich als überlegen bei der Identifizierung bakterieller Verunreinigungen in komplexen Matrices mit schwierigen Eigenschaften wie hohem Fett- oder Salzgehalt. Die ONT-Sequenzierung ermöglichte auch bei der schnellen Bibliotheksvorbereitung mttels Rapid Kit die Zusammenstellung von bakteriellen Contigs, die Kladenzuordnung und die Identifizierung von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen). Der Grad der bakteriellen Verunreinigung blieb jedoch ein entscheidender Faktor, und bei den analysierten Matrices übertraf die Long-Read-Technologie die Short-Read-Sequenzierung bei der Identifizierung ausgewählter bakterieller Verunreinigungen.Zur Erleichterung des institutsübergreifenden Vergleichs und zur Bestimmung der Nachweisgrenzen wurde eine kommerziell erhältliche Mock-Community (ZymoBIOMICS Gut Microbiome Standard, GMS, CAT-Nr. D6331) verwendet, um konsistente Ergebnisse und einen Methodenvergleich zwischen den Konsortialpartnern zu ermöglichen. Der Darm-Mikrobiom-Standard (GMS) wurde entweder in PBS (PURE-Probe) oder in Büffelkot (SPIKED-Probe) inokuliert. Ungeimpfter Büffelkot (BLANK-Probe) wurde ebenfalls analysiert, um die natürliche Mikroflora zu verstehen. Die DNA-Extraktion aus den drei Proben (PURE, SPIKED und BLANK) erfolgte mit dem Quick-DNA ™ HMW MagBead Kit von ZymoResearch (ausgewählt in WP1-T1) und ergab ausreichend reine, lange DNA-Fragmente, die den Anforderungen der Nanopore-Sequenzierung mit dem Ligationspräparat (mindestens 1 μg) entsprachen. Die Proben wurden zum Vergleich mit Nanopore und Illumina sequenziert. Alle Sequenzierungsläufe erzeugten umfangreiche genomische Daten, die sich für bioinformatische Analysen eignen (siehe WP2.T1). Insgesamt wurden die GenauigkeitPositiver prädiktiver WertZum Glossareintrag und Empfindlichkeit der Sequenzierung durch die experimentellen Einstellungen erheblich beeinflusst. Ein von Sciensano durchgeführter Vergleich der KMA-Ausgangsdaten von APHA, BfRkurz fürBundesinstitut für Risikobewertung, Sciensano, SSI und WBVR anhand von Nachweiskriterien (siehe WP2-T1) ergab, dass die verschiedenen Institute bei Experimenten mit GMS, die in reiner Form (PURE) oder als Spiked (SPIKED) in einer komplexen Matrix analysiert wurden, ähnlich abschnitten. Sie verwendeten jedoch unterschiedliche Sequenzierungsmultiplexing-Stufen (1plex, 3plex, 4plex, 5plex und 6plex), Laufzeiten (24h, 48h und 72h), Bibliotheksvorbereitungsmethoden (Rapid Kit- oder Native Barcoding Kit) und DNA-Extraktionskits (Quick-DNA HMW MagBead Kit, ZymoResearch oder GenFind V3, Beckman). Die verschiedenen Kombinationen von Versuchseinstellungen wurden von "idealen Einstellungen" (d. h. Singleplex, 72h, Ligationskit und Quick-DNA HMW MagBeat-Kit) bis hin zu "kosteneffizienten Einstellungen" (d. h. 6plex, 24h, Rapid-Kit und GenFind V3-Kit) kategorisiert. Es wurde festgestellt, dass mit dem Wechsel von idealen zu kosteneffizienten Versuchseinstellungen die Nachweisgenauigkeit und Empfindlichkeit abnahm und nicht mehr mit der Illumina-Sequenzierung vergleichbar war.
JRP12-WP1-T4- Durchführung von Hi-C-Metagenomik Diese Aufgabe wurde in enger Zusammenarbeit zwischen dem BfRkurz fürBundesinstitut für Risikobewertung und Sciensano durchgeführt.Bei der Hi-C-Metagenom-Sequenzierung, einer kürzlich entwickelten Technologie, werden DNA-Moleküle in unmittelbarer Nähe ligiert, um den genetischen Kontext von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen und ihre Zugehörigkeit zum bakteriellen Wirtschromosom zu ermitteln. Dieser Ansatz, der vor der Short-Read-Sequenzierung durchgeführt wird, soll Einblicke in den genetischen Kontext von AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Genen und ihre genomische Position, einschließlich extrachromosomaler Elemente wie Plasmide oder ihre Verbindung zu bakteriellen Wirtschromosomen, ermöglichen. Die Durchführbarkeit wurde sowohl anhand von artifiziellen Proben als auch anhand von Proben aus dem EFFORT-Projekt untersucht.Das BfRkurz fürBundesinstitut für Risikobewertung konstruierte eine künstliche Gemeinschaft (MC), die aus vier Arten mit bekannten ARG-Profilen, Genomen und Plasmidsequenzen bestand. Hi-C- und Shotgun-Illumina Bibliotheken wurden erstellt und sequenziert, die anschließende Analyse erfolgte mit ProxiMeta und der selbst entwickelten Hiccap-Pipeline. Beide Pipelines verknüpften die meisten AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Gene erfolgreich mit den Bakterienspezies innerhalb der künstlichen Gemeinschaft, wobei die Sensitivität und Spezifität der Hiccap-Analyse über Schwellenwerte flexibel eingestellt werden kann. Während es künstlichen Gemeinschaften an echter Probenkomplexität mangelt, boten die Proben des EFFORT-Projekts aus einem In-vivo-Experiment mit Salmonella enterica serovar Corvallis realistischere Bedingungen. Hi-C Metagenomik zeigte eine hohe Spezifität und Sensitivität (>90%) bei der Zuordnung von ARGs zu Bakterienspezies.Sciensano verwendete eine künstliche Gemeinschaft (MC1) vom BFR, die sechs Arten mit bekannten Referenzgenomen umfasste, um eine Hi-C-Bibliothek zu erstellen. Die Sequenzierung mit Illumina MiSeq und die Analyse mit den Tools ProxiMeta und HiCExplorer zeigten eine erfolgreiche Verknüpfung von Plasmiden mit Wirtsstämmen. Zukünftige Arbeiten werden die Verwendung von ONT-basierten Assemblies als Shotgun-Bibliotheken untersuchen. Die Ergebnisse deuten darauf hin, dass wissenschaftliche Untersuchungen in Zukunft den Shotgun-Datensatz umgehen können, um Kosten zu sparen.Zu den Herausforderungen gehören die begrenzten verfügbaren Pipelines für die Hi-C-Datenanalyse. Während ProxiMeta eine Option ist, wurden alternative Open-Source-Pipelines wie HAM-ART und HiCBin identifiziert. Die laufende Entwicklung der hauseigenen Hiccap-Pipeline zielt darauf ab, sich ausschließlich auf eine Deep-Sequencing-Hi-C-Bibliothek mit gepaarten Enden zu stützen, was die praktischen Kosten für die Sequenzierung verringern könnte. Obwohl die Analyse von Hi-C-Daten noch nicht standardisiert oder routinemäßig durchgeführt wird, zeigt die Verwendung der hauseigenen Hiccap-Pipeline die Fähigkeit der metagenomischen Hi-C-Sequenzierung, genomische Identitäten von Reads zu identifizieren und ARGs den Arten zuzuordnen. Zukünftige Entwicklungen könnten den Bedarf an gepaarten, tief sequenzierten Shotgun-Bibliotheken in dieser Methodik überflüssig machen. Trotz des derzeitigen Mangels an Standardisierung macht die einzigartige Fähigkeit der Hi-C-Metagenomsequenzierung, Plasmide mit Wirten in Metagenomik-Proben zu verknüpfen, sie zu einem vielversprechenden Forschungsinstrument für die Behandlung von Fragen der genetischen modifizierten Mikroorganismen (GMM)-Charakterisierung.  WP2 - Bioinformatik-Tools zur Analyse der Sequenzierungsdaten und zur Definition der Merkmale innerhalb der Probe.
Für den Zweck der gemeinsamen Nutzung und Speicherung von Sequenzierungsdaten innerhalb des Konsortiums mit der Option, die Privatsphäre bis zur Veröffentlichung zu wahren, wurden von APHA und SCIENSANO Nachforschungen angestellt, um geeignete Lösungen zu finden, da das OHEJP diese Möglichkeit nicht bietet. In Erwartung der Erzeugung von bis zu 120 GB an MinION-Daten und 192 GB an Illumina-Daten für jeden Aufgabenvergleich innerhalb des Konsortiums wurden drei Optionen in Betracht gezogen (Google Cloud, Google Drive und ownCloud), die jeweils ihre eigenen Vor- und Nachteile haben. Das Konsortium entschied sich für ownCloud (https://farmedejp12.owncloud.online/). Es ist von entscheidender Bedeutung, die Datenspeicherung nicht nur für das Volumen und die Größe der Sequenzierungsdaten und der Analyse, sondern auch für die bei der Metagenomanalyse verwendeten Datenbanken zu berücksichtigen.
JRP12-WP2-T1- Entwicklung/Anpassung einer Pipeline, die Arten innerhalb einer Probe/Matrix vorhersagen kannAufgrund der umfangreichen Daten, die durch die Metagenom-Sequenzierung erzeugt werden, ist das Vorhandensein einer ressourceneffizienten Analysepipeline von entscheidender Bedeutung, unabhängig davon, ob sie in einem Labor oder vor Ort durchgeführt wird. In der Projektantragsphase wurden Tools für die Abfrage von Metagenomdaten mit Short-Read-Sequenzierung entwickelt. Zu Beginn des Projekts wurde die KMA-Pipeline (k-mer alignment) von der DTU eingeführt, die eine innovative Mapping-Methode verwendet, um Rohdaten und Fasta-Dateien mit einer Datenbank abzugleichen (Clausen et al.kurz füret alii (lat. "und andere"), 2018, https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-018-2336-6). Diese kommandozeilenbasierte KMA-Pipeline kann für bakterielle Gemeinschaften und AMRkurz fürAntimicrobial resistance (Resistenzen gegenüber Wirkstoffen)-Zuordnungen sowohl aus Long-Read- als auch Short-Read-Sequenzen implementiert werden. Sie wurde für den Standard-Workflow in der FARMED-Datenanalyse berücksichtigt und ist frei verfügbar unter https://bitbucket.org/genomicepidemiology/kma.BfRkurz fürBundesinstitut für Risikobewertung, SSI, WBVR und APHA haben zu den folgenden Analysen unter der Leitung von Sciensano beigetragen. Die Sequenzierungsdaten aus den UNSPIKED-, PURE- und SPIKED-Proben aus WP1-T3 wurden mit KMA und den Custom-2-Parametern analysiert, wie im 12M-Report-Y4 beschrieben. Ein wichtiger Aspekt war die Auswahl der Referenzdatenbank, wobei mehrere Datenbanken für die Analyse von Metagenomikdaten getestet wurden, darunter gmstd_db, gmstdFP_db, DTU_db, newDTU_db und FARMED_db. Der Vergleich von gmstd_db, DTU_db und newDTU_db ergab, dass die Zusammensetzung der Datenbank (vollständige Genome vs. Contigs/Scaffold) die KMA-Ergebnisse beeinflusst. Für eine genaue Interpretation wurde eine Datenbank empfohlen, die hauptsächlich aus vollständigen Genomen besteht, wobei Contigs/Scaffolds nur hinzugefügt werden, wenn keine vollständigen Genome verfügbar sind.Zur Analyse der UNSPIKED-, PURE- und SPIKED-Proben wurde eine neue Datenbank namens FARMED_db erstellt, die aus DTU_db mit angehängten vollständigen Genomen von Methanobrevibacter smithii und Contigs/Scaffolds-Listen von Veillonella rogosae und Prevotella corporis besteht. Die Analyse der PURE-Probe unter Verwendung von gmstd_db, gmstdFP_db und FARMED_db half bei der Festlegung von Schwellenwerten für die Identifizierung von Spezies auf der Grundlage der von KMA generierten Werte für Tiefe, Template-Identität und Template-Abdeckung. Aufgrund der umfangreichen Daten, die von KMA mit den Custom-2 Parameter abgerufen wurden, schlug Sciensano sechs verschiedene Detektionslevel mit unterschiedlichen Zuverlässigkeitsstufen vor, um die Dateninterpretation zu vereinfachen. Je nach Erkennungsgrad kann man sich auf die taxonomische Identifizierung verlassen, oder es ist eine ergänzende Analyse erforderlich, um das Ergebnis zu bestätigen.
Projekttyp

Drittmittelprojekt

BFR-Forschungsschwerpunkt

Gesundheit von Mensch, Tier und Umwelt (One Health)

Organisationseinheiten und Partner

Federführende Fachgruppe: Studienzentrum für Genomsequenzierung und -analyse (4NSZ)
Kontaktpersonen: Dr. Carlus Deneke, Dr. Simon Tausch
Externe Partner: Sciensano, Animal & Plant Health Agency, DTU National Food Institute, Wageningen Bioveterinary Research

Mittelgeber und Förderkennzeichen

Europäische Union
Grant agreement 773830