Direkte Unterscheidung von Biomolekülen in gemischten Proben mithilfe von Nanogap

Wissenschaftliche Berichte Band 13, Artikelnummer: 9103 (2023) Diesen Artikel zitieren

1 Altmetrisch

Details zu den Metriken

Bei Einzelmolekülmessungen messen Metall-Nanogap-Elektroden direkt den Strom eines einzelnen Moleküls. Diese Technik wurde aktiv als neue Nachweismethode für eine Vielzahl von Proben untersucht. Maschinelles Lernen wurde eingesetzt, um von einzelnen Molekülen abgeleitete Signale zu analysieren und so die Identifizierungsgenauigkeit zu verbessern. Herkömmliche Identifizierungsmethoden weisen jedoch Nachteile auf, z. B. die Notwendigkeit, für jedes Zielmolekül Daten zu messen, und die Variation der elektronischen Struktur der Nanogap-Elektrode. In dieser Studie berichten wir über eine Technik zur Identifizierung von Molekülen basierend auf Einzelmolekül-Messdaten, die nur in gemischten Probenlösungen gemessen wurden. Im Vergleich zu herkömmlichen Methoden, die das Training von Klassifikatoren anhand von Messdaten einzelner Proben erfordern, kann unsere vorgeschlagene Methode das Mischungsverhältnis anhand der Messdaten in gemischten Lösungen erfolgreich vorhersagen. Dies zeigt die Möglichkeit, einzelne Moleküle ohne vorheriges Training nur anhand von Daten aus gemischten Lösungen zu identifizieren. Man geht davon aus, dass diese Methode besonders nützlich für die Analyse biologischer Proben ist, bei denen chemische Trennmethoden nicht anwendbar sind, wodurch sich das Potenzial für die breite Anwendung von Einzelmolekülmessungen als Analysetechnik erhöht.

Die direkte Messung komplexer Proben bietet Vorteile wie Zeit- und Kosteneinsparungen durch Minimierung der Probenvorbereitungsschritte und des Probenverlusts und ermöglicht gleichzeitig den Nachweis einer breiten Palette von Molekülen. Die Einzelmolekülmessung erregt als neuartige molekulare Detektions-/Quantifizierungsmessmethode große Aufmerksamkeit, da bei dieser Methode ein Molekül zwischen Nanoelektroden direkt gemessen wird1,2,3. Bei der Break-Junction-Methode4,5,6,7, einer elektrischen Einzelmolekül-Messmethode, wird ein Metall-Nanospalt durch wiederholtes Brechen und Bilden von Verbindungen gebildet. Der Nachweis eines einzelnen Moleküls erfolgt durch Messung des Tunnelstroms, der entsteht, wenn ein Molekül die Nanolücke passiert. Einzelmolekülmessungen werden aktiv für die Entwicklung molekularer Geräte erforscht2,8,9,10,11,12,13. Seit Di Ventras Gruppe theoretisch das Potenzial für DNA- und RNA-Sequenzierung vorschlug, haben Einzelmolekülmessungen aufgrund ihres hohen Durchsatzes, der niedrigen Nachweisgrenze und der Möglichkeit, Messungen ohne Vorverarbeitungsschritte durchzuführen, große Aufmerksamkeit als Analysemethode erhalten3,14,15 . Bisher hat unsere Gruppe über Leitfähigkeitsmessungen von DNA- und RNA-Nukleobasen berichtet und die Anwendbarkeit von Einzelmolekülmessungen als Analysemethode nachgewiesen16,17,18. Die Zielmoleküle sind nicht auf DNA und RNA beschränkt und können auf verschiedene Moleküle wie Aminosäuren19,20, Peptide21,22, Proteine23,24,25, Neurotransmitter26, Glukose27 und NADH28 ausgedehnt werden. Darüber hinaus sind die Messziele nicht auf Biomoleküle beschränkt. Es wird erwartet, dass Einzelmolekülmessungen ein breites Anwendungsspektrum haben; zum Beispiel die Möglichkeit, Sprengstoffe aufzuspüren29. Obwohl die Leitfähigkeit verschiedener Moleküle mit Einzelmolekülmessungen gemessen werden kann, ist die Leitfähigkeit einzelner Moleküle sehr unterschiedlich30,31,32,33. Daher ist die statistische Auswertung einzelner Molekülsignale für eine zuverlässige molekulare Identifizierung unerlässlich. Die meisten typischen auf Leitfähigkeitshistogrammen basierenden Analysen liefern nur statistische Leitfähigkeitsinformationen zur Einzelmolekülleitfähigkeit. Die Überlappung der Leitfähigkeitshistogramme führt zu einer geringen Genauigkeit bei der Einzelmolekülunterscheidung. Die Anwendung maschinellen Lernens auf Einzelmolekülmessungen ist eine vielversprechende Methode, um diese Probleme anzugehen. Die auf maschinellem Lernen basierende Analyse hat die Unterscheidungsgenauigkeit von Einzelmolekülmessungen verbessert26,34,35,36,37,38. Herkömmliche Ansätze des maschinellen Lernens erfordern jedoch Trainingsdaten, die aus Lösungen gewonnen werden, die nur eine chemische Spezies für jedes Zielmolekül enthalten. Wenn man die Anwendung von Einzelmolekülmessungen zum Nachweis von Biomolekülen oder spezifischen Zielmolekülen in Betracht zieht, ist die Herstellung einer Referenz, die nur eine Probe enthält, aus einer Lösung, die Verunreinigungen für alle Moleküle enthält, gelegentlich schwierig. Allerdings kann die Vorbereitung von Proben mit unterschiedlichen Konzentrationen der Zielmoleküle in unreinen Lösungen vergleichsweise einfacher sein. Beispielsweise durch Förderung oder Hemmung der Emission des Ziels in biologischen Proben oder durch Zugabe eines Referenzmoleküls zu einer Probenlösung. Selbst wenn eine Lösung, die nur ein bestimmtes Zielmolekül enthält, gemessen werden kann, ist der mit den Trainingsdaten erstellte Klassifikator für maschinelles Lernen möglicherweise nicht auf die Proben anwendbar, da sich die Messumgebung der Trainingsdaten möglicherweise von der der Probe unterscheidet. Aus diesen Gründen stellt die Entwicklung einer Methode zur direkten Unterscheidung gemischter Proben ohne Einzelspezies-Zielproben einen bedeutenden Fortschritt auf dem Gebiet der Einzelmolekülmessungen dar. Der Ansatz hat ein erhebliches Potenzial, Einblicke in die Erkennung biologischer Moleküle und anderer Ziele in komplexen Proben zu gewinnen. Das Ziel dieser Studie war die Entwicklung einer Analysemethode zur Identifizierung von Molekülen, die ausschließlich auf gemischten Lösungen basiert. Wie in Abbildung 1 gezeigt, haben wir eine Methode entwickelt, um das Konzentrationsverhältnis gemischter Lösungen nur aus ihren Mischungen zu bestimmen, wobei wir auf dGMP und dTMP abzielen, von denen bereits bekannt ist, dass sie durch Einzelmolekülmessungen in reinen Lösungen und herkömmliche, auf maschinellem Lernen basierende Analysen identifizierbar sind.

Flussdiagramm der Einzelmolekülklassifizierung. Für Einzelmolekül-Strommessungen wurden die Probenlösungen in eine PDMS-Vertiefung injiziert und die Chips mit einer fein gesteuerten Schubstange mit einem piezoelektrischen Gerät gebogen, um einen Nanospalt zu bilden, woraufhin der Strom gemessen wurde. Das grüne Kästchen stellt die herkömmliche Methode dar, während das orange Kästchen die neuen Konzepte darstellt. Die durchgezogenen Linien zeigen den Prozess für jede einzelne Probe und die gestrichelten Linien zeigen den Prozess für die Mischung.

Die Zielmoleküle in dieser Studie sind zwei DNA-Nukleotide, Desoxyguanosinmonophosphat (dGMP) und Thymidinmonophosphat (dTMP). Diese Ziele wurden als Modellsysteme für die Signalidentifizierung einzelner Moleküle mittels maschinellem Lernen ausgewählt und nicht aufgrund ihrer Anwendbarkeit bei der Identifizierung von Gemischen aus zwei Molekülen. Nukleotide können durch Einzelmolekülmessungen identifiziert werden und wurden bereits in verschiedenen Studien als Zielmoleküle beschrieben15,17,36. Abbildung 2a,b zeigen die molekularen Strukturen von dGMP bzw. dTMP. Wie in Abb. 2c, d dargestellt, wird ein Stromimpulssignal erzeugt, wenn ein einzelnes Molekül den Nanospalt passiert. Abbildung 2c und d zeigen Histogramme der maximalen Stromwerte (Ip). Die durchschnittlichen Ströme für dGMP und dTMP betragen 32 pA bzw. 25 pA bei einer Vorspannung von 100 mV für dGMP und dTMP. dGMP weist eine höhere Leitfähigkeit auf als dTMP, da sein HOMO-Niveau näher am Au-Fermi-Niveau liegt39, das das Leitungsorbital für dGMP und nicht für dTMP ist. Obwohl die durchschnittliche Leitfähigkeit der beiden Moleküle einen deutlichen Unterschied aufweist, weisen ihre Ip-Histogramme eine Überlappung auf. Beide Histogramme zeigen schwache Stromsignale bei 20 pA. Das schwache Stromsignal wurde durch die einzelne Molekülbrückenstruktur zwischen der Nanolücke verursacht. Der Elektronentransport über das niedrigere Molekülorbital des Ribosezuckers verursacht einen geringeren Strom40. Die große Überlappung weist darauf hin, dass es für eine genaue Unterscheidung nicht ausreicht, sich ausschließlich auf histogrammbasierte Analysemethoden zu verlassen, die von Ip abhängen, und dass der Einsatz von maschinellem Lernen notwendig ist.

Ergebnisse von dGMP- und dTMP-Einzelmolekülmessungen. (a), (b) Molekülstruktur von dGMP bzw. dTMP. (c), (d) Drei einzelne Stromimpulse von dGMP und dTMP. (e), (f) Histogramme des maximalen Stroms (Ip) für dGMP bzw. dTMP. Jeder Strom wird unter einer Vorspannung von 100 mV gemessen.

Als Vergleich zur vorgeschlagenen Methode wurde das Mischungsverhältnis der Mischung mithilfe einer herkömmlichen, auf maschinellem Lernen basierenden Klassifizierungsmethode vorhergesagt. Bei der herkömmlichen Methode wird der maschinell lernende Klassifikator zunächst anhand der Einzelmolekül-Stromsignale trainiert, die aus Messungen jeder Einzelziellösung mit der Bezeichnung der Molekülnamen gewonnen werden. Der maschinell lernende Klassifikator identifiziert dann die aktuellen Signale, die aus der Mischung erhalten werden, basierend auf den gelernten Eigenschaften jedes molekularen Signals. Schließlich wird jede vorhergesagte molekulare Markierung der gemischten Lösungsdaten gezählt und das Konzentrationsverhältnis als Verhältnis der Anzahl der Signale für jedes Molekül bestimmt. Abb. 3a zeigt den Validierungsprozess des Klassifikatortrainings für maschinelles Lernen. Der Validierungsprozess für maschinelles Lernen besteht aus der Messung mechanisch kontrollierbarer Break Junctions (MCBJ), der Signalextraktion, der Merkmalsextraktion, dem Training und der Identifizierung. In dieser Studie werden 13-dimensionale Vektoren bestehend aus Ip, Dauerzeit (td) und dem 10-dimensionalen normalisierten Stromfaktor, die in zuvor beschriebenen Methoden verwendet wurden, als Merkmale verwendet20,26,35,36. Die 10-dimensionalen normalisierten Stromfaktoren sind definiert als der durchschnittliche Stromwert, normalisiert durch den maximalen Stromwert jedes der 10-Zeitabschnitte, wie in Abb. 3b dargestellt. Für die Verifizierung, das Training und die Vorhersage wurde eine 10-fache Kreuzvalidierungsmethode (CV) verwendet, wie in Abb. S1 in den Zusatzinformationen dargestellt. Beim 10-fachen CV werden alle Daten in zehn Teilmengen unterteilt, und eine Teilmenge wird als Testdaten verwendet, während die Identifizierung von den anderen Teilmengen in einer 10-fachen Schleife trainiert wird, um sicherzustellen, dass alle Daten einmal getestet werden. Die Validierungsergebnisse für die beiden in reinen Lösungen gemessenen Moleküle sind in der in Abb. 3c dargestellten Verwirrungsmatrix dargestellt. Das F-Maß, ein Leistungsindex der Klassifizierung, beträgt 0,78. Dieser Ansatz demonstriert die Identifizierbarkeit eines maschinell lernenden Klassifikators, der auf Daten trainiert wurde, die von Lösungen gemessen wurden, die nur eine einzige chemische Spezies enthalten. Um die Unterscheidungsfähigkeit des Klassifikators zu bestätigen, wurde das Mischungsverhältnis des Ziels mithilfe eines Klassifikators für maschinelles Lernen vorhergesagt, der im vorherigen Schritt das aktuelle Signal jedes Moleküls lernte. Abbildung 4a,b zeigt die Histogramme von Ip, gemessen in den beiden Mischungen dGMP:dTMP = 3:1 bzw. dGMP:dTMP = 1:3. Die dGMP:dTMP = 3:1-Lösung, die mehr vom leitfähigeren dGMP enthält, zeigt eine höhere Leitfähigkeit als die dGMP:dTMP = 1:3-Lösung, die mehr vom weniger leitfähigen dTMP enthält. Abbildung 4c zeigt den Prozess der Identifizierung der in der Mischung erhaltenen Stromsignale mithilfe des maschinell lernenden Klassifikators, der im vorherigen Schritt aus den Stromsignalen jedes Ziels trainiert wurde, um das Mischungsverhältnis vorherzusagen. Mit diesem Verfahren sagte der Klassifikator für maschinelles Lernen Mischungsverhältnisse von 1,7:1 und 1:1,6 für die Signale voraus, die aus den Lösungen dGMP:dTMP = 3:1 bzw. dGMP:dTMP = 1:3 erhalten wurden, wie in Abb. 4d. Wie in Abb. 3c gezeigt, variiert die Identifizierungsgenauigkeit jedes Nukleotids individuell, was zu einer Unterschätzung des Vorhersageverhältnisses reichlich vorhandener Nukleotide führen kann.

Herkömmliche Trainingsmethoden und Identifikationsergebnisse für maschinelles Lernen. (a) Trainingsprozess des maschinellen Lernens für reine Lösungen unter Verwendung der herkömmlichen Methode. Zu den Funktionen gehören Faktoren wie Spitzenstrom (Ip), Dauer (td), Durchschnittsstrom (Iavg.) und 10-dimensionaler normalisierter Strom für jedes Impulssignal. (b) Einzelmolekül-Stromimpuls (blaue durchgezogene Linie) und Definitionen der Merkmale. Die schwarzen gestrichelten Linien zeigen die Fläche des Stromimpulses, aufgeteilt in zehn Teile entlang der Zeitachse. Die durchschnittlichen Stromwerte (rote gestrichelte Linien) jedes Abschnitts, aufgeteilt auf I1 bis I10, betragen 13,2, 38,3, 38,0, 43,5, 35,4, 44,1, 42,0, 34,3, 39,0 bzw. 30,8 pA. Si bedeutet, dass Ii bezüglich Ip normalisiert ist. Die durchgezogenen grünen, roten und rosa Linien repräsentieren Ip, td bzw. Iavg. (c) Verwirrungsmatrix von dGMP- und dTMP-Vorhersagen in reinen Lösungen.

Prozess und Ergebnisse der Vorhersage des Mischungsverhältnisses des Ziels mithilfe des Klassifikators, der im vorherigen Schritt auf das aktuelle Signal des Moleküls trainiert wurde. (a), (b) Ip-Histogramme, gemessen in zwei Mischungen, dGMP:dTMP = 3:1 bzw. dGMP:dTMP = 1:3. (c) Der Prozess der Identifizierung des aktuellen Signals von Mischungen mithilfe des maschinell lernenden Klassifikators, der auf dem aktuellen Signal jedes Ziels trainiert wird, um das Mischungsverhältnis vorherzusagen. (d) Die Ergebnisse der Vorhersage des Mischungsverhältnisses von Mischungen basierend auf trainierten Daten.

Das Hauptziel dieser Forschung ist die Entwicklung einer Methode zur Unterscheidung der beiden Moleküle anhand der gemessenen Daten, bei denen nur gemischte Lösungen verwendet werden. Der Zusammenhang zwischen den Konzentrationen der beiden Gemische, also Lösungen, die mehr dGMP oder dTMP enthalten, ist bekannt. Die Mess- und Identifikationsprozesse für dieses neue Konzept sind in Abb. 5a dargestellt. Die Unterscheidungsgrenzen der beiden Moleküle wurden direkt aus den aus den beiden Mischungen erhaltenen Daten mit unbeschrifteten Daten und unbeschrifteter Datenklassifizierung (UUC) basierend auf der Kerndichteschätzung (KDE)41 geschätzt. Abb. 5b zeigt ein konzeptionelles Diagramm von UUC, einer Methode zur Bestimmung von Diskriminanzgrenzen aus Daten, in denen die beiden Klassen in unterschiedlichen Konzentrationen gemischt sind. In Abb. 5b stellen die Farben Blau und Rot zwei Arten von Mischungen dar. Beide Lösungen enthalten unterschiedliche Konzentrationen der beiden Klassen. Die Kurse sind im Voraus nicht bekannt. Der Zweck von UUC besteht darin, zwischen diesen beiden Klassen zu unterscheiden, je nachdem, welche Klasse in der Lösung häufiger vorkommt. KDE ist eine nichtparametrische statistische Technik, mit der die Wahrscheinlichkeitsdichtefunktion in einem Merkmalsraum direkt aus beobachteten Daten geschätzt wird, wie in Abb. 5c dargestellt. Intuitiv berechnet KDE die Wahrscheinlichkeitsdichte durch Addition der aus jedem beobachteten Datenpunkt erhaltenen Gaußschen Kernel, ähnlich wie bei der Erstellung eines Histogramms durch Addition von Datenpunkten. Mit dieser Methode kann eine glatte Wahrscheinlichkeitsdichteverteilung mit weniger Daten als mit einem Histogramm erzielt werden. In dieser Studie konzentrierte sich der Gaußsche Kernel auf die beobachteten Datenpunkte. Bei der in dieser Studie verwendeten UUC-Methode wurden die Wahrscheinlichkeitsdichteverteilungen der beiden Klassen von KDE durch Korrektur bestimmt. Diese Methode wird für eine Situation vorgeschlagen, in der einer der Datenpunkte nur positive Klassen enthält. Da die vorgeschlagene Methode jedoch auf dem Prinzip basiert, dass Regionen höherer Konzentration höhere Wahrscheinlichkeitsdichten aufweisen, kann sie auch auf zwei unbeschriftete Datenmischungen mit bekannten Konzentrationsbeziehungen angewendet werden. Zum Vergleich mit der herkömmlichen Methode wurde die Identifizierung mit denselben Merkmalen durchgeführt, die aus demselben Datensatz extrahiert wurden wie im vorherigen Abschnitt beschrieben. Der UUC-Klassifikator für maschinelles Lernen wurde nur mit den Signalen der Mischungen trainiert und die Moleküle vorhergesagt. Die Ergebnisse sind in Abb. 5d dargestellt. Die Signalverhältnisse, die den Verhältnissen von dGMP:dTMP von 3:1 und 1:3 entsprechen, wurden mit 3,2:1 bzw. 1:3,5 vorhergesagt. Die Leistung der in dieser Studie vorgeschlagenen neuen Identifizierungsmethode wird mit der herkömmlicher Methoden verglichen, wie in Abb. 5e dargestellt. Die elektronischen Strukturen der Elektroden beeinflussen die Leitfähigkeit einzelner Moleküle. Variationen der elektronischen Struktur aufgrund der molekularen Adsorption auf der Elektrodenoberfläche oder unterschiedlicher Geometrien der Elektroden können die Signale einzelner Moleküle beeinflussen42,43,44,45. In den letzten Jahren wurden verschiedenste Methoden des maschinellen Lernens entwickelt. Unüberwachtes Lernen ist ebenso wie überwachtes Lernen auf die Identifizierung von Daten ohne explizite Kennzeichnung anwendbar. Diese Methode wurde auf die Unterscheidung von I–z-Spuren von Einzelmolekülmessungen angewendet34. Herkömmliche Methoden des unbeaufsichtigten Lernens können die experimentellen Daten der beiden Lösungen jedoch nicht ausreichend identifizieren, wie in SI.5 gezeigt. Die neue UUC-Methode kann zwischen zwei Molekülen unterscheiden, indem sie nur die Mischungen misst. Es wird davon ausgegangen, dass die Methode die Ausbreitung von Fehlern aufgrund von Umgebungsveränderungen verhindert und eine höhere Genauigkeitsunterscheidung als herkömmliche Methoden ermöglicht. Abbildung 5f zeigt das aktuelle Profil der dGMP:dTMP = 3:1-Lösung mit den molekularen Vorhersageergebnissen, die mit der UUC-Methode erhalten wurden. Die roten und blauen Signale bezeichnen von dGMP bzw. dTMP abgeleitete Signale. Die aus den Mischungen gewonnenen Signale können individuell unterschieden werden.

(a) Prozess des Trainings und der Identifizierung ausschließlich mit Daten aus Gemischen. (b) Schematisches Bild von UUC. Die roten und blauen Farben stellen zwei Arten von Gemischen mit unterschiedlichen Konzentrationen der beiden Klassen dar. Die Kreise und Dreiecke repräsentieren jede Klasse. Die UUC-Methode ermittelt die orange Kurve, die die Grenze zwischen zwei Klassen darstellt. (c) Schematische Darstellung des KDE zur Schätzung der Wahrscheinlichkeitsdichtefunktion im Merkmalsraum. Die roten und blauen Punkte und gestrichelten Linien geben die Datenpunkte bzw. ihren Gaußschen Kern an. Die durchgezogenen Kurven stellen die Summe der gestrichelten Linien dar, die die Kerndichteschätzung darstellt. (d) Das Ergebnis der Vorhersage des Mischungsverhältnisses zweier Mischungen mit nur für die Mischung trainierten Daten. (e) Vergleich der Leistung der neuen und alten Methode im Hinblick auf das Vorhersageverhältnis. (f) Das aktuelle Profil, das sich aus der individuellen Identifizierung des Signals jedes einzelnen Moleküls ergibt (in dGMP:dTMP = 3:1-Lösung). (g), (h) Ip-Histogramme basierend auf den Identifikationsergebnissen der dGMP:dTMP = 3:1- bzw. dGMP:dTMP = 1:3-Lösungen. Die roten und blauen Balken stellen die als dGMP bzw. dTMP vorhergesagten Histogramme dar. Die durchgezogenen Linien stellen die Summe der beiden Histogramme dar.

Im vorherigen Abschnitt zeigten die Leitfähigkeitshistogramme einzelner Nukleotide (Abb. 2), dass dGMP eine höhere Leitfähigkeit aufweist. Betrachtet man die einzelnen identifizierten Signale, zeigt das dGMP-Signal nicht immer eine höhere Leitfähigkeit als das dTMP-Signal. Algorithmen für maschinelles Lernen können Signale anhand des Leitwerts und der Signalform unterscheiden. Denn die aktuellen Histogramme der ermittelten Ergebnisse werden statistisch ausgewertet. Die Ip-Histogramme der identifizierten Ergebnisse der Signale, die aus dGMP:dTMP = 3:1- und dGMP:dTMP = 1:3-Lösungen erhalten wurden, sind in Abb. 5g bzw. h dargestellt. Die roten und blauen Balken stellen Histogramme dar, die als dGMP bzw. dTMP vorhergesagt wurden. Die Histogramme bestätigen, dass die UUC-Methode Mischungsverhältnisse vorhersagen kann und dass dGMP eine höhere Leitfähigkeit als dTMP aufweist. Dies stimmt mit den Ergebnissen der reinen Lösungsmessung überein. Insbesondere ermöglicht diese neue Methode die Bestimmung von Konzentrationsverhältnissen mit nur zwei Mischlösungen unbekannter Konzentration. Es wird angenommen, dass diese Technik auf molekulare Nachweismethoden anwendbar ist. Diese Technik kann beispielsweise angewendet werden, um das Konzentrationsverhältnis eines Moleküls in einer biologischen Probe, die ein Fremdmaterial enthält, zu bestimmen, indem es mit einer normalen Probe und einer positiven/negativen Probe mit einer Kontrolle verglichen wird, die das interessierende Molekül fördert oder hemmt Messen der Konzentration des interessierenden Moleküls in einer Probe unbekannter Konzentration und einer Probe, zu der eine Referenzprobe hinzugefügt wird. Das Konzentrationsverhältnis des interessierenden Moleküls kann auch aus positiven/negativen Proben des interessierenden Moleküls mit einer Kontrolle bestimmt werden, die das interessierende Molekül fördert oder hemmt.

In dieser Studie haben wir eine neue Methode zur Identifizierung von Molekülen mithilfe der Einzelmolekülmessung nur gemischter Lösungen und eine Unterscheidungsmethode für zwei Arten unbeschrifteter Daten mithilfe der Kerndichteschätzung entwickelt. Im Vergleich zur herkömmlichen Methode zeigte unser Ansatz eine verbesserte Genauigkeit bei der Vorhersage der Zusammensetzung gemischter Lösungen. Die in dieser Studie entwickelte Technik zur Identifizierung von Zielmolekülen in gemischten Lösungen ohne individuelles Probentraining wird voraussichtlich breite Anwendungsmöglichkeiten für verschiedene Moleküle im Bereich der Einzelmolekülmessung haben.

Desoxyguanosinmonophosphat (dGMP, Sigma-Aldrich) und Desoxythymidinmonophosphat (dGTP, Sigma-Aldrich) wurden ohne weiteren Reinigungsprozess in Milli-Q-Wasser verdünnt. Die Konzentration jeder bei der Messung verwendeten dGMP- und dTMP-Lösung betrug 10 μM. Bei Messungen von dGMP:dTMP = 3:1 wurde eine Mischung aus 750 μM dGMP und 250 μM dTMP verwendet, und bei Messungen von dGMP:dTMP = 1:3 wurde eine Lösung aus 250 μM dGMP und 750 μM dTMP verwendet. Polydimethylsiloxan (PDMS)-Wells wurden hergestellt und 10 s lang mit einem Sauerstoffplasma behandelt, an der MCBJ-Nanogap-Elektrodenvorrichtung befestigt und 60 min lang im Vakuumofen bei 90 °C behandelt.

Zur Bildung von Gold-Nanolücken wurde die MCBJ-Technik angewendet. Die Golddrähte wurden auf dem flexiblen Siliziumsubstrat abgeschieden. Zunächst wurde ein dünner Polyimidfilm als Isolierschicht auf dem Siliziumsubstrat gebildet. Mithilfe der Elektronenstrahllithographie wurden Dutzende nanometergroße Muster hergestellt, und die Golddrähte wurden mittels plasmaunterstützter chemischer Gasphasenabscheidung auf den Mustern abgeschieden. Abschließend wurde die Polyimidschicht trockengeätzt, um die Golddrahtbrücke zu bilden. Das Golddrahtsubstrat wurde im MCBJ-System installiert und die Stromänderung wurde überwacht, bis die Drähte aufgrund wiederholter Biegung durch Dreipunktbiegung mechanisch brachen und ein starker Stromabfall auftrat. Während dieses Vorgangs wurde der Strom mithilfe des piezoelektrischen Geräts gemessen, um die Spaltbreite in Echtzeit präzise zu steuern und die piezojustierte Schubstange fein abzustimmen.

Die Lösungen wurden in PDMS injiziert, das gut am MCBJ-Gerät befestigt war. An die Lösungselektrode wurde 5 Minuten lang eine Spannung von 100 mV angelegt. Vor jeder Einzelmessung wurde ein Kontrollexperiment durchgeführt, bei dem nur Milli-Q-Wasser injiziert wurde. Der Elektrodenabstand d des Nanospalts wurde durch die MCBJ-Technik auf 0,58, 0,56 und 0,54 nm festgelegt.

Jedes der 830 Pulssignale wurde mit überwachtem maschinellem Lernen des Random Forest (RF)-Klassifikators in der Scikit-Learn-Version 0.24.246 trainiert und klassifiziert. Im Validierungsprozess wurde der 10-fache CV durchgeführt und seine Durchschnitts- und Standardabweichungswerte lieferten die Klassifizierungsverhältnisse und Fehler. Die Fehler sind Standardabweichungen der 10-fachen Klassifizierung. Bei der Analyse gemischter Lösungen wurde der RF-überwachte Klassifikator für maschinelles Lernen mit jeweils 1000 dGMP- und dTMP-Signalen trainiert. Es wurden Signale mit Ip > 20 pA und td > 1 ms analysiert. Die Signale der Mischungen wurden einzeln mit dem trainierten Klassifikator klassifiziert. Die Analyse wurde mit Python 3.10.4 durchgeführt. UUC- und gewichtete KDE-Quellcodes wurden von uns selbst mit Python 3.10.4 erstellt. Die 1000 Signale und Merkmale von Mischungen sind die gleichen wie bei herkömmlichen Methoden. Der Gaußsche Kernel wurde übernommen. Die Bandbreite wird durch die Silverman-Regel41 bestimmt.

Die Daten, die die Ergebnisse dieser Studie stützen, sind auf begründete Anfrage beim entsprechenden Autor erhältlich. Korrespondenz und Materialanfragen sind an MT zu richten

Li, Y., Yang, C. & Guo, X. Elektrische Einzelmoleküldetektion: Ein vielversprechender Weg zu den grundlegenden Grenzen der Chemie und Biowissenschaften. Acc. Chem. Res. 53, 159–169 (2020).

Artikel CAS PubMed Google Scholar

Xie, X. et al. Einzelmolekül-Verbindung: Eine zuverlässige Plattform zur Überwachung molekularphysikalischer und chemischer Prozesse. ACS Nano 16, 3476–3505 (2022).

Artikel CAS PubMed Google Scholar

Di Ventra, M. & Taniguchi, M. Dekodierung von DNA, RNA und Peptiden mit Quantentunneln. Nat. Nanotechnologie. 11, 117–126 (2016).

Artikel ADS PubMed Google Scholar

Martin, CA, Ding, D., Van Der Zant, HSJ & Van Ruitenbeek, JM Lithografische mechanische Bruchstellen für Einzelmolekülmessungen im Vakuum: Möglichkeiten und Grenzen. Neue J. Phys. 10, 065008 (2008).

Artikel ADS Google Scholar

Reed, MA, Zhou, C., Muller, CJ, Burgin, TP & Tour, JM Leitfähigkeit einer molekularen Verbindung. Wissenschaft 278, 1–3 (1997).

Artikel Google Scholar

Krans, JM et al. Ein-Atom-Punktkontakte. Physik. Rev. B 48, 14721–14724 (1993).

Artikel ADS CAS Google Scholar

Agraït, N., Yeyati, AL & van Ruitenbeek, JM Quanteneigenschaften atomarer Leiter. Phys. Rep. 377, 81–279 (2003).

Artikel ADS Google Scholar

Evers, F., Korytár, R., Tewari, S. & Van Ruitenbeek, JM Fortschritte und Herausforderungen beim Einzelmolekül-Elektronentransport. Rev. Mod. Physik. 92, 35001 (2020).

Artikel CAS Google Scholar

Bai, J., Li, X., Zhu, Z., Zheng, Y. & Hong, W. Einzelmolekül-Elektrochemische Transistoren. Adv. Mater. 33, 1–20 (2021).

Artikel Google Scholar

Aradhya, SV & Venkataraman, L. Einzelmolekülverbindungen jenseits des elektronischen Transports. Nat. Nanotechnologie. 8, 399–410 (2013).

Artikel ADS CAS PubMed Google Scholar

Huang, C., Rudnev, AV, Hong, W. & Wandlowski, T. Unterbrechungskontakt unter elektrochemischem Gating: Prüfstand für Einzelmolekülelektronik. Chem. Soc. Rev. 44, 889–901 (2015).

Artikel CAS PubMed Google Scholar

Su, TA, Neupane, M., Steigerwald, ML, Venkataraman, L. & Nuckolls, C. Chemische Prinzipien der Einzelmolekülelektronik. Nat. Rev. Mater. https://doi.org/10.1038/natrevmats.2016.2 (2016).

Artikel Google Scholar

Song, H., Reed, MA & Lee, T. Elektronische Einzelmolekülgeräte. Adv. Mater. 23, 1583–1608 (2011).

Artikel CAS PubMed Google Scholar

Zwolak, M. & Di Ventra, M. Kolloquium: Physikalische Ansätze zur DNA-Sequenzierung und -Detektion. Rev. Mod. Physik. 80, 141–165 (2008).

Artikel ADS Google Scholar

Zwolak, M. & Di Ventra, M. Elektronische Signatur von DNA-Nukleotiden über Quertransport. Nano Lett. 5, 421–424 (2005).

Artikel ADS CAS PubMed Google Scholar

Ohshiro, T. et al. Direkte Beobachtung von DNA-Veränderungen, die durch einen DNA-Disruptor hervorgerufen werden. Wissenschaft. Rep. 12, 1–9 (2022).

Artikel Google Scholar

Tsutsui, M., Taniguchi, M., Yokota, K. & Kawai, T. Identifizierung einzelner Nukleotide durch Tunnelstrom. Nat. Nanotechnologie. 5, 286–290 (2010).

Artikel ADS CAS PubMed Google Scholar

Ohshiro, T. et al. Einzelmolekül-RNA-Sequenzierung zum gleichzeitigen Nachweis von m6A und 5mC. Wissenschaft. Rep. 11, 1–10 (2021).

Artikel Google Scholar

Zhao, Y. et al. Einzelmolekülspektroskopie von Aminosäuren und Peptiden durch Erkennungstunnelung. Nat. Nanotechnologie. 9, 466–473 (2014).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Ryu, J., Komoto, Y., Ohshiro, T. & Taniguchi, M. Einzelmolekülklassifizierung von Asparaginsäure und Leucin durch molekulare Erkennung durch Wasserstoffbrückenbindung und Zeitreihenanalyse. Chem. Asian J. 17, e202200179 (2022).

Google Scholar

Ohshiro, T. et al. Nachweis posttranslationaler Modifikationen in einzelnen Peptiden mithilfe von Elektronentunnelströmen. Nat. Nanotechnologie. 9, 835–840 (2014).

Artikel ADS CAS PubMed Google Scholar

Hihath, J. & Tao, N. Schnelle Messung der Einzelmolekülleitfähigkeit. Nanotechnologie 19, 265204 (2008).

Artikel ADS PubMed Google Scholar

Zhang, B. et al. Beobachtung riesiger Leitfähigkeitsschwankungen in einem Protein. Nano-Futur. 1, 035002 (2017).

Artikel ADS Google Scholar

Zhang, B. et al. Rolle von Kontakten bei der Proteinleitfähigkeit über große Entfernungen. Proz. Natl. Acad. Wissenschaft. USA 116, 5886–5891 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Ruiz, MP et al. Bioengineering einer Einzelproteinverbindung. Marmelade. Chem. Soc. 139, 15337–15346 (2017).

Artikel CAS PubMed Google Scholar

Komoto, Y. et al. Zeitaufgelöster Neurotransmitter-Nachweis im Hirngewebe von Mäusen mithilfe einer künstlichen Intelligenz-Nanogap. Wissenschaft. Rep. 10, 1–7 (2020).

Artikel Google Scholar

Nishino, T., Shiigi, H., Kiguchi, M. & Nagaoka, T. Spezifischer Einzelmolekülnachweis von Glucose in einer supramolekular gestalteten Tunnelverbindung. Chem. Komm. 53, 5212–5215 (2017).

Artikel CAS Google Scholar

Hu, Y. et al. Bestimmung von Ag[I] und NADH mithilfe ratiometrischer Einzelmolekül-Leitfähigkeitssonden. ACS Sensors 6, 461–469 (2021).

Artikel CAS PubMed Google Scholar

Yu, P. et al. Einzelmolekül-Tunnelsensoren für Nitrobenzol-Sprengstoffe. Anal. Chem. 94, 12042–12050 (2022).

Artikel CAS PubMed Google Scholar

Zhu, Z. et al. Schwankungen der Leitfähigkeit einzelner Moleküle um bis zu vier Größenordnungen durch Kontaktierung von Elektroden mit unterschiedlichen Verankerungsstellen. J. Mater. Chem. C 9, 16192–16198 (2021).

Artikel CAS Google Scholar

Chen, F., Hihath, J., Huang, Z., Li, X. & Tao, NJ Messung der Einzelmolekülleitfähigkeit. Annu. Rev. Phys. Chem. 58, 535–564 (2007).

Artikel ADS CAS PubMed Google Scholar

Stefani, D. et al. Große Leitfähigkeitsschwankungen in einer mechanosensitiven Einzelmolekülverbindung. Nano Lett. 18, 5981–5988 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Li, H. et al. Große Unterschiede in der Einzelmolekülleitfähigkeit zyklischer und bizyklischer Silane. Marmelade. Chem. Soc. 140, 15080–15088 (2018).

Artikel CAS PubMed Google Scholar

Huang, F. et al. Automatische Klassifizierung von Ladungstransportdaten einzelner Moleküle mit einem unbeaufsichtigten maschinellen Lernalgorithmus. Physik. Chem. Chem. Physik. 22, 1674–1681 (2020).

Artikel CAS PubMed Google Scholar

Komoto, Y., Ohshiro, T. & Taniguchi, M. Nachweis eines alkoholassoziierten Krebsmarkers durch Einzelmolekül-Quantensequenzierung. Chem. Komm. 56, 14299–14302 (2020).

Artikel CAS Google Scholar

Taniguchi, M. et al. Hochpräzise Einzelmolekülidentifizierung basierend auf Einzelmolekülinformationen innerhalb einer verrauschten Matrix. J. Phys. Chem. C 123, 15867–15873 (2019).

Artikel CAS Google Scholar

Bro-Jørgensen, W., Hamill, JM, Bro, R. & Solomon, GC Vertrauen in unsere Maschinen: Validierung maschineller Lernmodelle für Einzelmolekültransportexperimente. Chem. Soc. Rev. 51, 6875–6892 (2022).

Artikel PubMed PubMed Central Google Scholar

Magyarkuti, A., Balogh, N., Balogh, Z., Venkataraman, L. & Halbritter, A. Unüberwachte Merkmalserkennung in Einzelmolekül-Bruchverbindungsdaten. Nanoscale 12, 8355–8363 (2020).

Artikel CAS PubMed Google Scholar

Ohshiro, T. et al. Elektrische Zufallsresequenzierung einzelner Moleküle von DNA und RNA. Wissenschaft. Rep. https://doi.org/10.1038/srep00501 (2012).

Artikel PubMed PubMed Central Google Scholar

Furuhata, T. et al. Hochleitfähiges Nukleotidanalogon erleichtert das Basen-Calling bei der Quantentunnel-basierten DNA-Sequenzierung. ACS Nano 13, 5028–5035 (2019).

Artikel CAS PubMed Google Scholar

Yoshida, T., Washio, T., Ohshiro, T. & Taniguchi, M. Klassifizierung aus positiven und unbeschrifteten Daten basierend auf der Wahrscheinlichkeitsinvarianz für die Messung. Intel. Daten Anal. 25, 57–79 (2021).

Artikel Google Scholar

Kaneko, S. et al. Identifizierung der molekularen Adsorptionsstelle einer Einzelmolekülverbindung durch kombinierte Raman- und Leitfähigkeitsstudien. Chem. Wissenschaft. 10, 6261–6269 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Bekyarova, E. et al. Elektronische Eigenschaften einwandiger Kohlenstoff-Nanoröhrchen-Netzwerke. Marmelade. Chem. Soc. 127, 5990–5995 (2005).

Artikel CAS PubMed Google Scholar

Li, C. et al. Ladungstransport in einzelnen Au|Alkandithiol|Au-Übergängen: Koordinationsgeometrien und Konformationsfreiheitsgrade. Marmelade. Chem. Soc. 130, 318–326 (2008).

Artikel CAS PubMed Google Scholar

Bamberger, ND et al. Über einfache Struktur-Funktions-Beziehungen hinaus: Das Zusammenspiel von Geometrie, elektronischer Struktur und Molekül-/Elektrodenkopplung bei Einzelmolekülverbindungen. J. Phys. Chem. C 126, 6653–6661 (2022).

Artikel CAS Google Scholar

Pedregosa, F. et al. Scikit-learn: Maschinelles Lernen in Python. J. Mach. Lernen. Res. 12, 2825–2830 (2011).

MathSciNet MATH Google Scholar

Referenzen herunterladen

Diese Arbeit wurde von der Japan Society for the Promotion of Science (JSPS) KAKENHI Grant Numbers 19H00852, 21H01741, 22K14566 und der Japan Science and Technology Agency (JST) Core Research for Evolutional Science and Technology (CREST) Grant Number JPMJCR1666 und JST Support for Pioneering unterstützt Forschung initiiert durch das Next Generation (SPRING)-Stipendium mit der Nummer JPMJSP2138, Japan. Wir möchten Editage (www.editage.com) für die Bearbeitung in englischer Sprache danken.

SANKEN, Universität Osaka, 8-1 Mihogaoka, Ibaraki, Osaka, 567-0047, Japan

Jiho Ryu, Yuki Komoto, Takahito Ohshiro und Masateru Taniguchi

Forschungszentrum für künstliche Intelligenz, Universität Osaka, Ibaraki, Osaka, 567-0047, Japan

Yuki Komoto

Abteilung „Integrated Frontier Research for Medical Science“, Institut für offene und transdisziplinäre Forschungsinitiative (OTRI), Universität Osaka, Ibaraki, Osaka, 567-0047, Japan

Yuki Komoto

Sie können diesen Autor auch in PubMed Google Scholar suchen

JR, YK, TO und MT planten und gestalteten die Experimente. JR, YK und TO waren an der Herstellung von MCBJs und elektrischen Einzelmolekülmessungen beteiligt. JR und YK führten eine Datenanalyse durch. JR, YK, TO und MT haben das Papier gemeinsam geschrieben.

Korrespondenz mit Masateru Taniguchi.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Ryu, J., Komoto, Y., Ohshiro, T. et al. Direkte Unterscheidung von Biomolekülen in gemischten Proben mittels Nanogap-basierter elektrischer Einzelmolekülmessung. Sci Rep 13, 9103 (2023). https://doi.org/10.1038/s41598-023-35724-1

Zitat herunterladen

Eingegangen: 27. März 2023

Angenommen: 23. Mai 2023

Veröffentlicht: 05. Juni 2023

DOI: https://doi.org/10.1038/s41598-023-35724-1

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

Blog

Direkte Unterscheidung von Biomolekülen in gemischten Proben mithilfe von Nanogap