banner

Nachricht

Nov 03, 2023

Von CMU-Forschern entwickelte Methode des maschinellen Lernens beleuchtet grundlegende Aspekte der Evolution

Ein Forscherteam der Computational Biology Department(opens in new window) (CBD) der Carnegie Mellon University hat neue Methoden entwickelt, um Teile des Genoms zu identifizieren, die für das Verständnis der Entwicklung bestimmter Merkmale von Arten von entscheidender Bedeutung sind.

Die Arbeit, veröffentlicht in Science(öffnet ein neues Fenster) und unter der Leitung von Assistenzprofessor der Fakultät für Informatik Andreas Pfenning(öffnet ein neues Fenster) trägt zum Zoonomia-Projekt(öffnet ein neues Fenster) bei, einem Versuch, die gesamten Genome von zu sequenzieren 240 Säugetiere sollen Licht auf grundlegende Aspekte von Genen und Merkmalen werfen, die wichtige Auswirkungen auf den Schutz der menschlichen Gesundheit und die Erhaltung der biologischen Vielfalt haben. Um diese neuen, großen Datensätze sinnvoll nutzen zu können, sind die neuesten Technologien der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) erforderlich.

Bestimmte Teile des Genoms, die als kodierende DNA bekannt sind, liefern Anweisungen für die Produktion von Proteinen, den unverzichtbaren Regulatoren der Zellfunktion. Im Laufe der Zeit treten geringfügige Unterschiede in den Anweisungen auf, die die kodierende DNA für die Proteinproduktion bereitstellt, und werden zu einer der treibenden Kräfte der Evolution.

Dennoch machen diese proteinproduzierenden DNA-Stücke nur ein mageres Prozent der drei Milliarden Nukleotidpaare aus, aus denen das menschliche Genom besteht. Andere nichtkodierende DNA-Regionen, sogenannte Enhancer, bestimmen, wann und wo bestimmte Gene aktiv sind. Das CMU-Team hat einen ML-Ansatz namens Tissue-Aware Conservation Inference Toolkit (TACIT) entwickelt, um mehr über die Funktionsweise dieser Bereiche zu erfahren. Während ein traditionelles Evolutionsmodell Veränderungen in der Gehirngröße einer Art durch eine Reihe von Mutationen in einer Gruppe von Genen zeigen könnte, können Enhancer einfach Gene ein- oder ausschalten und das gleiche Ergebnis erzielen.

Die meisten Forschungen zur Evolution von Säugetieren konzentrieren sich auf die Teile des Genoms, die sich über Millionen von Jahren relativ wenig verändert haben. Diese konservierten Regionen, insbesondere Gene, bieten Einblicke in grundlegende Elemente in der DNA von Säugetieren, die einzigartige Merkmale einzelner Arten hervorheben.

Die Herausforderung für Pfenning und sein Team besteht darin, dass sich die DNA-Enhancer-Regionen im Laufe der Zeit zwar in der Reihenfolge, nicht aber in ihrer Funktion ändern können. Beispielsweise reguliert ein gut untersuchter Insel-Enhancer (öffnet sich in neuem Fenster) die Genspiegel in ähnlichen Mustern bei Menschen, Mäusen, Zebrafischen und Schwämmen, obwohl die Evolution mehr als 700 Millionen Jahre zurückliegt. Dies macht es viel schwieriger, sie mit herkömmlichen Methoden zur Untersuchung einzelner Nukleotide zu identifizieren und zu verfolgen.

TACIT begegnet diesem Problem, indem es genau vorhersagt, ob ein Enhancer in einem bestimmten Zelltyp oder Gewebe aktiv sein wird. Es ermöglicht Wissenschaftlern, diese wichtigen Enhancer-Regionen in einem neu sequenzierten Genom zu identifizieren, ohne ein neues Laborexperiment durchzuführen, was potenzielle Anwendungen in der Naturschutzbiologie bietet. Das Toolkit kann Vorhersagen darüber treffen, wie Enhancer bei gefährdeten oder bedrohten Arten funktionieren, bei denen kontrollierte Laborexperimente unmöglich sind.

„TACIT bietet eine beispiellose Möglichkeit, die Funktion von Teilen des Genoms außerhalb von Genen bei Arten vorherzusagen, für die wir keine primären Gewebeproben erhalten können, wie etwa beim Großen Tümmler und beim vom Aussterben bedrohten Spitzmaulnashorn“, sagte Irene Kaplow, eine Hauptautorin von der Artikel und ein Postdoktorand und Lane Fellow im CBD. „Da sich ML-Methoden und Methoden zur Identifizierung von Enhancern aus bestimmten Zelltypen verbessern, erwarte ich, dass wir die Funktionen von TACIT erweitern können, um neue Arten von Einblicken in die Evolution von Säugetieren zu liefern.“

Nachdem das Forschungsteam die Funktion genomischer Sequenzen bei den 240 Säugetieren vorhergesagt hatte, wandte es TACIT an, um die Teile des Genoms zu identifizieren, die sich bei Säugetieren für größere Gehirne entwickelt haben, und stellte fest, dass sich diese tendenziell in der Nähe von Genen befanden, deren Mutationen mit der Entwicklung des menschlichen Gehirns in Zusammenhang stehen. Größenstörungen. Sie identifizierten außerdem einen Verstärker, der mit dem Sozialverhalten bei Säugetieren in Zusammenhang steht und spezifisch für einen bestimmten Subtyp von Neuronen ist, das Parvalbumin-positive inhibitorische Interneuron.

„Wir glauben, dass dies nur die Spitze des Eisbergs ist“, sagte Pfenning, leitender Autor der Studie. „Wir haben interessante Zusammenhänge gefunden, indem wir TACIT auf eine kleine Anzahl von Geweben und eine kleine Anzahl von Merkmalen angewendet haben, aber es gibt noch viel mehr zu entdecken.“

Zu den Hauptautoren des Artikels gehören neben Pfenning und Kaplow auch Alyssa Lawler, eine ehemalige Doktorandin der Biowissenschaften. Student jetzt am Broad Institute; und Daniel Schaffer, ein frischgebackener Absolvent des CBD-Bachelor-Programms. Schaffers Co-Erstautorenschaft an dieser Veröffentlichung ist ein bedeutender Beweis für den innovativen Lehrplan des Bachelor-Studiengangs, der sich auf modernste Computertechniken konzentriert und praktische wissenschaftliche Forschungsmöglichkeiten in den Vordergrund stellt.

Weitere Informationen zum Zoonomia-Projekt finden Sie auf seiner Website (öffnet sich in neuem Fenster).

Von: Name Aaron Aupperlee
AKTIE