Das sogenannte "Unsupervised Learning" (unüberwachtes Lernen) ist eine spezielle Strategie des Maschinellen Lernens, bei dem das Computerprogramm eigenständig Muster und Zusammenhänge in den Daten findet. Markierte Trainingsdaten sind nicht notwendig. Das Modell trainiert ohne Aufsicht.
Für sein Modell hat der Preisträger neue Methoden zur Extraktion aussagekräftiger Darstellungen entwickelt, die das Programm aus verschiedenen Rohdatendarstellungen von Molekülen, z. B. in Form von Texten, Graphen und Punktwolken, ausgibt. Das Computermodell ist für die Entwicklung von Folgemodellen zur Vorhersage von Moleküleigenschaften oder zur Generierung neuer Moleküle mit gewünschten Eigenschaften und damit u.a. für die Grundlagenforschung und die pharmazeutische Wirkstoffentwicklung interessant.
Originalpublikationen des Autors zum Thema:
Winter R, Montanari F, Noé F, Clevert DA. Learning continuous and data-driven molecular descriptors by translating equivalent chemical representations. Chem Sci. 2018 Nov 19;10(6):1692-1701. doi: 10.1039/c8sc04175j. PMID: 30842833; PMCID: PMC6368215.
Clevert DA, Le T, Winter R, Montanari F. Img2Mol - accurate SMILES recognition from molecular graphical depictions. Chem Sci. 2021 Sep 29;12(42):14174-14181. doi: 10.1039/d1sc01839f. PMID: 34760202; PMCID: PMC8565361.
Kim PT, Winter R, Clevert DA. Unsupervised Representation Learning for Proteochemometric Modeling. Int J Mol Sci. 2021 Nov 28;22(23):12882. doi: 10.3390/ijms222312882. PMID: 34884688; PMCID: PMC8657702.
Weitere Informationen:
https://www.fu-berlin.de/presse/informationen/fup/2024/fup_24_331-tiburtius-preise-2024/index.html
https://refubium.fu-berlin.de/handle/fub188/42166
https://datasolut.com/wiki/unsupervised-learning/