Bakalářská práce

Interpretace dat o molekulární dynamice proteinů s využitím nástrojů umělé inteligence

Interpreting Protein Molecular Dynamics Data with Explainable Artificial Intelligence

Matej Demovič
Anotace

V této bakalářské práci zkoumáme využití strojového učení (ML) a vysvětlitelné umělé inteligence (XAI) pro interpretaci dat molekulární dynamiky (MD) proteinů. Vyvinuli jsme konvoluční autoenkodér, který slouží k predikci strukturálních změn mezi po sobě jdoucími snímky MD u tří proteinů s rodiny luciferáz: RLuc8, AncHLD-RLuc a AncFT. Pro interpretaci natrénovaných modelů byly aplikovány tři metody …více

Abstract

In this thesis, we explore the use of machine learning (ML) and explainable artificial intelligence (XAI) for interpreting molecular dynamics (MD) data of proteins. We developed a convolutional autoencoder to predict structural changes between consecutive MD snapshots for three luciferase-related proteins: RLuc8, AncHLD-RLuc, and AncFT. To interpret the trained models, we applied three XAI methods …více

Zadání práce
Protein molecular dynamics trajectories contain vast amounts of data and insights into mechanisms behind protein function and interactions with the environment. Interpretation of this data is typically addressed through visual inspection or manual projection to simplified subspaces, risking oversight of critical patterns due to data complexity and human bias. Machine learning (ML) and explainable artificial intelligence (XAI) offer robust solutions to analyze large and intricate datasets, enabling the identification of patterns, relationships, and predictions, thereby aiding in overcoming these challenges. However, XAI potential for extracting biological insights from molecular dynamics has barely been explored in the field. This thesis will aim to use ML and different XAI techniques to understand which parts of a protein are critical for its dynamics.

The student will solve the following specific tasks:
1. Study the literature on molecular dynamics, ML, XAI;
2. Train ML-based predictors on the existing protein molecular dynamics data;
3. Apply and compare XAI techniques on the trained model;
4. Analyze and interpret the results.
To solve the practical part of the diploma thesis, the student will use Python, TensorFlow or PyTorch, scikit-learn, and the iNNvestigate library.

Recommended literature:
1. Montavon, G., Binder, A., Lapuschkin, S., Samek, W., Müller, K.-R. Layer-Wise Relevance Propagation An Overview. In Explainable AI: Interpreting, Explaining and Visualizing Deep Learning; Samek, W., Montavon, G., Vedaldi, A., Hansen, L. K., Müller, K.-R., Eds.; Lecture Notes in Computer Science; Springer International Publishing: Cham (2019); pp 193–209. https://doi.org/10.1007/978-3-030-28954-6_10.
2. Schenkmayerova, A., Pinto, G.P., Toul, M. et al. Engineering the protein dynamics of an ancestral luciferase. Nat Commun 12, 3616 (2021). https://doi.org/10.1038/s41467-021-23450-z
3. INNvestigate library: https://innvestigate.readthedocs.io/en/latest/, https://github.com/albermax/innvestigate
Práce zkontrolována:
19. 5. 2025 16:39, Stanislav Mazurenko, PhD, učo 235907
Plný text práce
4,6 MB / soubor PDF
Jazyk práce
angličtina angličtina
Termín obhajoby
24. 6. 2025
Práce byla úspěšně obhájena

Vedoucí

Stanislav Mazurenko, PhD, učo 235907
ArtInt ProtIng RECETOX PřF MU

Oponent

Mgr. Eva Maršálková, Ph.D., učo 469217
BioIT CMM CEITEC MU

Konzultant

Faraneh Haddadi, Ph.D.
ArtInt ProtIng RECETOX PřF MU

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.