Diplomová práce

Klasifikace zdravotnických dat prostřednictvím neuronových sítí

Health data classification using neural networks

Bc. Hoa Vu Thu
Anotace

Tato diplomová práce je zaměřena na návrh a implementaci klasifikace textových zdravotnických dat. Cílem práce je najít vhodné řešení pro porovnání dokumentů ze dvou portálů webových stránek Národního zdravotnického informačního systému, konkrétně Reporting a DRG, a identifikovat jejich sémantickou podobnost. Praktickým výstupem této práce je algoritmus s veřejným rozhraním, který lze použít s externími aplikacemi a který porovnává dva dokumenty a klasifikuje je jako podobné nebo ne podobné.

Abstract

This diploma thesis is focused on designing and implementing the classification of textual health data. The aim is to find a suitable solution for a comparison of documents from two websites portals of the National Health Information System, more specifically it is Reporting and DRG, and to identify their semantic similarity. The practical output is an algorithm with a public interface that can be …více

Zadání práce
Tématem diplomové práce je návrh a implementace klasifikačního algoritmu založeného na konceptu neuronových sítí nad daty z oblasti zdravotnictví. Cílem je s použitím metod strojového učení najít vhodné řešení pro zařazení výstupů regionálního zpravodajství Národního zdravotnického informačního systému k odpovídajícím klasifikačním třídám vybraného klasifikačního systému hospitalizovaných pacientů, který je v praxi používán v českém zdravotnictví. Nedílnou součástí práce bude teoretický rozbor všech použitých metod společně s přehledem souvisejících publikovaných výsledků za posledních pět let. Samotná klasifikační úloha, která spadá do oblasti vytěžování přínosných informací z textových dat, bude řešena v souladu s jednotlivými fázemi ověřené metodiky CRISP-DM (porozumění doméně, porozumění datovým zdrojům, předzpracování dat, modelování, evaluace, nasazení). Praktickým výstupem práce bude funkční algoritmus pro pilotní klasifikaci dat, jehož součástí bude veřejné rozhraní, které bude sloužit jako komunikační medium s externími aplikacemi.
Student v rámci práce:
(1) vypracuje přehled o současně používaných klasifikačních technikách pro porovnávání textů a jejich vizualizaci včetně zdůvodnění výběru daného přístupu pro řešení stanovené úlohy;
(2) navrhne a v praxi implementuje funkční řešení pro porovnávání vstupních datových sad;
(3) bude diskutovat kvalitu výstupů s ohledem na jejich použitelnost v běžné praxi;
(4) bude svoje výsledky diskutovat v kontextu publikované literatury.

Doporučená literatura
  • Raschka, S. (2015). Python machine learning. Packt Publishing Ltd. ISBN 9781783555147.
  • Poulos, J., & Bronner, L. Document Similarity using Feed Forward Neural Networks CS224D Final Project Writeup.
Práce zkontrolována:
16. 6. 2020 04:32, RNDr. Martin Komenda, Ph.D., MBA, učo 98951
Plný text práce
1,9 MB / soubor PDF
Jazyk práce
angličtina angličtina
Termín obhajoby
30. 6. 2020
Práce byla úspěšně obhájena

Vedoucí

RNDr. Martin Komenda, Ph.D., MBA, učo 98951
IBA SpolP LF MU

Oponent

RNDr. Daniel Klimeš, Ph.D., učo 11180
IBA SpolP LF MU

Konzultant

Mgr. Matěj Karolyi
IBA SpolP LF MU

Masarykova univerzita Přírodovědecká fakulta
Studijní program
Experimentální biologie
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.