Repository logo
Doctoral Dissertation

Foundation model for electronic health records

dc.contributor.authorRenc, Paweł
dc.contributor.departmentWydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
dc.contributor.reviewerZielosko, Beata
dc.contributor.reviewerStefanowski, Jerzy
dc.contributor.reviewerKwinta, Przemko
dc.contributor.supervisorWąs, Jarosław
dc.contributor.supervisorSitek, Arkadiusz
dc.date.defence2026-04-15
dc.date.issued2025
dc.descriptionZawiera bibliogr.
dc.description.abstractRozprawa doktorska stawia hipotezę, że tokenizowane osie czasu zdrowia pacjenta (PHT), modelowane za pomocą generatywnych architektur transformatorowych, stanowią uniwersalną reprezentację elektronicznej dokumentacji medycznej (EHR), umożliwiającą budowę skalowalnych, chroniących prywatność i klinicznie wiarygodnych modeli bazowych. Praca postuluje odejście od wąsko wyspecjalizowanych modeli Al w ochronie zdrowia na rzecz ujednoliconych, ogólnego przeznaczenia ram modelowania. Hipotezę potwierdzają trzy główne wkłady. Po pierwsze, Enhanced Transformer for Health Outcome Simulation (ETHOS) wprowadził tokenizowaną reprezentację podłużnych danych klinicznych jako PHT i wykazał, że generatywne modelowanie zero-shot może skutecznie realizować różnorodne zadania kliniczne, m.in. predykcję śmiertelności, rehospitalizacji, długości pobytu, ocenę SOFA oraz klasyfikację DRG, bez dostrajania, ustanawiając jeden model bazowy dla heterogenicznych zadań. Po drugie, Adaptive Risk Estimation System (ARES) rozszerzył ETHOS o symulację wielu możliwych trajektorii pacjenta, umożliwiając adaptacyjne, spersonalizowane i wyjaśnialne szacowanie ryzyka. Po trzecie, Federated Timeline Synthesis (FTS) umożliwił prywatnościowe uczenie wieloośrodkowe poprzez lokalne generowanie syntetycznych osi czasu i ich centralną agregację, zachowując jakość predykcji przy ochronie danych wrażliwych. Prace te wywarły znaczący wpływ: ETHOS został szybko zaadaptowany i rozwinięty m.in. przez Microsoft Research i Epic Systems, potwierdzając skalowalność do setek milionów pacjentów. Całość dowodzi, że generatywne transformatory oparte na PHT mogą integrować predykcję, symulację, wyjaśnialność i wdrożenia federacyjne, tworząc podstawy dla skalowalnej i godnej zaufania klinicznej Al.pl
dc.description.abstractThis dissertation advances the hypothesis that tokenized patient health timelines (PHTs), modeled with generative transformer architectures, provide a universal representation of electronic health records (EHRs) that enables scalable, privacy-preserving, and clinically faithful foundation models. The work argues for moving beyond task-specific healthcare AI toward unified, general-purpose modeling frameworks. Three contributions validate this hypothesis. First, the Enhanced Transformer for Health Outcome Simulation (ETHOS) introduced tokenized longitudinal health records as PHTs and showed that zero-shot generative modeling can perform diverse clinical tasks, including mortality, readmission, length of stay, SOFA estimation, and DRG classification, without fine-tuning, establishing a single foundation model for heterogeneous outcomes. Second, ETHOS was extended into the Adaptive Risk Estimation System (ARES), which simulates multiple patient futures to produce adaptive, personalized, and explainable risk estimates, demonstrating clinically meaningful inference through trajectory simulation. Third, Federated Timeline Synthesis (FTS) enabled privacy-preserving, multi-institutional training by generating synthetic timelines locally and aggregating them centrally; evaluations showed preserved predictive fidelity while protecting sensitive data. The framework has seen rapid impact, with ETHOS receiving over 30 citations in its first year and extensions by organizations such as Microsoft Research and Epic Systems, validating scalability to hundreds of millions of patients. Overall, this work demonstrates that generative transformers over tokenized patient timelines can unify prediction, simulation, explainability, and federated deployment, laying the foundation for scalable and trustworthy clinical AI.en
dc.description.physical[2], 80 str. : il.
dc.description.placeOfPublicationKraków
dc.identifier.otherR.12526
dc.identifier.urihttps://repo.agh.edu.pl/handle/AGH/117344
dc.language.isoeng
dc.rightsAGH Licence (PhD) 2.0 - Fair Use
dc.rights.accessotwarty dostęp
dc.rights.urihttps://repo.agh.edu.pl/info/licence-agh-doctoral-dissertation-2
dc.subjectmodelowanie generatywnepl
dc.subjectmedycynapl
dc.subjectdokumentacja medycznapl
dc.subjectprogramowanie (informatyka)pl
dc.subjectsymulacjapl
dc.subject.disciplineOfScienceInformatyka Techniczna i Telekomunikacja
dc.subject.fieldOfScienceDziedzina nauk inżynieryjno-technicznych
dc.titleFoundation model for electronic health recordsen
dc.title.alternativeModel bazowy elektronicznej dokumentacji medycznejpl
dc.typerozprawa doktorska
dspace.entity.typePublication
relation.isOrgUnitOfPublicationadbf336f-8f6b-4c4b-8c1e-67e228ef3ced
relation.isOrgUnitOfPublication.latestForDiscoveryadbf336f-8f6b-4c4b-8c1e-67e228ef3ced
relation.isSupervisorOfPublication65d297ae-1b06-4949-a284-e6935b34a9a7
relation.isSupervisorOfPublication.latestForDiscovery65d297ae-1b06-4949-a284-e6935b34a9a7
thesis.degree.grantorAkademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
R12526_Renc.pdf
Size:
4.64 MB
Format:
Adobe Portable Document Format