Modelització de les corbes d’aparició de glucosa en sang d’àpats reals per al seu ús en aplicacions biomèdiques
Share
L’experimentació és essencial per tal que el coneixement sigui precís, confiable i perquè aquest
pugui servir de suport a l’hora de prendre decisions en una àmplia varietat de camps, provar
teories, determinar l’eficàcia de tractaments o la seguretat de nous dissenys. De tota manera
l’experimentació és un procés complex i requereix dissenys precisos per a reduir problemes de
cost econòmic, ètica, reproductibilitat i biaix. Amb aquesta finalitat les dades sintètiques permeten
representar entorns reals de manera acurada, que poden ser utilitzats per a realitzar proves i
investigació. Els progressos en computació i en les diverses tècniques de generació de dades han
suposat un creixement en el potencial de les dades sintètiques, ja que cada cop és possible treballar
amb conjunts més grans i personalitzats que els que poden obtenir-se únicament amb dades reals.
Es poden construir escenaris que d’altra manera no podrien ser simulats. Un dels camps que més
es beneficia d’aquest tipus de dades és la medicina, on les dades sintètiques són una eina per a
poder dur a terme proves i assaigs de noves tecnologies, protegint alhora la privacitat i la seguretat
del pacient.
L’objecte d’aquest treball és el disseny i implementació d’un sistema basat en tècniques d’aprenentatge
automàtic generatiu, per tal de modelar de manera acurada les corbes de la ràtio d’aparició de
glucosa exògena (RA) en sang. A partir d’un set de dades d’àpats reals es dissenya un model per
a replicar las corbes que genera aquesta RA les hores postprandials. Les dades subministrades pel
laboratori de recerca MICELab de la Universitat de Girona contenen l’especificació detallada dels
diferents ingredients, informació nutricional precisa i la RA. Per tant, es busca obtenir un sistema
basat en dades, capaç de millorar l’aproximació dels models metabòlics actuals.
La metodologia proposada es basa en arquitectures d’aprenentatge profund (xarxa generativa
adversària condicionada (C-GAN), autoencoders, transformers, entre d’altres) per a millorar les
aproximacions actuals a partir de l’aprenentatge de les distribucions de dades reals, condicionades
als paràmetres que defineixen cada àpat (ingredients, valor nutricional, etc.). Els resultats son
contrastats a través de la validació estadística pertinent i comparant corbes reals amb corbes
generades a partir dades no utilitzades en l’entrenament del model. Finalment, es fa servir el
model construït per a definir les corbes d’aparició de glucosa en sang d’un conjunt de dades sintètic
a partir de valors simulats de les diferents entrades que condicionen al model