Classificació de troballes en radiografies de tòrax
dc.contributor
dc.contributor.author
dc.contributor.other
dc.date.accessioned
2022-12-07T08:16:19Z
dc.date.available
2022-12-07T08:16:19Z
dc.date.issued
2022-09-01
dc.identifier.uri
dc.description.abstract
El COVID-19 és un virus que ha tingut un impacte a nivell mundial durant
aquests últims dos anys amb un índex de mortalitat elevat. És per això que tant
la comunitat mèdica com la de intel·ligència artificial ha dedicat molts esforços
a fer front a aquesta pandèmia.
S’ha demostrat que les xarxes neuronals convolucionals poden ajudar als
metges amb l’anàlisi d’imatge mèdica per assistir en el diagnòstic o la detecció
de malalties. En el cas del COVID-19, els esforços de l’aprenentatge automàtic
s’estan centrant en la detecció de lesions en els pulmons causades pel virus.
El grup de recerca ViCOROB de la Universitat de Girona va proposar un
projecte sobre aquesta temàtica. El projecte tracta de treballar sobre imatges de
radiografies de tòrax i està dividit en tres parts que són: classificació de lesions,
detecció de lesions i una tècnica de preprocess innovadora simulant els passos
que realitzen els radiòlegs a l’hora d’analitzar imatges.
L’objectiu d’aquest treball de final de màster és contribuir en aquest projecte
enfocant-nos en la part de classificació. Per tal de fer això s’ha proposat crear
models de xarxes convolucionals utilitzant Transfer Learning d’arquitectures ja
existents. Apart d’això, s’han proposat diversos experiments de classificació de
radiografies per tal de veure quins donen millors resultats i a la vegada comparar
les diferents arquitectures a cada experiment.
Les dades que hem utilitzat provenen de la competició de Kaggle pública “SIIM-FISABIORSNA COVID-19 Detection” que va acabar l’Agost de 2021.
Aquesta competició en ofereix 6334 imatges de Train i 1263 imatges de Test.
També ens proporciona dos fitxers CSV, un a nivell d’estudi i un a nivell d’imatge. El fitxer a nivell d’estudi ens diu la classe de lesió que s’haurà de classificar
i el fitxer a nivell d’imatge ens dóna unes coordenades que són la regió amb la
lesió que s’ha de detectar. Com que nosaltres ens centrem amb la classificació,
farem servir principalment el fitxer a nivell d’estudi. En aquest cas, les classes
són Negatiu, Aparença Típica, Aparença Atípica i Aparença Indeterminada.
Tot i agafar les dades de la competició, l’objectiu del treball no és en cap
moment fer enviaments, ja que aquest treball es centra en la classificació i la
competició requereix tant classificació com detecció per tal de fer un enviament.
Per tant, en el treball no hem utilitzat les dades de Test de la competició i en
el seu lloc hem dividit les dades de Train i hem agafat 80% per entrenament i
20% per validació
The COVID-19 is a virus that has had a global impact during
these last two years with a high mortality rate. That's why so much
the medical community as well as the artificial intelligence community have devoted a lot of effort
to deal with this pandemic.
It has been shown that convolutional neural networks can help the
doctors with medical image analysis to assist in diagnosis or detection
of diseases In the case of COVID-19, machine learning efforts
they are focusing on the detection of lesions in the lungs caused by the virus.
The ViCOROB research group of the University of Girona proposed a
project on this topic. The project is about working on images of
chest x-rays and is divided into three parts which are: injury classification,
injury detection and an innovative pre-process technique simulating the steps
that radiologists perform when analyzing images.
The aim of this master's thesis is to contribute to this project
focusing on the classification part. In order to do this, it has been proposed to create
convolutional network models using Transfer Learning of architectures already
existing Apart from this, several classification experiments have been proposed
x-rays in order to see which ones give better results and at the same time to compare
the different architectures in each experiment.
The data we used comes from the public Kaggle competition “SIIM-FISABIORSNA COVID-19 Detection” that ended in August 2021.
This competition offers 6334 Train images and 1263 Test images.
It also provides us with two CSV files, one at the study level and one at the image level. The study level file tells us the class of injury that will have to be classified
and the file at the image level gives us some coordinates that are the region with the
injury that must be detected. Since we focus on classification,
we will mainly use the study level file. In this case, classes
they are Negative, Typical Appearance, Atypical Appearance and Indeterminate Appearance.
Despite taking the data from the competition, the aim of the work is not at all
time to make shipments, since this work focuses on the classification and the
competition requires both classification and detection in order to make a shipment.
Therefore, in the work we did not use the data from the Test of the competition and in
instead we split the Train data and took 80% for training and
20% for validation
dc.format.mimetype
application/pdf
dc.language.iso
cat
dc.relation.ispartofseries
Màster en Ciència de Dades
dc.rights
Attribution-NonCommercial-NoDerivatives 4.0 International
dc.rights.uri
dc.subject
dc.title
Classificació de troballes en radiografies de tòrax
dc.type
info:eu-repo/semantics/masterThesis
dc.rights.accessRights
info:eu-repo/semantics/openAccess
dc.audience.educationlevel
Estudis de postgrau (màsters oficials i doctorats)