02
2023
LE PROFESSEUR ROBERTA WICHMANN PUBLIE DANS UN MAGAZINE RENOMMÉ
La professeure du master en économie, Roberta Wichmann, a publié avec des chercheurs de l'USP et des membres du réseau IACOV-BR, l'article intitulé Improving the performance of machine learning algorithms for health results prédictions in multicentric cohorts dans la revue Nature Scientific Reports. . Scientific Reports est la cinquième revue la plus citée au monde, avec plus de 696 000 citations en 2021, et bénéficie d’une large attention dans les documents politiques et dans les médias. ( https://www.nature.com/srep/ ).
L’idée de cette recherche est née lorsque les auteurs se sont demandé si les performances prédictives des modèles d’apprentissage automatique pouvaient être améliorées simplement en ajoutant davantage de données à la formation en cas de prédictions dans le domaine de la santé. En d’autres termes, serait-il possible de généraliser un modèle à différents hôpitaux d’un État ou de différentes régions du Brésil ? Par conséquent, les auteurs ont testé différentes stratégies de formation pour les modèles d’apprentissage automatique, en commençant par la formation locale avec des données d’un seul hôpital, jusqu’à différentes formes d’agrégation avec des données d’autres hôpitaux, afin d’évaluer les performances prédictives dans l’identification du risque de décès dû au COVID. -19 et si oui, serait-il possible de généraliser la prévision dans différentes régions du pays.
Comment s’est déroulée l’étude ? 8 stratégies différentes ont ensuite été créées et les données de 18 hôpitaux de toutes les régions du Brésil ont été utilisées pour entraîner 3 modèles d'apprentissage automatique (xgboost, catboost et lightgbm) afin d'identifier la meilleure stratégie maximisant les performances prédictives.
« Dans notre étude, la meilleure stratégie consistait à s'entraîner avec les données d'un seul hôpital, obtenant les meilleures performances dans 11 (61%) des 18 hôpitaux, même si dans quelques cas, les performances prédictives étaient meilleures en agrégeant davantage de données » , il dit le professeur Roberta . Par conséquent, l’utilisation des données d’un seul hôpital peut entraîner de meilleures performances que l’ajout de données provenant de différents hôpitaux avec des protocoles et des différences socio-économiques différents.
Félicitations Professeur Roberta et tous les auteurs et partenaires impliqués !