Om op betrouwbare wijze voorspellende factoren voor een uitkomst te identificeren via een multivariabele regressieanalyse, moet de dataset groot genoeg zijn in vergelijking met het aantal mogelijke factoren. In de praktijk ontbreken vaak voldoende gegevens. Het gebruik van kleine datasets kan leiden tot ‘overfitting’ van het statistische model en, als gevolg daarvan, onnauwkeurige schattingen van de parameters in het model en onbetrouwbare voorspellingen van de uitkomst van nieuwe patiënten. Het combineren van gegevens van verschillende centra of datasets in één (grotere) database zou dit probleem verlichten, maar is in de praktijk een uitdaging vanwege problemen met regelgeving en logistiek.
In dit artikel beschrijven de auteurs een Bayesian Federated Inference (BFI) raamwerk voor multicenter data. Het doel is om uit lokale conclusies in afzonderlijke centra te construeren wat zou zijn afgeleid als de datasets waren samengevoegd. Het raamwerk probeert de statistische kracht van grotere datasets te benutten zonder deze daadwerkelijk te creëren. Het BFI raamwerk is ontworpen om om te gaan met kleine datasets door lokaal niet alleen de optimale parameterwaarden af te leiden, maar ook aanvullende kenmerken van de posterieure parameterverdeling. Belangrijk is dat een enkele inferentiecyclus over de centra voldoende is voor de BFI methode, terwijl de meeste Federated Learning strategieën meerdere cycli over de centra nodig hebben. De prestaties van de voorgestelde methode blijken uitstekend te zijn. Er is een R-pakket ontwikkeld om alle berekeningen uit te voeren en er is een gebruikersvriendelijke handleiding beschikbaar.
Lees hier het artikel: Bayesian federated inference for estimating statistical models based on non‐shared multicenter data sets (wiley.com)