Машинное обучение определяет простые правила раннего предупреждения о вспышках хантавируса Пуумала у человека

Научные отчеты, том 13, Номер статьи: 3585 (2023) Цитировать эту статью

523 доступа

2 Альтметрика

Подробности о метриках

Уровень заболеваемости вирусом Пуумала (PUUV) в Германии колеблется на протяжении нескольких лет вслед за колебаниями численности популяции рыжей полевки. Мы применили преобразование к годовым значениям заболеваемости и разработали эвристический метод для разработки простой и надежной модели риска бинарного заражения человека на районном уровне. Модель классификации была основана на алгоритме машинного обучения и достигла чувствительности 85 % и точности 71 %, несмотря на то, что в качестве входных данных использовались только три погодных параметра предыдущих лет, а именно температура почвы в апреле за два года до этого и в сентябре предыдущего года. году, а продолжительность солнечного сияния в сентябре двухлетней давности. Кроме того, мы ввели Индекс вспышек PUUV, который количественно определяет пространственную синхронность локальных вспышек PUUV, и применили его к семи зарегистрированным вспышкам в период 2006–2021 гг. Наконец, мы использовали классификационную модель для оценки индекса вспышки PUUV, достигнув максимальной неопределенности 20%.

Условия окружающей среды, вызванные изменением климата, играют все возрастающую роль в распространении зоонозных инфекционных заболеваний, изменяя естественную среду обитания животных, влияя на доступность пищи и даже вызывая изменения в распространении видов. В рамках этой концепции мы разработали простую погодную модель риска заражения ортохантавирусом Пуумала (PUUV) человека в Германии.

PUUV — наиболее распространенный хантавирус в Европе, передающийся рыжими полевками (Clethrionomys glareolus, син. Myodes glareolus). PUUV может вызывать легкую и умеренную геморрагическую лихорадку с почечным синдромом (эпидемическая нефропатия) с летальностью 0,1–0,4%1. Заболеваемость человека PUUV-инфекцией колеблется в течение нескольких лет. В последнее время в Германии2 в течение нескольких лет ежегодно регистрируются \(>{1000}\) случаи заболевания, как правило, крупномасштабные, вызванные интенсивностью буковых мачт (специализация Fagus), как это было показано в прошлом в Бельгии3,4 и в Германии5. ,6.

Основные механизмы передачи PUUV человеку кажутся слишком сложными для прямого моделирования, поскольку они зависят от численности популяций рыжих полевок, их распространенности PUUV и взаимодействия человека и рыжей полевки; все из которых колеблются во времени и варьируются локально. Тем не менее, погодные условия могут быть использованы в качестве предикторов риска PUUV-инфекции человека, поскольку колебания численности рыжих полевок сильно коррелируют с погодными параметрами двух предыдущих лет7, тогда как распространенность PUUV в основном зависит от численности рыжих полевок3,8, 9.

Мы выбрали немецкие округа со значительным количеством случаев заражения и заболеваемости людей в 2006–2021 гг. и исследовали корреляцию годовой PUUV-заболеваемости с ежемесячными погодными параметрами на уровне округа. Мы выполнили преобразование данных, которое подчеркивает пространственную синхронность временных колебаний заболеваемости PUUV. Это преобразование позволило разработать модель бинарной классификации на основе машин опорных векторов (SVM) для вспышек, связанных с районами, применимую по всей стране и основанную исключительно на легкодоступных погодных параметрах. Кроме того, мы ввели индекс вспышки PUUV (POI) как индикатор ежегодного риска заражения человека PUUV. POI впервые позволяет однозначно определить вспышку PUUV, учитывая локальные масштабы заболеваемости PUUV. Определение POI не зависит от общего ежегодного числа инфекций, но их значения сильно коррелируют. Наконец, мы применили модель бинарной классификации к POI и показали, что всего трех значений погодных параметров достаточно для получения хорошей оценки. Комбинированная модель POI может применяться в качестве простого эмпирического правила для выявления лет высокого риска. Такую модель можно использовать для интерпретации вспышек PUUV, а также для получения приблизительных сведений о динамике грызунов. Это очень важно для поддержки стратегий и решений по защите здоровья человека и растений.

{900}\) total reported infections in the selected districts have a POI value of \(>\text{50\%}\)./p>\text{77\%}\) and precision \(>\text{67\%}\) (Fig. 3a,b). Weather parameters are for the most part spatially uniform. Thus, the observations from each year formed clusters in the 3D input space of our model. The values of the weather variables for these "cluster centers" were the annual average values over whole Germany./p>\text{90\%}\) was achieved, i.e., 2012 from the outbreak years, and 2008, 2011, 2013, 2016, 2018 and 2020 from the non-outbreak years. The lowest annual accuracy was 41% for 2015 (39 FP), followed by 65% for 2021 (12 FP and 11 FN). For 2014, the only wrong classifications were false negatives (15 FN, 77% accuracy). The highest accuracy was achieved in Baden-Württemberg (90%), and the lowest in North Rhine-Westphalia (66%) and Lower Saxony (69%). There were 6 districts from Baden-Württemberg, 2 from Bavaria, and 1 from Hesse with 100% accuracy. Another 15 districts had only one false classification (9 FP and 6 FN). The maximum numbers of false negatives came from the districts of Borken and Bentheim, with 7 FN and 6 FN, respectively. Borken also had the lowest accuracy among the districts with 44% (7 FN and 2 FP)./p>-\text{0.03}\) (a positive distance means that the observation is above the boundary with respect to V1_ST_9; thus, there is high infection risk for that year) and for \({\text{distance}}_{\text{t}}<-\text{0.37}\) (a negative distance means that the observation is below the boundary with respect to V1_ST_9; thus, there is low infection risk for that year). We compared the groups’ means by a one-way ANOVA with the function f_oneway from the SciPy library14. Based on the F-value of 97 and p value of 1.1 × 10−7, we concluded that the means of the two groups were statistically significantly different./p>-\text{0.03}\)). For distances in the interval \(\text{[}-\text{0.37,}-\text{0.03]}\), where the step occurred and no observation was available, no estimate could be generated. With an uncertainty equal to three times the standard error of the mean, we could estimate the POI for the year \({\text{t}}\) as:/p>

Новости