Speakers
Description
Ilglaicīgas pazemes ūdens līmeņu novērojumu datu rindas ir nozīmīgs datu avots dažādos pazemes ūdeņu dinamikas pētījumos. Pazemes ūdeņu līmeņu mērījumu bieži ir neregulāri un tajos mēdz ieviesties kļūdas, pēc kuru izņemšanas datu rindās parādās iztrūkstoši novērojumi. Tas būtiski ierobežo iespējas pielietot virkni laikrindu analīzes metodes, kas pieprasa nepārtrauktas datu rindas. Risinājums ir veikt iztrūkstošo novērojumu aizpildīšanu, tādējādi atjaunojot pazemes ūdens līmeņu datu rindu nepārtrauktību. Tiek pielietotas vairākas metodes, kas spēj aizpildīt iztrūkstošos datus, tomēr zināšanas par šādu metožu veiktspēju aizpildot pazemes ūdens līmeņu novērojumu datu rindas ir ierobežotas.
Pētījumā izmantota iztrūkstošo vērtību klāsterēšana, kas ļauj grupēt urbumus ar līdzīga rakstura iztrūkstošo vērtību sadalījumu. Iegūtie iztrūkstošo vērtību raksturi izmantoti, lai mākslīgi ieviestu iztrūkstošas vērtības visos pārējos urbumos, pēc kuriem var novērtēt katras metodes veiktspēju, salīdzinot patiesos pazemes ūdens līmeņus, ar katras metodes aizpildītajām vērtībām. Veiktspējas novērtēšanai izmantotas tādas metrikas, kā R2, vidējā kvadrātiskā kļūda, Naša-Satklifa efektivitātes koeficients un Kling-Gupta efektivitātes koeficients.
Rezultāti liecina, ka vislabākā veiktspēja iztrūkstošo pazemes ūdens līmeņu datu aizpildīšanā ir missForest algoritmam, kam seko imputePCA algoritms. Konvencionālās metodes, kā aizpildīšana ar vidējo vērtību vai lineārā interpolācija uzrāda sliktāku veiktspēju, lai gan ir atsevišķi izņēmumi, kuros lineārā interpolācija pārspēj sarežģītākos algoritmus.
Pētījumu finansē Latvijas Zinātnes padome, projekts ”Laiktelpiskā pazemes ūdeņu sausuma prognozēšana ar jauktiem modeļiem daudzslāņu sedimentācijas baseinā klimata pārmaiņu ietekmē”, projekta Nr. lzp-2019/1-0165