Pajūrio maudyklų vandens kokybės prognozė remiantis Escherichia coli vertinimu
Mockutė, Miglė |
Maudyklų vandens direktyva 2006/7/EB (angl. The Bathing Water Directive, BWD) yra pagrindinis dokumentas, reglamentuojantis maudyklų vandens priežiūrą ir kokybę Europos Sąjungoje. Lietuvoje ši direktyva įgyvendinama pagal higienos normą HN: 92:2018 „Paplūdimiai ir jų maudyklų vandens kokybė“ (Lietuvos Respublikos sveikatos apsaugos ministras, 2018). Pagrindinis šios direktyvos tikslas yra apsaugoti žmonių sveikatą ir išsaugoti, saugoti ir gerinti aplinkos kokybę. Pagal šią direktyvą šalys narės įsipareigojusios maudymosi sezonu, nustatytose maudymosi vietose, atlikti vandens kokybės matavimus (The European Parliament and the Council of the European Union, 2006). Tačiau toks monitoringas turi apribojimų, nes ne tik negaunama informacija apie vandens kokybę laikotarpiu tarp mėginių ėmimo, bet ir nėra atliekamos vandens kokybės prognozės (Van der Meulen et al., 2024). Šiam tikslui vis dažniau pritaikomi mašininio mokymosi algoritmai, pvz. atsitiktinių miškų ar ,,XGBoost“ modeliai, kurie geba atlikti maudyklų vandens kokybės prognozes, į prognozę integruodami ne tik in situ, bet ir nuotolinius duomenis apie gamtinius aplinkos veiksnius. Šiame tyrime vandens kokybė Lietuvos ir Lenkijos pajūrio maudyklose klasifikuojama pritaikant du mašininio mokymosi algoritmus – atsitiktinio miško (angl. Random Forest) ir ,,XGBoost“ modelį. Vandens kokybė vertinama pagal vieną iš vandens kokybės parametrų: žarninių lazdelių (Escherichia coli) kolonijas sudarančių vienetų skaičių 100 ml vandens mėginiuose. Atsitiktinių miškų ir ,,XGBoost“ modeliui naudojami in situ matavimų ir nuotoliniai duomenys. Tyrimo metu įvertintas Escherichia coli koncentracijų erdvinis pasiskirstymas maudyklose, įvertinta fizinių aplinkos veiksnių kaita ir jų sąveika su Escherichia coli koncentracijomis bei mašininio mokymosi modelių vandens kokybės prognozių tikslumas. Tyrimo rezultatai parodė, kad tiriamu laikotarpiu didžiausios Escherichia coli koncentracijos buvo fiksuotos 2019-ais, 2020-ais ir 2023-ais metais, dažniausiai rugpjūčio mėnesį. Lietuvos maudyklose tiriamu laikotarpiu buvo fiksuotos mažesnės E. coli koncentracijos, nei Lenkijos maudyklose. Nustatyta, jog vandens kokybės prognozei labiausiai tinkami aplinkos veiksniai yra vėjo greitis ir kryptis, druskingumas ir vandens temperatūra. Krituliai – mažiau svarbus veiksnys. Taip pat prognozei reikalingas ir upės padėties veiksnys. Tyrimo metu tiksliausi mašininio mokymosi modeliai sudaryti su 2-jų dienų slenkančiu vėjo greičio vidurkiu ir 2-jų dienų atsilikusiomis druskingumo, vėjo krypties, kritulių, vandens temperatūros reikšmėmis bei upių įtaka. Naudojant šiuos aplinkos veiksnius atsitiktinio miško modelis suklasifikavo vandens kokybę 85 %, o ,,XGBoost“ modelis – 80 % tikslumu. Lietuvos priekranteje sudarant erdvinę prognozę vienai iš tiriamo laikotarpio dienų pasiektas 100 % tikslumas, kai prognozė klasifikuoja reikšmes į ,,puiki“ ir ,,neatitinkanti puikios kokybės“.
The Bathing Water Directive 2006/7/EC (BWD) is the main document regulating the maintenance and quality of bathing water in the European Union. In Lithuania, this directive is implemented in accordance with the hygiene standard HN: 92:2018 “Beaches and the quality of their bathing water” (Minister of Health of the Republic of Lithuania, 2018). The main objective of this directive is to protect human health and to preserve, protect and improve the quality of the environment. According to this directive, member states are obliged to carry out water quality measurements during the bathing season at designated bathing sites (European Parliament and Council of the European Union, 2006). However, such monitoring has limitations, as not only is there no information about water quality between sampling periods, but also no predictions of water quality are made (Van der Meulen et al., 2024). For this purpose, machine learning algorithms are being applied, e.g. Random Forest or "XGBoost" models, which are capable of making predictions of bathing water quality by integrating not only in situ but also remote sensing data on natural environmental factors into the prediction. In this study, water quality in Lithuanian and Polish seaside bathing areas is classified by applying two machine learning algorithms – Random Forest and the “XGBoost” model. Water quality is assessed according to one of the water quality parameters: the number of Escherichia coli colony-forming units in 100 ml of water samples. In situ measurements and remote sensing data are used for the Random Forest and “XGBoost” models. The study assessed the spatial distribution of Escherichia coli concentrations in bathing areas, the change in physical environmental factors and their interactions with Escherichia coli concentrations, and assessed the accuracy of water quality predictions of machine learning models. The results of the study showed that during the study period, the highest Escherichia coli concentrations were recorded in 2019, 2020, and 2023, most often in August. During the study period, lower E. coli concentrations were recorded in Lithuanian bathing areas than in Polish bathing areas. It was found that the most suitable environmental factors for water quality prediction are wind speed and direction, salinity, and water temperature. Precipitation is a less important factor. The river position factor is also required for the prediction. During the study, the most accurate machine learning models were created with a 2-day moving average of wind speed and 2-day lagged values of salinity, wind direction, precipitation, water temperature, and the influence of rivers. Using these environmental factors, the Random Forest model classified water quality with 85 % accuracy, and the “XGBoost” model with 80 % accuracy. For the Lithuanian coast, spatial forecasting for one of the days in the study period achieved 100 % accuracy when the forecast classified values into "excellent" and "not in excellent quality".