Pomimo fundamentalnej roli roślin dla funkcjonowania ekosystemów, cykli biogeochemicznych i dobrobytu człowieka, wiedza na temat ich rozmieszczenia na Ziemi jest nadal niekompletna, co utrudnia podstawowe badania i ochronę bioróżnorodności. Wykorzystaliśmy techniki uczenia maszynowego (lasy losowe, drzewa decyzyjne, ekstremalne wzmocnienie gradientu i sieci neuronowe) oraz konwencjonalne metody statystyczne (uogólnione modele liniowe i uogólnione modele addytywne) do testowania hipotez związanych ze środowiskami o długich gradientach różnorodności roślin naczyniowych oraz do modelowania i przewidywania bogactwa gatunkowego i filogenetycznego na całym świecie. W tym celu wykorzystaliśmy 830 regionalnych inwentaryzacji roślin, w tym około 300 000 gatunków i predyktorów przeszłych i obecnych warunków środowiskowych. Uczenie maszynowe wykazało doskonałą wydajność, wyjaśniając do 80,9% bogactwa gatunkowego i 83,3% bogactwa filogenetycznego, ilustrując ogromny potencjał takich technik do rozróżniania złożonych i wzajemnie oddziałujących powiązań między środowiskiem a różnorodnością roślin.

Abstract

Despite the paramount role of plant diversity for ecosystem functioning, biogeochemical cycles, and human welfare, knowledge of its global distribution is still incomplete, hampering basic research and biodiversity conservation. Here, we used machine learning (random forests, extreme gradient boosting, and neural networks) and conventional statistical methods (generalized linear models and generalized additive models) to test environment-related hypotheses of broad-scale vascular plant diversity gradients and to model and predict species richness and phylogenetic richness worldwide. To this end, we used 830 regional plant inventories including c. 300 000 species and predictors of past and present environmental conditions. Machine learning showed a superior performance, explaining up to 80.9% of species richness and 83.3% of phylogenetic richness, illustrating the great potential of such techniques for disentangling complex and interacting associations between the environment and plant diversity. Current climate and environmental heterogeneity emerged as the primary drivers, while past environmental conditions left only small but detectable imprints on plant diversity. Finally, we combined predictions from multiple modeling techniques (ensemble predictions) to reveal global patterns and centers of plant diversity at multiple resolutions down to 7774 km2. Our predictive maps provide accurate estimates of global plant diversity available at grain sizes relevant for conservation and macroecology.

 

Lirong C., Kreft, H., Taylor, A., Denelle, P., Schrader, J., Essl, F., van Kleunen, M., Pergl, J., Pyšek, P., Stein, A., Winter, M., Barcelona, J.F., Fuentes, N., Inderjit, I., Karger, D., Kartesz, J., Kuprijanov, A., Nishino, M., Nickrent, D., Nowak, A., Patzelt, A., Pelser, P., Singh, P., Wieringa, J., Weigelt, P. 2022. Global models and predictions of plant diversity based on advanced machine learning techniques. New Phytologist 10.1111/nph.18533