SELEÇÃO DAS VARIÁVEIS PREDITORAS PARA MODELAGEM CORRELATIVA DE DISTRIBUIÇÃO DE ESPÉCIES NA AMÉRICA DO SUL
DOI:
https://doi.org/10.4257/oeco.2018.2202.02Keywords:
camada matricial, espaço geográfico, fenomenologia, modelo empírico, sobreajusteAbstract
Modelagem de distribuição geográfica é uma técnica utilizada para estimar a área de distribuição de espécies no espaço geográfico. A etapa de seleção das variáveis preditoras é fundamental para a construção do modelo conceitual no procedimento de modelagem correlativa. O presente estudo teve por objetivo descrever como os pesquisadores selecionaram as variáveis preditoras em seus estudos conduzidos na extensão geográfica da América do Sul. Foi realizado levantamento e revisão da literatura de estudos publicados no período de 2002 a 2014. Os artigos foram triados em duas categorias: seleção arbitrária e seleção baseada em critério. Os artigos que utilizaram critérios foram subcategorizados em quatro grupos: axiomático, biológico, estatístico ou metodológico. Do total de artigos analisados (n = 177), em 31% os autores não justificaram a seleção das variáveis. Em 24% dos artigos os autores combinaram critérios, o critério estatístico foi adotado de modo não combinado em 23% dos artigos e o biológico em 13% dos artigos. Quando os autores utilizaram algum critério, o conjunto apresentou menor número de variáveis. Os autores que adotaram o critério biológico apresentaram explicações imprecisas da relação entre as variáveis e os organismos. Pela primeira vez foi diagnosticado o procedimento de combinar critérios e este interpretado como solução para a) balancear o número de variáveis do conjunto e b) contornar o déficit de conhecimento das espécies. A maior frequência de utilização do critério estatístico, isolado e combinado, corroborou o esperado para a modelagem correlativa. Admite-se como prática adequada a seleção de variáveis utilizando princípios e análises estatísticas para a construção de conjuntos com seis a nove variáveis preditoras. A adoção plena do critério biológico necessita de estudos que descrevam com maior rigor teórico a relação entre as variáveis e as respostas ecofisiológicas dos organismos.
SELECTING PREDICTORS IN CORRELATIVE SPECIES DISTRIBUTION MODELING IN SOUTH AMERICA. Species distribution modelling is a technique that estimates species geographical ranges. Variable selection is a fundamental step in conceptual model formulation and in correlative modelling procedure. Herein we describe how authors selected variables in their modelling studies within the extent of the South American continent. We analysed 177 papers that were published between 2002 and 2014. For each paper, we searched for explicit information on authors' reasoning for selecting variables. We classified papers into two categories: arbitrary and criterion-based. Criterion-based papers were subclassified into axiomatic, biological, methodological, or statistical categories. From all papers analysed (n = 177), authors did not justify or comment on their variable sets in 31% of the papers. For 24% of the papers authors combined criteria; statistical criterion alone was adopted in 23% of the papers; and biological criterion was adopted in 13% of the papers. We observed that when authors selected variables based on a criterion, it decreased the number of variables. Authors that adopted biological criterion showed unprecise explanations on the relation between variables and organisms. We highlighted the emergent procedure of combining criteria which was interpreted as a way a) to balance the number of variables and avoid overfitting and overestimated predictions and b) to overcome the deficit on biological knowledge about species. The statistical criterion was more frequently adopted, and this fact corroborates our expectation based on the empirical nature of the correlative approach. For a sounding use of the biological criterion it is necessary a more theoretical and rigorous description of the relationship between variables and ecophysiological responses of the organisms.