Revista Cartográfica 101 | Artículos | ISSN (impresa) 0080-2085 ISSN (en línea) 2663-3981 julio-diciembre 2020: 135-153

DOI:https://doi.org/10.35424/rcarto.v0i101.669 | Este es un artículo de acceso abierto bajo la licencia CC BY-NC-SA 4.0

 

Aplicação das normas L1 e L∞ em redes
altimétricas: identificação de outliers e construção do modelo estocástico

L1 and L∞ norms adjustment in leveling networks:
outlier identification and stochastic modeling

Stefano Sampaio Suraci*

Leonardo Castro de Oliveira**

Recebido 30 de agosto de 2019; aceito 2 de novembro de 2019

Resumo

Nesse artigo, aplicações da minimização da norma L1 (ML1) e da norma L∞ (ML∞) na estimação de redes altimétricas foram investigadas. Redes de nivelamento simuladas pela Técnica de Monte Carlo e dados reais da rede brasileira de nivelamento foram empregados nos experimentos. Na identificação de outliers pela ML1, foi verificado que o ajustamento com pesos unitários apresentou condições vantajosas em relação ao modelo estocástico usual dos pesos proporcionais ao inverso do comprimento das linhas de nivelamento. O Classificador VL1, que estipula um Valor de Corte para os resíduos do ajustamento pela ML1 a partir do qual a respectiva observação passa a ser classificada como outlier, foi proposto. A taxa de sucesso dele na identificação de outliers foi superior à do procedimento data snooping iterativo em cenários de geometria da rede deficiente. a aplicação da ML∞ investigada é posterior ao tratamento de outliers. Um modelo estocástico alternativo para ajustamento da rede pelo MMQ que aproveitou a característica de minimização do máximo resíduo absoluto da rede no ajustamento pela ML∞ foi analisado. Além dessa minimização, o ajustamento da rede pelo MMQ com o modelo alternativo gerou, na significativa maioria dos casos, resíduos e precisão desses e dos parâmetros estimados mais homogêneos, com menor desvio padrão, que aqueles com o modelo estocástico usual. Todos os resultados são especialmente relevantes para o caso de redes altimétricas.

      Palavras chaves: normas L1e L∞, modelo estocástico, Monte Carlo, altimetria.

Abstract

In this paper, applications of L1 norm minimization (ML1) and of L∞ norm minimization (ML∞) in the estimation of leveling networks were investigated. Leveling networks simulated by the Monte Carlo technique and real data from the Brazilian leveling network were employed in the experiments. In the identification of outliers by ML1, it was verified that the adjustment with unit weights presented advantageous conditions in relation to the usual stochastic model of weights of observations as proportional to the inverse of the length of the leveling lines. The Classificador VL1, which stipulates a cut-off value for the residuals of the adjustment by ML1 from which the respective observation is classified as outlier, was proposed. Its success rate in identifying outliers was higher than that of the iterative data snooping procedure in poor network geometry scenarios. The application investigated for ML∞ is after the treatment of outliers. An alternative stochastic model for network adjustment by Least Squares (LS) that took advantage of the characteristic of minimization of the maximum absolute residual of the network in the adjustment by ML∞ was analyzed. In addition to this minimization, the adjustment of the network by LS with the proposed model generated, in most cases, residuals and precision of these and of the estimated parameters more homogeneous, with lower standard deviation, than those with the usual stochastic model. All results are especially relevant for the case of altimetric networks.

      Palabras clave: L1 and L∞ norms, stochastic model, Monte Carlo, leveling networks.

Introdução

A altimetria tem recebido especial atenção atualmente no contexto dos sistemas de referência. Prova disto é a Resolução 1/2015 (IAG, 2015) da International Association of Geodesy (IAG), que definiu o International Height Reference System (IHRS), com geoide único e adoção de números geopotenciais, reconhecendo a necessidade de um sistema global de alta acurácia para investigação de mudanças na Terra, como a elevação dos níveis dos oceanos.

      Nesse trabalho, aplicações da minimização das normas L1 e L∞ no contexto da estimação de redes altimétricas foram investigadas, mais especificamente nas etapas de identificação de outliers e na definição do modelo estocástico para ajustamento final da rede pelo Método dos Mínimos Quadrados (MMQ), respectivamente. Com isso, espera-se que seus resultados contribuam para a definição de metodologias para a implantação de redes altimétricas a nível nacional e internacional.

       Nos subitens a seguir, a revisão teórica e as situações específicas que originaram as hipóteses dessa pesquisa foram evidenciadas.

Normas L1, L2 e L∞ no ajustamento de observações geodésicas

Na estimação de redes geodésicas, o número de observações é superior ao de incógnitas. Os inevitáveis erros de medida tornam o sistema inconsistente (Gemael et al., 2015). O ajustamento da rede é usualmente realizado pelo MMQ, também referenciado por minimização da norma L2 dos resíduos.

      O MMQ minimiza a soma dos quadrados dos resíduos v (diferença entre valores ajustados e observados), ponderados pela matriz dos pesos das observações P (Equação 1). Seus resultados são os de mínima variância para os parâmetros estimados e de máxima verossimilhança, essa sob a premissa de ocorrência de somente erros aleatórios normalmente distribuídos nas observações
(Ghilani, 2010).

 

 

 

(1)

 

 

 

 

      Apesar de menos conhecida que o MMQ, a minimização da norma L1 (ML1) também foi testada no ajustamento de redes geodésicas por diversos autores, como (Marshall & Bethel, 1996), (Amiri-Simkooei, 2003) e (Yetkin & Inal, 2011). Para observações independentes, sendo p o vetor dos pesos, expresso pelos elementos da diagonal principal de P, ela minimiza a soma dos resíduos absolutos ponderados por p (Equação 2). O método SIMPLEx de programação linear (Dantzig, 1963) é o mais utilizado na literatura geodésica para solução da ML1.

 

(2)

 

 

      Outra minimização de norma vetorial, bem menos explorada na estimação de redes geodésicas, envolve o ajustamento pela minimização da norma L∞ (ML∞). Por analogia com o caso de regressão polinomial de (Mason & Handscomb, 2003), o ajustamento pela ML∞ pode ser entendido como a minimização do máximo resíduo absoluto ponderado pelo peso da respectiva observação (Equação 3), sendo m o número de observações. (Ebong, 1986) foi o único registro encontrado de aplicação da norma L∞ em redes geodésicas. Uma formulação detalhada da solução da ML∞ por programação linear foi apresentada em (Suraci & Oliveira, 2019a), artigo 1 (de 4) produzido no contexto da dissertação de mestrado (Suraci, 2018) a que o presente artigo se refere.

 

                   (3)

 

Identificação de outliers em redes geodésicas e a aplicação da ML1

Apesar de o MMQ ser uma técnica estatística poderosa para o ajustamento de observações, ele demanda a inexistência de outliers para produzir resultados confiáveis (Yetkin & Inal, 2011). Entretanto, é inviável se garantir a ausência deles na prática dos levantamentos geodésicos.

      Nesse trabalho, as observações com magnitude do erro total de medida superior a três vezes o seu respectivo desvio padrão (σ) foram consideradas outliers. Uma análise conceitual sobre termos relacionados a outliers, seus significados e aspectos, foi apresentada em (Suraci & Oliveira, 2019b), artigo 2 (de 4) produzido no contexto da dissertação de mestrado (Suraci, 2018) a que o presente artigo se refere. Nessas duas referências, essa regra adotada para definição de outliers foi intitulada regra dos 3σ para o erro total.

      duas principais abordagens para a identificação de outliers em redes geodésicas: testes estatísticos e métodos robustos. Classificado no primeiro grupo, o procedimento data-snooping, proposto inicialmente por (Baarda, 1968), é um dos melhores métodos para identificação de outliers em redes geodésicas (Rofatto et al., 2017). O data-snooping iterativo (Teunissen, 2006), um procedimento que consiste na aplicação iterativa do data-snooping, é o mais usual e será referido simplesmente por data-snooping (DS) nesse trabalho. Aplicando o DS, (Rofatto et al., 2018) apresentaram recentemente uma relevante inovação na identificação de outliers em redes geodésicas: a aferição de níveis de probabilidade de acerto e dos diferentes tipos de erro via Simulação de Monte Carlo (SMC).

      A SMC é um tipo de simulação que se baseia em repetidas amostras aleatórias das variáveis de entrada, permitindo dessa forma uma acurada caracterização da variação dos resultados do modelo a ser estudado (Raychaudhuri, 2008). Quanto maior a quantidade de amostras aleatórias simuladas, mais acurada será a referida caracterização (Rofatto et al., 2018). Sua aplicação tem se tornado usual também na avaliação de métodos de identificação de outliers em redes geodésicas, podendo ser vista, por exemplo, nesse último artigo, em (Klein et al., 2015), em (Hekimoglu & Erenoglu, 2007) e em (Durdag et al., 2016).

      no âmbito dos métodos robustos, a ML1 também pode ser aplicada na identificação de outliers. Por ser um método resistente a outliers (Abdelmalek & Malek, 2008), tende a apresentar resíduos absolutos relativamente maiores para os outliers das redes analisadas. Assim, observações com resíduos absolutos relativamente “grandes” podem ser classificadas como outliers. Esse procedimento foi demonstrado por (Amiri-Simkooei, 2003) em redes de nivelamento e trilateração, e por (Yetkin & Inal, 2011) em redes GNSS. Um exemplo detalhado da questão da classificação de observações como outlier a partir de seu resíduo absoluto relativamente “grande” no ajustamento pela ML1 foi apresentado em (Suraci, 2018).

      Outras aplicações da ML1 podem ainda ser vistas em (Marshall & Bethel, 1996), (Kampmann & Krause, 1997), (Koch, 1999), (Baselga, 2007), (Khodabandeh & Amiri-Simkooei, 2011), e (Amiri-Simkooei, 2018).

      Diversos outros métodos robustos foram aplicados em redes geodésicas. Em especial, recentemente, (Koch et al., 2019) apresentaram aplicações de alguns deles, com proposta de uma nova meta-heurística para solução dos mesmos. Vale ressaltar que (Rofatto et al., 2018) colocam os algoritmos meta-heurísticos, junto com a SMC e os algoritmos genéticos, dentre outras, como uma das técnicas cujo potencial ainda não foi totalmente explorado em geodésia.

      Entretanto, voltando à identificação de outliers pela ML1, o que seria um resíduo absoluto “grande”? Não na literatura um critério objetivo estabelecido para classificação de uma observação como outlier a partir de seu respectivo resíduo absoluto no ajuste pela ML1. É razoável visualizar que isto se torna crítico principalmente para outliers de magnitude relativamente menores e para caracterização de uma rede como sem outlier. O Classificador VL1 proposto no corrente artigo estabelece um possível critério a ser adotado.

      Ademais, não uma investigação que valide a escolha do resíduo absoluto como parâmetro de comparação para identificação de outliers. Uma vez que o ajustamento pela ML1 adota determinado modelo estocástico, pode-se imaginar que o resíduo absoluto ponderado seja também um parâmetro viável de comparação. Nesse sentido, a potencial eficácia de um ajustamento com pesos unitários para as observações na identificação de outliers, para o caso do resíduo absoluto ser mesmo o parâmetro a ser analisado é também passível de investigação.

      Essa questão foi abordada nos experimentos desse trabalho, sendo intitulada Alternativa de Pesos e de Parâmetro de Comparação para a ML1 (APPC-ML1). A verificação da eficácia de se adotar pesos unitários, juntamente com outros aspectos da ML1, foi abordada em (Suraci et al., 2019), artigo 3 (de 4) produzido no contexto da dissertação de mestrado (Suraci, 2018) a que o presente artigo se refere. Em relação a esse último, a principal contribuição do corrente artigo corresponde à verificação também de Alternativa para o Parâmetro de Comparação e sua integração com a Alternativa de Pesos. Os resultados dessa questão foram aplicados na construção do Classificador VL1.               

      Para um apropriado entendimento dos experimentos, é importante apresentar ainda o Método das Equações Medianas (MEM). Segundo (Hekimoglu et al., 2011), em redes geodésicas, falhas na identificação de outliers podem ocorrer devido a pouca redundância das respectivas observações, independentemente do método utilizado na identificação deles. Assim, foi proposto o MEM: um método para identificação de redundância deficiente na geometria de redes geodésicas, que verifica se um conjunto de outliers é controlável (passível de ser confiavelmente identificado) ou não. Maiores detalhes sobre o MEM no referido artigo.

Modelagem estocástica em redes altimétricas e a aplicação da ML∞

O modelo estocástico usual em redes altimétricas adota pesos das observações como inversamente proporcionais ao comprimento das respectivas linhas de nivelamento. É baseado em conjecturas cuja garantia de ocorrência na prática dos levantamentos é pouco viável, como a utilização de equipamentos com a mesma precisão e adoção da mesma distância em todas as visadas da rede (Ghilani, 2010), o que justifica a busca por abordagens alternativas para o modelo estocástico de redes altimétricas.

      Além disso, em redes de nivelamento o número de injunções normalmente é relativamente baixo. No caso da Rede Altimétrica de Alta Precisão (RAAP) do Sistema Geodésico Brasileiro, por exemplo, apenas uma injunção para o trecho que atende a maior parte do território. Com o afastamento das referências de nível (RRNN) da injunção, devido à propagação de covariâncias, isso tende a gerar RRNN com precisões muito piores do que outras, como visto em (IBGE, 2018).

      Da análise da Equação 3, nota-se que, caso se adotem pesos unitários para as observações, o ajustamento pela ML∞ irá acarretar a minimização do máximo resíduo absoluto (MRA) do ajustamento. No presente trabalho, a abordagem alternativa para o modelo estocástico do ajustamento pelo MMQ de redes altimétricas visou minimizar o MRA desse ajustamento, para verificação dos possíveis efeitos na homogeneidade dos resultados. Essa investigação foi intitulada Alternativa de Pesos para o MMQ (AP-MMQ).

      Deve ficar claro para o leitor que a aplicação da ML∞ é proposta para uma fase posterior à identificação de outliers na rede, ou seja, em redes livres de outliers. Isso, também, pois a ML∞ tende a distribuir erros de outliers entre as demais observações, o que dificultaria sua aplicação na identificação dos mesmos (Abdelmalek & Malek, 2008; Suraci & Oliveira, 2019a).

      A proposta e a forma de obtenção desse modelo estocástico alternativo advindo do MRA foram apresentadas em (Suraci & Oliveira, 2019c), artigo 4 (de 4) produzido no contexto da dissertação de mestrado (Suraci, 2018) a que o presente artigo se refere. Resumidamente, para cálculo do mínimo MRA, um pré-ajuste da rede pela ML∞ com pesos iguais para as observações é aplicado. Em seguida, o modelo estocástico alternativo é obtido iterativamente, incrementando (a cada iteração) o peso de observações com resíduo absoluto maior que o mínimo MRA calculado. As iterações terminam quando nenhum resíduo absoluto dentre as observações da rede for maior que o mínimo MRA, considerando a tolerância estipulada. Em relação ao artigo citado, a contribuição do corrente artigo refere-se à análise dos resultados do modelo proposto com aplicação de SMC.

Hipóteses

A partir do conteúdo abordado na introdução, foram formuladas duas hipóteses, a saber:

 

·       cenários de redes altimétricas em que o Classificador VL1 é mais eficaz que o DS na identificação de outliers.

·       O ajustamento pelo MMQ de redes altimétricas livres de outliers com modelagem estocástica advinda do MRA gera resultados mais homogêneos que com o modelo usual.

Metodologia

Conforme visto, as investigações desse trabalho podem ser divididas em três tópicos: a APPC-ML1, o Classificador VL1 e a AP-MMQ, os quais são detalhados na sequência.

APPC-ML1

As Alternativas de Pesos e de Parâmetro de Comparação para a ML1 foram realizadas de maneira conjunta nos experimentos, pois se desejou investigar qual abordagem para o modelo estocástico e com qual parâmetro de comparação, na identificação de outliers a partir de resultados do ajustamento da rede pela ML1, apresenta condições mais vantajosas para a execução dessa tarefa. Entendeu-se por vantajosa a ocorrência do parâmetro de comparação do outlier como sendo o maior dentre as observações da rede. Caso isto não ocorra, pode-se considerar que houve o indesejado mascaramento do outlier.

      Nesse trabalho, com aplicação de SMC, isso foi mensurado em redes altimétricas pelo percentual de ocorrências do parâmetro de comparação do outlier como sendo o maior dentre as observações da rede (PPCOMR), apresentado na Equação 4. Quanto maior o PPCOMR, mais vantajosa a abordagem conjunta avaliada. Similarmente, para cenários de múltiplos outliers, o numerador do PPCOMR computou a quantidade de experimentos em que os valores do parâmetro de comparação dos outliers foram os maiores da rede.

 

       (4)

 

      O PPCOMR foi avaliado também se adotando pesos unitários com o resíduo absoluto como parâmetro de comparação e pesos usuais com o resíduo absoluto ponderado como parâmetro. Assim, além da abordagem comum na literatura (pesos usuais com resíduo absoluto), duas alternativas foram testadas, totalizando três comparadas. Obviamente, uma quarta opção, que seria se testar pesos unitários com resíduos absolutos ponderados, não se fez necessária, pois ela é equivalente à abordagem alternativa citada de pesos unitários e resíduos absolutos.

O Classificador VL1 proposto

foi visto que o ajustamento pela ML1 é resistente a outliers e, assim, normalmente faz com que os resíduos absolutos desses tendam a ser relativamente maiores. Visando tirar proveito dessa característica, a estratégia do Classificador VL1 é determinar um valor de corte (VC), intitulado VCL1, para o resíduo absoluto de uma observação no ajustamento da rede pela ML1, a partir do qual a mesma passará a ser classificada como outlier. Assim, a primeira etapa da aplicação do Classificador é a construção do VCL1 da rede analisada, caso o mesmo não esteja disponível. A Figura 1 ilustra a aplicação completa do Classificador VL1.

     

 

 

Figura 1.       Aplicação do Classificador VL1.

      Após isso, a rede deve ser ajustada pela ML1, adotando-se modelo estocástico com pesos unitários para as observações. Em seguida, vem a decisão binária sobre a classificação como outlier de cada observação da rede, pela comparação de seu respectivo resíduo absoluto |vi| com o valor de corte VCL1. Caso seja maior, considera-se que a i-ésima observação é um outlier (Equação 5).

 

 a i-ésima observação da rede é um outlier            (5)

     

      Vale esclarecer que a decisão de se utilizar a ML1 com pesos unitários e a confirmação do resíduo absoluto como parâmetro de comparação para o Classificador VL1 está amparada pelos resultados dos experimentos da APPC-ML1, que são apresentados na sequência desse artigo. Neles se verificou que com essa abordagem conjunta houve maior PPCOMR.

      Para construção do valor de corte VCL1 do Classificador VL1 (Figura 2), cenários aleatórios com outlier referentes à rede altimétrica analisada devem ser preparados via SMC. Concluídas as simulações, um VCk é estipulado - k é o número de ordem do VC. Fazendo VCL1 = VCk, testa-se o comportamento dele para todos os cenários simulados da rede analisada, obtendo-se a respectiva Taxa de Sucesso (TS) (Equação 6). Esse processo é iterativo até que se chegue, por tentativa e erro, a um VCk no qual a TS seja máxima, o qual será o valor final para o VCL1 a ser empregado para a identificação de outliers.

 

                           (6)

 

 

 

 

Figura 2.       Diagrama de atividades para construção do VCL1.

      A aplicação do Classificador VL1 na identificação de outliers foi avaliada por comparação com o DS, em relação a cenários de redes nos quais os outliers eram conhecidos. A comparação entre os métodos, em ambos os casos, foi feita pelas respectivas TS.

AP-MMQ

Seja |v| o vetor do valor absoluto dos resíduos, e Ex e Ev o das raízes quadradas dos elementos da diagonal principal das MVCs (que representam as precisões) dos parâmetros estimados e dos resíduos no ajustamento pelo MMQ, respectivamente. Via SMC, para verificação da homogeneidade dos resultados, os desvios padrão dos elementos dos vetores |v|, Ex e Ev, após ajustamento das redes sem outliers pelo MMQ com o modelo estocástico usual dos pesos proporcionais ao inverso do comprimento das linhas de nivelamento, e com o modelo estocástico alternativo advindo do MRA, foram comparados.

Dados

Para consecução dos experimentos, observações reais da RAAP e cenários obtidos por SMC a partir de uma rede matemática foram utilizados.

Rede Matemática – base para SMC

As observações da rede matematicamente “perfeita” correspondem propositalmente aos desníveis exatos entre as respectivas RRNN. Trata-se de uma rede sem qualquer erro de medida (nem mesmo aleatórios), útil para aplicação de SMC, assim como feito por (Hekimoglu & Erenoglu, 2007). Nas simulações a partir dela, a altitude do ponto A é considerada fixa e com valor hA=0. Assim, foram simuladas redes com 20 observações e 10 pontos de altitudes a determinar (incógnitas), ou seja, 10 graus de liberdade. A geometria das redes simuladas consta da Figura 3.

 

 

Figura 3.       Geometria da rede matemática e das simulações decorrentes.

      Foi intitulada Simulação 1 a criação, a partir da Rede Matemática, de cenários aleatórios de rede altimétrica sem outliers. As observações foram simuladas da mesma forma que as “observations without outliers” do caso de heterocedasticidade de (Hekimoglu & Erenoglu, 2007), com apenas uma diferença: como no corrente artigo se adotou a regra dos 3σ para o erro total (Suraci & Oliveira, 2019b) na definição de outlier, valores de erro aleatório com magnitude superior aos 3σ não foram considerados. Nas simulações a partir da Rede Matemática, o desvio padrão das observações foi dado pela Equação 7, sendo K (em km) o comprimento da respectiva linha.

 

(7)

 

      a Simulação 2 correspondeu à criação, a partir da Rede Matemática, de cenários aleatórios de rede altimétrica com outliers. As “boas” observações foram simuladas assim como na Simulação 1, e a simulação de outliers foi inspirada na das “bad observationscom sinal aleatório de (Hekimoglu & Erenoglu, 2007). Maiores detalhes em (Suraci, 2018).

 

Rede real – trecho da RAAP

Os dados da RAAP utilizados nos experimentos foram adaptados de (Beserra, 1952). Tratam-se dos dados do nivelamento geométrico de precisão do território brasileiro que tinha sido realizado até então, configurando 105 linhas de nivelamento (observações), com um comprimento total de 15.706,25 km, passando por diversos estados do território brasileiro. O retângulo envolvente correspondente a este nivelamento é apresentado na Figura 4. Um arquivo nomeado “Rede_real_geometria.pdf” e um nomeado “Rede_real_observacoes.pdf”, nos quais a geometria, e os comprimentos e desníveis das observações dessa rede podem ser vistos com maior detalhamento, foram disponibilizados em (Suraci, 2019).

      A altitude de uma das RRNN (da RRNN chamada 3L) foi considerada fixa (injunção fixa) e com valor h3L=10,8190m. Com uma quantidade de pontos de altitude a determinar de 67, o número de graus de liberdade é 38. Não foram identificados outliers nessa rede pelo DS (com α=0,001), adotando-se pesos das observações equivalentes ao inverso do comprimento das respectivas linhas, multiplicados por um fator de proporcionalidade A=200, como feito por (Beserra, 1952).

Descrição dos experimentos e Resultados

Os experimentos foram conduzidos no software Octave. As soluções dos ajustamentos pelas normas L1 e L∞ foram feitas por programação linear, utilizando o método

 

 


 

 

Figura 4.       Retângulo envolvente da rede real.

 

SIMPLEx. O estado inicial das sequências de números pseudoaleatórios foi modificado sempre que necessário para evitar qualquer viés nos resultados. Os códigos dos experimentos estão disponibilizados em (Suraci, 2019).

Experimento 1 – APPC-ML1

No Experimento 1, a APPC-ML1 foi testada em cenários de rede obtidos pela Simulação 2. A Tabela 1 apresenta o PPCOMR (Equação 4) para diferentes intervalos de magnitude do erro do outlier propositalmente inserido. A linhaPIV” corresponde aos resultados dos ajustamentos pela ML1 com pesos pelo inverso da variância das respectivas observações (logo, proporcionais ao inverso do comprimento das linhas de nivelamentoEquação 7) e a “PUnitcom pesos unitários para as observações da rede. os parâmetros de comparação são indicados por “RA” para o resíduo absoluto e “RAP” para o resíduo absoluto ponderado. O total de cenários de rede simulados, para cada intervalo de magnitude de erro total inserido, foi de 200.000.

 

Tabela 1

PPCOMR – cenários com 1 outlier – Experimento 1

Erro Total

3-6σ

6-12σ

12-25σ

25-100σ

PUnit

RA

63,79%

95,01%

99,92%

100,00%

PIV

RA

58,10%

84,32%

89,88%

90,07%

PIV

RAP

59,29%

86,65%

90,05%

90,07%

 

      A Tabela 2 é similar à Tabela 1, mas para o caso de 2 outliers em cada cenário de rede simulado.

 

Tabela 2

PPCOMR – cenários com 2 outliers – Experimento 1

Erro Total

3-6σ

6-12σ

12-25σ

25-100σ

PUnit

RA

38,02%

79,76%

89,37%

89,66%

PIV

RA

32,06%

62,92%

71,03%

71,37%

PIV

RAP

33,13%

65,64%

71,29%

71,37%

 

      Da análise das Tabelas 1 e 2, nota-se que o PPCOMR foi sempre maior no ajustamento pela ML1 com pesos unitários. Assim, verifica-se que a adoção de pesos unitários para as observações no ajustamento pela ML1 apresentou condições vantajosas para a identificação de outliers em relação aos usuais pesos proporcionais ao inverso do comprimento das linhas de nivelamento.

      Vale notar ainda que a utilização de pesos usuais com o resíduo absoluto como parâmetro de comparação, abordagem conjunta comum na literatura, apresentou em geral o pior resultado (menor PPCOMR) dentre as três avaliadas. Ademais, as três abordagens conjuntas obtiveram aumento do PPCOMR para maiores magnitudes dos outliers inseridos e diminuição do PPCOMR com o aumento da quantidade de outliers.

Experimento 2 – Classificador VL1 proposto

O Experimento 2 visou comparar o desempenho do Classificador VL1 com o do DS na identificação de outliers. Para construção do VCL1, foram utilizados cenários de rede com 1 outlier (com magnitude entre 3σ e 100σ) obtidos pela Simulação 2. De um total de 200.000 cenários simulados na identificação de outliers para cada um dos diversos VCs testados, o valor de 29,2 mm foi selecionado, por ter obtido a maior quantidade de acertos (191.307). Para cada cenário, foi considerado que houve acerto se o outlier foi identificado, sem que nenhuma outra observação também tenha sido assim classificada.

      Deve-se atentar para o fato de que a construção do VCL1 ora apresentada foi feita com inserção de outliers entre 3σ e 100σ, nos moldes da Simulação 2. A construção do VCL1 com inserção proposital de outliers com outros intervalos de magnitude, o que ocasionou diferentes valores para o VCL1 e, em consequência, diferentes TSs (Equação 6) para o Classificador VL1 nos experimentos a seguir, foi vista em (Suraci, 2018).

      Na continuidade, o Classificador VL1, com o VCL1 construído, foi aplicado em cenários de rede com as diferentes magnitudes de erro dos outliers da Tabela 3, obtidos via Simulação 2. Para cada faixa de magnitude de outlier, foram testados 200.000 cenários simulados. A Tabela 3 apresenta a TS do Classificador VL1 e do DS nesse contexto.

 

Tabela 3

TS – 1 outlier – Experimento 2

Método

3-6σ

6-12σ

12-25σ

25-100σ

DS (α=0,001)

42,90%

93,92%

98,75%

98,76%

Classificador VL1

18,99%

79,02%

98,93%

99,11%

 

      A Tabela 4 é similar à Tabela 3, mas para o caso de 2 outliers inseridos propositalmente em cada cenário de rede simulado via Simulação 2. Nesse contexto, foi considerado que houve acerto na identificação de outliers se ambos foram identificados pelo método aplicado, sem que nenhuma outra observação também tenha sido assim classificada.

 

Tabela 4

TS – 2 outliers – Experimento 2

Método

3-6σ

6-12σ

12-25σ

25-100σ

DS (α=0,001)

14,32%

76,55%

87,29%

88,88%

Classificador VL1

3,35%

56,34%

87,90%

88,32%

 

      No caso anterior de 1 outlier, o DS apresentou tempo médio computacional inferior ao do Classificador VL1 (os tempos foram de 2,6 ms e 2,9 ms, respectivamente). Porém, seguindo para os testes com 2 outliers, o tempo médio do Classificador VL1 se manteve estável (2,9 ms), enquanto o do DS (4,2 ms) obteve uma tendência de crescimento, passando a ser maior que o do Classificador VL1. Isso era esperado, pois o DS é um método iterativo, enquanto o Classificador VL1 identifica os outliers em uma única iteração.

      As Tabelas 5 e 6 são similares à Tabela 4, mas tratando separadamente os casos de 2 outliers controláveis e de 2 não controláveis (considerando a análise da geometria da rede pelo MEM), respectivamente. Para o primeiro caso, a TS do DS foi sempre superior à do Classificador VL1. Entretanto, se ressalta o resultado do Classificador VL1 em cenários de dois outliers não controláveis, significativamente superior ao do DS.

 

Tabela 5

TS – 2 outliers controláveis – Experimento 2

Método

3-6σ

6-12σ

12-25σ

25-100σ

DS (α=0,001)

16,01%

84,75%

95,99%

97,23%

Classificador VL1

3,46%

59,19%

93,48%

93,94%

 

 

Tabela 6

TS – 2 outliers não controláveis – Experimento 2

Método

3-6σ

6-12σ

12-25σ

25-100σ

DS (α=0,001)

1,24%

19,39%

27,07%

31,36%

Classificador VL1

2,03%

34,56%

49,59%

49,71%

 

      Contudo, é lícito afirmar que o Experimento 2 mostrou que há cenários de redes altimétricas em que o Classificador VL1 foi mais eficaz que o DS na identificação de outliers, especialmente no caso de geometria da rede deficiente.

Experimento 3 – AP-MMQ

No Experimento 3, primeiramente a AP-MMQ foi testada em 2.000 cenários de rede obtidos pela Simulação 1. O MRA médio calculado no ajustamento pela ML∞ dos cenários simulados foi de 6,2162 mm. O modelo estocástico alternativo foi obtido, em média, após 34 iterações do ajustamento pelo MMQ.

      A Tabela 7 apresenta a quantidade de cenários nos quais o desvio padrão (σ) dos elementos de |v|, Ev e Ex foi menor (caracterizando maior homogeneidade dos elementos) para os ajustamentos pelo MMQ com modelo estocástico usual (ME usual) e com o modelo estocástico alternativo (ME alternativo) advindo do MRA.

 

Tabela 7

Quantidade de resultados mais homogêneos – Experimento 3 – Simulação 1

σ

ME usual

ME alternativo

|v|

35

1965

Ev

153

1848

Ex

241

1759

      Em seguida, a AP-MMQ foi testada na Rede Real com dados da RAAP. A Tabela 8 apresenta os valores do desvio padrão dos elementos de |v|, DPv e DPx para os ajustamentos pelo MMQ com o ME usual e com o ME alternativo. O MRA calculado no ajustamento pela ML∞ para a rede foi de 0,1392 m. O modelo estocástico alternativo foi obtido após 15 iterações. Vale esclarecer que o ajustamento pelo MMQ com o ME alternativo apresentou MRA (máximo elemento de |v|) inferior em todos os casos (2.000 cenários simulados e rede com dados da RAAP). Obviamente, isso era de se esperar, pois esse modelo estocástico foi construído de forma a implicar isso.

     

Tabela 8

Resultados do ajustamento pelo MMQ – Experimento 3 – Trecho da RAAP

σ

ME usual

ME alternativo

|v|

0,0281 m

0,0238 m

Ev

0,0178 m

0,0042 m

Ex

0,0248 m

0,0225 m

     

      Da análise da Tabela 7, verifica-se que o desvio padrão dos elementos dos vetores |v|, DPv e DPx com o ME alternativo foi menor que os equivalentes com o ME usual em cerca de 98%, 92% e 88% dos cenários simulados, respectivamente. Essa tendência também foi vista com os dados reais da RAAP (Tabela 8). Assim, na significativa maioria dos cenários analisados, o ajustamento pelo MMQ de redes altimétricas livres de outliers com modelagem estocástica alternativa advinda do MRA gerou resultados mais homogêneos que com o modelo usual.

      A desvantagem do ME alternativo é que esta ponderação dificilmente reflete a realidade da rede. Neste caso o ajustamento das observações é obtido única e exclusivamente em função dos dados de campo e da configuração geométrica da rede. Logo, os resultados obtidos não necessariamente conduzem a uma solução ótima, uma vez que o modelo estocástico foi simplificado. Apesar do ME usual também representar uma simplificação, espera-se que ele seja uma aproximação mais realista.

      Por fim, diante dos resultados, não se pode indicar qual dos modelos estocásticos deve ser seguido. Um modelo não exclui o outro. Contudo, os promissores resultados com o ME alternativo advindo do MRA mostram haver indícios da possibilidade de maiores investigações sobre o mesmo, ou até de formas de combinar os dois modelos estocásticos, visando resultados mais realistas e apropriados.

Conclusões e implicações para a prática da estimação de redes altimétricas

O Classificador VL1 proposto apresentou TS significativamente superior à do DS em cenários de outliers não controláveis (considerando o MEM). Isso é particularmente relevante para redes com grande quantidade de observações, mas baixa redundância função da geometria mais pobre, caso da RAAP e das redes de nivelamento de forma geral. A implantação de extensas redes altimétricas com geometria que permita grande resistência contra múltiplos outliers possui custo elevado, de forma que métodos com maior eficácia em cenários de menor resistência são de grande valia.

      O tempo de execução computacional do Classificador VL1 se mantém estável com o aumento da quantidade de outliers nas observações, enquanto o do DS tende a ser aumentado, por ser esse último um método iterativo. Isso representa também uma vantagem do Classificador VL1 para cenários com quantidade relativamente grande de observações, como redes de nivelamento a nível nacional.

      Quanto à aplicação da norma L∞, o modelo estocástico alternativo gerou resíduos e precisão desses e dos parâmetros estimados mais homogêneos, com menor desvio padrão, que aqueles com a abordagem usual para o modelo estocástico, na significativa maioria dos casos analisados. Isso pode ser aproveitado para que se evitem redes com vértices relativamente muito menos precisos que outros, especialmente quando o controle é baixo, algo também comum em redes de nivelamento.

 

Este artigo é apresentado a partir dos resultados da Dissertação de Mestrado intitulada: “Aplicação das normas L1 e L∞ em redes altimétricas: identificação de outliers e construção do modelo estocástico”, defendida em 19 de dezembro de 2018.

Bibliografia

Abdelmalek, N. & Malek, W. (2008). Numerical linear approximation in C. CRC Press: Boca Raton, EUA, Taylor & Francis Group.

Amiri-Simkooei, A. (2003). “Formulation of L1 Norm Minimization in Gauss-Markov Models”, Journal of Surveying Engineering, fev., pp. 37-43. https://doi.org/10.1061/(ASCE)0733-9453(2003)129:1(37)

Amiri-Simkooei, A. (2018). “On the use of two L1 norm minimization methods in geodetic networks”, Earth Observation and Geomatics Engineering, 2(1): 1-8. https://doi.org/10.22059/EOGE.2018.256034.1021

Baarda, W. (1968). “A testing procedure for use in geodetic networks”, Publications on Geodesy - New Series, 2(5): 1-97. Disponível em http://www.ncgeo.nl/downloads/09Baarda.pdf

Baselga, S. (2007). “Global Optimization Solution of Robust Estimation”, Journal of Surveying Engineering, 133(3): 123-128.             
https://doi.org/ 10.1061/(ASCE)0733-9453(2007)133:3(123)

Beserra, H. (1952). Ajustamento da rede de nivelamento, IBGE, Rio de Janeiro, Brasil, Biblioteca Geográfica Brasileira.

Dantzig, G. (1963). Linear Programming and Extensions, The Rand Corporation, Santa Monica, EUA, Princeton University Press.

Durdag, U.M., Hekimoglu, S. & Erdogan, B. (2016). “Outlier detection by using fault detection and isolation techniques in geodetic networks”, Survey Review, 48(351): 400-408. https://doi.org/10.1179/1752270615Y.0000000038

Ebong, M.B. (1986). “The Chebyshev adjustment of a geodetic levelling network”, Survey Review, 28(220): p. 315-321. https://doi.org/10.1179/sre.1986.28.220.315

Gemael, C., Machado, A.M.L. & Wandresen, R. (2015). Introdução ao ajustamento de observações: aplicações geodésicas, (2). UFPR, Curitiba, Brasil, Ed. UFPR.

Ghilani, C. (2010). Adjustment Computations: Spatial Data Analysis, (5), John Wiley & Sons, Hoboken, EUA.

Hekimoglu, S., Erenoglu, R.C., Sanli, D.U. & Erdogan, B. (2011). “Detecting Configuration Weaknesses in Geodetic Networks”, Survey Review, 43(323): 713-730. https://doi.org/10.1179/003962611X13117748892632

Hekimoglu, S. & Erenoglu, R.C. (2007). “Effect of heteroscedasticity and heterogeneousness on outlier detection for geodetic networks”, Journal of Geodesy, 81: 137-148. https://doi.org/10.1007/s00190-006-0095-z

IAG (2015). IAG Resolution (No. 1/2015) for the definition and realization of an International Height Reference System. Disponível em       https://ihrs.dgfi.tum.de/fileadmin/JWG_2011/IAG_Resolutions_2015.pdf

IBGE (2018). Reajustamento da Rede Altimétrica com Números Geopotenciais 2018, IBGE, Rio de Janeiro, Brasil. Disponível em https://biblioteca.ibge.gov.br/visualizacao/livros/liv101666.pdf

Kampmann, G. & Krause, B. (1997). “A breakdown point analysis for the straight line fit based on balanced observations”, Bollettino di Geodesia e Scienze Affini, 3: 293-303.

Khodabandeh, A. & Amiri-Simkooei, A. (2011). “Recursive Algorithm for L1 Norm Estimation in Linear Models”, Journal of Surveying Engineering, 137(1): 1-8. https://doi.org/10.1061/(ASCE)SU.1943-5428.0000031

Klein, I., Matsuoka, M.T., Guzatto, M.P., Souza, S.F. & Veronez, M.R., (2015). “On evaluation of different methods for quality control of correlated observations”, Survey review, 47(340): 28-35.      https://doi.org/10.1179/1752270614Y.0000000089

Koch, I.E., Klein, I., Gonzaga Jr., L., Matsuoka, M.T., Rofatto, V.F., Veronez, M.R. (2019). “Robust Estimators in Geodetic Networks Based ona New Metaheuristic: Independent Vortices Search”, Sensors, 19(20), 4535, pp. 1-27. https://doi.org/10.3390/s19204535

Koch, K. (1999). Parameter Estimation and Hypothesis Testing in Linear Models, (2), Springer, Berlim, Alemanha.

Marshall, J. & Bethel, J. (1996). Basic concepts of L1 norm minimization for surveying applications, Journal of Surveying Engineering, 122(4): 168-179. https://doi.org/10.1061/(ASCE)0733-9453(1996)122:4(168)

Mason, J.C. & Handscomb, D.C., Chebyshev polynomials, CRC Press, Florida, EUA, 2003.

Raychaudhuri, S. (2008). “Introduction to Monte Carlo Simulation”, Proceedings of the 2008 Winter Simulation Conference, pp. 91-100. Disponível em               https://dl.acm.org/citation.cfm?id=1516768

Rofatto, V., Matsuoka, M. & Klein, I. (2017). An Attempt to Analyse Baarda’s Iterative Data Snooping Procedure based on Monte Carlo Simulation. South African Journal of Geomatics, 6(3): 416-435. Disponível em            http://www.sajg.org.za/index.php/sajg/article/view/578

Rofatto, V.F., Matsuoka, M.T., Klein, I., Veronez, M.R., Bonimani, M.L. & Lehmann, R. (2018). “A half-century of Baarda’s concept of reliability: a review, new perspectives, and applications”, Survey Review,          https://doi.org/10.1080/00396265.2018.1548118

Suraci, S.S. (2018). Aplicação das normas L1 e L∞ em redes altimétricas: identificação de outliers e construção do modelo estocástico, Dissertação Mestrado em Engenharia Cartográfica, IME: Rio de Janeiro, Brasil. Disponível em https://1drv.ms/b/s!AlQm3WMI4DY1gdNKKtQ5NTnu7PQUQg

——— (2019). “GitHub de Stefano Sampaio Suraci”, Disponível em https://github.com/stefano998/artigoRevCartografica

Suraci, S.S. & Oliveira, L.C. (2019a). “Chebyshev norm minimization: what to expect? Case study in a leveling network”, Revista Brasileira de Geomática: no prelo.

——— (2019b). “Outlier=gross error? Do only Gross errors cause outliers in geodetic networks? Addressing these and other questions”, Boletim de Ciências Geodésicas, 25: 1-16. https://doi.org/10.1590/s1982-21702019000s00004

——— (2019c). “Proposta de modelo estocástico para minimização do máximo resíduo absoluto em redes de nivelamento”, Revista Militar de Ciência e Tecnologia, 36: 55-58. Disponível em  http://ebrevistas.eb.mil.br/index.php/CT/article/view/2722

Suraci, S.S., Oliveira, L.C. & Klein, I., (2019). “Two aspects on L1-norm adjustment of leveling networks”, Revista Brasileira de Cartografia, 71(2): 486-500. https://doi.org/10.14393/rbcv71n2-47697

Teunissen, P., (2006). Testing theory: an introduction, (2), Delft Univ. of Technology: Delft, Holanda.

Yetkin, M. & Inal, C. (2011). L1 norm minimization in GPS networks. Survey Review, 43(323): 523-532. https://doi.org/10.1179/003962611X13117748892038



*    Instituto Militar de Engenharia, Brasil, correio eletrônico: stefano@ime.eb.br.              
ORCID:
https://orcid.org/0000-0002-4453-9273.

**     Instituto Militar de Engenharia, Brasil, correio eletrônico: leonardo@ime.eb.br.            
ORCID: https://orcid.org/0000-0001-5290-5029.