# Comparando Conjuntos de Dados de Produtividade

## Contexto

A tomada de decisão agrícola moderna depende fortemente de Conjuntos de Dados de Produtividade, que representam a produtividade coletada e refletem uma grande parte da renda do agricultor. Esses conjuntos de dados devem ser precisos e de alta qualidade para informar decisões sobre manejo de insumos e otimizar estratégias futuras de plantio e fertilização.

Os Dados de Produtividade são tipicamente coletados por equipamentos de colheita, mas leituras brutas frequentemente estão incompletas, contêm erros ou exigem calibração para lidar com inconsistências dos sensores e condições variáveis do campo. Para superar esses desafios, os profissionais normalmente empregam técnicas de limpeza, calibração e geração de conjuntos de dados sintéticos para produzir Dados de Produtividade confiáveis e comparáveis.

Ambos[ Limpeza e Calibração de Produtividade](https://docs.geopard.tech/geopard-tutorials/pt-br/agronomia/calibracao-e-limpeza-de-produtividade) e [Restauração Sintética de Dados de Produtividade](https://docs.geopard.tech/geopard-tutorials/pt-br/agronomia/mapa-de-produtividade-sintetico) são suportados pelo GeoPard.

<mark style="color:padrão;background-color:yellow;">Comparar Conjuntos de Dados de Produtividade de diferentes anos de safra fornece insights valiosos, ajudando a validar práticas de manejo, confirmar a precisão dos sensores e melhorar estratégias para as próximas temporadas.</mark> Essas comparações também orientam o refinamento de prescrições de fertilidade e semeadura, garantindo que cada decisão seja baseada em informações confiáveis.

## Abordagem de Comparação (usando Equação de Similaridade)

Para comparar quantitativamente Conjuntos de Dados de Produtividade, utilizamos uma Equação pré-salva chamada <mark style="color:padrão;background-color:yellow;">Análise de Correlação Espacial (Similaridade de Camadas de Dados)</mark> que mede a similaridade entre atributos associados à produtividade de Conjuntos de Dados de Produtividade em uma base espacial.

Essa equação atribui uma pontuação de similaridade, indicando quão próximo um conjunto de dados corresponde a outro em padrão espacial e distribuição de valores.&#x20;

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F9O2baZdOVQWoiJrJqPdv%2Fimage.png?alt=media&#x26;token=4014a70b-804e-46fa-8206-19f58cc345cd" alt=""><figcaption><p>Pesquisar a Equação de Similaridade de Camadas de Dados existente</p></figcaption></figure>

<mark style="color:padrão;background-color:yellow;">Os valores de similaridade variam de 0 a 1, onde 0 indica nenhuma correspondência e 1 significa correspondência espacial de valores de 100%</mark>. Em outras palavras, quanto mais próxima a pontuação de similaridade estiver de 1, mais semelhantes são os atributos de produtividade.&#x20;

## **Conjunto de Dados de Produtividade Real (2015** Soja **vs 2018** Soj&#x61;**)**

Neste caso, começamos com Dados de Produtividade brutos coletados durante duas diferentes safras, 2015 e 2018, com a mesma cultura soja. Os conjuntos de dados iniciais contêm locais anormalmente altos e baixos, especialmente no início/fim das passadas da colheitadeira, e os dados necessitam de leve recalibração.

Após aplicar as ferramentas de limpeza e calibração do GeoPard, o conjunto de dados resultante fica mais uniforme, consistente e mais fácil de interpretar.

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FDTbHLvB354jBMO3fub2W%2Fimage.png?alt=media&#x26;token=6ca5f428-021b-453d-b6c7-330038294e0c" alt=""><figcaption><p>Soja 2015: Dados de Produtividade Originais vs Limpos e Calibrados</p></figcaption></figure>

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FaiDl2niPiQyUwQ6kDTdW%2Fimage.png?alt=media&#x26;token=7bb1ccdb-b41c-4590-b47f-a803cdbe8e01" alt=""><figcaption><p>Soja 2018: Dados de Produtividade Originais vs Limpos e Calibrados</p></figcaption></figure>

O mapa de execução da Equação de Similaridade está abaixo como uma captura de tela.

Do ponto de vista estatístico, ele mostra uma média alta (0,869) e mediana (0,876), indicando que <mark style="color:padrão;background-color:yellow;">os padrões de produtividade da soja de 2018 se assemelham fortemente aos de 2015</mark>. Embora algumas áreas caiam para 0,599, a baixa variação (0,005) e o desvio padrão modesto (0,073) confirmam <mark style="color:padrão;background-color:yellow;">consistência geral</mark>.&#x20;

Do ponto de vista agronômico, <mark style="color:padrão;background-color:yellow;">essa estabilidade sugere que as condições subjacentes do campo e as respostas às práticas de manejo permaneceram amplamente inalteradas</mark>.

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FAyZjM18FRfT03KXUX2yW%2Fimage.png?alt=media&#x26;token=d48c86e2-0aa0-4eb4-b626-29e645399a77" alt=""><figcaption><p>Comparando Similaridade de Produtividade: Soja 2015 vs Soja 2018</p></figcaption></figure>

## **Conjunto de Dados de Produtividade Real (2022** Milho **vs 2024** Milh&#x6F;**)**

Neste cenário, começamos com Dados de Produtividade brutos de duas safras de milho — 2022 e 2024. Os conjuntos de dados iniciais contêm anomalias como leituras anormalmente altas ou baixas, passadas cruzadas e trajetórias curvas, indicando a necessidade de recalibração dos sensores.&#x20;

Após aplicar as ferramentas de limpeza e calibração do GeoPard, os conjuntos de dados tornam-se mais confiáveis, possibilitando análises automatizadas e tomadas de decisão informadas.

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FrCMUu65DPZjqVmuvoUvM%2Fimage.png?alt=media&#x26;token=00c11d5e-70b7-49ea-9943-0e4ac5b2b990" alt=""><figcaption><p>Milho 2022: Dados de Produtividade Originais vs Limpos e Calibrados</p></figcaption></figure>

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Ff53cGgbe2gWO4LbW2OUN%2Fimage.png?alt=media&#x26;token=f48408bd-662e-44f8-9fca-c334b23324b8" alt=""><figcaption><p>Milho 2024: Dados de Produtividade Originais vs Limpos e Calibrados</p></figcaption></figure>

O mapa de execução da Equação de Similaridade está abaixo como uma captura de tela.

Do ponto de vista estatístico, uma média de 0,791 e uma mediana de 0,799 mostram <mark style="color:padrão;background-color:yellow;">as produtividades de milho de 2024 se assemelham amplamente às de 2022</mark>, embora áreas com valores tão baixos quanto 0,413 indiquem variabilidade. Um desvio padrão de 0,115 confirma <mark style="color:padrão;background-color:yellow;">algumas diferenças ao longo do campo</mark>.

Do ponto de vista agronômico, <mark style="color:padrão;background-color:yellow;">padrões consistentes sugerem condições estáveis e manejo eficaz ao longo do tempo</mark>. Contudo, zonas <mark style="color:padrão;background-color:yellow;">de baixa similaridade localizadas podem requerer ajustes direcionados para melhorar o desempenho da produtividade futura</mark>.

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FhOWLFRX43inp21kga5y9%2Fimage.png?alt=media&#x26;token=308de900-e22a-4330-b517-a88ca89c5012" alt=""><figcaption><p>Comparando Similaridade de Produtividade: Milho 2022 vs Milho 2024</p></figcaption></figure>

## **Conjunto de Dados de Produtividade Sintético vs Real (2023** Colza)

Neste cenário, começamos com um Conjunto de Dados de Produtividade bruto da safra de colza de 2023 e um Conjunto de Dados de Produtividade gerado sinteticamente para a mesma cultura e o mesmo ano de 2023. <mark style="color:padrão;background-color:yellow;">O objetivo é avaliar a precisão espacial do Produtividade Real versus Sintética, fornecendo um caminho para preencher dados não registrados, tratar lacunas nos dados de produtividade e corrigir anomalias usando valores sintéticos</mark>. O Conjunto de Dados de Produtividade Real contém problemas como leituras anormalmente altas ou baixas, passadas cruzadas, trajetórias curvas e passadas com valor zero, todos indicando a necessidade de recalibração dos sensores.

Após aplicar as [Limpeza e Calibração](https://docs.geopard.tech/geopard-tutorials/pt-br/agronomia/calibracao-e-limpeza-de-produtividade) aos Dados de Produtividade Reais e gerar [Produtividade Sintética](https://docs.geopard.tech/geopard-tutorials/pt-br/agronomia/mapa-de-produtividade-sintetico) para colza, podemos iniciar uma comparação significativa de sua similaridade.

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwkCRiie2suhom6bxWKCJ%2Fimage.png?alt=media&#x26;token=f4752a43-55e2-431c-a667-8363c8f742c6" alt=""><figcaption><p>Colza 2023: Dados de Produtividade Originais vs Limpos e Calibrados</p></figcaption></figure>

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fz427malsrdHAQOCNjQyh%2Fimage.png?alt=media&#x26;token=26a63983-2a7f-48b2-bfc9-3e40a883582a" alt=""><figcaption><p>Produtividade Sintética de Colza 2023</p></figcaption></figure>

O mapa de execução da Equação de Similaridade está abaixo como uma captura de tela.

Do ponto de vista estatístico, as altas média (0,889) e mediana (0,904) indicam que, <mark style="color:padrão;background-color:yellow;">no geral, o Conjunto de Dados de Produtividade Sintético corresponde de perto aos padrões espaciais da Produtividade Real de Colza 2023</mark>. Embora uma área caia até 0,291, a baixa variação (0,006) e o desvio padrão modesto (0,08) sugerem que <mark style="color:padrão;background-color:yellow;">a maioria das partes do campo se alinha de perto entre os Conjuntos de Dados Real e Sintético, com muito poucos outliers</mark>.

Do ponto de vista agronômico, essa forte similaridade implica que <mark style="color:padrão;background-color:yellow;">os Dados de Produtividade Sintéticos podem servir como um proxy confiável para as condições reais do campo</mark>, reforçando a confiança no uso de cenários modelados para orientar decisões. <mark style="color:padrão;background-color:yellow;">As práticas agronômicas refletidas nos Dados de Produtividade Reais são bem capturadas pelo modelo de Produtividade Sintética</mark>, permitindo um planejamento mais informado e consistente para estratégias de manejo futuras.

<figure><img src="https://1397135423-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FZT4vMwtGPgMFsmWAsIb4%2Fimage.png?alt=media&#x26;token=bf195514-380e-43fb-bbee-5922dd92b769" alt=""><figcaption><p>Comparando Similaridade de Produtividade Colza: Real 2023 vs Sintético 2023</p></figcaption></figure>
