# Opbrengstdatasets vergelijken

## Context

Moderne agrarische besluitvorming is sterk afhankelijk van opbrengstdatasets, die verzamelde opbrengstgegevens weergeven en een groot deel van het inkomen van de teler vertegenwoordigen. Deze datasets moeten nauwkeurig en van hoge kwaliteit zijn om beslissingen over inputbeheer te onderbouwen en toekomstige zaaien en bemestingsstrategieën te optimaliseren.

Opbrengstgegevens worden doorgaans verzameld door oogstmachines, maar ruwe metingen zijn vaak incompleet, bevatten fouten of vereisen kalibratie om sensorinconsistenties en variabele veldomstandigheden te corrigeren. Om deze uitdagingen te overwinnen, gebruiken professionals vaak technieken voor opschoning, kalibratie en synthetische datasetgeneratie om betrouwbare en vergelijkbare opbrengstgegevens te produceren.

Beide[ Opbrengstopschoning & Kalibratie](https://docs.geopard.tech/geopard-tutorials/nl/agronomie/opbrengstkalibratie-en-opschoning) en [Synthetisch herstellen van opbrengstgegevens](https://docs.geopard.tech/geopard-tutorials/nl/agronomie/synthetische-opbrengstkaart) worden ondersteund door GeoPard.

<mark style="color:standaard;background-color:yellow;">Het vergelijken van opbrengstdatasets uit verschillende teeltjaren biedt waardevolle inzichten, helpt beheerspraktijken te valideren, de sensoraccuratesse te bevestigen en strategieën voor komende seizoenen te verbeteren.</mark> Deze vergelijkingen sturen ook de verfijning van bemestings- en zaairecepten, zodat elke beslissing gebaseerd is op betrouwbare informatie.

## Vergelijkingsbenadering (met behulp van gelijkenheidsvergelijking)

Om opbrengstdatasets kwantitatief te vergelijken, gebruiken we een vooraf opgeslagen vergelijking met de naam <mark style="color:standaard;background-color:yellow;">Ruimtelijke correlatieanalyse (vergelijkbaarheid van datalagen)</mark> die de gelijkenis meet tussen opbrengst-gerelateerde attributen van opbrengstdatasets op ruimtelijke basis.

Deze vergelijking kent een gelijkenheidsscore toe, die aangeeft hoe nauw een dataset overeenkomt met een andere in ruimtelijk patroon en waardeverdeling.&#x20;

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F9O2baZdOVQWoiJrJqPdv%2Fimage.png?alt=media&#x26;token=4014a70b-804e-46fa-8206-19f58cc345cd" alt=""><figcaption><p>Zoek de bestaande vergelijking voor vergelijkbaarheid van datalagen</p></figcaption></figure>

<mark style="color:standaard;background-color:yellow;">De gelijkeniswaarden variëren van 0 tot 1, waarbij 0 geen overeenkomst aangeeft en 1 een 100% ruimtelijke waarde-overeenkomst betekent</mark>. Met andere woorden, hoe dichter de gelijkenheidsscore bij 1 ligt, hoe meer de opbrengstattributen overeenkomen.&#x20;

## **Reële opbrengstdataset (2015** Sojaboon **vs 2018** Sojaboo&#x6E;**)**

In dit geval beginnen we met ruwe opbrengstgegevens die zijn verzameld tijdens twee verschillende teeltseizoenen 2015 en 2018 met hetzelfde gewas sojaboon. De initiële datasets bevatten abnormaal hoge en lage locaties, vooral aan het begin/einde van maaidorspasses, en de gegevens vereisen lichte recalibratie.

Na het toepassen van GeoPard’s opschonings- en kalibratietools is de resulterende dataset uniformer, consistenter en gemakkelijker te interpreteren.

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FDTbHLvB354jBMO3fub2W%2Fimage.png?alt=media&#x26;token=6ca5f428-021b-453d-b6c7-330038294e0c" alt=""><figcaption><p>Sojaboon 2015: Oorsprong vs Opgeschoonde &#x26; Gekalibreerde opbrengstgegevens</p></figcaption></figure>

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FaiDl2niPiQyUwQ6kDTdW%2Fimage.png?alt=media&#x26;token=7bb1ccdb-b41c-4590-b47f-a803cdbe8e01" alt=""><figcaption><p>Sojaboon 2018: Oorsprong vs Opgeschoonde &#x26; Gekalibreerde opbrengstgegevens</p></figcaption></figure>

De uitvoermap van de gelijkenheidsvergelijking staat hieronder als screenshot.

Statistisch gezien toont het een hoog gemiddelde (0,869) en mediaan (0,876), wat aangeeft dat <mark style="color:standaard;background-color:yellow;">de opbrengstpatronen van sojabonen in 2018 sterk lijken op die van 2015</mark>. Hoewel sommige gebieden dalen tot 0,599, bevestigen de lage variatie (0,005) en bescheiden standaarddeviatie (0,073) <mark style="color:standaard;background-color:yellow;">algemene consistentie</mark>.&#x20;

Agronomisch gezien, <mark style="color:standaard;background-color:yellow;">suggereert deze stabiliteit dat de onderliggende omstandigheden van het perceel en de reacties op beheersmaatregelen grotendeels ongewijzigd zijn gebleven</mark>.

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FAyZjM18FRfT03KXUX2yW%2Fimage.png?alt=media&#x26;token=d48c86e2-0aa0-4eb4-b626-29e645399a77" alt=""><figcaption><p>Vergelijking opbrengstgelijkenis: Sojaboon 2015 vs Sojaboon 2018</p></figcaption></figure>

## **Reële opbrengstdataset (2022** Mais **vs 2024** Mai&#x73;**)**

In dit scenario starten we met ruwe opbrengstgegevens van twee maisseizoenen — 2022 en 2024. De initiële datasets bevatten anomalieën zoals abnormaal hoge of lage metingen, kruisende passes en gebogen trajecten, wat wijst op de noodzaak van sensorrecalibratie.&#x20;

Na het toepassen van GeoPard’s opschonings- en kalibratietools worden de datasets betrouwbaarder, waardoor geautomatiseerde analyses en goed onderbouwde besluitvorming mogelijk zijn.

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FrCMUu65DPZjqVmuvoUvM%2Fimage.png?alt=media&#x26;token=00c11d5e-70b7-49ea-9943-0e4ac5b2b990" alt=""><figcaption><p>Mais 2022: Oorsprong vs Opgeschoonde &#x26; Gekalibreerde opbrengstgegevens</p></figcaption></figure>

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Ff53cGgbe2gWO4LbW2OUN%2Fimage.png?alt=media&#x26;token=f48408bd-662e-44f8-9fca-c334b23324b8" alt=""><figcaption><p>Mais 2024: Oorsprong vs Opgeschoonde &#x26; Gekalibreerde opbrengstgegevens</p></figcaption></figure>

De uitvoermap van de gelijkenheidsvergelijking staat hieronder als screenshot.

Statistisch gezien tonen een gemiddelde van 0,791 en een mediaan van 0,799 aan dat <mark style="color:standaard;background-color:yellow;">de maisopbrengsten van 2024 grotendeels lijken op die van 2022</mark>, hoewel gebieden tot 0,413 variabiliteit aangeven. Een standaarddeviatie van 0,115 bevestigt <mark style="color:standaard;background-color:yellow;">enkele verschillen over het perceel</mark>.

Agronomisch gezien, <mark style="color:standaard;background-color:yellow;">consistente patronen suggereren stabiele omstandigheden en effectief beheer over de tijd</mark>. Echter, gelokaliseerde <mark style="color:standaard;background-color:yellow;">zones met lagere gelijkenis kunnen gerichte aanpassingen vereisen om toekomstige opbrengstprestaties te verbeteren</mark>.

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FhOWLFRX43inp21kga5y9%2Fimage.png?alt=media&#x26;token=308de900-e22a-4330-b517-a88ca89c5012" alt=""><figcaption><p>Vergelijking opbrengstgelijkenis: Mais 2022 vs Mais 2024</p></figcaption></figure>

## **Synthetische vs reële opbrengstdataset (2023** Koolzaad)

In dit scenario beginnen we met de ruwe opbrengstdataset van het koolzaadseizoen 2023 en een synthetisch gegenereerde opbrengstdataset voor hetzelfde gewas en hetzelfde jaar 2023. <mark style="color:standaard;background-color:yellow;">Het doel is de ruimtelijke nauwkeurigheid van reële versus synthetische opbrengst te beoordelen, wat een manier biedt om niet-gedocumenteerde gegevens aan te vullen, gaten in opbrengstgegevens aan te pakken en anomalieën te corrigeren met synthetische waarden</mark>. De reële opbrengstdataset bevat problemen zoals abnormaal hoge of lage metingen, kruisende passes, gebogen trajecten en nulmetingen, wat allemaal wijst op de noodzaak van sensorrecalibratie.

Na het toepassen van GeoPard’s [Opschoning & Kalibratie](https://docs.geopard.tech/geopard-tutorials/nl/agronomie/opbrengstkalibratie-en-opschoning) op de reële opbrengstgegevens en het genereren van [Synthetische opbrengst](https://docs.geopard.tech/geopard-tutorials/nl/agronomie/synthetische-opbrengstkaart) voor koolzaad, kunnen we een zinvolle vergelijking van hun gelijkenis starten.

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwkCRiie2suhom6bxWKCJ%2Fimage.png?alt=media&#x26;token=f4752a43-55e2-431c-a667-8363c8f742c6" alt=""><figcaption><p>Koolzaad 2023: Oorsprong vs Opgeschoonde &#x26; Gekalibreerde opbrengstgegevens</p></figcaption></figure>

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fz427malsrdHAQOCNjQyh%2Fimage.png?alt=media&#x26;token=26a63983-2a7f-48b2-bfc9-3e40a883582a" alt=""><figcaption><p>Koolzaad synthetische opbrengst 2023</p></figcaption></figure>

De uitvoermap van de gelijkenheidsvergelijking staat hieronder als screenshot.

Statistisch gezien duiden de hoge gemiddelde (0,889) en mediaan (0,904) scores erop dat <mark style="color:standaard;background-color:yellow;">over het algemeen de synthetische opbrengstdataset goed overeenkomt met de ruimtelijke patronen van de reële koolzaadopbrengst 2023</mark>. Hoewel één gebied daalt tot 0,291, suggereren de lage variatie (0,006) en bescheiden standaarddeviatie (0,08) dat <mark style="color:standaard;background-color:yellow;">de meeste delen van het perceel dicht op elkaar aansluiten tussen de reële en synthetische datasets, met zeer weinig uitschieters</mark>.

Agronomisch gezien impliceert deze sterke gelijkenis dat <mark style="color:standaard;background-color:yellow;">de synthetische opbrengstgegevens kunnen dienen als een betrouwbare proxy voor reële veldomstandigheden</mark>, wat het vertrouwen versterkt in het gebruik van gemodelleerde scenario’s om beslissingen te sturen. <mark style="color:standaard;background-color:yellow;">De agronomische praktijk die in de reële opbrengstgegevens wordt weerspiegeld, wordt goed vastgelegd door het synthetische opbrengstmodel</mark>, waardoor beter onderbouwde en consistentere planning voor toekomstige beheersstrategieën mogelijk wordt.

<figure><img src="https://3615228694-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FZT4vMwtGPgMFsmWAsIb4%2Fimage.png?alt=media&#x26;token=bf195514-380e-43fb-bbee-5922dd92b769" alt=""><figcaption><p>Vergelijking opbrengstgelijkenis koolzaad: Werkelijk 2023 vs Synthetisch 2023</p></figcaption></figure>
