# Ertragsdatensätze vergleichen

## Kontext

Moderne landwirtschaftliche Entscheidungsprozesse basieren stark auf Ertragsdatensätzen, die gesammelte Erträge darstellen und einen großen Teil des Einkommens der Betriebsleiter widerspiegeln. Diese Datensätze müssen genau und von hoher Qualität sein, um Entscheidungen zur Einsatzsteuerung zu informieren und zukünftige Pflanz- und Düngestrategien zu optimieren.

Ertragsdaten werden typischerweise von Erntemaschinen erfasst, doch rohe Messwerte sind oft unvollständig, enthalten Fehler oder müssen kalibriert werden, um Sensorinkonsistenzen und variable Feldbedingungen auszugleichen. Um diese Herausforderungen zu bewältigen, wenden Fachleute üblicherweise Bereinigungs-, Kalibrierungs- und Methoden zur synthetischen Datensatzgenerierung an, um verlässliche, vergleichbare Ertragsdaten zu erzeugen.

Beides[ Ertragsbereinigung & Kalibrierung](https://docs.geopard.tech/geopard-tutorials/de/agronomie/ertragskalibrierung-und-bereinigung) und [Synthetische Wiederherstellung von Ertragsdaten](https://docs.geopard.tech/geopard-tutorials/de/agronomie/synthetische-ertragskarte) werden von GeoPard unterstützt.

<mark style="color:Standard;background-color:yellow;">Der Vergleich von Ertragsdatensätzen aus verschiedenen Erntejahren liefert wertvolle Erkenntnisse, hilft bei der Validierung von Managementmaßnahmen, bestätigt die Sensorgenauigkeit und verbessert Strategien für kommende Saisonperioden.</mark> Solche Vergleiche leiten außerdem die Verfeinerung von Dünge- und Aussaatvorgaben an, sodass jede Entscheidung auf vertrauenswürdigen Informationen beruht.

## Vergleichsansatz (unter Verwendung der Ähnlichkeitsgleichung)

Um Ertragsdatensätze quantitativ zu vergleichen, nutzen wir eine vorab gespeicherte Gleichung namens <mark style="color:Standard;background-color:yellow;">Räumliche Korrelationsanalyse (Ähnlichkeit von Datenlayern)</mark> die die Ähnlichkeit zwischen ertragsbezogenen Attributen von Ertragsdatensätzen auf räumlicher Basis misst.

Diese Gleichung weist einen Ähnlichkeitswert zu, der angibt, wie eng ein Datensatz in räumlichem Muster und Werteverteilung einem anderen entspricht.&#x20;

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F9O2baZdOVQWoiJrJqPdv%2Fimage.png?alt=media&#x26;token=4014a70b-804e-46fa-8206-19f58cc345cd" alt=""><figcaption><p>Suche nach der vorhandenen Gleichung zur Ähnlichkeit von Datenlayern</p></figcaption></figure>

<mark style="color:Standard;background-color:yellow;">Die Ähnlichkeitswerte reichen von 0 bis 1, wobei 0 keine Übereinstimmung und 1 eine 100%-ige räumliche Wertübereinstimmung anzeigt</mark>Mit anderen Worten: Je näher der Ähnlichkeitswert an 1 liegt, desto ähnlicher sind die Ertragsattribute.&#x20;

## **Realer Ertragsdatensatz (2015** Sojabohne **gegen 2018** Sojabohn&#x65;**)**

In diesem Fall beginnen wir mit rohen Ertragsdaten, die während zweier unterschiedlicher Vegetationsperioden 2015 und 2018 für dieselbe Kultur Sojabohne erhoben wurden. Die Anfangsdatensätze enthalten ungewöhnlich hohe und niedrige Werte, insbesondere am Anfang/Ende der Mähdrescherdurchgänge, und die Daten erfordern eine leichte Rekalibrierung.

Nach der Anwendung von GeoPards Bereinigungs- und Kalibrierungswerkzeugen ist der resultierende Datensatz gleichmäßiger, konsistenter und leichter zu interpretieren.

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FDTbHLvB354jBMO3fub2W%2Fimage.png?alt=media&#x26;token=6ca5f428-021b-453d-b6c7-330038294e0c" alt=""><figcaption><p>Sojabohne 2015: Ursprung vs Bereinigte &#x26; Kalibrierte Ertragsdaten</p></figcaption></figure>

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FaiDl2niPiQyUwQ6kDTdW%2Fimage.png?alt=media&#x26;token=7bb1ccdb-b41c-4590-b47f-a803cdbe8e01" alt=""><figcaption><p>Sojabohne 2018: Ursprung vs Bereinigte &#x26; Kalibrierte Ertragsdaten</p></figcaption></figure>

Die Ausführungs-Map der Ähnlichkeitsgleichung ist unten als Screenshot dargestellt.

Aus statistischer Sicht zeigt sie einen hohen Mittelwert (0,869) und Median (0,876), was darauf hinweist, dass <mark style="color:Standard;background-color:yellow;">die Ertragsmuster der Sojabohne 2018 denen von 2015 stark ähneln</mark>Während einige Bereiche bis auf 0,599 fallen, bestätigen die geringe Varianz (0,005) und die moderate Standardabweichung (0,073) <mark style="color:Standard;background-color:yellow;">eine insgesamt hohe Konsistenz</mark>.&#x20;

Aus agronomischer Sicht <mark style="color:Standard;background-color:yellow;">weist diese Stabilität darauf hin, dass die zugrunde liegenden Feldbedingungen und die Reaktion auf Managementmaßnahmen weitgehend unverändert geblieben sind</mark>.

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FAyZjM18FRfT03KXUX2yW%2Fimage.png?alt=media&#x26;token=d48c86e2-0aa0-4eb4-b626-29e645399a77" alt=""><figcaption><p>Vergleich der Ertragsähnlichkeit: Sojabohne 2015 vs Sojabohne 2018</p></figcaption></figure>

## **Realer Ertragsdatensatz (2022** Mais **gegen 2024** Mai&#x73;**)**

In diesem Szenario starten wir mit rohen Ertragsdaten aus zwei Maisperioden — 2022 und 2024. Die Anfangsdatensätze enthalten Anomalien wie ungewöhnlich hohe oder niedrige Messwerte, Querfahrten und gekrümmte Fahrspuren, was auf die Notwendigkeit einer Sensorkalibrierung hinweist.&#x20;

Nach der Anwendung von GeoPards Bereinigungs- und Kalibrierungswerkzeugen werden die Datensätze verlässlicher, sodass automatisierte Analysen und fundierte Entscheidungen möglich werden.

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FrCMUu65DPZjqVmuvoUvM%2Fimage.png?alt=media&#x26;token=00c11d5e-70b7-49ea-9943-0e4ac5b2b990" alt=""><figcaption><p>Mais 2022: Ursprung vs Bereinigte &#x26; Kalibrierte Ertragsdaten</p></figcaption></figure>

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Ff53cGgbe2gWO4LbW2OUN%2Fimage.png?alt=media&#x26;token=f48408bd-662e-44f8-9fca-c334b23324b8" alt=""><figcaption><p>Mais 2024: Ursprung vs Bereinigte &#x26; Kalibrierte Ertragsdaten</p></figcaption></figure>

Die Ausführungs-Map der Ähnlichkeitsgleichung ist unten als Screenshot dargestellt.

Aus statistischer Sicht zeigen ein Mittelwert von 0,791 und ein Median von 0,799, dass <mark style="color:Standard;background-color:yellow;">die Maiserträge 2024 weitgehend denen von 2022 ähneln</mark>, obwohl Bereiche bis auf 0,413 Variabilität anzeigen. Eine Standardabweichung von 0,115 bestätigt <mark style="color:Standard;background-color:yellow;">einige Unterschiede über das Feld hinweg</mark>.

Aus agronomischer Sicht <mark style="color:Standard;background-color:yellow;">konsistente Muster deuten auf stabile Bedingungen und effektives Management über die Zeit hin</mark>Jedoch können lokal <mark style="color:Standard;background-color:yellow;">niedriger-ähnliche Zonen gezielte Anpassungen erfordern, um die zukünftige Ertragsleistung zu verbessern</mark>.

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FhOWLFRX43inp21kga5y9%2Fimage.png?alt=media&#x26;token=308de900-e22a-4330-b517-a88ca89c5012" alt=""><figcaption><p>Vergleich der Ertragsähnlichkeit: Mais 2022 vs Mais 2024</p></figcaption></figure>

## **Synthetisch vs Realer Ertragsdatensatz (2023** Raps)

In diesem Szenario beginnen wir mit einem rohen Ertragsdatensatz aus der Rapskampagne 2023 und einem synthetisch erzeugten Ertragsdatensatz für dieselbe Kultur und dasselbe Jahr 2023. <mark style="color:Standard;background-color:yellow;">Das Ziel ist, die räumliche Genauigkeit von realen gegenüber synthetischen Erträgen zu bewerten, um nicht protokollierte Daten zu ergänzen, Lücken in den Ertragsdaten zu schließen und Anomalien mithilfe synthetischer Werte zu korrigieren</mark>Der reale Ertragsdatensatz enthält Probleme wie ungewöhnlich hohe oder niedrige Messwerte, Querfahrten, gekrümmte Fahrspuren und Null-Durchgänge, die alle auf die Notwendigkeit einer Sensorkalibrierung hinweisen.

Nach der Anwendung von GeoPards [Bereinigung & Kalibrierung](https://docs.geopard.tech/geopard-tutorials/de/agronomie/ertragskalibrierung-und-bereinigung) an den realen Ertragsdaten und der Generierung von [Synthetischem Ertrag](https://docs.geopard.tech/geopard-tutorials/de/agronomie/synthetische-ertragskarte) für Raps können wir einen aussagekräftigen Vergleich ihrer Ähnlichkeit beginnen.

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwkCRiie2suhom6bxWKCJ%2Fimage.png?alt=media&#x26;token=f4752a43-55e2-431c-a667-8363c8f742c6" alt=""><figcaption><p>Raps 2023: Ursprung vs Bereinigte &#x26; Kalibrierte Ertragsdaten</p></figcaption></figure>

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fz427malsrdHAQOCNjQyh%2Fimage.png?alt=media&#x26;token=26a63983-2a7f-48b2-bfc9-3e40a883582a" alt=""><figcaption><p>Raps Synthetischer Ertrag 2023</p></figcaption></figure>

Die Ausführungs-Map der Ähnlichkeitsgleichung ist unten als Screenshot dargestellt.

Aus statistischer Sicht deuten der hohe Mittelwert (0,889) und der Median (0,904) darauf hin, dass <mark style="color:Standard;background-color:yellow;">der synthetische Ertragsdatensatz insgesamt die räumlichen Muster des realen Raps-Ertrags 2023 gut abbildet</mark>Während ein Bereich bis auf 0,291 absinkt, deuten die geringe Varianz (0,006) und die moderate Standardabweichung (0,08) darauf hin, dass <mark style="color:Standard;background-color:yellow;">die meisten Feldbereiche zwischen den realen und synthetischen Datensätzen eng übereinstimmen, mit sehr wenigen Ausreißern</mark>.

Aus agronomischer Sicht impliziert diese starke Ähnlichkeit, dass <mark style="color:Standard;background-color:yellow;">die synthetischen Ertragsdaten als verlässlicher Stellvertreter für reale Feldbedingungen dienen können</mark>, was das Vertrauen in die Verwendung modellierter Szenarien zur Entscheidungsfindung stärkt. <mark style="color:Standard;background-color:yellow;">Die agronomischen Praktiken, die sich in den realen Ertragsdaten widerspiegeln, werden vom synthetischen Ertragsmodell gut erfasst</mark>, was eine fundiertere und konsistentere Planung zukünftiger Managementstrategien ermöglicht.

<figure><img src="https://1347797700-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FZT4vMwtGPgMFsmWAsIb4%2Fimage.png?alt=media&#x26;token=bf195514-380e-43fb-bbee-5922dd92b769" alt=""><figcaption><p>Vergleich der Ertragsähnlichkeit Raps: Real 2023 vs Synthetisch 2023</p></figcaption></figure>
