# Comparer des jeux de données de rendement

## Contexte

La prise de décision agricole moderne repose fortement sur les jeux de données de rendement, qui représentent les rendements collectés et constituent une part importante des revenus des exploitants. Ces jeux de données doivent être précis et de haute qualité pour orienter la gestion des intrants et optimiser les stratégies de semis et de fertilisation futures.

Les données de rendement sont généralement collectées par les équipements de récolte, mais les relevés bruts sont souvent incomplets, comportent des erreurs ou nécessitent un calibrage pour corriger les incohérences des capteurs et les conditions variables du champ. Pour surmonter ces défis, les professionnels utilisent couramment des techniques de nettoyage, de calibrage et de génération de jeux de données synthétiques afin de produire des données de rendement fiables et comparables.

Les deux[ Nettoyage et calibrage des rendements](https://docs.geopard.tech/geopard-tutorials/fr/agronomie/calibration-et-nettoyage-du-rendement) et [Restauration synthétique des données de rendement](https://docs.geopard.tech/geopard-tutorials/fr/agronomie/carte-de-rendement-synthetique) sont pris en charge par GeoPard.

<mark style="color:par défaut;background-color:yellow;">Comparer des jeux de données de rendement issus de différentes années culturales fournit des informations précieuses, aidant à valider les pratiques de gestion, confirmer la précision des capteurs et améliorer les stratégies pour les saisons à venir.</mark> Ces comparaisons guident également l’affinement des prescriptions d’engrais et de semis, en veillant à ce que chaque décision repose sur des informations fiables.

## Approche de comparaison (utilisant l’équation de similarité)

Pour comparer quantitativement des jeux de données de rendement, nous utilisons une équation préenregistrée nommée <mark style="color:par défaut;background-color:yellow;">Analyse de corrélation spatiale (similarité des couches de données)</mark> qui mesure la similarité entre les attributs associés au rendement des jeux de données de rendement sur une base spatiale.

Cette équation attribue un score de similarité, indiquant dans quelle mesure un jeu de données correspond à un autre en termes de motif spatial et de répartition des valeurs.&#x20;

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F9O2baZdOVQWoiJrJqPdv%2Fimage.png?alt=media&#x26;token=4014a70b-804e-46fa-8206-19f58cc345cd" alt=""><figcaption><p>Rechercher l'équation existante de similarité des couches de données</p></figcaption></figure>

<mark style="color:par défaut;background-color:yellow;">Les valeurs de similarité varient de 0 à 1, où 0 indique aucune correspondance et 1 signifie une correspondance spatiale des valeurs à 100 %</mark>. Autrement dit, plus le score de similarité est proche de 1, plus les attributs de rendement sont similaires.&#x20;

## **Jeu de données de rendement réel (2015** Soja **vs 2018** Soj&#x61;**)**

Dans ce cas, nous commençons par des données de rendement brutes collectées au cours de deux saisons culturales différentes, 2015 et 2018, avec la même culture, le soja. Les jeux de données initiaux contiennent des emplacements anormalement hauts ou bas, en particulier au début/à la fin des passages de la moissonneuse, et les données nécessitent un léger recalibrage.

Après avoir appliqué les outils de nettoyage et de calibrage de GeoPard, le jeu de données résultant est plus uniforme, cohérent et plus facile à interpréter.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FDTbHLvB354jBMO3fub2W%2Fimage.png?alt=media&#x26;token=6ca5f428-021b-453d-b6c7-330038294e0c" alt=""><figcaption><p>Soja 2015 : Données de rendement d’origine vs nettoyées et calibrées</p></figcaption></figure>

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FaiDl2niPiQyUwQ6kDTdW%2Fimage.png?alt=media&#x26;token=7bb1ccdb-b41c-4590-b47f-a803cdbe8e01" alt=""><figcaption><p>Soja 2018 : Données de rendement d’origine vs nettoyées et calibrées</p></figcaption></figure>

La carte d’exécution de l’équation de similarité est présentée ci-dessous sous forme de capture d’écran.

D’un point de vue statistique, elle montre une moyenne élevée (0,869) et une médiane (0,876), indiquant que <mark style="color:par défaut;background-color:yellow;">les schémas de rendement du soja en 2018 ressemblent fortement à ceux de 2015</mark>. Bien que certaines zones descendent jusqu’à 0,599, la faible variation (0,005) et l’écart type modeste (0,073) confirment <mark style="color:par défaut;background-color:yellow;">une cohérence globale</mark>.&#x20;

D’un point de vue agronomique, <mark style="color:par défaut;background-color:yellow;">cette stabilité suggère que les conditions sous-jacentes du champ et les réponses aux pratiques de gestion sont restées en grande partie inchangées</mark>.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FAyZjM18FRfT03KXUX2yW%2Fimage.png?alt=media&#x26;token=d48c86e2-0aa0-4eb4-b626-29e645399a77" alt=""><figcaption><p>Comparaison de la similarité des rendements : Soja 2015 vs Soja 2018</p></figcaption></figure>

## **Jeu de données de rendement réel (2022** Maïs **vs 2024** Maï&#x73;**)**

Dans ce scénario, nous partons de données de rendement brutes de deux saisons de maïs — 2022 et 2024. Les jeux de données initiaux contiennent des anomalies telles que des relevés anormalement élevés ou faibles, des passages croisés et des trajectoires courbes, indiquant la nécessité d’un recalibrage des capteurs.&#x20;

Après avoir appliqué les outils de nettoyage et de calibrage de GeoPard, les jeux de données deviennent plus fiables, permettant une analyse automatisée et une prise de décision éclairée.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FrCMUu65DPZjqVmuvoUvM%2Fimage.png?alt=media&#x26;token=00c11d5e-70b7-49ea-9943-0e4ac5b2b990" alt=""><figcaption><p>Maïs 2022 : Données de rendement d’origine vs nettoyées et calibrées</p></figcaption></figure>

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Ff53cGgbe2gWO4LbW2OUN%2Fimage.png?alt=media&#x26;token=f48408bd-662e-44f8-9fca-c334b23324b8" alt=""><figcaption><p>Maïs 2024 : Données de rendement d’origine vs nettoyées et calibrées</p></figcaption></figure>

La carte d’exécution de l’équation de similarité est présentée ci-dessous sous forme de capture d’écran.

D’un point de vue statistique, une moyenne de 0,791 et une médiane de 0,799 montrent que <mark style="color:par défaut;background-color:yellow;">les rendements du maïs en 2024 ressemblent en grande partie à ceux de 2022</mark>, bien que des zones aussi basses que 0,413 indiquent une variabilité. Un écart type de 0,115 confirme <mark style="color:par défaut;background-color:yellow;">certaines différences à travers le champ</mark>.

D’un point de vue agronomique, <mark style="color:par défaut;background-color:yellow;">des schémas cohérents suggèrent des conditions stables et une gestion efficace au fil du temps</mark>. Cependant, des zones localisées <mark style="color:par défaut;background-color:yellow;">à similarité plus faible peuvent nécessiter des ajustements ciblés pour améliorer les performances de rendement futures</mark>.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FhOWLFRX43inp21kga5y9%2Fimage.png?alt=media&#x26;token=308de900-e22a-4330-b517-a88ca89c5012" alt=""><figcaption><p>Comparaison de la similarité des rendements : Maïs 2022 vs Maïs 2024</p></figcaption></figure>

## **Jeu de données de rendement synthétique vs réel (2023** Colza)

Dans ce scénario, nous commençons par un jeu de données de rendement brut de la saison 2023 de colza et un jeu de données de rendement généré synthétiquement pour la même culture et la même année 2023. <mark style="color:par défaut;background-color:yellow;">L’objectif est d’évaluer la précision spatiale du rendement réel par rapport au rendement synthétique, fournissant une voie pour combler les données non enregistrées, traiter les lacunes dans les données de rendement et corriger les anomalies en utilisant des valeurs synthétiques</mark>. Le jeu de données de rendement réel contient des problèmes tels que des relevés anormalement élevés ou faibles, des passages croisés, des trajectoires courbes et des passages à zéro, indiquant tous la nécessité d’un recalibrage des capteurs.

Après avoir appliqué les outils de [Nettoyage et calibrage](https://docs.geopard.tech/geopard-tutorials/fr/agronomie/calibration-et-nettoyage-du-rendement) aux données de rendement réelles et généré [Rendement synthétique](https://docs.geopard.tech/geopard-tutorials/fr/agronomie/carte-de-rendement-synthetique) pour le colza, nous pouvons initier une comparaison significative de leur similarité.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwkCRiie2suhom6bxWKCJ%2Fimage.png?alt=media&#x26;token=f4752a43-55e2-431c-a667-8363c8f742c6" alt=""><figcaption><p>Colza 2023 : Données de rendement d’origine vs nettoyées et calibrées</p></figcaption></figure>

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fz427malsrdHAQOCNjQyh%2Fimage.png?alt=media&#x26;token=26a63983-2a7f-48b2-bfc9-3e40a883582a" alt=""><figcaption><p>Rendement synthétique du colza 2023</p></figcaption></figure>

La carte d’exécution de l’équation de similarité est présentée ci-dessous sous forme de capture d’écran.

D’un point de vue statistique, la moyenne élevée (0,889) et la médiane (0,904) indiquent que, <mark style="color:par défaut;background-color:yellow;">dans l’ensemble, le jeu de données de rendement synthétique correspond étroitement aux schémas spatiaux du rendement réel du colza 2023</mark>. Bien qu’une zone descende jusqu’à 0,291, la faible variation (0,006) et l’écart type modeste (0,08) suggèrent que <mark style="color:par défaut;background-color:yellow;">la plupart des parties du champ s’alignent étroitement entre les jeux de données réels et synthétiques, avec très peu d’exceptions</mark>.

D’un point de vue agronomique, cette forte similarité implique que <mark style="color:par défaut;background-color:yellow;">les données de rendement synthétiques peuvent servir de proxy fiable pour les conditions réelles du champ</mark>, renforçant la confiance dans l’utilisation de scénarios modélisés pour guider les décisions. <mark style="color:par défaut;background-color:yellow;">Les pratiques agronomiques reflétées dans les données de rendement réelles sont bien capturées par le modèle de rendement synthétique</mark>, permettant une planification plus informée et plus cohérente des stratégies de gestion futures.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FZT4vMwtGPgMFsmWAsIb4%2Fimage.png?alt=media&#x26;token=bf195514-380e-43fb-bbee-5922dd92b769" alt=""><figcaption><p>Comparaison de la similarité des rendements du colza : Réel 2023 vs Synthétique 2023</p></figcaption></figure>
