# Comparer les données de scanner de sol entre les années

Les scanners de sol sont des outils essentiels pour l'agriculture de précision, permettant la collecte de données à haute résolution sur les propriétés du sol telles que l'humidité, la matière organique et les niveaux de nutriments. Comparer deux jeux de données de scanners de sol est crucial pour comprendre les changements au fil du temps, valider différentes méthodes de numérisation ou étalonner de nouveaux appareils. Cet article explore diverses approches mathématiques pour mesurer l'écart entre deux jeux de données de scanners de sol, fournissant des informations exploitables pour les chercheurs et les agronomes.

### Comprendre l'écart dans les données des scanners de sol

L'écart entre deux jeux de données de scanners de sol renvoie aux différences des valeurs mesurées aux mêmes emplacements, qui peuvent provenir de variations des conditions de mesure, du calibrage des capteurs ou de la dynamique du sol. Les types d'écarts les plus courants incluent :

* Différences absolues : soustraction directe des valeurs entre les jeux de données.
* Différences relatives : comparaison basée sur l'amplitude des mesures.
* Indicateurs d'erreur : mesures statistiques comme l'erreur absolue moyenne (MAE) et la différence normalisée.

Deux jeux de données de scanners de sol avec potassium pour 2024 et 2025 ont été choisis.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FC2QduX7YR6gTjWUZGqMX%2Fimage.png?alt=media&#x26;token=f1609570-7428-4883-b589-963d4d8e2767" alt=""><figcaption><p>Jeux de données initiaux des scanners de sol</p></figcaption></figure>

### Choisir la bonne méthode d'écart

| Méthode                                | Idéal pour                                                       |
| -------------------------------------- | ---------------------------------------------------------------- |
| Différence directe                     | Visualisation simple des changements positifs/négatifs           |
| Différence relative                    | Comparer des jeux de données avec des échelles différentes       |
| Différence normalisée                  | Analyse standardisée entre différents jeux de données            |
| Écart relatif                          | Différences proportionnelles, utile pour l'analyse des tendances |
| Erreur absolue moyenne (MAE) par pixel | Identifier les zones avec de grandes différences absolues        |

### Calcul de la différence directe

Cette méthode de différence directe soustrait simplement un jeu de données de l'autre pour visualiser directement les changements des attributs du sol.

L'utilisation de `geopard.calculate_difference(dataset_1, dataset_2)` avec l'explication des paramètres est documentée [ici](https://docs.geopard.tech/geopard-tutorials/fr/visite-du-produit-application-web/analyses-basees-sur-des-equations/catalogue-de-fonctions-personnalisees#calculate_difference).

Avantages :

* Montre clairement les changements positifs et négatifs.
* Facile à interpréter et à visualiser.

Inconvénients :

* Les valeurs de différence peuvent être difficiles à comparer si les jeux de données ont des échelles différentes.
* Une forte variation peut dominer l'interprétation.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwgA9AsI1dfinjjQwJ8C9%2Fimage.png?alt=media&#x26;token=20e684fd-02fb-4cbb-9c9d-b34aa62ed38f" alt=""><figcaption><p>Calcul de la différence directe</p></figcaption></figure>

### Calcul de la différence relative

La méthode de différence relative calcule le changement en pourcentage entre les jeux de données basé sur le second jeu, offrant une autre perspective sur l'écart.

L'utilisation de `geopard.calculate_relative_difference(dataset_1, dataset_2)` avec l'explication des paramètres est documentée [ici](https://docs.geopard.tech/geopard-tutorials/fr/visite-du-produit-application-web/analyses-basees-sur-des-equations/catalogue-de-fonctions-personnalisees#calculate_relative_difference).

Avantages :

* Bon pour comprendre dans quelle mesure un jeu de données a changé par rapport à un autre.
* Normalise les différences à travers des amplitudes variables.

Inconvénients :

* Peut devenir instable lorsque les valeurs du second jeu sont proches de zéro.
* Moins intuitif lorsque les différences absolues sont importantes.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fdvu0tLmgObpZ3WsvGrKQ%2Fimage.png?alt=media&#x26;token=fbe018a8-a8dc-421f-9fe9-19b78869b18f" alt=""><figcaption><p>Calcul de la différence relative</p></figcaption></figure>

### Calcul de la différence normalisée

La méthode de différence normalisée normalise les jeux de données par leur valeur maximale globale avant de calculer les différences, assurant que les variations sont comparables entre différentes échelles.

L'utilisation de `geopard.calculate_normalized_difference(dataset_1, dataset_2)` avec l'explication des paramètres est documentée [ici](https://docs.geopard.tech/geopard-tutorials/fr/visite-du-produit-application-web/analyses-basees-sur-des-equations/catalogue-de-fonctions-personnalisees#calculate_normalized_difference).

Avantages :

* Efficace pour les jeux de données avec des plages dynamiques différentes.
* Réduit l'impact des valeurs extrêmes.

Inconvénients :

* Les petites variations peuvent sembler exagérées si elles ne sont pas correctement mises à l'échelle.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FSfC0I2ieL3Tsb7zP0wlg%2Fimage.png?alt=media&#x26;token=2d0c3bc9-5c7d-4fb7-971f-2ea23d6b8402" alt=""><figcaption><p>Calcul de la différence normalisée</p></figcaption></figure>

### Écart relatif par pixel

La méthode d'écart relatif calcule la déviation en pourcentage par rapport au premier jeu de données. Elle aide à comprendre les différences proportionnelles plutôt que les différences absolues.

L'utilisation de `geopard.calculate_per_pixel_relative_deviation(dataset_1, dataset_2)` avec l'explication des paramètres est documentée [ici](https://docs.geopard.tech/geopard-tutorials/fr/visite-du-produit-application-web/analyses-basees-sur-des-equations/catalogue-de-fonctions-personnalisees#calculate_per_pixel_relative_deviation).

Avantages :

* Utile lors de la comparaison de jeux de données ayant des échelles différentes.
* Exprime la déviation dans un format pourcentage interprétable.

Inconvénients :

* Peut induire en erreur si les valeurs d'origine sont très faibles.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FdAxMNaTGC9JR857B6IdN%2Fimage.png?alt=media&#x26;token=1d81e310-a29a-4963-81ad-24b7d24c6e87" alt=""><figcaption><p>Écart relatif par pixel</p></figcaption></figure>

### Erreur absolue moyenne (MAE) par pixel

La méthode de l'erreur absolue moyenne (MAE) mesure les différences absolues entre les valeurs correspondantes dans deux jeux de données. Elle fournit une vue claire des endroits où se produisent les plus grands écarts.

L'utilisation de `geopard.calculate_per_pixel_mae(dataset_1, dataset_2)` avec l'explication des paramètres est documentée [ici](https://docs.geopard.tech/geopard-tutorials/fr/visite-du-produit-application-web/analyses-basees-sur-des-equations/catalogue-de-fonctions-personnalisees#calculate_per_pixel_mae).

Avantages :

* Simple et intuitive.
* Met en évidence clairement les grandes différences.
* Fonctionne bien pour les jeux de données ayant des échelles similaires.

Inconvénients :

* Ne montre pas la direction de la différence (c.-à-d. changement positif ou négatif).
* Sensible aux valeurs aberrantes.

<figure><img src="https://690567185-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F2vU1J5nHGE6WVdGdyoOh%2Fimage.png?alt=media&#x26;token=79fcb18b-0a60-4dbe-8f9a-900d28ccb0e8" alt=""><figcaption><p>Erreur absolue moyenne (MAE) par pixel</p></figcaption></figure>

### Conclusion

Comparer des jeux de données de scanners de sol nécessite une variété d'approches mathématiques pour extraire des différences significatives. Qu'il s'agisse d'utiliser des mesures absolues comme la MAE, des écarts relatifs ou des comparaisons normalisées, le choix de la méthode dépend du cas d'utilisation. En tirant parti de ces techniques, les agronomes et les chercheurs peuvent améliorer l'analyse des sols, détecter les variations de parcelles et optimiser les flux de travail d'agriculture de précision.
