# Sammenlign jordscanningsdata mellem år

Jordscannere er essentielle værktøjer til præcisionslandbrug, der gør det muligt at indsamle højtopløselige data om jordegenskaber som fugtighed, organisk materiale og næringsstofniveauer. At sammenligne to jordscannerdatasæt er afgørende for at forstå ændringer over tid, validere forskellige scanningsmetoder eller kalibrere nye enheder. Denne artikel gennemgår forskellige matematiske metoder til at måle afvigelse mellem to jordscannerdatasæt og giver håndgribelige indsigter til forskere og agronomer.

### Forståelse af afvigelse i jordscannerdatasæt

Afvigelsen mellem to jordscannerdatasæt henviser til forskellene i målte værdier på de samme lokaliteter, hvilket kan opstå på grund af variationer i måleforhold, sensorkalibrering eller jorddynamik. De mest almindelige typer af afvigelser inkluderer:

* Absolutte forskelle: Direkte subtraktion af værdier mellem datasæt.
* Relative forskelle: Sammenligning baseret på målingernes størrelsesorden.
* Fejlmål: Statistiske mål som Mean Absolute Error (MAE) og normaliseret differens.

To jordscannerdatasæt med kalium for 2024 og 2025 blev valgt.

<figure><img src="https://1581835146-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FC2QduX7YR6gTjWUZGqMX%2Fimage.png?alt=media&#x26;token=f1609570-7428-4883-b589-963d4d8e2767" alt=""><figcaption><p>Indledende jordscannerdatasæt</p></figcaption></figure>

### Valg af den rette afvigelsesmetode

| Metode                              | Bedst til                                               |
| ----------------------------------- | ------------------------------------------------------- |
| Direkte differens                   | Simpel visualisering af positive/negative ændringer     |
| Relativ forskel                     | Sammenligning af datasæt med forskellige skalaer        |
| Normaliseret differens              | Standardiseret analyse på tværs af forskellige datasæt  |
| Relativ afvigelse                   | Proportionale forskelle, nyttigt til trendanalyse       |
| Mean Absolute Error (MAE) per pixel | Identifikation af områder med store absolutte forskelle |

### Beregning af direkte differens

Denne direkte differensmetode trækker blot det ene datasæt fra det andet for direkte at visualisere ændringer i jordegenskaber.

Brugen af `geopard.calculate_difference(dataset_1, dataset_2)` med parameterforklaring er dokumenteret [her](https://docs.geopard.tech/geopard-tutorials/dnk/produktgennemgang-webapp/formelbaseret-analyse/katalog-over-brugerdefinerede-funktioner#calculate_difference).

Fordele:

* Viser tydeligt positive og negative ændringer.
* Let at fortolke og visualisere.

Ulemper:

* Differensværdier kan være svære at sammenligne, hvis datasæt har forskellige skalaer.
* Stor variation kan dominere fortolkningen.

<figure><img src="https://1581835146-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwgA9AsI1dfinjjQwJ8C9%2Fimage.png?alt=media&#x26;token=20e684fd-02fb-4cbb-9c9d-b34aa62ed38f" alt=""><figcaption><p>Beregning af direkte differens</p></figcaption></figure>

### Beregning af relativ forskel

Metoden Relativ forskel beregner procentvis ændring mellem datasættene baseret på det andet datasæt og tilbyder et andet perspektiv på afvigelse.

Brugen af `geopard.calculate_relative_difference(dataset_1, dataset_2)` med parameterforklaring er dokumenteret [her](https://docs.geopard.tech/geopard-tutorials/dnk/produktgennemgang-webapp/formelbaseret-analyse/katalog-over-brugerdefinerede-funktioner#calculate_relative_difference).

Fordele:

* God til at forstå, hvor meget et datasæt har ændret sig i forhold til et andet.
* Normaliserer forskelle på tværs af varierende størrelsesordener.

Ulemper:

* Kan blive ustabil, når værdier i det andet datasæt er tæt på nul.
* Mindre intuitiv, når absolutte forskelle er vigtige.

<figure><img src="https://1581835146-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fdvu0tLmgObpZ3WsvGrKQ%2Fimage.png?alt=media&#x26;token=fbe018a8-a8dc-421f-9fe9-19b78869b18f" alt=""><figcaption><p>Beregning af relativ forskel</p></figcaption></figure>

### Beregning af normaliseret differens

Metoden Normaliseret differens normaliserer datasættene ved deres globale maksimumværdi, før der beregnes forskelle, hvilket sikrer, at variationer kan sammenlignes på tværs af forskellige skalaer.

Brugen af `geopard.calculate_normalized_difference(dataset_1, dataset_2)` med parameterforklaring er dokumenteret [her](https://docs.geopard.tech/geopard-tutorials/dnk/produktgennemgang-webapp/formelbaseret-analyse/katalog-over-brugerdefinerede-funktioner#calculate_normalized_difference).

Fordele:

* Effektiv for datasæt med forskellige dynamiske intervaller.
* Reducerer påvirkningen fra ekstreme værdier.

Ulemper:

* Små variationer kan fremstå overdrevne, hvis ikke skaleret korrekt.

<figure><img src="https://1581835146-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FSfC0I2ieL3Tsb7zP0wlg%2Fimage.png?alt=media&#x26;token=2d0c3bc9-5c7d-4fb7-971f-2ea23d6b8402" alt=""><figcaption><p>Beregning af normaliseret differens</p></figcaption></figure>

### Relativ afvigelse per pixel

Metoden Relativ afvigelse beregner afvigelsen som en procent i forhold til det første datasæt. Den hjælper med at forstå proportionelle forskelle frem for absolutte forskelle.

Brugen af `geopard.calculate_per_pixel_relative_deviation(dataset_1, dataset_2)` med parameterforklaring er dokumenteret [her](https://docs.geopard.tech/geopard-tutorials/dnk/produktgennemgang-webapp/formelbaseret-analyse/katalog-over-brugerdefinerede-funktioner#calculate_per_pixel_relative_deviation).

Fordele:

* Nyttig ved sammenligning af datasæt med forskellige skalaer.
* Udtrykker afvigelsen i et fortolkeligt procentformat.

Ulemper:

* Kan være vildledende, hvis de oprindelige værdier er meget små.

<figure><img src="https://1581835146-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FdAxMNaTGC9JR857B6IdN%2Fimage.png?alt=media&#x26;token=1d81e310-a29a-4963-81ad-24b7d24c6e87" alt=""><figcaption><p>Relativ afvigelse per pixel</p></figcaption></figure>

### Mean Absolute Error (MAE) per pixel

Mean Absolute Error (MAE)-metoden måler de absolutte forskelle mellem tilsvarende værdier i to datasæt. Den giver et klart billede af, hvor de største uoverensstemmelser forekommer.

Brugen af `geopard.calculate_per_pixel_mae(dataset_1, dataset_2)` med parameterforklaring er dokumenteret [her](https://docs.geopard.tech/geopard-tutorials/dnk/produktgennemgang-webapp/formelbaseret-analyse/katalog-over-brugerdefinerede-funktioner#calculate_per_pixel_mae).

Fordele:

* Simpel og intuitiv.
* Fremhæver store forskelle tydeligt.
* Fungerer godt for datasæt med lignende skalaer.

Ulemper:

* Viser ikke retningen af forskellen (dvs. positiv eller negativ ændring).
* Følsom over for outliers.

<figure><img src="https://1581835146-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F2vU1J5nHGE6WVdGdyoOh%2Fimage.png?alt=media&#x26;token=79fcb18b-0a60-4dbe-8f9a-900d28ccb0e8" alt=""><figcaption><p>Mean Absolute Error (MAE) per pixel</p></figcaption></figure>

### Konklusion

Sammenligning af jordscannerdatasæt kræver en række matematiske tilgange for at udtrække meningsfulde forskelle. Uanset om man bruger absolutte mål som MAE, relative afvigelser eller normaliserede sammenligninger, afhænger valget af den rette metode af brugstilfældet. Ved at udnytte disse teknikker kan agronomer og forskere forbedre jordanalysen, opdage variationer i marken og optimere præcisionslandbrugsarbejdet.
