# Comparar datos de escáner de suelo entre años

Los escáneres de suelo son herramientas esenciales para la agricultura de precisión, que permiten la recopilación de datos de alta resolución sobre propiedades del suelo como humedad, materia orgánica y niveles de nutrientes. Comparar dos conjuntos de datos de escáneres de suelo es crucial para entender cambios a lo largo del tiempo, validar distintos métodos de escaneo o calibrar nuevos dispositivos. Este artículo explora varios enfoques matemáticos para medir la desviación entre dos conjuntos de datos de escáneres de suelo, proporcionando ideas prácticas para investigadores y agrónomos.

### Comprendiendo la desviación en los datos de escáneres de suelo

La desviación entre dos conjuntos de datos de escáneres de suelo se refiere a las diferencias en los valores medidos en las mismas ubicaciones, que pueden surgir debido a variaciones en las condiciones de medición, la calibración de los sensores o la dinámica del suelo. Los tipos de desviación más comunes incluyen:

* Diferencias absolutas: sustracción directa de valores entre conjuntos de datos.
* Diferencias relativas: comparación basada en la magnitud de las mediciones.
* Métricas de error: medidas estadísticas como el Error Medio Absoluto (MAE) y la Diferencia Normalizada.

Se eligieron dos conjuntos de datos de escáneres de suelo con potasio para 2024 y 2025.

<figure><img src="https://2708050521-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FC2QduX7YR6gTjWUZGqMX%2Fimage.png?alt=media&#x26;token=f1609570-7428-4883-b589-963d4d8e2767" alt=""><figcaption><p>Conjuntos de datos iniciales de escáneres de suelo</p></figcaption></figure>

### Elegir el método de desviación adecuado

| Método                               | Mejor para                                                      |
| ------------------------------------ | --------------------------------------------------------------- |
| Diferencia directa                   | Visualización simple de cambios positivos/negativos             |
| Diferencia relativa                  | Comparar conjuntos de datos con diferentes escalas              |
| Diferencia normalizada               | Análisis estandarizado entre distintos conjuntos de datos       |
| Desviación relativa                  | Diferencias proporcionales, útil para el análisis de tendencias |
| Error Medio Absoluto (MAE) por píxel | Identificar áreas con grandes diferencias absolutas             |

### Cálculo de diferencia directa

Este método de Diferencia Directa simplemente resta un conjunto de datos del otro para visualizar los cambios en los atributos del suelo de forma directa.

El uso de `geopard.calculate_difference(dataset_1, dataset_2)` con la explicación de parámetros está documentado [aquí](https://docs.geopard.tech/geopard-tutorials/esp/recorrido-del-producto-aplicacion-web/analisis-basados-en-ecuaciones/catalogo-de-funciones-personalizadas#calculate_difference).

Pros:

* Muestra claramente cambios positivos y negativos.
* Fácil de interpretar y visualizar.

Contras:

* Los valores de diferencia pueden ser difíciles de comparar si los conjuntos de datos tienen escalas diferentes.
* La alta variación puede dominar la interpretación.

<figure><img src="https://2708050521-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwgA9AsI1dfinjjQwJ8C9%2Fimage.png?alt=media&#x26;token=20e684fd-02fb-4cbb-9c9d-b34aa62ed38f" alt=""><figcaption><p>Cálculo de diferencia directa</p></figcaption></figure>

### Cálculo de diferencia relativa

El método de Diferencia Relativa calcula el cambio porcentual entre los conjuntos de datos basado en el segundo conjunto, ofreciendo otra perspectiva sobre la desviación.

El uso de `geopard.calculate_relative_difference(dataset_1, dataset_2)` con la explicación de parámetros está documentado [aquí](https://docs.geopard.tech/geopard-tutorials/esp/recorrido-del-producto-aplicacion-web/analisis-basados-en-ecuaciones/catalogo-de-funciones-personalizadas#calculate_relative_difference).

Pros:

* Bueno para entender cuánto ha cambiado un conjunto de datos en proporción a otro.
* Normaliza las diferencias a través de magnitudes variables.

Contras:

* Puede volverse inestable cuando los valores en el segundo conjunto de datos están cerca de cero.
* Menos intuitivo cuando las diferencias absolutas son importantes.

<figure><img src="https://2708050521-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fdvu0tLmgObpZ3WsvGrKQ%2Fimage.png?alt=media&#x26;token=fbe018a8-a8dc-421f-9fe9-19b78869b18f" alt=""><figcaption><p>Cálculo de diferencia relativa</p></figcaption></figure>

### Cálculo de diferencia normalizada

El método de Diferencia Normalizada normaliza los conjuntos de datos por su valor máximo global antes de calcular las diferencias, asegurando que las variaciones sean comparables entre distintas escalas.

El uso de `geopard.calculate_normalized_difference(dataset_1, dataset_2)` con la explicación de parámetros está documentado [aquí](https://docs.geopard.tech/geopard-tutorials/esp/recorrido-del-producto-aplicacion-web/analisis-basados-en-ecuaciones/catalogo-de-funciones-personalizadas#calculate_normalized_difference).

Pros:

* Eficaz para conjuntos de datos con diferentes rangos dinámicos.
* Reduce el impacto de valores extremos.

Contras:

* Pequeñas variaciones pueden parecer exageradas si no se escalan correctamente.

<figure><img src="https://2708050521-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FSfC0I2ieL3Tsb7zP0wlg%2Fimage.png?alt=media&#x26;token=2d0c3bc9-5c7d-4fb7-971f-2ea23d6b8402" alt=""><figcaption><p>Cálculo de diferencia normalizada</p></figcaption></figure>

### Desviación relativa por píxel

El método de Desviación Relativa calcula la desviación como un porcentaje relativo al primer conjunto de datos. Ayuda a entender diferencias proporcionales en lugar de diferencias absolutas.

El uso de `geopard.calculate_per_pixel_relative_deviation(dataset_1, dataset_2)` con la explicación de parámetros está documentado [aquí](https://docs.geopard.tech/geopard-tutorials/esp/recorrido-del-producto-aplicacion-web/analisis-basados-en-ecuaciones/catalogo-de-funciones-personalizadas#calculate_per_pixel_relative_deviation).

Pros:

* Útil al comparar conjuntos de datos con diferentes escalas.
* Expresa la desviación en un formato porcentual interpretable.

Contras:

* Puede ser engañoso si los valores originales son muy pequeños.

<figure><img src="https://2708050521-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FdAxMNaTGC9JR857B6IdN%2Fimage.png?alt=media&#x26;token=1d81e310-a29a-4963-81ad-24b7d24c6e87" alt=""><figcaption><p>Desviación relativa por píxel</p></figcaption></figure>

### Error Medio Absoluto (MAE) por píxel

El método de Error Medio Absoluto (MAE) mide las diferencias absolutas entre valores correspondientes en dos conjuntos de datos. Proporciona una visión clara de dónde ocurren las discrepancias más altas.

El uso de `geopard.calculate_per_pixel_mae(dataset_1, dataset_2)` con la explicación de parámetros está documentado [aquí](https://docs.geopard.tech/geopard-tutorials/esp/recorrido-del-producto-aplicacion-web/analisis-basados-en-ecuaciones/catalogo-de-funciones-personalizadas#calculate_per_pixel_mae).

Pros:

* Simple e intuitivo.
* Resalta claramente las grandes diferencias.
* Funciona bien para conjuntos de datos con escalas similares.

Contras:

* No muestra la dirección de la diferencia (es decir, cambio positivo o negativo).
* Sensibles a valores atípicos.

<figure><img src="https://2708050521-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F2vU1J5nHGE6WVdGdyoOh%2Fimage.png?alt=media&#x26;token=79fcb18b-0a60-4dbe-8f9a-900d28ccb0e8" alt=""><figcaption><p>Error Medio Absoluto (MAE) por píxel</p></figcaption></figure>

### Conclusión

Comparar conjuntos de datos de escáneres de suelo requiere una variedad de enfoques matemáticos para extraer diferencias significativas. Ya sea usando métricas absolutas como MAE, desviaciones relativas o comparaciones normalizadas, la selección del método correcto depende del caso de uso. Al aprovechar estas técnicas, los agrónomos e investigadores pueden mejorar el análisis del suelo, detectar variaciones en el campo y optimizar los flujos de trabajo de agricultura de precisión.
