# Confronto dei dataset di resa

## Contesto

Il processo decisionale agricolo moderno si basa in larga misura sui dataset di rese, che rappresentano le rese raccolte e riflettono una porzione significativa del reddito dell'azienda. Questi dataset devono essere accurati e di alta qualità per informare le decisioni sulla gestione degli input e ottimizzare le strategie future di semina e fertilizzazione.

I dati di resa vengono generalmente raccolti dalle macchine di raccolta, tuttavia le letture grezze sono spesso incomplete, contengono errori o richiedono calibrazione per correggere incoerenze del sensore e condizioni variabili del campo. Per superare queste sfide, i professionisti utilizzano comunemente tecniche di pulizia, calibrazione e generazione sintetica di dataset per produrre dati di resa affidabili e confrontabili.

Entrambi[ Pulizia e calibrazione delle rese](https://docs.geopard.tech/geopard-tutorials/it/agronomia/calibrazione-e-pulizia-della-resa) e [Ripristino sintetico dei dati di resa](https://docs.geopard.tech/geopard-tutorials/it/agronomia/mappa-di-resa-sintetica) sono supportati da GeoPard.

<mark style="color:predefinito;background-color:yellow;">Confrontare dataset di resa di annate diverse fornisce approfondimenti preziosi, aiutando a validare le pratiche gestionali, confermare l'accuratezza dei sensori e migliorare le strategie per le stagioni successive.</mark> Questi confronti guidano anche il perfezionamento delle prescrizioni di fertilità e semina, garantendo che ogni decisione sia basata su informazioni affidabili.

## Approccio di confronto (utilizzando l'equazione di similarità)

Per confrontare quantitativamente i dataset di resa, utilizziamo un'equazione pre-salvata chiamata <mark style="color:predefinito;background-color:yellow;">Analisi di Correlazione Spaziale (Somiglianza tra Strati Dati)</mark> che misura la similarità tra gli attributi associati alla resa dei dataset su base spaziale.

Questa equazione assegna un punteggio di similarità, indicando quanto un dataset si avvicina a un altro nella distribuzione spaziale e dei valori.&#x20;

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F9O2baZdOVQWoiJrJqPdv%2Fimage.png?alt=media&#x26;token=4014a70b-804e-46fa-8206-19f58cc345cd" alt=""><figcaption><p>Cerca l'Equazione esistente per la Somiglianza tra Strati Dati</p></figcaption></figure>

<mark style="color:predefinito;background-color:yellow;">I valori di somiglianza variano da 0 a 1, dove 0 indica nessuna corrispondenza e 1 indica una corrispondenza spaziale del valore al 100%</mark>. In altre parole, più il punteggio di similarità è vicino a 1, più gli attributi di resa sono simili.&#x20;

## **Dataset di resa reale (2015** Soia **vs 2018** Soi&#x61;**)**

In questo caso, iniziamo con dati di resa grezzi raccolti durante due diverse stagioni di crescita, 2015 e 2018, con la stessa coltura: soia. I dataset iniziali contengono punti con valori anormalmente alti o bassi, soprattutto all'inizio/fine delle passate della mietitrebbia, e i dati necessitano di una lieve ricalibrazione.

Dopo l'applicazione degli strumenti di pulizia e calibrazione di GeoPard, il dataset risultante è più uniforme, coerente e più facile da interpretare.

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FDTbHLvB354jBMO3fub2W%2Fimage.png?alt=media&#x26;token=6ca5f428-021b-453d-b6c7-330038294e0c" alt=""><figcaption><p>Soia 2015: Dati di resa originali vs puliti e calibrati</p></figcaption></figure>

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FaiDl2niPiQyUwQ6kDTdW%2Fimage.png?alt=media&#x26;token=7bb1ccdb-b41c-4590-b47f-a803cdbe8e01" alt=""><figcaption><p>Soia 2018: Dati di resa originali vs puliti e calibrati</p></figcaption></figure>

La mappa di esecuzione dell'Equazione di Similarità è mostrata di seguito come screenshot.

Da un punto di vista statistico, mostra una media elevata (0,869) e una mediana (0,876), indicando che <mark style="color:predefinito;background-color:yellow;">i modelli di resa della soia del 2018 assomigliano fortemente a quelli del 2015</mark>. Sebbene alcune aree scendano fino a 0,599, la bassa variazione (0,005) e la modesta deviazione standard (0,073) confermano <mark style="color:predefinito;background-color:yellow;">la coerenza complessiva</mark>.&#x20;

Dal punto di vista agronomico, <mark style="color:predefinito;background-color:yellow;">questa stabilità suggerisce che le condizioni di base del campo e le risposte alle pratiche gestionali sono rimaste in gran parte invariate</mark>.

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FAyZjM18FRfT03KXUX2yW%2Fimage.png?alt=media&#x26;token=d48c86e2-0aa0-4eb4-b626-29e645399a77" alt=""><figcaption><p>Confronto di similarità delle rese: Soia 2015 vs Soia 2018</p></figcaption></figure>

## **Dataset di resa reale (2022** Mais **vs 2024** Mai&#x73;**)**

In questo scenario, partiamo dai dati di resa grezzi di due stagioni di mais — 2022 e 2024. I dataset iniziali contengono anomalie come letture anormalmente alte o basse, passate incrociate e traiettorie curve, indicando la necessità di ricalibrazione dei sensori.&#x20;

Dopo l'applicazione degli strumenti di pulizia e calibrazione di GeoPard, i dataset diventano più affidabili, consentendo analisi automatizzate e decisioni informate.

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FrCMUu65DPZjqVmuvoUvM%2Fimage.png?alt=media&#x26;token=00c11d5e-70b7-49ea-9943-0e4ac5b2b990" alt=""><figcaption><p>Mais 2022: Dati di resa originali vs puliti e calibrati</p></figcaption></figure>

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Ff53cGgbe2gWO4LbW2OUN%2Fimage.png?alt=media&#x26;token=f48408bd-662e-44f8-9fca-c334b23324b8" alt=""><figcaption><p>Mais 2024: Dati di resa originali vs puliti e calibrati</p></figcaption></figure>

La mappa di esecuzione dell'Equazione di Similarità è mostrata di seguito come screenshot.

Da un punto di vista statistico, una media di 0,791 e una mediana di 0,799 mostrano che <mark style="color:predefinito;background-color:yellow;">le rese di mais del 2024 somigliano in gran parte a quelle del 2022</mark>, sebbene aree con valori fino a 0,413 indichino variabilità. Una deviazione standard di 0,115 conferma <mark style="color:predefinito;background-color:yellow;">alcune differenze nel campo</mark>.

Dal punto di vista agronomico, <mark style="color:predefinito;background-color:yellow;">schemi coerenti suggeriscono condizioni stabili e una gestione efficace nel tempo</mark>. Tuttavia, zone localizzate <mark style="color:predefinito;background-color:yellow;">a bassa similarità potrebbero richiedere adeguamenti mirati per migliorare le prestazioni di resa future</mark>.

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FhOWLFRX43inp21kga5y9%2Fimage.png?alt=media&#x26;token=308de900-e22a-4330-b517-a88ca89c5012" alt=""><figcaption><p>Confronto di similarità delle rese: Mais 2022 vs Mais 2024</p></figcaption></figure>

## **Dataset sintetico vs reale di resa (2023** Colza)

In questo scenario, iniziamo con un dataset di resa grezzo della stagione 2023 di colza e un dataset di resa generato sinteticamente per la stessa coltura e lo stesso anno 2023. <mark style="color:predefinito;background-color:yellow;">L'obiettivo è valutare l'accuratezza spaziale della resa reale rispetto a quella sintetica, fornendo un percorso per colmare dati non registrati, affrontare lacune nei dati di resa e correggere anomalie utilizzando valori sintetici</mark>. Il dataset di resa reale presenta problemi come letture anormalmente alte o basse, passate incrociate, traiettorie curve e passate a zero, tutti indicatori della necessità di ricalibrazione dei sensori.

Dopo l'applicazione degli strumenti di [Pulizia e calibrazione](https://docs.geopard.tech/geopard-tutorials/it/agronomia/calibrazione-e-pulizia-della-resa) ai dati di resa reali e la generazione di [Resa sintetica](https://docs.geopard.tech/geopard-tutorials/it/agronomia/mappa-di-resa-sintetica) per la colza, possiamo avviare un confronto significativo della loro similarità.

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwkCRiie2suhom6bxWKCJ%2Fimage.png?alt=media&#x26;token=f4752a43-55e2-431c-a667-8363c8f742c6" alt=""><figcaption><p>Colza 2023: Dati di resa originali vs puliti e calibrati</p></figcaption></figure>

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fz427malsrdHAQOCNjQyh%2Fimage.png?alt=media&#x26;token=26a63983-2a7f-48b2-bfc9-3e40a883582a" alt=""><figcaption><p>Resa sintetica colza 2023</p></figcaption></figure>

La mappa di esecuzione dell'Equazione di Similarità è mostrata di seguito come screenshot.

Da un punto di vista statistico, l'elevata media (0,889) e la mediana (0,904) indicano che, <mark style="color:predefinito;background-color:yellow;">complessivamente, il dataset di resa sintetica corrisponde strettamente ai modelli spaziali della resa reale di colza 2023</mark>. Sebbene un'area scenda fino a 0,291, la bassa variazione (0,006) e la modesta deviazione standard (0,08) suggeriscono che <mark style="color:predefinito;background-color:yellow;">la maggior parte delle parti del campo si allinea strettamente tra i dataset reale e sintetico, con pochissimi outlier</mark>.

Dal punto di vista agronomico, questa forte similarità implica che <mark style="color:predefinito;background-color:yellow;">i dati di resa sintetici possono fungere da proxy affidabile per le condizioni reali del campo</mark>, rafforzando la fiducia nell'uso di scenari modellati per guidare le decisioni. <mark style="color:predefinito;background-color:yellow;">Le pratiche agronomiche riflesse nei dati di resa reali sono ben catturate dal modello di resa sintetica</mark>, consentendo una pianificazione più informata e coerente delle strategie di gestione future.

<figure><img src="https://1371939954-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FZT4vMwtGPgMFsmWAsIb4%2Fimage.png?alt=media&#x26;token=bf195514-380e-43fb-bbee-5922dd92b769" alt=""><figcaption><p>Confronto di similarità delle rese per colza: Reale 2023 vs Sintetico 2023</p></figcaption></figure>
