# 84. Mutacija: Umeri in očisti YieldDataset

Kalibracija "YieldDataset" je funkcionalnost, ki popravi porazdelitev vrednosti v skladu z matematičnimi načeli in izboljša celovito integriteto podatkov. Poveča kakovost odločanja in naredi nabor podatkov uporaben za nadaljnje poglobljene analize.

Pogoste uporabe te funkcionalnosti vključujejo:

* Sinhronizacijo podatkov, ko so z žetvijo hkrati ali v več dneh delali več kombajnov, s čimer se zagotovi doslednost.
* Naredi nabor podatkov bolj homogen in natančen z ublažitvijo različic.
* Odstranjevanje šuma v podatkih in odvečnih informacij, ki lahko zameglijo vpoglede.
* Odstranjevanje obračanj ali nenavadnih geometrij, ki lahko popačijo dejanske vzorce in trende na polju.
* Prilagoditev podatkov o pridelku, da se ujemajo z uveljavljenimi povprečji ali vsotami za vsak atribut.

Za podrobnejšo razlago in primere si oglejte našo [Kalibracija in čiščenje pridelka](/geopard-tutorials/svn/agronomija/kalibracija-in-ciscenje-pridelka.md) primer uporabe.

### Izvirni YieldDataset z atributom WetMass

Na prikazanem 30 ha polju je hkrati delalo pet kombajnov vzporedno. Kalibracija enega izmed kombajnov ni bila sinhronizirana z ostalimi, kar je povzročilo <mark style="color:oranžna;">oranžna</mark> pege, kar nakazuje, da je potrebna dodatna `KALIBRACIJA` Poleg tega je več obračališč <mark style="color:rdeče;">rdeče</mark> pege bližje robom "Polja", ki jih je treba odstraniti.

<figure><img src="/files/5c703ab00f0c6d905e0e3ffe7ba33d5648c93dfc" alt=""><figcaption><p>Izvirni YieldDataset z atributom WetMass</p></figcaption></figure>

### Kalibriran in očiščen YieldDataset z atributom WetMass

Spodnji rezultat prikazuje nabor podatkov po uporabi samodejnih `KALIBRIRAJ` in `OČISTI` operacij z uporabo privzetih parametrov. Rezultirajoči "YieldDataset" je postal homogen, brez odstopanj ali nenadnih sprememb med sosednjimi geometrijami.

<figure><img src="/files/7efec49596cf80cd72927a01b2f79d87fffeb700" alt=""><figcaption><p>Kalibriran in očiščen YieldDataset z atributom WetMass</p></figcaption></figure>

### Možnosti: po poteh proti povprečju/vsoti proti pogojnemu

**Kalibracija po poteh** ustreza sledem stroja. Vsaka sled stroja se za namene kalibracije obravnava kot ločena regija. Ekipa GeoPard predlaga uporabo te metode kot standardnega pristopa.

**Kalibracija povprečje/vsota** se osredotoča na prerazporeditev vrednosti atributov. Če so geografski vzorci pravilni, vendar absolutne številke odstopajo od dejanskih, je ta metoda koristna. Za optimalne rezultate GeoPard priporoča kombinacijo s kalibracijo po poteh: najprej uporabite kalibracijo po poteh, nato prilagodite znanim vrednostim povprečja/vsote.

**Pogojna kalibracija** prilagodi vrednosti atributov glede na dane minimalne in maksimalne meje. Ta metoda je še posebej dragocena, ko so geografski vzorci natančni, vendar porazdelitev vrednosti potrebuje prilagoditve, zlasti kadar so znane minimalne in maksimalne vrednosti. Za najboljše rezultate GeoPard priporoča združitev s kalibracijo po poteh: začnite s kalibracijo po poteh, nato prilagodite tako, da se ujemajo z znanimi min in max vrednostmi.

### Namigi

{% hint style="warning" %}
**Nasvet za anomalije v podatkih**

Če uporabnik naleti na anomalije v podatkih, kot so vrednosti pri ali blizu ničle, ali nenavadno velike vrednosti (na primer povprečje 10 z maksimumom 8000), se priporoča potek dela **Čiščenje in kalibracija** Je konfiguriran z uporabo parametrov `dejanja: [CLEAN, CALIBRATE]`.&#x20;

Prednostno čiščenje podatkov pred kalibracijo zagotavlja odstranitev napak, manjkajočih vrednosti ali nedoslednosti, s čimer se izboljša kakovost in natančnost podatkov.
{% endhint %}

{% hint style="warning" %}
**Nasvet za podatke brez začetnih napak**&#x20;

Za nabor podatkov, ki sprva ne vsebuje napak, manjkajočih vrednosti ali nedoslednosti, in kadar je znano, da je bilo vključenih več kombajnov, razmislite o poteku dela **Kalibracija in čiščenje** Je konfiguriran z uporabo parametrov `dejanja:  [CALIBRATE, CLEAN]`.

Čiščenje podatkov po kalibraciji pomaga dodatno izpiliti nabor podatkov z morebitnim odstranjevanjem artefaktov, uvedenih med kalibracijo.
{% endhint %}

### Dokumentacija: Podrobnosti mutacije

Privzeta standardna konfiguracija omogoča samodejno kalibracijo in čiščenje "YieldDataset".

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutacija AutoCalibrateYieldDataset {
  calibrateYieldDataset(vhod: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    dejanja: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        conditionPathwiseCalibration: {
          calibrationBasis: "WetMass"
          maxHomogeneityRegion: true
          syntheticMachinePath: true
        }
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
      }
      
      dejanja:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusnaKoda
    statusMessage
  }
}
```

{% endcode %}

Naprednejši primer zagotavlja ročno kontrolo min/maks razponov in vključuje dodatne atribute.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutacija CustomCalibrateYieldDataset {
  calibrateYieldDataset(vhod: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    dejanja: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        smoothWindowSize: 11
        conditionPathwiseCalibration: {
          calibrationBasis: "Machine"
          maxHomogeneityRegion: true
          syntheticMachinePath: false
        }
        conditionAvgTotalCalibration:[{
          calibrationAttribute: "WetMass"
          average:8.0
        }]
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
        conditionMinMaxClean: [{
          cleanAttribute: "Distance"
          min: 1.5
          max: 10.0
        }]
      }
      dejanja:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusnaKoda
    statusMessage
  }
}
```

{% endcode %}

{% hint style="info" %}
Za sledenje protokolu USDA za `OČISTI` operacijo, morate ali navesti VSE stolpce v `cleanAction` -> `conditionMinMaxClean` ali specificirati njihov del v `cleanAction` -> `conditionMinMaxClean` in preostale v `condtionAutoClean` -> `excludedAttributes`.
{% endhint %}

Vhodni parametri:

* `dejanja` kot polje, ki vam omogoča izbiro *korektivnih dejanj in njihovega zaporedja* uporabe; podprte vrednosti vključujejo `OČISTI` in `KALIBRIRAJ`.
* `calibrateAction` kot objekt, ki vsebuje podrobnosti konfiguracije v zvezi z `KALIBRIRAJ` operacijo.&#x20;
  * `calibrationAttributes` kot polje atributov, ki zahtevajo kalibracijo, običajno povezanih s stolpcem pridelka.
  * `smoothWindowSize` kot liho število, ki zgladi rezultatne vrednosti in zmanjša nenadne skoke v vrednostih.
  * `conditionPathwiseCalibration` kot objekt s **Po poteh** kalibracija ustreza sledem stroja. Vsaka sled stroja se za namene kalibracije obravnava kot ločena regija.
    * `calibrationBasis` kot niz, ki predstavlja atribut, uporabljen kot osnova za kalibracijo.
    * `maxHomogeneityRegion` kot boolean, ki označuje, ali se največja regija homogenosti uporablja kot referenčna regija za kalibracijo.
    * `syntheticMachinePath` kot boolean, ki označuje simulacijo poti stroja; koristno je, kadar natančen atribut poti stroja manjka in ga je treba simulirati na podlagi časovnih žigov ali podobnega atributa.
  * `conditionAvgTotalCalibration` kot objekt s **Povprečje/Vsota** kalibracija se osredotoča na prerazporeditev vrednosti atributov. Če so geografski vzorci pravilni, vendar absolutne številke odstopajo od dejanskih, je ta metoda koristna.
    * `calibrationAttribute` kot niz, ki predstavlja atribut, ki ga je treba kalibrirati.
    * `average` kot število, ki predstavlja povprečne vrednosti atributa; vrednosti atributa bi se morale ujemati s tem povprečjem. Uporabite se lahko le ena možnost, bodisi `average` ali `total`, je treba uporabiti naenkrat.
    * `total` kot število, ki predstavlja skupni seštevek vrednosti atributa; seštevek teh vrednosti bi se moral ujemati s skupno vsoto. Uporabite se lahko le ena možnost, bodisi `average` ali `total`, je treba uporabiti naenkrat.
  * `conditionMinMaxCalibration` kot objekt s **Pogojno** kalibracija prilagaja vrednosti atributov na podlagi danih minimalnih in maksimalnih mej.
    * `calibrationAttribute` kot niz, ki predstavlja atribut, ki ga je treba kalibrirati.
    * `min` kot število, ki predstavlja minimalne vrednosti atributa in služi kot najnižji razpon za kalibracijo.
    * `minIncluded` kot boolean, ki označuje, ali vključiti minimalno vrednost ali ne
    * `max` kot število, ki predstavlja maksimalne vrednosti atributa in služi kot najvišji razpon za kalibracijo.
    * `maxIncluded` kot boolean, ki označuje, ali vključiti maksimalno vrednost.
* `cleanAction` kot objekt, ki vključuje konfiguracijske podrobnosti povezane z `OČISTI` operacijo.
  * `conditionAutoClean` kot objekt, ki vključuje konfiguracije, specifične za algoritem samodejnega čiščenja.
    * `targetAttribute` kot niz, ki predstavlja ciljane vrednosti pridelka.
    * `excludedAttributes` kot polje nizov, ki opredeljuje atribute, ki ne vplivajo na operacijo čiščenja.
  * `conditionMinMaxClean` kot polje objektov, ki vsebuje opisana pravila čiščenja; vsak objekt vključuje naslednje parametre.
    * cleanAttribute kot niz, ki določa ime stolpca za pravilo.
    * `min` kot število, ki označuje minimalno vrednost.
    * `max` kot število, ki označuje maksimalno vrednost.

{% hint style="info" %}
Za ogled vhodov in dostop do najnovejših razpoložljivih vrednosti enumeracij (kot so `operacije`), je priporočljivo uporabiti [Altair](/geopard-tutorials/svn/api-dokumentacija/uvod-v-geopard-api.md).
{% endhint %}

### Dokumentacija: poizvedba YieldDataset

Kot uporabnik GeoPard API lahko pridobite podrobnosti o popravilih, uporabljenih na YieldDatasetih, preko atributov `appliedCorrections` in `appliedCorrectionsVersion`. Prvi navaja seznam opravljenih popravkov (npr., `KALIBRIRAJ` in `OČISTI`), pri čemer vrstni red izvajanja označuje njihovo zaporedje v polju. Medtem pa `appliedCorrectionsVersion` navaja različico uporabljenega algoritma.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
poizvedba DetailsAboutAppliedCalibrations {
  getFields (filter: {fieldUuid: "<placeholder_of_field_uuid>"}){
    polja {
      uuid
      yieldDatasets  {
        uuid
        appliedCorrections
        appliedCorrectionsVersion
      }
    }
  }
}
```

{% endcode %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.geopard.tech/geopard-tutorials/svn/api-dokumentacija/pregled-zahtevkov-geopard-api/84.-mutacija-umeri-in-ocisti-yielddataset.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
