# 84. Mutacija: sukalibruoti ir išvalyti YieldDataset

„YieldDataset“ kalibravimas yra funkcija, kuri ištaiso reikšmių pasiskirstymą pagal matematikos principus, pagerindama duomenų vientisumą. Tai stiprina sprendimų priėmimo kokybę ir daro duomenų rinkinį vertingu tolesnei išsamaiai analizei.

Šios funkcijos įprasti panaudojimo atvejai apima:

* Duomenų sinchronizavimą, kai keli kombainai dirbo vienu metu arba per kelias dienas, užtikrinant nuoseklumą.
* Duomenų rinkinio homogenizavimą ir tikslumo didinimą, sušvelninant svyravimus.
* Triukšmo ir nereikalingos informacijos pašalinimą, kuri gali užtemdyti įžvalgas.
* Apsisukimų arba nenormalių geometrijų eliminavimą, kurie gali iškraipyti tikrus lauko modelius ir tendencijas.
* Derliaus duomenų sureguliavimą taip, kad jie atitiktų nustatytus vidurkius arba sumas kiekvienam atributui.

Norėdami išsamesnės apžvalgos ir pavyzdžių, kreipkitės į mūsų [Derliaus kalibravimo ir valymo](/geopard-tutorials/ltu/agronomija/derliaus-kalibravimas-ir-valymas.md) naudojimo atvejį.

### Originalus YieldDataset su WetMass atributu

Penki kombainai dirbo lygiagrečiai 30 ha lauke, parodytame žemiau. Vieno iš kombainų kalibracija nebuvo sinchronizuota su kitais, dėl ko atsirado <mark style="color:oranžinė;">oranžinė</mark> taškeliai, rodantys, kad reikalingas papildomas `KALIBRAVIMAS` Be to, daugelyje vietų yra apsisukimų <mark style="color:raudoni;">raudoni</mark> taškai arčiau „Lauko“ kraštų, kuriuos reikia pašalinti.

<figure><img src="/files/f9a5111498124b514fa820a55ef692e2bbe61bc1" alt=""><figcaption><p>Originalus YieldDataset su WetMass atributu</p></figcaption></figure>

### Kalibruotas ir išvalytas YieldDataset su WetMass atributu

Žemiau pateiktas rezultatas rodo duomenų rinkinį po automatinio `KALIBRUOTI` ir `VALYTI` operacijų pritaikymo naudojant numatytuosius parametrus. Gautoji „YieldDataset“ tapo homogeniška, be anomalijų ar staigių pokyčių tarp gretimų geometrijų.

<figure><img src="/files/2bb747244ffdacf516ba334d9d3baac1c472ec7c" alt=""><figcaption><p>Kalibruotas ir išvalytas YieldDataset su WetMass atributu</p></figcaption></figure>

### Parinktys: pagal takus vs vidurkis/suma vs sąlyginė

**Pagal takus atliekama kalibracija** atitinka mašinos važiavimo takus. Kiekvienas mašinos takas apdorojamas kaip atskira sritis kalibravimo tikslais. GeoPard komanda siūlo naudoti šį metodą kaip standartinį požiūrį.

**Vidutinės/Reikšmės sumos kalibracija** koncentruojasi į atributų reikšmių perskirstymą. Jei geografiniai modeliai yra teisingi, bet absoliutūs skaičiai skiriasi nuo realių, šis metodas yra naudingas. Optimaliesiems rezultatams GeoPard rekomenduoja derinti su pagal takus atliekama kalibracija: pirmiausia taikyti pagal takus, tada reguliuoti pagal žinomas vidutines/sumines reikšmes.

**Sąlyginė kalibracija** reguliuoja atributų reikšmes pagal pateiktus min ir max slenkstelius. Šis metodas ypač naudingas, kai geografiniai modeliai yra tikslūs, tačiau reikšmių pasiskirstymas reikalauja korekcijų, ypač kai yra žinomos minimalios ir maksimalios reikšmės. Geriausiems rezultatams GeoPard rekomenduoja derinti su pagal takus atliekama kalibracija: pradėti nuo pagal takus, o tada pakoreguoti, kad atitiktų žinomas min ir max reikšmes.

### Patarimai

{% hint style="warning" %}
**Patarimas dėl duomenų anomalijų**

Jei vartotojas susiduria su duomenų anomalijomis, pvz., reikšmėmis, artimomis nuliui, arba neįprastai didelėmis reikšmėmis (pvz., vidurkis 10, bet maksimumas 8000), rekomenduojama naudoti **Valymo ir kalibravimo** darbo eigą. Ji konfigūruojama naudojant parametrus `veiksmai: [CLEAN, CALIBRATE]`.&#x20;

Pirmiausia išvalius duomenis prieš kalibravimą užtikrinama klaidų, trūkstamų reikšmių ar neatitikimų pašalinimas, taip pagerinant duomenų kokybę ir tikslumą.
{% endhint %}

{% hint style="warning" %}
**Patarimas dėl duomenų be pradinių klaidų**&#x20;

Jei duomenų rinkiniai iš pradžių yra be klaidų, trūkstamų reikšmių ar neatitikimų, ir žinoma, kad dalyvavo keli kombainai, apsvarstykite **Kalibravimo ir valymo** darbo eigą. Ji konfigūruojama naudojant parametrus `veiksmai:  [CALIBRATE, CLEAN]`.

Duomenų valymas po kalibravimo padeda toliau rafinuoti rinkinį, galbūt pašalinant bet kokius artefaktus, atsiradusius kalibravimo metu.
{% endhint %}

### Dokumentacija: Mutacijos detalės

Numatytoji standartinė konfigūracija įgalina automatinį „YieldDataset“ kalibravimą ir valymą.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutacija AutoCalibrateYieldDataset {
  calibrateYieldDataset(input: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    veiksmai: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        conditionPathwiseCalibration: {
          calibrationBasis: "WetMass"
          maxHomogeneityRegion: true
          syntheticMachinePath: true
        }
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
      }
      
      veiksmai:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusCode
    statusMessage
  }
}
```

{% endcode %}

Išsamesnis pavyzdys suteikia rankinę min/max diapazonų kontrolę ir įtraukia papildomus atributus.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutacija CustomCalibrateYieldDataset {
  calibrateYieldDataset(input: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    veiksmai: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        smoothWindowSize: 11
        conditionPathwiseCalibration: {
          calibrationBasis: "Machine"
          maxHomogeneityRegion: true
          syntheticMachinePath: false
        }
        conditionAvgTotalCalibration:[{
          calibrationAttribute: "WetMass"
          average:8.0
        }]
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
        conditionMinMaxClean: [{
          cleanAttribute: "Distance"
          min: 1.5
          max: 10.0
        }]
      }
      veiksmai:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusCode
    statusMessage
  }
}
```

{% endcode %}

{% hint style="info" %}
Norint laikytis USDA protokolo šiai `VALYTI` operacijai, turite arba nurodyti VISAS stulpelių reikšmes `cleanAction` -> `conditionMinMaxClean` arba pateikti jų dalį `cleanAction` -> `conditionMinMaxClean` ir likusias pateikti `condtionAutoClean` -> `excludedAttributes`.
{% endhint %}

Įvesties parametrai:

* `veiksmai` kaip masyvas, leidžiantis pasirinkti *taisymo veiksmus ir jų taikymo seką* palaikomos reikšmės apima `VALYTI` ir `KALIBRUOTI`.
* `calibrateAction` kaip objektą, kuriame yra konfigūracijos detalės, susijusios su `KALIBRUOTI` operacija.&#x20;
  * `calibrationAttributes` kaip masyvas atributų, kuriems reikia kalibracijos, paprastai susijusių su Derliaus stulpeliu.
  * `smoothWindowSize` kaip nelyginis sveikasis skaičius, kuris sušvelnina rezultatų reikšmes, mažindamas staigius šuolius reikšmėse.
  * `conditionPathwiseCalibration` kaip objektas su **Pagal takus** kalibracija atitinka mašinos važiavimo takus. Kiekvienas mašinos takas apdorojamas kaip atskira sritis kalibravimo tikslais.
    * `calibrationBasis` kaip eilutė, reiškianti atributą, naudojamą kalibracijos pagrindu.
    * `maxHomogeneityRegion` kaip loginė reikšmė, nurodanti, ar kaip etalono regionas kalibracijai naudojama didžiausia homogeninė sritis.
    * `syntheticMachinePath` kaip loginė reikšmė, nurodanti mašinos maršrutų simuliaciją; tai naudinga, kai trūksta tikslaus mašinos takų atributo ir jį reikia simuliuoti pagal laiko žymes ar panašų atributą.
  * `conditionAvgTotalCalibration` kaip objektas su **Vidutinė/Suma** kalibracija koncentruojasi į atributų reikšmių perskirstymą. Jei geografiniai modeliai yra teisingi, bet absoliutūs skaičiai skiriasi nuo realių, šis metodas yra naudingas.
    * `calibrationAttribute` kaip eilutė, reiškianti atributą, kuris bus kalibruojamas.
    * `average` kaip skaičius, reiškiantis atributų vidurkius; atributų reikšmės turėtų atitikti šį vidurkį. Vienu metu turėtų būti naudojama tik viena parinktis, arba `average` arba `total`, turėtų būti naudojama vienu metu.
    * `total` kaip skaičius, reiškiantis atributų reikšmių bendrą sumą; šių reikšmių suma turėtų atitikti nurodytą total. Vienu metu turėtų būti naudojama tik viena parinktis, arba `average` arba `total`, turėtų būti naudojama vienu metu.
  * `conditionMinMaxCalibration` kaip objektas su **Sąlyginė** kalibracija reguliuoja atributų reikšmes pagal pateiktus min ir max slenkstelius.
    * `calibrationAttribute` kaip eilutė, reiškianti atributą, kuris bus kalibruojamas.
    * `min` kaip skaičius, reiškiantis atributų minimalias reikšmes, veikiančias kaip žemiausias kalibravimo diapazonas.
    * `minIncluded` kaip loginė reikšmė, nurodanti, ar įtraukti minimalias reikšmes.
    * `max` kaip skaičius, reiškiantis atributų maksimaliąsias reikšmes, veikiančias kaip aukščiausias kalibravimo diapazonas.
    * `maxIncluded` kaip loginė reikšmė, nurodanti, ar įtraukti maksimaliąsias reikšmes.
* `cleanAction` kaip objektas, apimantis konfigūracijos specifikacijas, susijusias su `VALYTI` operacija.
  * `conditionAutoClean` kaip objektas, apimantis konfigūracijas, specifines automatinio valymo algoritmui.
    * `targetAttribute` kaip eilutė, reiškianti tikslines derliaus reikšmes.
    * `excludedAttributes` kaip eilutžių masyvas, nurodantis atributus, kurie neturi įtakos valymo operacijai.
  * `conditionMinMaxClean` kaip objektų masyvas, kuriame yra aprašytos valymo taisyklės; kiekvienas objektas apima šiuos parametrus.
    * cleanAttribute kaip eilutė, nurodanti taisyklės stulpelio pavadinimą.
    * `min` kaip skaičius, nurodantis minimalią reikšmę.
    * `max` kaip skaičius, nurodantis maksimalia reikšmę.

{% hint style="info" %}
Norėdami peržiūrėti įvestis ir gauti naujausias išvedamųjų reikšmių (pvz., `operacijos`), reikėtų naudoti [Altair](/geopard-tutorials/ltu/api-dokumentacija/darbo-pradzia-su-geopard-api.md).
{% endhint %}

### Dokumentacija: YieldDataset užklausa

Kaip GeoPard API vartotojas galite gauti informaciją apie YieldDatasetams taikytus pataisymus per atributus `appliedCorrections` ir `appliedCorrectionsVersion`. Pirmasis pateikia atliktų pataisymų sąrašą (pvz., `KALIBRUOTI` ir `VALYTI`), jų vykdymo tvarka nurodyta pagal jų eilę masyve. Tuo tarpu `appliedCorrectionsVersion` nurodo naudojamos algoritmo versiją.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
užklausa DetailsAboutAppliedCalibrations {
  getFields (filter: {fieldUuid: "<placeholder_of_field_uuid>"}){
    fields {
      uuid
      yieldDatasets  {
        uuid
        appliedCorrections
        appliedCorrectionsVersion
      }
    }
  }
}
```

{% endcode %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.geopard.tech/geopard-tutorials/ltu/api-dokumentacija/geopard-api-uzklausu-apzvalga/84.-mutacija-sukalibruoti-ir-isvalyti-yielddataset.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
