# 84. Muutos: Kalibroi ja puhdista satotietoaineisto

"YieldDatasetin" kalibrointi on toiminto, joka korjaa arvojen jakaumaa matemaattisten periaatteiden mukaiseksi ja parantaa näin datan eheyttä. Se vahvistaa päätöksenteon laatua ja tekee datasta arvokkaan jatkoanalyysiä varten.

Tämän toiminnon yleisiä käyttötapauksia ovat:

* Datan synkronointi, kun useat leikkuupuimurit ovat työskennelleet samanaikaisesti tai useiden päivien aikana, varmistamalla yhdenmukaisuus.
* Datasetin muuttaminen homogeenisemmaksi ja tarkemmaksi tasoittamalla vaihteluita.
* Datan kohinan ja ylimääräisen tiedon poistaminen, jotka voivat hämärtää havaintoja.
* Käännösten ja epänormaalien geometrioiden poistaminen, jotka voivat vääristää todellisia kaavoja ja trendejä pellolla.
* Satoarvojen säätäminen vastaamaan vakiintuneita keskiarvoja tai summia kullekin attribuutille.

Yksityiskohtaisempaa tarkastelua ja esimerkkejä varten katso [Sadon kalibrointi & puhdistus](/geopard-tutorials/fin/agronomia/satotiedon-kalibrointi-ja-puhdistus.md) käyttötapausta.

### Alkuperäinen YieldDataset WetMass-attribuutilla

Viisi leikkuupuimuria työskenteli rinnakkain alla esitetyllä 30 ha:n pellolla. Yhden puimurin kalibrointi ei ollut synkronoitu muiden kanssa, mikä johti <mark style="color:oranssi;">oranssi</mark> paikkoihin, mikä viittaa siihen, että lisä `KALIBROINTI` on tarpeen. Lisäksi lähellä pellon reunoja on lukuisia käännöksiä, jotka pitää poistaa. <mark style="color:punainen;">punainen</mark> pisteitä lähemmäs "pellon" reunoja, jotka on poistettava.

<figure><img src="/files/420c4b460a9aef12695f3eb537f2c08e98de0c89" alt=""><figcaption><p>Alkuperäinen YieldDataset WetMass-attribuutilla</p></figcaption></figure>

### Kalibroitu ja puhdistettu YieldDataset WetMass-attribuutilla

Alla oleva tulos näyttää datasetin automaattisen soveltamisen jälkeen `KALIBROI` ja `PUHDISTA` toiminnoilla oletusparametreilla. Tuloksena oleva "YieldDataset" on homogeeninen, ilman poikkeamia tai äkillisiä muutoksia vierekkäisten geometrioiden välillä.

<figure><img src="/files/b78b1c0b615e9b113bc9c69e886f96e1045ecc18" alt=""><figcaption><p>Kalibroitu ja puhdistettu YieldDataset WetMass-attribuutilla</p></figcaption></figure>

### Polku- vs Keskimääräinen/Summa- vs Ehdolliset vaihtoehdot

**Polku- eli Pathwise-kalibrointi** vastaa koneen ajouria. Jokainen koneen ajoura käsitellään erillisenä alueena kalibrointia varten. GeoPardin tiimi ehdottaa tämän menetelmän käyttöä vakiomenetelmänä.

**Keskimääräinen/Summa-kalibrointi** keskittyy attribuuttien arvojen uudelleenjakoon. Jos paikkatietomallit ovat paikkansapitäviä mutta absoluuttiset luvut poikkeavat todellisista, tämä menetelmä on hyödyllinen. Parhaan tuloksen saavuttamiseksi GeoPard suosittelee yhdistämään sen Pathwise-kalibrointiin: ensin Pathwise ja sen jälkeen säätö tunnettuja keskiarvo/summa-arvoja vastaavaksi.

**Ehdollinen kalibrointi** säätelee attribuuttien arvoja annettujen min- ja maksirajojen perusteella. Tämä menetelmä on erityisen hyödyllinen, kun paikkakuviot ovat tarkkoja mutta arvojen jakaumaa pitää säätää, erityisesti kun tunnetut min- ja maksimiarvot ovat saatavilla. Parhaiden tulosten saavuttamiseksi GeoPard suosittelee yhdistämään sen Pathwise-kalibrointiin: aloita Pathwisellä ja tee sitten säädöt tunnettuja min- ja maksimiarvoja vastaaviksi.

### Vihjeitä

{% hint style="warning" %}
**Vihje datan poikkeavuuksista**

Jos käyttäjä kohtaa datassa poikkeavuuksia, kuten arvoja lähellä nollaa tai epätavallisen suuria arvoja (esim. keskiarvo 10 ja maksimi 8000), suositellaan **Puhdistus & Kalibrointi** työnkulkua. Se määritellään parametreilla `toiminnot: [CLEAN, CALIBRATE]`.&#x20;

Datan puhdistuksen priorisointi ennen kalibrointia varmistaa virheiden, puuttuvien arvojen ja epäjohdonmukaisuuksien poistamisen, parantaen näin datan laatua ja tarkkuutta.
{% endhint %}

{% hint style="warning" %}
**Vihje datasta ilman alkuperäisiä virheitä**&#x20;

Dataseteille, joissa ei alun perin ole virheitä, puuttuvia arvoja tai epäjohdonmukaisuuksia, ja kun tiedetään useiden puimureiden osallistuneen, harkitse **Kalibrointi & Puhdistus** työnkulkua. Se määritellään parametreilla `toiminnot:  [CALIBRATE, CLEAN]`.

Datan puhdistus kalibroinnin jälkeen auttaa hiomaan datasettiä edelleen poistamalla mahdolliset kalibroinnin aikana syntyneet artefaktit.
{% endhint %}

### Dokumentaatio: Muutoksen tiedot

Oletusstandardi määritys mahdollistaa "YieldDatasetin" automaattisen kalibroinnin ja puhdistuksen.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutation AutoCalibrateYieldDataset {
  calibrateYieldDataset(input: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    actions: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        conditionPathwiseCalibration: {
          calibrationBasis: "WetMass"
          maxHomogeneityRegion: true
          syntheticMachinePath: true
        }
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
      }
      
      toiminnot:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusCode
    statusMessage
  }
}
```

{% endcode %}

Edistyneempi esimerkki tarjoaa manuaalisen hallinnan min/max-alueille ja sisältää lisäattribuutteja.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutation CustomCalibrateYieldDataset {
  calibrateYieldDataset(input: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    actions: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        smoothWindowSize: 11
        conditionPathwiseCalibration: {
          calibrationBasis: "Machine"
          maxHomogeneityRegion: true
          syntheticMachinePath: false
        }
        conditionAvgTotalCalibration:[{
          calibrationAttribute: "WetMass"
          average:8.0
        }]
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
        conditionMinMaxClean: [{
          cleanAttribute: "Distance"
          min: 1.5
          max: 10.0
        }]
      }
      toiminnot:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusCode
    statusMessage
  }
}
```

{% endcode %}

{% hint style="info" %}
USDA-protokollan noudattamiseksi `PUHDISTA` toiminnolle, sinun on joko mainittava KAIKKI sarakkeet `cleanActionissa` -> `conditionMinMaxCleanissa` tai määritettävä osa niistä `cleanActionissa` -> `conditionMinMaxCleanissa` ja jäljelle jäävät `condtionAutoCleanissa` -> `excludedAttributes`.
{% endhint %}

Syöteparametrit:

* `toiminnot` taulukkomuodossa, jolloin voit valita *korjaavat toimenpiteet ja niiden soveltamisjärjestyksen* soveltamisessa; tuetut arvot sisältävät `PUHDISTA` ja `KALIBROI`.
* `calibrateAction` objektina, joka sisältää konfiguraatiotiedot liittyen `KALIBROI` toimintoon.&#x20;
  * `calibrationAttributes` taulukkomuodossa attribuutteja, jotka vaativat kalibrointia, tyypillisesti Yield-sarakkeeseen liittyen.
  * `smoothWindowSize` parittomana kokonaislukuna, joka tasoittaa tulosarvoja vähentäen äkillisiä hyppyjä arvoissa.
  * `conditionPathwiseCalibration` objektina, joka sisältää **Pathwise** kalibrointi vastaa koneen ajouria. Jokainen koneen ajoura käsitellään erillisenä alueena kalibrointia varten.
    * `calibrationBasis` merkkijonona, joka edustaa attribuuttia, jota käytetään kalibroinnin perustana.
    * `maxHomogeneityRegion` booleen arvona, joka ilmaisee käytetäänkö maksimaalista homogeenisuusaluetta viitealueena kalibroinnissa.
    * `syntheticMachinePath` booleen arvona, joka ilmaisee koneiden reittien simuloinnin; se on hyödyllinen, kun tarkkaa koneen polkuattribuuttia ei ole ja se tarvitsee simuloida aikaleimojen tai vastaavan attribuutin perusteella.
  * `conditionAvgTotalCalibration` objektina, joka sisältää **Keskimääräinen/Summa** kalibrointi keskittyy attribuuttien arvojen uudelleenjakoon. Jos paikkakuviot ovat tarkkoja mutta absoluuttiset luvut poikkeavat todellisista, tämä menetelmä on hyödyllinen.
    * `calibrationAttribute` merkkijonona, joka edustaa attribuuttia, jota kalibroidaan.
    * `average` numerona, joka edustaa attribuutin keskiarvoa; attribuuttien arvojen tulisi vastata tätä keskiarvoa. Käytössä tulee olla vain yksi vaihtoehto, joko `average` tai `total`, jota tulisi käyttää kerrallaan.
    * `total` numerona, joka edustaa attribuuttien arvojen kokonaissummaa; näiden arvojen summa tulisi vastata tätä kokonaissummaa. Käytössä tulee olla vain yksi vaihtoehto, joko `average` tai `total`, jota tulisi käyttää kerrallaan.
  * `conditionMinMaxCalibration` objektina, joka sisältää **Ehdollinen** kalibrointi säätää attribuuttien arvoja annettujen min- ja maksirajojen perusteella.
    * `calibrationAttribute` merkkijonona, joka edustaa attribuuttia, jota kalibroidaan.
    * `min` numerona, joka edustaa attribuutin vähimmäisarvoa, toimien kalibroinnin alimpana rajana.
    * `minIncluded` booleen arvona, joka ilmaisee sisällytetäänkö vähimmäisarvo vai ei
    * `max` numerona, joka edustaa attribuutin enimmäisarvoa, toimien kalibroinnin ylimpänä rajana.
    * `maxIncluded` booleen arvona, joka ilmaisee sisällytetäänkö enimmäisarvo vai ei.
* `cleanActionissa` objektina, joka sisältää konfiguraation yksityiskohdat liittyen `PUHDISTA` toimintoon.
  * `conditionAutoClean` objektina, joka sisältää automaattisen puhdistusalgoritmin asetukset.
    * `targetAttribute` merkkijonona, joka edustaa kohdearvoja Yieldille.
    * `excludedAttributes` merkkijonomuotoisena taulukona, joka määrittelee attribuutit, joilla ei ole vaikutusta puhdistustoimintoon.
  * `conditionMinMaxCleanissa` objektien taulukkomuotoisena, joka sisältää kuvatut puhdistussäännöt; jokainen objekti sisältää seuraavat parametrit.
    * cleanAttribute merkkijonona, joka määrittelee säännön sarakenimen.
    * `min` numerona, joka ilmaisee vähimmäisarvon.
    * `max` numerona, joka ilmaisee enimmäisarvon.

{% hint style="info" %}
Näkyäksesi syötteet ja päästäksesi käsiksi luetteloiden (esim. `toiminnot`) uusimpiin saatavilla oleviin arvoihin, on suositeltavaa käyttää [Altair](/geopard-tutorials/fin/api-dokumentaatio/geopard-api-n-aloitus.md).
{% endhint %}

### Dokumentaatio: YieldDataset-kysely

GeoPard API:n käyttäjänä voit hakea tietoja YieldDataseteihin sovelletuista korjauksista attribuuttien kautta `appliedCorrections` ja `appliedCorrectionsVersion`. Ensimmäinen tarjoaa listan tehdyistä korjauksista (esim. `KALIBROI` ja `PUHDISTA`), ja niiden suoritusjärjestys näkyy taulukon järjestyksessä. Sillä välin `appliedCorrectionsVersion` ilmaisee käytetyn algoritmin version.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
query DetailsAboutAppliedCalibrations {
  getFields (filter: {fieldUuid: "<placeholder_of_field_uuid>"}){
    fields {
      uuid
      yieldDatasets  {
        uuid
        appliedCorrections
        appliedCorrectionsVersion
      }
    }
  }
}
```

{% endcode %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.geopard.tech/geopard-tutorials/fin/api-dokumentaatio/geopard-api-pyyntojen-yleiskatsaus/84.-muutos-kalibroi-ja-puhdista-satotietoaineisto.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
