# 84. Mutācija: kalibrēt un notīrīt ražas datu kopu

„YieldDataset” kalibrēšana ir funkcionalitāte, kas koriģē vērtību sadalījumu saskaņā ar matemātiskajiem principiem, uzlabojot datu kopējās integritāti. Tā nostiprina lēmumu pieņemšanas kvalitāti un padara datu kopu vērtīgu turpmākai padziļinātai analīzei.

Šīs funkcionalitātes izplatītie lietošanas gadījumi ietver:

* Datu sinhronizēšana, ja vairāki kombaini ir strādājuši vienlaikus vai vairākas dienas, nodrošinot konsekvenci.
* Datu kopas homogenizēšana un precizēšana, izlīdzinot svārstības.
* Datu trokšņa un liekas informācijas noņemšana, kas var aizēnot ieskatus.
* Apgriezienu vai anomālu ģeometriju likvidēšana, kas var izkropļot reālos laukā novērojamos modeļus un tendences.
* Ražas datu pielāgošana, lai tie atbilstu noteiktajiem vidējiem rādītājiem vai kopējiem apjomiem katram atribūtam.

Lai iegūtu detalizētāku izpēti un piemērus, lūdzu, skatiet mūsu [Ražas kalibrēšanas un datu tīrīšanas](/geopard-tutorials/lva/agronomija/razas-kalibresana-un-tirisana.md) lietošanas gadījumu.

### Oriģināls YieldDataset ar WetMass atribūtu

Pieci kombaini strādāja paralēli 30 ha laukā, kas parādīts zemāk. Viena no kombaina kalibrācija nebija sinhronizēta ar pārējām, kā rezultātā redzami <mark style="color:orandža;">orandža</mark> vietas, kas norāda, ka nepieciešama papildus `KALIBRĒŠANA` . Turklāt tajā ir daudz apgriezienu <mark style="color:sarkanās;">sarkanās</mark> vietas tuvāk "Lauka" maliņām, kuras jāizņem.

<figure><img src="/files/bb0fdc0c8b7c61210daa220142b2657d807e0387" alt=""><figcaption><p>Oriģināls YieldDataset ar WetMass atribūtu</p></figcaption></figure>

### Kalibrēts un attīrīts YieldDataset ar WetMass atribūtu

Zemāk redzams rezultāts pēc automātiskas `KALIBRĒŠANAS` un `TĪRĪŠANAS` operāciju piemērošanas, izmantojot noklusējuma parametrus. Iegūtā „YieldDataset” ir kļuvusi homogēna, bez ārējām vērtībām vai straujām izmaiņām starp kaimiņu ģeometrijām.

<figure><img src="/files/4f44eaa362400c03ca9bc30bb7b4bdaf77793fcb" alt=""><figcaption><p>Kalibrēts un attīrīts YieldDataset ar WetMass atribūtu</p></figcaption></figure>

### Pathwise pret Vidējo/Kopējo pret Nosacīto opcijas

**Pathwise kalibrēšana** atbilst mašīnas sliedēm. Katrs mašīnas maršruts tiek apstrādāts kā atsevišķa zona kalibrēšanas nolūkos. GeoPard komanda iesaka šo metodi kā standarta pieeju.

**Vidējā/Kopējā kalibrēšana** koncentrējas uz atribūtu vērtību pārdalīšanu. Ja ģeotelpiskie modeļi ir precīzi, bet absolūtie skaitļi atšķiras no reāliem, šī metode ir izdevīga. Optimāliem rezultātiem GeoPard iesaka kombinēt to ar Pathwise kalibrēšanu: vispirms piemērojot Pathwise, pēc tam pielāgojot līdz zināmiem vidējiem/kopējiem rādītājiem.

**Nosacītā kalibrēšana** pielāgo atribūtu vērtības, pamatojoties uz norādītajiem min un max sliekšņiem. Šī metode ir īpaši vērtīga, ja ģeotelpiskie modeļi ir precīzi, bet vērtību sadalījumam nepieciešami pielātojumi, it īpaši, ja ir zināmas min un max vērtības. Labākajiem rezultātiem GeoPard iesaka to savienot ar Pathwise kalibrēšanu: sākt ar Pathwise un pēc tam pielāgot līdz zināmajām min un max vērtībām.

### Padomi

{% hint style="warning" %}
**Padoms par datu anomālijām**

Ja lietotājs saskaras ar datu anomālijām, piemēram, vērtībām pie vai tuvu nulles, vai neparasti lielām vērtībām (piemēram, vidējais 10 ar maksimumu 8000), tiek ieteikts **Tīrīšanas un kalibrēšanas** darplūsma. To konfigurē, izmantojot parametrus `darbības: [CLEAN, CALIBRATE]`.&#x20;

Prioritāte datu tīrīšanai pirms kalibrēšanas nodrošina kļūdu, trūkstošo vērtību vai neatbilstību noņemšanu, tādējādi uzlabojot datu kvalitāti un precizitāti.
{% endhint %}

{% hint style="warning" %}
**Padoms par datiem bez sākotnējām kļūdām**&#x20;

Datu kopām, kas sākotnēji ir bez kļūdām, trūkstošām vērtībām vai neatbilstībām, un ja zināms, ka iesaistīti vairāki kombaini, apsveriet **Kalibrēšanas un tīrīšanas** darplūsmu. To konfigurē, izmantojot parametrus `darbības:  [CALIBRATE, CLEAN]`.

Datu tīrīšana pēc kalibrēšanas palīdz vēl vairāk pilnveidot datu kopu, potenciāli izņemot artefaktus, kas ievadīti kalibrēšanas laikā.
{% endhint %}

### Dokumentācija: Mutācijas detaļas

Noklusējuma standarta konfigurācija ieslēdz automātisku „YieldDataset” kalibrēšanu un attīrīšanu.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutācija AutoCalibrateYieldDataset {
  calibrateYieldDataset(input: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    darbības: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        conditionPathwiseCalibration: {
          calibrationBasis: "WetMass"
          maxHomogeneityRegion: true
          syntheticMachinePath: true
        }
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
      }
      
      darbības:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusaKods
    statusMessage
  }
}
```

{% endcode %}

Vairāk uzlabots piemērs nodrošina manuālu min/maks diapazonu kontroli un iekļauj papildu atribūtus.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutācija CustomCalibrateYieldDataset {
  calibrateYieldDataset(input: {
    fieldUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    darbības: {
      calibrateAction: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        smoothWindowSize: 11
        conditionPathwiseCalibration: {
          calibrationBasis: "Machine"
          maxHomogeneityRegion: true
          syntheticMachinePath: false
        }
        conditionAvgTotalCalibration:[{
          calibrationAttribute: "WetMass"
          average:8.0
        }]
      }
      cleanAction: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
        conditionMinMaxClean: [{
          cleanAttribute: "Distance"
          min: 1.5
          max: 10.0
        }]
      }
      darbības:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    statusaKods
    statusMessage
  }
}
```

{% endcode %}

{% hint style="info" %}
Lai ievērotu USDA protokolu attiecībā uz šo `TĪRĪŠANAS` operāciju, jums jānorāda VISS stabu saraksts `cleanAction` -> `conditionMinMaxClean` vai jānorāda to daļa `cleanAction` -> `conditionMinMaxClean` un pārējie jānorāda `condtionAutoClean` -> `excludedAttributes`.
{% endhint %}

Ievades parametri:

* `darbības` kā masīvs, ļaujot izvēlēties *koriģējošās darbības un to piemērošanas secību* vērtības; atbalstītās opcijas ietver `TĪRĪŠANAS` un `KALIBRĒŠANAS`.
* `calibrateAction` kā objektu, kas satur konfigurācijas detaļas, kas saistītas ar šo `KALIBRĒŠANAS` operāciju.&#x20;
  * `calibrationAttributes` kā atribūtu masīvs, kuriem nepieciešama kalibrēšana, parasti saistītiem ar ražas (Yield) kolonnu.
  * `smoothWindowSize` kā nepāra veselais skaitlis, kas izlīdzina rezultāta vērtības, samazinot straujas vērtību kāpumus.
  * `conditionPathwiseCalibration` kā objekts ar **Pathwise** kalibrēšana atbilst mašīnas sliedēm. Katrs mašīnas maršruts tiek apstrādāts kā atsevišķa zona kalibrēšanas nolūkos.
    * `calibrationBasis` kā virkne, kas apzīmē atribūtu, kas tiek izmantots kā kalibrēšanas pamats.
    * `maxHomogeneityRegion` kā booleans, kas norāda, vai maksimālā homogenitātes reģiona izmantošana tiek izmantota kā atsauces reģions kalibrēšanai.
    * `syntheticMachinePath` kā booleans, kas norāda mašīnas maršrutu simulāciju; tas ir noderīgi, ja precīzs mašīnas ceļa atribūts trūkst un ir jāsimulē, pamatojoties uz laika zīmēm vai līdzīgu atribūtu.
  * `conditionAvgTotalCalibration` kā objekts ar **Vidējā/Kopējā** kalibrēšana koncentrējas uz atribūtu vērtību pārdalīšanu. Ja ģeotelpiskie modeļi ir precīzi, bet absolūtie skaitļi atšķiras no reāliem, šī metode ir izdevīga.
    * `calibrationAttribute` kā virkne, kas apzīmē atribūtu, kas jākalibrē.
    * `average` kā skaitlis, kas apzīmē atribūta vidējās vērtības; atribūta vērtībām jāatbilst šim vidējam rādītājam. Vienlaikus jāizmanto tikai viena opcija, vai nu `average` vai `total`, jāizmanto tikai viena opcija vienlaikus.
    * `total` kā skaitlis, kas apzīmē atribūtu vērtību kopējo summu; šo vērtību kopsummai jāatbilst kopējam. Vienlaikus jāizmanto tikai viena opcija, vai nu `average` vai `total`, jāizmanto tikai viena opcija vienlaikus.
  * `conditionMinMaxCalibration` kā objekts ar **Nosacītā** kalibrēšana pielāgo atribūtu vērtības, pamatojoties uz norādītajiem min un max sliekšņiem.
    * `calibrationAttribute` kā virkne, kas apzīmē atribūtu, kas jākalibrē.
    * `min` kā skaitlis, kas apzīmē atribūta minimālās vērtības, kalibrēšanas zemāko diapazonu.
    * `minIncluded` kā booleans, kas norāda, vai iekļaut minimālo vērtību vai nē
    * `max` kā skaitlis, kas apzīmē atribūta maksimālās vērtības, kalibrēšanas augstāko diapazonu.
    * `maxIncluded` kā booleans, kas norāda, vai iekļaut maksimālo vērtību vai nē.
* `cleanAction` kā objekts, kas ietver konfigurācijas specifiku, kas saistīta ar `TĪRĪŠANAS` operāciju.
  * `conditionAutoClean` kā objekts, kas ietver konfigurācijas, kas specifiskas automātiskajam tīrīšanas algoritmam.
    * `targetAttribute` kā virkne, kas apzīmē mērķa ražas (Yield) vērtības.
    * `excludedAttributes` kā virkņu masīvs, kas definē atribūtus, kuri neietekmē tīrīšanas operāciju.
  * `conditionMinMaxClean` kā objektu masīvs, kas satur aprakstītās tīrīšanas noteikumu kopas; katrs objekts iekļauj sekojošos parametrus.
    * cleanAttribute kā virkne, kas norāda kolonnas nosaukumu šim noteikumam.
    * `min` kā skaitlis, kas norāda minimālo vērtību.
    * `max` kā skaitlis, kas norāda maksimālo vērtību.

{% hint style="info" %}
Lai skatītu ievades un piekļūtu jaunākajām pieejamajām enumerāciju vērtībām (piem., `operācijas`), ieteicams izmantot [Altair](/geopard-tutorials/lva/api-dokumentacija/darba-saksana-ar-geopard-api.md).
{% endhint %}

### Dokumentācija: YieldDataset vaicājums

Kā GeoPard API lietotājs jūs varat iegūt informāciju par koriģēšanas darbībām, kas piemērotas YieldDatasets, izmantojot atribūtus `appliedCorrections` un `appliedCorrectionsVersion`. Pirmais sniedz sarakstu ar veiktajām koriģēšanām (piem., `KALIBRĒŠANAS` un `TĪRĪŠANAS`), kuru izpildes secība norādīta to masīva secībā. Savukārt `appliedCorrectionsVersion` norāda izmantotā algoritma versiju.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
vaicājums DetailsAboutAppliedCalibrations {
  getFields (filter: {fieldUuid: "<placeholder_of_field_uuid>"}){
    fields {
      uuid
      yieldDatasets  {
        uuid
        appliedCorrections
        appliedCorrectionsVersion
      }
    }
  }
}
```

{% endcode %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.geopard.tech/geopard-tutorials/lva/api-dokumentacija/geopard-api-pieprasijumu-parskats/84.-mutacija-kalibret-un-notirit-razas-datu-kopu.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
