# 84. Modyfikacja: Skalibruj i wyczyść YieldDataset

Kalibracja "YieldDataset" to funkcja, która koryguje rozkład wartości zgodnie z zasadami matematycznymi, zwiększając ogólną spójność danych. Wzmacnia jakość podejmowania decyzji i sprawia, że zbiór danych jest wartościowy do dalszej, dogłębnej analizy.

Typowe zastosowania tej funkcjonalności obejmują:

* Synchronizację danych, gdy kilka kombajnów pracowało jednocześnie lub w ciągu kilku dni, zapewniając spójność.
* Uczynienie zbioru danych bardziej jednorodnym i dokładnym poprzez wygładzenie wariacji.
* Usuwanie szumu danych i informacji zbędnych, które mogą zaciemniać wnioski.
* Eliminowanie nawrotów manewrów lub nieprawidłowych geometrii, które mogą zniekształcać rzeczywiste wzory i trendy na polu.
* Dopasowywanie danych plonów do ustalonych średnich lub sum dla każego atrybutu.

Aby uzyskać bardziej szczegółowe omówienie i przykłady, prosimy odnieść się do naszego [Przypadku użycia: Kalibracja i czyszczenie plonów](/geopard-tutorials/pl/agronomia/kalibracja-i-czyszczenie-plonow.md) przypadku użycia.

### Oryginalny YieldDataset z atrybutem WetMass

Pięć kombajnów pracowało równolegle na pokazanym poniżej polu o powierzchni 30 ha. Kalibracja jednego z kombajnów nie była zsynchronizowana z pozostałymi, skutkując <mark style="color:pomarańczowy;">pomarańczowy</mark> plamami, wskazującymi, że wymagana jest dodatkowa `KALIBRACJA` . Dodatkowo występuje wiele miejsc zawracania <mark style="color:czerwone;">czerwone</mark> plamy bliżej krawędzi "Pola", które należy usunąć.

<figure><img src="/files/58ab501f1ba47725d60bcb01bbc373a29d835bd6" alt=""><figcaption><p>Oryginalny YieldDataset z atrybutem WetMass</p></figcaption></figure>

### Skalibrowany i oczyszczony YieldDataset z atrybutem WetMass

Poniższy wynik pokazuje zbiór danych po zastosowaniu automatycznych `KALIBRACJI` i `OCZYSZCZANIA` operacji z użyciem parametrów domyślnych. Powstały "YieldDataset" stał się jednorodny, bez wartości odstających ani nagłych zmian między sąsiednimi geometriami.

<figure><img src="/files/11b444d9d4eb8f5b0d6b348b4e81d60953f711c3" alt=""><figcaption><p>Skalibrowany i oczyszczony YieldDataset z atrybutem WetMass</p></figcaption></figure>

### Opcje: według ścieżki vs średnia/suma vs warunkowa

**Kalibracja według ścieżki** odnosi się do torów maszyny. Każdy tor maszyny jest przetwarzany jako odrębny region do celów kalibracji. Zespół GeoPard sugeruje stosowanie tej metody jako podejścia standardowego.

**Kalibracja średnia/suma** koncentruje się na redystrybucji wartości atrybutów. Jeśli wzory geoprzestrzenne są prawidłowe, ale wartości bezwzględne odbiegają od rzeczywistych, ta metoda jest korzystna. Dla optymalnych rezultatów GeoPard zaleca połączenie jej z kalibracją według ścieżki: najpierw zastosować kalibrację według ścieżki, a następnie dopasować do znanych wartości średnich/sum.

**Kalibracja warunkowa** koryguje wartości atrybutów na podstawie podanych progów min i max. Ta metoda jest szczególnie przydatna, gdy wzory geoprzestrzenne są precyzyjne, ale rozkład wartości wymaga korekty, zwłaszcza gdy znane są wartości minimalne i maksymalne. Dla najlepszych wyników GeoPard rekomenduje łączenie jej z kalibracją według ścieżki: rozpoczęcie od kalibracji według ścieżki, a następnie dostosowanie do znanych wartości min i max.

### Wskazówki

{% hint style="warning" %}
**Wskazówka dotycząca anomalii danych**

Jeśli użytkownik napotka anomalie w danych, takie jak wartości równe lub bliskie zeru, lub niezwykle duże wartości (na przykład średnia 10 z maksimum 8000), zaleca się użycie **przepływu pracy Clean & Calibration** . Jest on skonfigurowany przy użyciu parametrów `akcje: [CLEAN, CALIBRATE]`.&#x20;

Priorytetowe oczyszczanie danych przed kalibracją zapewnia usunięcie błędów, brakujących wartości lub niespójności, przez co poprawia jakość i dokładność danych.
{% endhint %}

{% hint style="warning" %}
**Wskazówka dotycząca danych bez początkowych błędów**&#x20;

Dla zbiorów danych początkowo wolnych od błędów, brakujących wartości lub niespójności, oraz gdy wiadomo, że uczestniczyło kilku kombajnów, rozważ zastosowanie **przepływu pracy Calibration & Clean** . Jest on skonfigurowany przy użyciu parametrów `akcje:  [CALIBRATE, CLEAN]`.

Oczyszczanie danych po kalibracji pomaga dodatkowo dopracować zbiór danych poprzez potencjalne usunięcie wszelkich artefaktów wprowadzonych podczas kalibracji.
{% endhint %}

### Dokumentacja: szczegóły mutacji

Domyślna standardowa konfiguracja umożliwia automatyczną kalibrację i oczyszczanie "YieldDataset".

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutacja AutoCalibrateYieldDataset {
  kalibrujYieldDataset(wejście: {
    poleUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    akcje: {
      akcjaKalibracji: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        conditionPathwiseCalibration: {
          calibrationBasis: "WetMass"
          maxHomogeneityRegion: true
          syntheticMachinePath: true
        }
      }
      akcjaCzyszczenia: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
      }
      
      akcje:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    kodStatusu
    statusMessage
  }
}
```

{% endcode %}

Bardziej zaawansowany przykład zapewnia ręczną kontrolę zakresów min/max i uwzględnia dodatkowe atrybuty.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
mutacja CustomCalibrateYieldDataset {
  kalibrujYieldDataset(wejście: {
    poleUuid: "<placeholder_of_field_uuid>"
    yieldDatasetUuid: "<placeholder_of_dataset_uuid>"
    akcje: {
      akcjaKalibracji: {
        calibrationAttributes:["WetMass", "VRYIELDVOL"]
        smoothWindowSize: 11
        conditionPathwiseCalibration: {
          calibrationBasis: "Machine"
          maxHomogeneityRegion: true
          syntheticMachinePath: false
        }
        conditionAvgTotalCalibration:[{
          calibrationAttribute: "WetMass"
          average:8.0
        }]
      }
      akcjaCzyszczenia: {
        condtionAutoClean: {
          targetAttribute: "WetMass"
        }
        conditionMinMaxClean: [{
          cleanAttribute: "Distance"
          min: 1.5
          max: 10.0
        }]
      }
      akcje:  [CALIBRATE, CLEAN]
    }
  }) {
    uuid
    fieldUuid
    originalUuid
    kodStatusu
    statusMessage
  }
}
```

{% endcode %}

{% hint style="info" %}
Aby przestrzegać protokołu USDA dla `OCZYSZCZANIA` operacji, musisz albo wymienić WSZYSTKIE kolumny w `akcjaCzyszczenia` -> `conditionMinMaxClean` albo określić ich część w `akcjaCzyszczenia` -> `conditionMinMaxClean` i pozostałe w `condtionAutoClean` -> `excludedAttributes`.
{% endhint %}

Parametry wejściowe:

* `akcje` jako tablica, umożliwiająca wybór *działań korygujących i ich kolejności* zastosowania; obsługiwane wartości obejmują `OCZYSZCZANIA` i `KALIBRACJI`.
* `akcjaKalibracji` jako obiekt zawierający szczegóły konfiguracji związane z `KALIBRACJI` operacją.&#x20;
  * `calibrationAttributes` jako tablica atrybutów wymagających kalibracji, zazwyczaj powiązanych z kolumną Yield.
  * `smoothWindowSize` jako nieparzysta liczba całkowita, która wygładza wartości wynikowe, zmniejszając nagłe skoki wartości.
  * `conditionPathwiseCalibration` jako obiekt z **Pathwise** kalibracja odnosi się do torów maszyny. Każdy tor maszyny jest przetwarzany jako odrębny region do celów kalibracji.
    * `calibrationBasis` jako łańcuch znaków reprezentujący atrybut używany jako baza do kalibracji.
    * `maxHomogeneityRegion` jako wartość logiczna wskazująca, czy region o maksymalnej jednorodności jest używany jako region referencyjny do kalibracji.
    * `syntheticMachinePath` jako wartość logiczna wskazująca symulację tras maszyny; jest korzystna, gdy precyzyjny atrybut ścieżki maszyny jest nieobecny i trzeba go zasymulować na podstawie znaczników czasu lub podobnego atrybutu.
  * `conditionAvgTotalCalibration` jako obiekt z **Średnia/Suma** kalibracja koncentruje się na redystrybucji wartości atrybutów. Jeśli wzory geoprzestrzenne są prawidłowe, ale wartości bezwzględne odbiegają od rzeczywistych, ta metoda jest korzystna.
    * `calibrationAttribute` jako łańcuch znaków reprezentujący atrybut, który ma być skalibrowany.
    * `average` jako liczba reprezentująca wartości średnie atrybutu; wartości atrybutu powinny być zgodne z tą średnią. Należy używać tylko jednej opcji, albo `average` lub `total`, powinna być używana jednocześnie.
    * `total` jako liczba reprezentująca całkowitą sumę wartości atrybutu; suma tych wartości powinna odpowiadać tej sumie. Należy używać tylko jednej opcji, albo `average` lub `total`, powinna być używana jednocześnie.
  * `conditionMinMaxCalibration` jako obiekt z **Warunkowa** kalibracja koryguje wartości atrybutów na podstawie podanych progów min i max.
    * `calibrationAttribute` jako łańcuch znaków reprezentujący atrybut, który ma być skalibrowany.
    * `min` jako liczba reprezentująca minimalne wartości atrybutu, służąca jako najniższy zakres dla kalibracji.
    * `minIncluded` jako wartość logiczna wskazująca, czy wartość minimalna ma być włączona, czy nie
    * `max` jako liczba reprezentująca maksymalne wartości atrybutu, służąca jako najwyższy zakres dla kalibracji.
    * `maxIncluded` jako wartość logiczna wskazująca, czy wartość maksymalna ma być włączona, czy nie.
* `akcjaCzyszczenia` jako obiekt, który zawiera szczegóły konfiguracji powiązane z `OCZYSZCZANIA` operacją.
  * `conditionAutoClean` jako obiekt, który zawiera konfiguracje specyficzne dla algorytmu automatycznego oczyszczania.
    * `targetAttribute` jako łańcuch znaków reprezentujący docelowe wartości Yield.
    * `excludedAttributes` jako tablica łańcuchów definiujących atrybuty, które nie wpływają na operację czyszczenia.
  * `conditionMinMaxClean` jako tablica obiektów zawierających opisane zasady czyszczenia; każdy obiekt zawiera następujące parametry.
    * cleanAttribute jako łańcuch określający nazwę kolumny dla reguły.
    * `min` jako liczba wskazująca wartość minimalną.
    * `max` jako liczba wskazująca wartość maksymalną.

{% hint style="info" %}
Aby zobaczyć wejścia i uzyskać dostęp do najnowszych dostępnych wartości enumeracji (takich jak `operacje`), zaleca się korzystanie z [Altair](/geopard-tutorials/pl/dokumentacja-api/pierwsze-kroki-z-api-geopard.md).
{% endhint %}

### Dokumentacja: zapytanie YieldDataset

Jako konsument API GeoPard możesz pobrać szczegóły dotyczące korekt zastosowanych do YieldDatasets poprzez atrybuty `appliedCorrections` i `appliedCorrectionsVersion`. Ten pierwszy dostarcza listę dokonanych korekt (np. `KALIBRACJI` i `OCZYSZCZANIA`), przy czym kolejność wykonania jest oznaczona przez ich sekwencję w tablicy. Tymczasem `appliedCorrectionsVersion` wskazuje wersję zastosowanego algorytmu.

{% code overflow="wrap" lineNumbers="true" %}

```graphql
zapytanie DetailsAboutAppliedCalibrations {
  getFields (filter: {fieldUuid: "<placeholder_of_field_uuid>"}){
    fields {
      uuid
      yieldDatasets  {
        uuid
        appliedCorrections
        appliedCorrectionsVersion
      }
    }
  }
}
```

{% endcode %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.geopard.tech/geopard-tutorials/pl/dokumentacja-api/przeglad-zapytan-api-geopard/84.-modyfikacja-skalibruj-i-wyczysc-yielddataset.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
