84. Mutacja: Skalibruj i oczyść YieldDataset
Wywołania API do czyszczenia i kalibracji zestawów danych plonów
Kalibracja "YieldDataset" to funkcja, która koryguje rozkład wartości zgodnie z zasadami matematycznymi, zwiększając ogólną spójność danych. Wzmacnia jakość podejmowania decyzji i sprawia, że zbiór danych jest wartościowy do dalszej, dogłębnej analizy.
Typowe zastosowania tej funkcjonalności obejmują:
Synchronizację danych, gdy kilka kombajnów pracowało jednocześnie lub w ciągu kilku dni, zapewniając spójność.
Uczynienie zbioru danych bardziej jednorodnym i dokładnym poprzez wygładzenie wariacji.
Usuwanie szumu danych i informacji zbędnych, które mogą zaciemniać wnioski.
Eliminowanie nawrotów manewrów lub nieprawidłowych geometrii, które mogą zniekształcać rzeczywiste wzory i trendy na polu.
Dopasowywanie danych plonów do ustalonych średnich lub sum dla każego atrybutu.
Aby uzyskać bardziej szczegółowe omówienie i przykłady, prosimy odnieść się do naszego Przypadku użycia: Kalibracja i czyszczenie plonów przypadku użycia.
Oryginalny YieldDataset z atrybutem WetMass
Pięć kombajnów pracowało równolegle na pokazanym poniżej polu o powierzchni 30 ha. Kalibracja jednego z kombajnów nie była zsynchronizowana z pozostałymi, skutkując pomarańczowy plamami, wskazującymi, że wymagana jest dodatkowa KALIBRACJA . Dodatkowo występuje wiele miejsc zawracania czerwone plamy bliżej krawędzi "Pola", które należy usunąć.

Skalibrowany i oczyszczony YieldDataset z atrybutem WetMass
Poniższy wynik pokazuje zbiór danych po zastosowaniu automatycznych KALIBRACJI i OCZYSZCZANIA operacji z użyciem parametrów domyślnych. Powstały "YieldDataset" stał się jednorodny, bez wartości odstających ani nagłych zmian między sąsiednimi geometriami.

Opcje: według ścieżki vs średnia/suma vs warunkowa
Kalibracja według ścieżki odnosi się do torów maszyny. Każdy tor maszyny jest przetwarzany jako odrębny region do celów kalibracji. Zespół GeoPard sugeruje stosowanie tej metody jako podejścia standardowego.
Kalibracja średnia/suma koncentruje się na redystrybucji wartości atrybutów. Jeśli wzory geoprzestrzenne są prawidłowe, ale wartości bezwzględne odbiegają od rzeczywistych, ta metoda jest korzystna. Dla optymalnych rezultatów GeoPard zaleca połączenie jej z kalibracją według ścieżki: najpierw zastosować kalibrację według ścieżki, a następnie dopasować do znanych wartości średnich/sum.
Kalibracja warunkowa koryguje wartości atrybutów na podstawie podanych progów min i max. Ta metoda jest szczególnie przydatna, gdy wzory geoprzestrzenne są precyzyjne, ale rozkład wartości wymaga korekty, zwłaszcza gdy znane są wartości minimalne i maksymalne. Dla najlepszych wyników GeoPard rekomenduje łączenie jej z kalibracją według ścieżki: rozpoczęcie od kalibracji według ścieżki, a następnie dostosowanie do znanych wartości min i max.
Wskazówki
Wskazówka dotycząca anomalii danych
Jeśli użytkownik napotka anomalie w danych, takie jak wartości równe lub bliskie zeru, lub niezwykle duże wartości (na przykład średnia 10 z maksimum 8000), zaleca się użycie przepływu pracy Clean & Calibration . Jest on skonfigurowany przy użyciu parametrów akcje: [CLEAN, CALIBRATE].
Priorytetowe oczyszczanie danych przed kalibracją zapewnia usunięcie błędów, brakujących wartości lub niespójności, przez co poprawia jakość i dokładność danych.
Wskazówka dotycząca danych bez początkowych błędów
Dla zbiorów danych początkowo wolnych od błędów, brakujących wartości lub niespójności, oraz gdy wiadomo, że uczestniczyło kilku kombajnów, rozważ zastosowanie przepływu pracy Calibration & Clean . Jest on skonfigurowany przy użyciu parametrów akcje: [CALIBRATE, CLEAN].
Oczyszczanie danych po kalibracji pomaga dodatkowo dopracować zbiór danych poprzez potencjalne usunięcie wszelkich artefaktów wprowadzonych podczas kalibracji.
Dokumentacja: szczegóły mutacji
Domyślna standardowa konfiguracja umożliwia automatyczną kalibrację i oczyszczanie "YieldDataset".
Bardziej zaawansowany przykład zapewnia ręczną kontrolę zakresów min/max i uwzględnia dodatkowe atrybuty.
Aby przestrzegać protokołu USDA dla OCZYSZCZANIA operacji, musisz albo wymienić WSZYSTKIE kolumny w akcjaCzyszczenia -> conditionMinMaxClean albo określić ich część w akcjaCzyszczenia -> conditionMinMaxClean i pozostałe w condtionAutoClean -> excludedAttributes.
Parametry wejściowe:
akcjejako tablica, umożliwiająca wybór działań korygujących i ich kolejności zastosowania; obsługiwane wartości obejmująOCZYSZCZANIAiKALIBRACJI.akcjaKalibracjijako obiekt zawierający szczegóły konfiguracji związane zKALIBRACJIoperacją.calibrationAttributesjako tablica atrybutów wymagających kalibracji, zazwyczaj powiązanych z kolumną Yield.smoothWindowSizejako nieparzysta liczba całkowita, która wygładza wartości wynikowe, zmniejszając nagłe skoki wartości.conditionPathwiseCalibrationjako obiekt z Pathwise kalibracja odnosi się do torów maszyny. Każdy tor maszyny jest przetwarzany jako odrębny region do celów kalibracji.calibrationBasisjako łańcuch znaków reprezentujący atrybut używany jako baza do kalibracji.maxHomogeneityRegionjako wartość logiczna wskazująca, czy region o maksymalnej jednorodności jest używany jako region referencyjny do kalibracji.syntheticMachinePathjako wartość logiczna wskazująca symulację tras maszyny; jest korzystna, gdy precyzyjny atrybut ścieżki maszyny jest nieobecny i trzeba go zasymulować na podstawie znaczników czasu lub podobnego atrybutu.
conditionAvgTotalCalibrationjako obiekt z Średnia/Suma kalibracja koncentruje się na redystrybucji wartości atrybutów. Jeśli wzory geoprzestrzenne są prawidłowe, ale wartości bezwzględne odbiegają od rzeczywistych, ta metoda jest korzystna.calibrationAttributejako łańcuch znaków reprezentujący atrybut, który ma być skalibrowany.averagejako liczba reprezentująca wartości średnie atrybutu; wartości atrybutu powinny być zgodne z tą średnią. Należy używać tylko jednej opcji, alboaveragelubtotal, powinna być używana jednocześnie.totaljako liczba reprezentująca całkowitą sumę wartości atrybutu; suma tych wartości powinna odpowiadać tej sumie. Należy używać tylko jednej opcji, alboaveragelubtotal, powinna być używana jednocześnie.
conditionMinMaxCalibrationjako obiekt z Warunkowa kalibracja koryguje wartości atrybutów na podstawie podanych progów min i max.calibrationAttributejako łańcuch znaków reprezentujący atrybut, który ma być skalibrowany.minjako liczba reprezentująca minimalne wartości atrybutu, służąca jako najniższy zakres dla kalibracji.minIncludedjako wartość logiczna wskazująca, czy wartość minimalna ma być włączona, czy niemaxjako liczba reprezentująca maksymalne wartości atrybutu, służąca jako najwyższy zakres dla kalibracji.maxIncludedjako wartość logiczna wskazująca, czy wartość maksymalna ma być włączona, czy nie.
akcjaCzyszczeniajako obiekt, który zawiera szczegóły konfiguracji powiązane zOCZYSZCZANIAoperacją.conditionAutoCleanjako obiekt, który zawiera konfiguracje specyficzne dla algorytmu automatycznego oczyszczania.targetAttributejako łańcuch znaków reprezentujący docelowe wartości Yield.excludedAttributesjako tablica łańcuchów definiujących atrybuty, które nie wpływają na operację czyszczenia.
conditionMinMaxCleanjako tablica obiektów zawierających opisane zasady czyszczenia; każdy obiekt zawiera następujące parametry.cleanAttribute jako łańcuch określający nazwę kolumny dla reguły.
minjako liczba wskazująca wartość minimalną.maxjako liczba wskazująca wartość maksymalną.
Aby zobaczyć wejścia i uzyskać dostęp do najnowszych dostępnych wartości enumeracji (takich jak operacje), zaleca się korzystanie z Altair.
Dokumentacja: zapytanie YieldDataset
Jako konsument API GeoPard możesz pobrać szczegóły dotyczące korekt zastosowanych do YieldDatasets poprzez atrybuty appliedCorrections i appliedCorrectionsVersion. Ten pierwszy dostarcza listę dokonanych korekt (np. KALIBRACJI i OCZYSZCZANIA), przy czym kolejność wykonania jest oznaczona przez ich sekwencję w tablicy. Tymczasem appliedCorrectionsVersion wskazuje wersję zastosowanego algorytmu.
Last updated
Was this helpful?