84. Mutation: Kalibrera och rensa skörde-dataset
API-anrop för att rensa och kalibrera skörde-dataset
Kalibrering av "YieldDataset" är en funktion som korrigerar värdefördelningen i enlighet med matematiska principer och förbättrar datans övergripande integritet. Den stärker beslutsfattandets kvalitet och gör datasettet användbart för vidare fördjupad analys.
Vanliga användningsfall för denna funktionalitet inkluderar:
Synkronisering av data när flera skördetröskor har arbetat samtidigt eller över flera dagar, för att säkerställa konsekvens.
Gör datasettet mer homogent och exakt genom att jämna ut variationer.
Tar bort databrus och överflödig information som kan dölja insikter.
Eliminerar vändningar eller onormala geometriska former som kan förvränga verkliga mönster och trender på fältet.
Justera skördeuppgifter så att de motsvarar etablerade medelvärden eller totalsummor för varje attribut.
För en mer detaljerad genomgång och exempel, vänligen se vår Yield Calibration & Cleaning användningsfall.
Originalt YieldDataset med attributet WetMass
Fem skördetröskor arbetade parallellt på det 30 ha stora fältet som visas nedan. Kalibreringen av en av tröskorna var inte synkroniserad med de andra, vilket resulterade i orange fläckar, vilket indikerar att ytterligare KALIBRERING krävs. Dessutom finns det många vändnings- röda fläckar närmare "Field"-kanterna som behöver elimineras.

Kalibrerat och rensat YieldDataset med attributet WetMass
Resultatet nedan visar datasettet efter att automatiska KALIBRERA och RENSA operationer har tillämpats med standardparametrar. Det resulterande "YieldDataset" har blivit homogent, utan avvikare eller plötsliga förändringar mellan intilliggande geometrier.

Alternativ: Pathwise vs Average/Total vs Conditional
Pathwise-kalibrering motsvarar maskinens körspår. Varje maskinspår behandlas som en separat region för kalibreringsändamål. GeoPard-teamet föreslår att använda denna metod som standard.
Average/Total-kalibrering fokuserar på att omfördela attributvärden. Om de geospatiala mönstren är korrekta men de absoluta siffrorna avviker från verkligheten, är denna metod fördelaktig. För bästa resultat rekommenderar GeoPard att kombinera den med Pathwise-kalibrering: tillämpa först Pathwise och justera sedan till kända Average/Total-värden.
Conditional-kalibrering justerar attributvärden baserat på angivna min- och maxtrösklar. Denna metod är särskilt värdefull när de geospatiala mönstren är precisa men värdefördelningen behöver justeras, särskilt när kända min- och maxvärden finns. För bästa resultat rekommenderar GeoPard att kombinera den med Pathwise-kalibrering: börja med Pathwise och följ sedan upp med justeringar för att anpassa till de kända min- och maxvärdena.
Tips
Tips för dataavvikelser
Om en användare stöter på avvikelser i datan, som värden vid eller nära noll, eller ovanligt stora värden (till exempel ett medelvärde på 10 med en maximal värde på 8000), rekommenderas Clean & Calibration arbetsflödet. Det konfigureras med parametrar åtgärder: [CLEAN, CALIBRATE].
Att prioritera datarensning innan kalibrering säkerställer att fel, saknade värden eller inkonsekvenser tas bort, vilket förbättrar datakvalitet och noggrannhet.
Tips för data utan initiala fel
För dataset som initialt är fria från fel, saknade värden eller inkonsekvenser, och när flera skördetröskor är kända att ha varit involverade, överväg Calibration & Clean arbetsflödet. Det konfigureras med parametrar åtgärder: [CALIBRATE, CLEAN].
Att rensa datan efter kalibrering hjälper till att ytterligare förfina datasettet genom att potentiellt eliminera artefakter som introducerats under kalibreringen.
Dokumentation: Mutationdetaljer
Standardkonfigurationen aktiverar automatisk kalibrering och rensning av "YieldDataset".
Ett mer avancerat exempel ger manuell kontroll över min/max-intervall och inkluderar ytterligare attribut.
För att följa USDA-protokollet för RENSA operationen måste du antingen nämna ALLA kolumner i cleanAction -> conditionMinMaxClean eller specificera en del av dem i cleanAction -> conditionMinMaxClean och de återstående i condtionAutoClean -> excludedAttributes.
Inmatningsparametrar:
åtgärdersom en array, vilket låter dig välja de korrigerande åtgärderna och deras ordningsföljd för tillämpning; stödda värden inkluderarRENSAochKALIBRERA.calibrateActionsom ett objekt som innehåller konfigurationsdetaljer relaterade tillKALIBRERAoperationen.calibrationAttributessom en lista med attribut som kräver kalibrering, vanligtvis kopplade till Yield-kolumnen.smoothWindowSizesom ett udda heltal som utjämnar resultatvärdena och minskar plötsliga hopp i värdena.conditionPathwiseCalibrationsom ett objekt med Pathwise kalibreringen motsvarar maskinens körspår. Varje maskinspår behandlas som en separat region för kalibreringsändamål.calibrationBasissom en sträng som representerar attributet som används som grund för kalibreringen.maxHomogeneityRegionsom en boolean som anger om maximal homogenitetsregion används som referensregion för kalibrering.syntheticMachinePathsom en boolean som indikerar simulering av maskinrutter; det är fördelaktigt när exakt maskinspårs-attribut saknas och behöver simuleras baserat på tidsstämplar eller liknande attribut.
conditionAvgTotalCalibrationsom ett objekt med Average/Total kalibrering fokuserar på att omfördela attributvärden. Om de geospatiala mönstren är korrekta men de absoluta siffrorna avviker från verkligheten är denna metod fördelaktig.calibrationAttributesom en sträng som representerar attributet som ska kalibreras.averagesom ett nummer som representerar attributets medelvärden; attributvärdena bör överensstämma med detta medelvärde. Endast ett alternativ, antingenaverageellertotal, bör användas åt gången.totalsom ett nummer som representerar den totala summan av attributvärdena; summan av dessa värden bör matcha totalen. Endast ett alternativ, antingenaverageellertotal, bör användas åt gången.
conditionMinMaxCalibrationsom ett objekt med Conditional kalibrering justerar attributvärden baserat på angivna min- och maxtrösklar.calibrationAttributesom en sträng som representerar attributet som ska kalibreras.minsom ett nummer som representerar attributets minimivärde och fungerar som det lägsta intervallet för kalibrering.minIncludedsom en boolean som indikerar om minimivärdet ska inkluderas eller intemaxsom ett nummer som representerar attributets maximivärde och fungerar som det högsta intervallet för kalibrering.maxIncludedsom en boolean som indikerar om maximivärdet ska inkluderas eller inte.
cleanActionsom ett objekt som inkluderar konfigurationsspecifika detaljer knutna tillRENSAoperationen.conditionAutoCleansom ett objekt som innehåller konfigurationerna specifika för auto-clean-algoritmen.targetAttributesom en sträng som representerar målade Yield-värden.excludedAttributessom en lista med strängar som definierar attribut som inte påverkar rensningsoperationen.
conditionMinMaxCleansom en lista med objekt som innehåller de beskrivna rensningsreglerna; varje objekt inkluderar följande parametrar.cleanAttribute som en sträng som anger kolumnnamnet för regeln.
minsom ett nummer som anger minimivärdet.maxsom ett nummer som anger maximivärdet.
För att visa inmatningarna och få tillgång till de senaste tillgängliga värdena för uppräkningar (såsom operationer), rekommenderas det att använda Altair.
Dokumentation: YieldDataset-fråga
Som en GeoPard API-konsument kan du hämta detaljer om de korrigeringar som tillämpats på YieldDatasets genom attributen appliedCorrections och appliedCorrectionsVersion. Det förstnämnda ger en lista över gjorda korrigeringar (t.ex., KALIBRERA och RENSA), där utförandeordningen anges av deras sekvens i arrayen. Samtidigt appliedCorrectionsVersion anger versionen av den använda algoritmen.
Last updated
Was this helpful?