84. Mutation: Kalibrer og rens YieldDataset
API-opkald til rensning og kalibrering af ydelsesdatasæt
Kalibrering af "YieldDataset" er en funktion, der korrigerer fordeling af værdier i overensstemmelse med matematiske principper og forbedrer datas integritet. Det styrker kvaliteten af beslutningstagning og gør datasættet værdifuldt til yderligere dybdegående analyser.
Almindelige anvendelsestilfælde for denne funktion omfatter:
Synkronisering af data når flere mejetærskere har arbejdet enten samtidig eller over flere dage for at sikre konsistens.
Gøre datasættet mere homogent og præcist ved at udjævne variationer.
Fjerne datastøj og overflødig information, som kan sløre indsigt.
Fjerne vendinger eller unormale geometrier, som kan forvride de faktiske mønstre og tendenser i marken.
Justere udbyttedata, så de svarer til etablerede gennemsnit eller totaler for hver attribut.
For en mere detaljeret gennemgang og eksempler, se venligst vores Yield Kalibrering & Rensning use case.
Originalt YieldDataset med WetMass-attribut
Fem mejetærskere arbejdede parallelt på den 30 ha store mark vist nedenfor. Kalibreringen af en af mejetærskerne var ikke synkroniseret med de andre, hvilket resulterede i orange pletter, hvilket indikerer, at yderligere KALIBRERING er påkrævet. Derudover er der talrige vendinger røde pletter tættere på "Mark"-kanterne, som skal fjernes.

Kalibreret og Renset YieldDataset med WetMass-attribut
Resultatet nedenfor viser datasættet efter automatisk anvendelse af KALIBRER og RENS operationer med standardparametre. Det resulterende "YieldDataset" er blevet homogent, uden afvigere eller abrupt skift mellem nabogeometrier.

Pathwise vs Gennemsnit/Total vs Betingede muligheder
Pathwise-kalibrering svarrer til maskinens spor. Hvert maskinspors behandles som en individuel region til kalibreringsformål. GeoPard-teamet foreslår at bruge denne metode som standardtilgang.
Gennemsnit/Total-kalibrering fokuserer på at omfordele attributværdier. Hvis de geospatiale mønstre er korrekte, men de absolutte tal afviger fra realiteterne, er denne metode nyttig. For optimale resultater anbefaler GeoPard at kombinere den med Pathwise-kalibrering: først anvende Pathwise og derefter justere til kendte gennemsnits-/totalværdier.
Betinget kalibrering justerer attributværdier baseret på angivne min- og maks-grænser. Denne metode er særligt værdifuld, når de geospatiale mønstre er præcise, men fordelingen af værdier kræver justeringer, især hvis kendte min- og maks-værdier foreligger. For de bedste resultater anbefaler GeoPard at parre denne metode med Pathwise-kalibrering: start med Pathwise og følg op med justeringer for at tilpasse til de kendte min- og maks-værdier.
Tip
Tip til dataanomalier
Hvis en bruger støder på anomalier i dataene, såsom værdier på eller tæt på nul, eller usædvanlig store værdier (for eksempel et gennemsnit på 10 med et maksimum på 8000), anbefales Rens & Kalibrering workflowet. Det konfigureres ved hjælp af parametre actions: [CLEAN, CALIBRATE].
At prioritere rensning af data før kalibrering sikrer fjernelse af fejl, manglende værdier eller inkonsistenser og forbedrer dermed datakvaliteten og nøjagtigheden.
Tip til data uden indledende fejl
For datasæt, der indledningsvist er fri for fejl, manglende værdier eller inkonsistenser, og når flere mejetærskere vides at være involveret, bør man overveje Kalibrering & Rens workflowet. Det konfigureres ved hjælp af parametre actions: [CALIBRATE, CLEAN].
At rense data efter kalibrering hjælper med yderligere at forfine datasættet ved potentielt at fjerne artefakter, der er indført under kalibreringen.
Dokumentation: Mutation detaljer
Standardkonfigurationen aktiverer automatisk kalibrering og rensning af "YieldDataset".
Et mere avanceret eksempel giver manuel kontrol af min/max-intervaller og indarbejder yderligere attributter.
For at følge USDA-protokollen for RENS operationen, skal du enten nævne ALLE kolonner i cleanAction -> conditionMinMaxClean eller angive en del af dem i cleanAction -> conditionMinMaxClean og de resterende i condtionAutoClean -> excludedAttributes.
Inputparametre:
actionssom et array, der giver dig mulighed for at vælge de korrigerende handlinger og deres rækkefølge for anvendelse; understøttede værdier inkludererRENSogKALIBRER.calibrateActionsom et objekt, der indeholder konfigurationsdetaljer relateret tilKALIBRERoperationen.calibrationAttributessom et array af attributter, der kræver kalibrering, typisk knyttet til Yield-kolonnen.smoothWindowSizesom et ulige heltal, der udjævner resultatværdierne og reducerer pludselige spring i værdierne.conditionPathwiseCalibrationsom et objekt med Pathwise kalibreringen svarer til maskinens spor. Hvert maskinspors behandles som en individuel region til kalibreringsformål.calibrationBasissom en streng, der repræsenterer den attribut, der bruges som basis for kalibrering.maxHomogeneityRegionsom en boolean, der angiver, om den maksimale homogenitetsregion bruges som referenceområde for kalibrering.syntheticMachinePathsom en boolean, der angiver simulering af maskineruter; det er nyttigt, når den præcise maskinsti-attribut mangler og skal simuleres baseret på tidsstempler eller en lignende attribut.
conditionAvgTotalCalibrationsom et objekt med Gennemsnit/Total kalibrering fokuserer på omfordeling af attributværdier. Hvis de geospatiale mønstre er korrekte, men de absolutte tal afviger fra realiteterne, er denne metode nyttig.calibrationAttributesom en streng, der repræsenterer den attribut, der skal kalibreres.averagesom et tal, der repræsenterer attributtens gennemsnitsværdier; attributværdierne bør stemme overens med dette gennemsnit. Kun én mulighed, entenaverageellertotal, bør anvendes ad gangen.totalsom et tal, der repræsenterer den totale sum af attributværdierne; summen af disse værdier bør matche totalen. Kun én mulighed, entenaverageellertotal, bør anvendes ad gangen.
conditionMinMaxCalibrationsom et objekt med Betinget kalibrering justerer attributværdier baseret på angivne min- og maks-grænser.calibrationAttributesom en streng, der repræsenterer den attribut, der skal kalibreres.minsom et tal, der repræsenterer attributtens minimumsværdier og fungerer som den laveste rækkevidde for kalibrering.minIncludedsom en boolean, der angiver om minimumsværdien skal medtages eller ej.maxsom et tal, der repræsenterer attributtens maksimumsværdier og fungerer som den højeste rækkevidde for kalibrering.maxIncludedsom en boolean, der angiver om maksimumsværdien skal medtages eller ej.
cleanActionsom et objekt, der indeholder konfigurationsspecifikke detaljer knyttet tilRENSoperationen.conditionAutoCleansom et objekt, der indeholder konfigurationer specifikke for auto-clean-algoritmen.targetAttributesom en streng, der repræsenterer målte Yield-værdier.excludedAttributessom et array af strenge, der definerer attributter, der ikke påvirker renseoperationen.
conditionMinMaxCleansom et array af objekter, der indeholder de beskrevne rense-regler; hvert objekt inkluderer følgende parametre.cleanAttribute som en streng, der specificerer kolonnenavnet for reglen.
minsom et tal, der angiver minimumsværdien.maxsom et tal, der angiver maksimumsværdien.
For at se inputtene og få adgang til de senest tilgængelige værdier af enumerationer (såsom operationer), anbefales det at bruge Altair.
Dokumentation: YieldDataset-forespørgsel
Som GeoPard API-bruger kan du hente detaljer om de korrektioner, der er anvendt på YieldDatasets gennem attributterne appliedCorrections og appliedCorrectionsVersion. Den første giver en liste over foretagne korrektioner (f.eks., KALIBRER og RENS), med udførelsesrækkefølgen angivet ved deres sekvens i arrayet. Imens appliedCorrectionsVersion angiver den version af algoritmen, der blev anvendt.
Last updated
Was this helpful?