84. Mutasjon: Kalibrer og rengjør avlingsdatasett
API-kall for å rense og kalibrere avlingsdatasett
Kalibrering av "YieldDataset" er en funksjon som korrigerer fordelingen av verdier i tråd med matematiske prinsipper, noe som forbedrer dataintegriteten. Det styrker beslutningskvaliteten og gjør datasettet verdifullt for videre dyptgående analyser.
Vanlige bruksområder for denne funksjonaliteten inkluderer:
Synkronisering av data når flere treskere har jobbet samtidig eller over flere dager, for å sikre konsistens.
Gjøre datasettet mer homogent og nøyaktig ved å utjevne variasjoner.
Fjerne datastøy og overflødig informasjon som kan tilsløre innsikter.
Fjerne vendinger eller unormale geometrier som kan forvrenge de faktiske mønstrene og trender i åkeren.
Justere avlingsdata slik at de samsvarer med etablerte gjennomsnitt eller totaler for hvert attributt.
For en mer detaljert gjennomgang og eksempler, vennligst se vår Yield Calibration & Cleaning brukstilfelle.
Originalt YieldDataset med attributtet WetMass
Fem treskere jobbet parallelt på 30 ha-åkeren vist nedenfor. Kalibreringen av en av treskerne var ikke synkronisert med de andre, noe som resulterte i oransje flekkene, som indikerer at ytterligere KALIBRERING er nødvendig. I tillegg finnes det en rekke vendinger røde flekkene nærmere "Field"-kanten som må fjernes.

Kalibrert og renset YieldDataset med attributtet WetMass
Resultatet nedenfor viser datasettet etter å ha brukt automatiske KALIBRER og RENS operasjoner med standardparametere. Det resulterende "YieldDataset" har blitt homogent, uten uteliggere eller brå endringer mellom nabogeometrier.

Alternativene Pathwise vs Average/Total vs Conditional
Pathwise-kalibrering tilsvarer maskinens kjørespor. Hvert maskinspors behandles som en individuell region for kalibreringsformål. GeoPard-teamet foreslår å bruke denne metoden som standardtilnærming.
Average/Total-kalibrering fokuserer på å omfordele attributtverdier. Hvis de geospatiale mønstrene er riktige, men de absolutte tallene avviker fra realitetene, er denne metoden nyttig. For best resultat anbefaler GeoPard å kombinere den med Pathwise-kalibrering: først bruke Pathwise, deretter justere til kjente Average/Total-verdier.
Conditional-kalibrering justerer attributtverdier basert på oppgitte min- og maksgrenser. Denne metoden er spesielt verdifull når de geospatiale mønstrene er presise, men fordelingen av verdier trenger justeringer, særlig når kjente min- og maksverdier finnes. For beste resultater anbefaler GeoPard å kombinere den med Pathwise-kalibrering: starte med Pathwise, etterfulgt av justeringer for å samsvare med de kjente min- og maksverdiene.
Tips
Tips for dataanomalier
Hvis en bruker møter anomalier i dataene, som verdier på eller nær null, eller uvanlig store verdier (for eksempel et gjennomsnitt på 10 med en maksimum på 8000), anbefales Clean & Calibration arbeidsflyten. Den er konfigurert ved hjelp av parametere actions: [CLEAN, CALIBRATE].
Å prioritere datarensing før kalibrering sikrer fjerning av feil, manglende verdier eller inkonsistenser, og forbedrer dermed datakvaliteten og nøyaktigheten.
Tips for data uten innledende feil
For datasett som i utgangspunktet er fri for feil, manglende verdier eller inkonsistenser, og når flere treskere er kjent å ha vært involvert, vurder Calibration & Clean arbeidsflyten. Den er konfigurert ved hjelp av parametere actions: [CALIBRATE, CLEAN].
Rensing av data etter kalibrering hjelper med å finpusse datasettet ytterligere ved å potensielt eliminere eventuelle artefakter som ble introdusert under kalibreringen.
Dokumentasjon: Detaljer om mutasjon
Standardkonfigurasjonen aktiverer automatisk kalibrering og rensing av "YieldDataset".
Et mer avansert eksempel gir manuell kontroll av min/maks-områder og inkluderer flere attributter.
For å følge USDA-protokollen for RENS operasjonen, må du enten nevne ALLE kolonner i cleanAction -> conditionMinMaxClean eller spesifisere en del av dem i cleanAction -> conditionMinMaxClean og de resterende i condtionAutoClean -> excludedAttributes.
Inndataparamertere:
actionssom et array, som lar deg velge korrigeringshandlingene og rekkefølgen av anvendelse; støttede verdier inkludererRENSogKALIBRER.calibrateActionsom et objekt som inneholder konfigurasjonsdetaljer knyttet tilKALIBRERoperasjonen.calibrationAttributessom et array av attributter som krever kalibrering, vanligvis knyttet til Yield-kolonnen.smoothWindowSizesom et oddetalls heltall som jevner resultatverdiene og reduserer brå hopp i verdiene.conditionPathwiseCalibrationsom et objekt med Pathwise kalibrering tilsvarer maskinens kjørespor. Hvert maskinspors behandles som en individuell region for kalibreringsformål.calibrationBasissom en streng som representerer attributtet som brukes som basis for kalibrering.maxHomogeneityRegionsom en boolsk verdi som angir om maksimal homogenitetsregion brukes som referanseområde for kalibrering.syntheticMachinePathsom en boolsk verdi som angir simulering av maskinruter; det er nyttig når det presise maskinsporattributtet mangler og må simuleres basert på tidsstempler eller et lignende attributt.
conditionAvgTotalCalibrationsom et objekt med Average/Total kalibrering fokuserer på å omfordele attributtverdier. Hvis de geospatiale mønstrene er riktige, men de absolutte tallene avviker fra realitetene, er denne metoden nyttig.calibrationAttributesom en streng som representerer attributtet som skal kalibreres.averagesom et tall som representerer gjennomsnittsverdiene for attributtet; attributtverdiene bør samsvare med dette gjennomsnittet. Bare ett alternativ, entenaverageellertotal, bør brukes om gangen.totalsom et tall som representerer totalsummen av attributtverdiene; aggregatet av disse verdiene bør matche totalen. Bare ett alternativ, entenaverageellertotal, bør brukes om gangen.
conditionMinMaxCalibrationsom et objekt med Conditional kalibrering justerer attributtverdier basert på oppgitte min- og maksgrenser.calibrationAttributesom en streng som representerer attributtet som skal kalibreres.minsom et tall som representerer minimumsverdiene for attributtet, som fungerer som laveste grense for kalibrering.minIncludedsom en boolsk verdi som angir om minverdien skal inkluderes eller ikkemaxsom et tall som representerer maksimumsverdiene for attributtet, som fungerer som høyeste grense for kalibrering.maxIncludedsom en boolsk verdi som angir om maksverdien skal inkluderes eller ikke.
cleanActionsom et objekt som inkluderer konfigurasjonsspesifikasjonene knyttet tilRENSoperasjonen.conditionAutoCleansom et objekt som inkluderer konfigurasjonene spesifikke for auto-clean-algoritmen.targetAttributesom en streng som representerer målte Yield-verdier.excludedAttributessom et array av strenger som definerer attributter som ikke påvirker renseoperasjonen.
conditionMinMaxCleansom et array av objekter som inneholder de beskrevne rense-reglene; hvert objekt inkluderer følgende parametere.cleanAttribute som en streng som spesifiserer kolonnenavnet for regelen.
minsom et tall som angir minimumsverdien.maxsom et tall som angir maksimumsverdien.
For å se inputene og få tilgang til de siste tilgjengelige verdiene av enumerasjoner (for eksempel operations), anbefales det å bruke Altair.
Dokumentasjon: YieldDataset-spørring
Som en GeoPard API-bruker kan du hente detaljer om korrigeringene som er brukt på YieldDatasets gjennom attributtene appliedCorrections og appliedCorrectionsVersion. Den førstnevnte gir en liste over utførte korrigeringer (f.eks., KALIBRER og RENS), hvor rekkefølgen av utførelse angis av sekvensen i arrayet. I mellomtiden appliedCorrectionsVersion indikerer versjonen av algoritmen som ble brukt.
Sist oppdatert
Var dette nyttig?