84. Mutacija: kalibruoti ir valyti derliaus duomenų rinkinį
API iškvietimai derliaus duomenų rinkinių valymui ir kalibravimui
„YieldDataset“ kalibravimas yra funkcija, kuri ištaiso reikšmių pasiskirstymą pagal matematikos principus, pagerindama duomenų vientisumą. Tai stiprina sprendimų priėmimo kokybę ir daro duomenų rinkinį vertingu tolesnei išsamaiai analizei.
Šios funkcijos įprasti panaudojimo atvejai apima:
Duomenų sinchronizavimą, kai keli kombainai dirbo vienu metu arba per kelias dienas, užtikrinant nuoseklumą.
Duomenų rinkinio homogenizavimą ir tikslumo didinimą, sušvelninant svyravimus.
Triukšmo ir nereikalingos informacijos pašalinimą, kuri gali užtemdyti įžvalgas.
Apsisukimų arba nenormalių geometrijų eliminavimą, kurie gali iškraipyti tikrus lauko modelius ir tendencijas.
Derliaus duomenų sureguliavimą taip, kad jie atitiktų nustatytus vidurkius arba sumas kiekvienam atributui.
Norėdami išsamesnės apžvalgos ir pavyzdžių, kreipkitės į mūsų Derliaus kalibravimo ir valymo naudojimo atvejį.
Originalus YieldDataset su WetMass atributu
Penki kombainai dirbo lygiagrečiai 30 ha lauke, parodytame žemiau. Vieno iš kombainų kalibracija nebuvo sinchronizuota su kitais, dėl ko atsirado oranžinė taškeliai, rodantys, kad reikalingas papildomas KALIBRAVIMAS Be to, daugelyje vietų yra apsisukimų raudoni taškai arčiau „Lauko“ kraštų, kuriuos reikia pašalinti.

Kalibruotas ir išvalytas YieldDataset su WetMass atributu
Žemiau pateiktas rezultatas rodo duomenų rinkinį po automatinio KALIBRUOTI ir VALYTI operacijų pritaikymo naudojant numatytuosius parametrus. Gautoji „YieldDataset“ tapo homogeniška, be anomalijų ar staigių pokyčių tarp gretimų geometrijų.

Parinktys: pagal takus vs vidurkis/suma vs sąlyginė
Pagal takus atliekama kalibracija atitinka mašinos važiavimo takus. Kiekvienas mašinos takas apdorojamas kaip atskira sritis kalibravimo tikslais. GeoPard komanda siūlo naudoti šį metodą kaip standartinį požiūrį.
Vidutinės/Reikšmės sumos kalibracija koncentruojasi į atributų reikšmių perskirstymą. Jei geografiniai modeliai yra teisingi, bet absoliutūs skaičiai skiriasi nuo realių, šis metodas yra naudingas. Optimaliesiems rezultatams GeoPard rekomenduoja derinti su pagal takus atliekama kalibracija: pirmiausia taikyti pagal takus, tada reguliuoti pagal žinomas vidutines/sumines reikšmes.
Sąlyginė kalibracija reguliuoja atributų reikšmes pagal pateiktus min ir max slenkstelius. Šis metodas ypač naudingas, kai geografiniai modeliai yra tikslūs, tačiau reikšmių pasiskirstymas reikalauja korekcijų, ypač kai yra žinomos minimalios ir maksimalios reikšmės. Geriausiems rezultatams GeoPard rekomenduoja derinti su pagal takus atliekama kalibracija: pradėti nuo pagal takus, o tada pakoreguoti, kad atitiktų žinomas min ir max reikšmes.
Patarimai
Patarimas dėl duomenų anomalijų
Jei vartotojas susiduria su duomenų anomalijomis, pvz., reikšmėmis, artimomis nuliui, arba neįprastai didelėmis reikšmėmis (pvz., vidurkis 10, bet maksimumas 8000), rekomenduojama naudoti Valymo ir kalibravimo darbo eigą. Ji konfigūruojama naudojant parametrus veiksmai: [CLEAN, CALIBRATE].
Pirmiausia išvalius duomenis prieš kalibravimą užtikrinama klaidų, trūkstamų reikšmių ar neatitikimų pašalinimas, taip pagerinant duomenų kokybę ir tikslumą.
Patarimas dėl duomenų be pradinių klaidų
Jei duomenų rinkiniai iš pradžių yra be klaidų, trūkstamų reikšmių ar neatitikimų, ir žinoma, kad dalyvavo keli kombainai, apsvarstykite Kalibravimo ir valymo darbo eigą. Ji konfigūruojama naudojant parametrus veiksmai: [CALIBRATE, CLEAN].
Duomenų valymas po kalibravimo padeda toliau rafinuoti rinkinį, galbūt pašalinant bet kokius artefaktus, atsiradusius kalibravimo metu.
Dokumentacija: Mutacijos detalės
Numatytoji standartinė konfigūracija įgalina automatinį „YieldDataset“ kalibravimą ir valymą.
Išsamesnis pavyzdys suteikia rankinę min/max diapazonų kontrolę ir įtraukia papildomus atributus.
Norint laikytis USDA protokolo šiai VALYTI operacijai, turite arba nurodyti VISAS stulpelių reikšmes cleanAction -> conditionMinMaxClean arba pateikti jų dalį cleanAction -> conditionMinMaxClean ir likusias pateikti condtionAutoClean -> excludedAttributes.
Įvesties parametrai:
veiksmaikaip masyvas, leidžiantis pasirinkti taisymo veiksmus ir jų taikymo seką palaikomos reikšmės apimaVALYTIirKALIBRUOTI.calibrateActionkaip objektą, kuriame yra konfigūracijos detalės, susijusios suKALIBRUOTIoperacija.calibrationAttributeskaip masyvas atributų, kuriems reikia kalibracijos, paprastai susijusių su Derliaus stulpeliu.smoothWindowSizekaip nelyginis sveikasis skaičius, kuris sušvelnina rezultatų reikšmes, mažindamas staigius šuolius reikšmėse.conditionPathwiseCalibrationkaip objektas su Pagal takus kalibracija atitinka mašinos važiavimo takus. Kiekvienas mašinos takas apdorojamas kaip atskira sritis kalibravimo tikslais.calibrationBasiskaip eilutė, reiškianti atributą, naudojamą kalibracijos pagrindu.maxHomogeneityRegionkaip loginė reikšmė, nurodanti, ar kaip etalono regionas kalibracijai naudojama didžiausia homogeninė sritis.syntheticMachinePathkaip loginė reikšmė, nurodanti mašinos maršrutų simuliaciją; tai naudinga, kai trūksta tikslaus mašinos takų atributo ir jį reikia simuliuoti pagal laiko žymes ar panašų atributą.
conditionAvgTotalCalibrationkaip objektas su Vidutinė/Suma kalibracija koncentruojasi į atributų reikšmių perskirstymą. Jei geografiniai modeliai yra teisingi, bet absoliutūs skaičiai skiriasi nuo realių, šis metodas yra naudingas.calibrationAttributekaip eilutė, reiškianti atributą, kuris bus kalibruojamas.averagekaip skaičius, reiškiantis atributų vidurkius; atributų reikšmės turėtų atitikti šį vidurkį. Vienu metu turėtų būti naudojama tik viena parinktis, arbaaveragearbatotal, turėtų būti naudojama vienu metu.totalkaip skaičius, reiškiantis atributų reikšmių bendrą sumą; šių reikšmių suma turėtų atitikti nurodytą total. Vienu metu turėtų būti naudojama tik viena parinktis, arbaaveragearbatotal, turėtų būti naudojama vienu metu.
conditionMinMaxCalibrationkaip objektas su Sąlyginė kalibracija reguliuoja atributų reikšmes pagal pateiktus min ir max slenkstelius.calibrationAttributekaip eilutė, reiškianti atributą, kuris bus kalibruojamas.minkaip skaičius, reiškiantis atributų minimalias reikšmes, veikiančias kaip žemiausias kalibravimo diapazonas.minIncludedkaip loginė reikšmė, nurodanti, ar įtraukti minimalias reikšmes.maxkaip skaičius, reiškiantis atributų maksimaliąsias reikšmes, veikiančias kaip aukščiausias kalibravimo diapazonas.maxIncludedkaip loginė reikšmė, nurodanti, ar įtraukti maksimaliąsias reikšmes.
cleanActionkaip objektas, apimantis konfigūracijos specifikacijas, susijusias suVALYTIoperacija.conditionAutoCleankaip objektas, apimantis konfigūracijas, specifines automatinio valymo algoritmui.targetAttributekaip eilutė, reiškianti tikslines derliaus reikšmes.excludedAttributeskaip eilutžių masyvas, nurodantis atributus, kurie neturi įtakos valymo operacijai.
conditionMinMaxCleankaip objektų masyvas, kuriame yra aprašytos valymo taisyklės; kiekvienas objektas apima šiuos parametrus.cleanAttribute kaip eilutė, nurodanti taisyklės stulpelio pavadinimą.
minkaip skaičius, nurodantis minimalią reikšmę.maxkaip skaičius, nurodantis maksimalia reikšmę.
Norėdami peržiūrėti įvestis ir gauti naujausias išvedamųjų reikšmių (pvz., operacijos), reikėtų naudoti Altair.
Dokumentacija: YieldDataset užklausa
Kaip GeoPard API vartotojas galite gauti informaciją apie YieldDatasetams taikytus pataisymus per atributus appliedCorrections ir appliedCorrectionsVersion. Pirmasis pateikia atliktų pataisymų sąrašą (pvz., KALIBRUOTI ir VALYTI), jų vykdymo tvarka nurodyta pagal jų eilę masyve. Tuo tarpu appliedCorrectionsVersion nurodo naudojamos algoritmo versiją.
Last updated
Was this helpful?