84. Mutācija: kalibrēt un tīrīt YieldDataset
API izsaukumi, lai tīrītu un kalibrētu ražas datu kopas
„YieldDataset” kalibrēšana ir funkcionalitāte, kas koriģē vērtību sadalījumu saskaņā ar matemātiskajiem principiem, uzlabojot datu kopējās integritāti. Tā nostiprina lēmumu pieņemšanas kvalitāti un padara datu kopu vērtīgu turpmākai padziļinātai analīzei.
Šīs funkcionalitātes izplatītie lietošanas gadījumi ietver:
Datu sinhronizēšana, ja vairāki kombaini ir strādājuši vienlaikus vai vairākas dienas, nodrošinot konsekvenci.
Datu kopas homogenizēšana un precizēšana, izlīdzinot svārstības.
Datu trokšņa un liekas informācijas noņemšana, kas var aizēnot ieskatus.
Apgriezienu vai anomālu ģeometriju likvidēšana, kas var izkropļot reālos laukā novērojamos modeļus un tendences.
Ražas datu pielāgošana, lai tie atbilstu noteiktajiem vidējiem rādītājiem vai kopējiem apjomiem katram atribūtam.
Lai iegūtu detalizētāku izpēti un piemērus, lūdzu, skatiet mūsu Ražas kalibrēšanas un datu tīrīšanas lietošanas gadījumu.
Oriģināls YieldDataset ar WetMass atribūtu
Pieci kombaini strādāja paralēli 30 ha laukā, kas parādīts zemāk. Viena no kombaina kalibrācija nebija sinhronizēta ar pārējām, kā rezultātā redzami orandža vietas, kas norāda, ka nepieciešama papildus KALIBRĒŠANA . Turklāt tajā ir daudz apgriezienu sarkanās vietas tuvāk "Lauka" maliņām, kuras jāizņem.

Kalibrēts un attīrīts YieldDataset ar WetMass atribūtu
Zemāk redzams rezultāts pēc automātiskas KALIBRĒŠANAS un TĪRĪŠANAS operāciju piemērošanas, izmantojot noklusējuma parametrus. Iegūtā „YieldDataset” ir kļuvusi homogēna, bez ārējām vērtībām vai straujām izmaiņām starp kaimiņu ģeometrijām.

Pathwise pret Vidējo/Kopējo pret Nosacīto opcijas
Pathwise kalibrēšana atbilst mašīnas sliedēm. Katrs mašīnas maršruts tiek apstrādāts kā atsevišķa zona kalibrēšanas nolūkos. GeoPard komanda iesaka šo metodi kā standarta pieeju.
Vidējā/Kopējā kalibrēšana koncentrējas uz atribūtu vērtību pārdalīšanu. Ja ģeotelpiskie modeļi ir precīzi, bet absolūtie skaitļi atšķiras no reāliem, šī metode ir izdevīga. Optimāliem rezultātiem GeoPard iesaka kombinēt to ar Pathwise kalibrēšanu: vispirms piemērojot Pathwise, pēc tam pielāgojot līdz zināmiem vidējiem/kopējiem rādītājiem.
Nosacītā kalibrēšana pielāgo atribūtu vērtības, pamatojoties uz norādītajiem min un max sliekšņiem. Šī metode ir īpaši vērtīga, ja ģeotelpiskie modeļi ir precīzi, bet vērtību sadalījumam nepieciešami pielātojumi, it īpaši, ja ir zināmas min un max vērtības. Labākajiem rezultātiem GeoPard iesaka to savienot ar Pathwise kalibrēšanu: sākt ar Pathwise un pēc tam pielāgot līdz zināmajām min un max vērtībām.
Padomi
Padoms par datu anomālijām
Ja lietotājs saskaras ar datu anomālijām, piemēram, vērtībām pie vai tuvu nulles, vai neparasti lielām vērtībām (piemēram, vidējais 10 ar maksimumu 8000), tiek ieteikts Tīrīšanas un kalibrēšanas darplūsma. To konfigurē, izmantojot parametrus darbības: [CLEAN, CALIBRATE].
Prioritāte datu tīrīšanai pirms kalibrēšanas nodrošina kļūdu, trūkstošo vērtību vai neatbilstību noņemšanu, tādējādi uzlabojot datu kvalitāti un precizitāti.
Padoms par datiem bez sākotnējām kļūdām
Datu kopām, kas sākotnēji ir bez kļūdām, trūkstošām vērtībām vai neatbilstībām, un ja zināms, ka iesaistīti vairāki kombaini, apsveriet Kalibrēšanas un tīrīšanas darplūsmu. To konfigurē, izmantojot parametrus darbības: [CALIBRATE, CLEAN].
Datu tīrīšana pēc kalibrēšanas palīdz vēl vairāk pilnveidot datu kopu, potenciāli izņemot artefaktus, kas ievadīti kalibrēšanas laikā.
Dokumentācija: Mutācijas detaļas
Noklusējuma standarta konfigurācija ieslēdz automātisku „YieldDataset” kalibrēšanu un attīrīšanu.
Vairāk uzlabots piemērs nodrošina manuālu min/maks diapazonu kontroli un iekļauj papildu atribūtus.
Lai ievērotu USDA protokolu attiecībā uz šo TĪRĪŠANAS operāciju, jums jānorāda VISS stabu saraksts cleanAction -> conditionMinMaxClean vai jānorāda to daļa cleanAction -> conditionMinMaxClean un pārējie jānorāda condtionAutoClean -> excludedAttributes.
Ievades parametri:
darbībaskā masīvs, ļaujot izvēlēties koriģējošās darbības un to piemērošanas secību vērtības; atbalstītās opcijas ietverTĪRĪŠANASunKALIBRĒŠANAS.calibrateActionkā objektu, kas satur konfigurācijas detaļas, kas saistītas ar šoKALIBRĒŠANASoperāciju.calibrationAttributeskā atribūtu masīvs, kuriem nepieciešama kalibrēšana, parasti saistītiem ar ražas (Yield) kolonnu.smoothWindowSizekā nepāra veselais skaitlis, kas izlīdzina rezultāta vērtības, samazinot straujas vērtību kāpumus.conditionPathwiseCalibrationkā objekts ar Pathwise kalibrēšana atbilst mašīnas sliedēm. Katrs mašīnas maršruts tiek apstrādāts kā atsevišķa zona kalibrēšanas nolūkos.calibrationBasiskā virkne, kas apzīmē atribūtu, kas tiek izmantots kā kalibrēšanas pamats.maxHomogeneityRegionkā booleans, kas norāda, vai maksimālā homogenitātes reģiona izmantošana tiek izmantota kā atsauces reģions kalibrēšanai.syntheticMachinePathkā booleans, kas norāda mašīnas maršrutu simulāciju; tas ir noderīgi, ja precīzs mašīnas ceļa atribūts trūkst un ir jāsimulē, pamatojoties uz laika zīmēm vai līdzīgu atribūtu.
conditionAvgTotalCalibrationkā objekts ar Vidējā/Kopējā kalibrēšana koncentrējas uz atribūtu vērtību pārdalīšanu. Ja ģeotelpiskie modeļi ir precīzi, bet absolūtie skaitļi atšķiras no reāliem, šī metode ir izdevīga.calibrationAttributekā virkne, kas apzīmē atribūtu, kas jākalibrē.averagekā skaitlis, kas apzīmē atribūta vidējās vērtības; atribūta vērtībām jāatbilst šim vidējam rādītājam. Vienlaikus jāizmanto tikai viena opcija, vai nuaveragevaitotal, jāizmanto tikai viena opcija vienlaikus.totalkā skaitlis, kas apzīmē atribūtu vērtību kopējo summu; šo vērtību kopsummai jāatbilst kopējam. Vienlaikus jāizmanto tikai viena opcija, vai nuaveragevaitotal, jāizmanto tikai viena opcija vienlaikus.
conditionMinMaxCalibrationkā objekts ar Nosacītā kalibrēšana pielāgo atribūtu vērtības, pamatojoties uz norādītajiem min un max sliekšņiem.calibrationAttributekā virkne, kas apzīmē atribūtu, kas jākalibrē.minkā skaitlis, kas apzīmē atribūta minimālās vērtības, kalibrēšanas zemāko diapazonu.minIncludedkā booleans, kas norāda, vai iekļaut minimālo vērtību vai nēmaxkā skaitlis, kas apzīmē atribūta maksimālās vērtības, kalibrēšanas augstāko diapazonu.maxIncludedkā booleans, kas norāda, vai iekļaut maksimālo vērtību vai nē.
cleanActionkā objekts, kas ietver konfigurācijas specifiku, kas saistīta arTĪRĪŠANASoperāciju.conditionAutoCleankā objekts, kas ietver konfigurācijas, kas specifiskas automātiskajam tīrīšanas algoritmam.targetAttributekā virkne, kas apzīmē mērķa ražas (Yield) vērtības.excludedAttributeskā virkņu masīvs, kas definē atribūtus, kuri neietekmē tīrīšanas operāciju.
conditionMinMaxCleankā objektu masīvs, kas satur aprakstītās tīrīšanas noteikumu kopas; katrs objekts iekļauj sekojošos parametrus.cleanAttribute kā virkne, kas norāda kolonnas nosaukumu šim noteikumam.
minkā skaitlis, kas norāda minimālo vērtību.maxkā skaitlis, kas norāda maksimālo vērtību.
Lai skatītu ievades un piekļūtu jaunākajām pieejamajām enumerāciju vērtībām (piem., operācijas), ieteicams izmantot Altair.
Dokumentācija: YieldDataset vaicājums
Kā GeoPard API lietotājs jūs varat iegūt informāciju par koriģēšanas darbībām, kas piemērotas YieldDatasets, izmantojot atribūtus appliedCorrections un appliedCorrectionsVersion. Pirmais sniedz sarakstu ar veiktajām koriģēšanām (piem., KALIBRĒŠANAS un TĪRĪŠANAS), kuru izpildes secība norādīta to masīva secībā. Savukārt appliedCorrectionsVersion norāda izmantotā algoritma versiju.
Last updated
Was this helpful?