84. Мутация: Калибриране и почистване на YieldDataset
API повиквания за почистване и калибриране на набори данни за добив
Калибрирането на "YieldDataset" е функционалност, която коригира разпределението на стойностите в съответствие с математическите принципи, подобрявайки общата цялост на данните. Това повишава качеството на вземане на решения и прави набора от данни полезен за по-нататъшен задълбочен анализ.
Чести случаи на употреба за тази функционалност включват:
Синхронизиране на данни, когато няколко комбайна са работили едновременно или през няколко дни, за да се осигури последователност.
Правене на набора от данни по-хомогенен и точен чрез изглаждане на вариациите.
Премахване на шума в данните и излишна информация, която може да замъгли прозренията.
Премахване на завъртания или аномални геометрии, които могат да изкривят действителните модели и тенденции в полето.
Коригиране на данните за добив, за да съответстват на установени средни стойности или тотали за всеки атрибут.
За по-подробно разглеждане и примери, моля вижте нашия Use case: Калибриране и почистване на добива случай на използване.
Оригинален YieldDataset с атрибут WetMass
Пет комбайна работиха паралелно на полето от 30 ха, показано по-долу. Калибровката на един от комбайните не беше синхронизирана с останалите, в резултат на което се получиха оранжево места, което показва, че са необходими допълнителни КАЛИБРИРАНЕ Освен това има множество завъртания/обратни преобръщания червени точки по-близо до ръбовете на "Полето", които трябва да бъдат премахнати.

Калибриран и почистен YieldDataset с атрибут WetMass
Резултатът по-долу показва набора от данни след прилагане на автоматични КАЛИБРИРАЙ и ПОЧИСТИ операции с използване на подразбиращи се параметри. Полученият "YieldDataset" стана хомогенен, без аномалии или резки промени между съседни геометрии.

Опции: По пътека срещу Средно/Тотал срещу Условно
Калибриране по пътека отговаря на следите на машината. Всяка следа на машината се обработва като индивидуален регион за целите на калибрирането. Екипът на GeoPard препоръчва използването на този метод като стандартен подход.
Средно/Тотално калибриране се фокусира върху преразпределението на стойностите на атрибутите. Ако геопространствените модели са точни, но абсолютните числа се отклоняват от реалните, този метод е полезен. За оптимални резултати GeoPard съветва да се комбинира с калибриране по пътека: първо прилагане на калибриране по пътека, а след това настройка към известните средни/тотални стойности.
Условно калибриране коригира стойностите на атрибутите въз основа на предоставени минимални и максимални прагове. Този метод е особено ценен, когато геопространствените модели са точни, но разпределението на стойностите изисква корекции, особено когато са известни минимални и максимални стойности. За най-добри резултати GeoPard препоръчва да се комбинира с калибриране по пътека: започвайки с калибриране по пътека, последвано от настройки, за да се съобразят с известните минимални и максимални стойности.
Съвети
Съвет за аномалии в данните
Ако потребител срещне аномалии в данните, като стойности равни или близки до нула, или необичайно големи стойности (например средно 10 с максимум 8000), се препоръчва работният процес Почистване и калибриране Той е конфигуриран с параметри actions: [CLEAN, CALIBRATE].
Приоритизирането на почистването на данните преди калибрирането гарантира премахването на грешки, липсващи стойности или несъответствия, като по този начин подобрява качеството и точността на данните.
Съвет за данни без начални грешки
За набори от данни, които първоначално са без грешки, липсващи стойности или несъответствия, и когато е известно, че са участвали няколко комбайна, обмислете работния процес Калибриране и почистване Той е конфигуриран с параметри actions: [CALIBRATE, CLEAN].
Почистването на данните след калибрирането помага да се изчисти наборът от данни допълнително, като потенциално елиминира артефакти, въведени по време на калибрирането.
Документация: Детайли за мутацията
Подразбиращата се стандартна конфигурация позволява автоматично калибриране и почистване на "YieldDataset".
По-усъвършенстван пример предоставя ръчен контрол върху диапазоните мин/макс и включва допълнителни атрибути.
За да следвате протокола на USDA за тази ПОЧИСТИ операция, трябва или да споменете ВСИЧКИ колони в cleanAction -> conditionMinMaxClean или да посочите част от тях в cleanAction -> conditionMinMaxClean и останалите в condtionAutoClean -> excludedAttributes.
Входни параметри:
actionsкато масив, позволяващ ви да избирате коригиращите действия и тяхната последователност на прилагане; поддържаните стойности включватПОЧИСТИиКАЛИБРИРАЙ.calibrateActionкато обект, съдържащ конфигурационни детайли, свързани сКАЛИБРИРАЙоперацията.calibrationAttributesкато масив от атрибути, които изискват калибриране, обикновено свързани с колоната за добива.smoothWindowSizeкато нечетно цяло число, което изглажда резултатните стойности, намалявайки рязките скокове в стойностите.conditionPathwiseCalibrationкато обект със Калибрирането по пътека отговаря на следите на машината. Всяка следа на машината се обработва като индивидуален регион за целите на калибрирането.calibrationBasisкато низ, представляващ атрибута, използван като основа за калибриране.maxHomogeneityRegionкато булева стойност, която указва дали максималният хомогенен регион се използва като референтен регион за калибриране.syntheticMachinePathкато булева стойност, която указва симулация на маршрутите на машината; полезна е, когато точният атрибут за пътека на машината липсва и трябва да бъде симулиран въз основа на времеви марки или подобен атрибут.
conditionAvgTotalCalibrationкато обект със Средно/Тотално калибриране се фокусира върху преразпределението на стойностите на атрибутите. Ако геопространствените модели са точни, но абсолютните числа са отклонени от реалните, този метод е полезен.calibrationAttributeкато низ, представляващ атрибута, който трябва да бъде калибриран.averageкато число, представляващо средните стойности на атрибута; стойностите на атрибута трябва да съответстват на тази средна стойност. Трябва да се използва само една опция, илиaverageилиtotal, в даден момент.totalкато число, представляващо общата сума на стойностите на атрибута; сборът на тези стойности трябва да съвпада с тотала. Трябва да се използва само една опция, илиaverageилиtotal, в даден момент.
conditionMinMaxCalibrationкато обект със Условно калибриране коригира стойностите на атрибутите въз основа на предоставени минимални и максимални прагове.calibrationAttributeкато низ, представляващ атрибута, който трябва да бъде калибриран.minкато число, представляващо минималните стойности на атрибута, служейки като долна граница за калибриране.minIncludedкато булева стойност, указваща дали минималната стойност да бъде включена или неmaxкато число, представляващо максималните стойности на атрибута, служейки като горна граница за калибриране.maxIncludedкато булева стойност, указваща дали максималната стойност да бъде включена или не.
cleanActionкато обект, който включва конкретните конфигурации, свързани сПОЧИСТИоперацията.conditionAutoCleanкато обект, който включва конфигурациите, специфични за алгоритъма за автоматично почистване.targetAttributeкато низ, представляващ целевите стойности на добива.excludedAttributesкато масив от низове, дефиниращи атрибути, които не влияят на операцията по почистване.
conditionMinMaxCleanкато масив от обекти, съдържащи описаните правила за почистване; всеки обект включва следните параметри.cleanAttribute като низ, указващ името на колоната за правилото.
minкато число, указващо минималната стойност.maxкато число, указващо максималната стойност.
За да видите входовете и да получите достъп до най-новите налични стойности на изброявания (като операции), се препоръчва използването на Altair.
Документация: заявка за YieldDataset
Като потребител на GeoPard API можете да получите подробности за корекциите, приложени към YieldDatasets чрез атрибутите appliedCorrections и appliedCorrectionsVersion. Първият предоставя списък с направените корекции (напр., КАЛИБРИРАЙ и ПОЧИСТИ), като редът на изпълнение е обозначен чрез последователността им в масива. Междувременно appliedCorrectionsVersion показва версията на използвания алгоритъм.
Last updated
Was this helpful?