84. Мутація: калібрувати та очищувати набір даних урожайності
API‑виклики для очищення та калібрування наборів даних урожайності
Калібрування "YieldDataset" — це функціональність, яка коригує розподіл значень відповідно до математичних принципів, покращуючи загальну цілісність даних. Вона підвищує якість прийняття рішень і робить набір даних цінним для подальшого глибокого аналізу.
Поширені випадки використання цієї функціональності включають:
Синхронізацію даних, коли кілька жнивних машин працювали одночасно або протягом декількох днів, забезпечуючи узгодженість.
Зроблення набору даних більш однорідним і точним шляхом згладжування варіацій.
Видалення шуму в даних та зайвої інформації, яка може заважати отриманню інсайтів.
Видалення розворотів або аномальних геометрій, які можуть спотворювати реальні шаблони та тенденції на полі.
Коригування даних урожайності відповідно до встановлених середніх значень або сум для кожного атрибуту.
Для детальнішого вивчення та прикладів зверніться, будь ласка, до нашого Калібрування та очищення урожайності випадку використання.
Оригінальний YieldDataset з атрибутом WetMass
П’ять жнивних машин працювали паралельно на полі площею 30 га, показаному нижче. Калібрування однієї з машин не було синхронізоване з іншими, внаслідок чого з’явилися помаранчевий плями, що вказують на те, що додаткова КАЛІБРУВАННЯ потрібне. Крім того, є численні розвороти червоні плями ближче до країв "Поля", які потрібно усунути.

Калібрований і очищений YieldDataset з атрибутом WetMass
Результат нижче показує набір даних після застосування автоматичних КАЛІБРУВАТИ та ОЧИСТИТИ операцій з використанням параметрів за замовчуванням. Отриманий "YieldDataset" став однорідним, без викидів або раптових змін між сусідніми геометріями.

Параметри Pathwise проти Average/Total проти Conditional
Pathwise калібрування відповідає шляхам машини. Кожен шлях машини обробляється як окрема область для цілей калібрування. Команда GeoPard радить використовувати цей метод як стандартний підхід.
Average/Total калібрування зосереджується на перерозподілі значень атрибутів. Якщо геопросторові шаблони точні, але абсолютні показники відрізняються від фактичних, цей метод є корисним. Для оптимальних результатів GeoPard радить поєднувати його з Pathwise калібруванням: спочатку застосувати Pathwise, а потім коригувати до відомих значень Average/Total.
Conditional калібрування коригує значення атрибутів на основі заданих порогів мінімуму та максимуму. Цей метод особливо цінний, коли геопросторові шаблони точні, але розподіл значень потребує налаштування, особливо якщо відомі мінімальні та максимальні значення. Для найкращих результатів GeoPard рекомендує поєднувати його з Pathwise калібруванням: почати з Pathwise, а потім виконати коригування для відповідності відомим мінімуму та максимуму.
Підказки
Підказка щодо аномалій у даних
Якщо користувач стикається з аномаліями в даних, наприклад значеннями на або близькими до нуля, або незвично великими значеннями (наприклад, середнє 10 з максимумом 8000), рекомендується робочий процес Clean & Calibration Він налаштований за допомогою параметрів дії: [CLEAN, CALIBRATE].
Пріоритетне очищення даних перед калібруванням забезпечує видалення помилок, відсутніх значень або невідповідностей, тим самим покращуючи якість і точність даних.
Підказка для даних без початкових помилок
Для наборів даних, що спочатку не містять помилок, відсутніх значень або невідповідностей, і коли відомо про участь кількох жнивних машин, розгляньте можливість використання робочого процесу Calibration & Clean Він налаштований за допомогою параметрів дії: [CALIBRATE, CLEAN].
Очищення даних після калібрування допомагає додатково відшліфувати набір даних, потенційно усуваючи будь-які артефакти, введені під час калібрування.
Документація: деталі мутації
Стандартна конфігурація за замовчуванням дозволяє автоматичне калібрування та очищення "YieldDataset".
Більш просунутий приклад надає ручний контроль діапазонів min/max і включає додаткові атрибути.
Щоб дотримуватися протоколу USDA для ОЧИСТИТИ операції, ви повинні або вказати ВСІ стовпці в cleanAction -> conditionMinMaxClean або вказати частину з них у cleanAction -> conditionMinMaxClean і решту в condtionAutoClean -> excludedAttributes.
Вхідні параметри:
діїяк масив, що дозволяє вам вибирати коригувальні дії та їх послідовність застосування; підтримувані значення включаютьОЧИСТИТИтаКАЛІБРУВАТИ.calibrateActionяк об’єкт, що містить деталі конфігурації, пов’язані зКАЛІБРУВАТИоперацією.calibrationAttributesяк масив атрибутів, що потребують калібрування, зазвичай пов’язаних зі стовпцем Yield.smoothWindowSizeяк непарне ціле число, яке згладжує результуючі значення, зменшуючи різкі стрибки у значеннях.conditionPathwiseCalibrationяк об’єкт з Pathwise калібрування відповідає шляхам машини. Кожен шлях машини обробляється як окрема область для цілей калібрування.calibrationBasisяк рядок, що представляє атрибут, використаний як основа для калібрування.maxHomogeneityRegionяк булеве значення, яке вказує, чи використовується регіон максимального різноманіття як довідкова область для калібрування.syntheticMachinePathяк булеве значення, яке вказує на імітацію маршрутів машин; воно корисне, коли точний атрибут шляху машини відсутній і потребує імітації на основі часових міток або подібного атрибуту.
conditionAvgTotalCalibrationяк об’єкт з Average/Total калібрування зосереджується на перерозподілі значень атрибутів. Якщо геопросторові шаблони точні, але абсолютні показники відрізняються від фактичних, цей метод є корисним.calibrationAttributeяк рядок, що представляє атрибут, який буде калібруватися.averageяк число, що представляє середні значення атрибуту; значення атрибуту повинні відповідати цьому середньому. Слід використовувати лише один варіант, абоaverageабоtotal, одночасно.totalяк число, що представляє загальну суму значень атрибуту; сума цих значень повинна відповідати загальному підсумку. Слід використовувати лише один варіант, абоaverageабоtotal, одночасно.
conditionMinMaxCalibrationяк об’єкт з Conditional калібрування коригує значення атрибутів на основі заданих порогів мінімуму та максимуму.calibrationAttributeяк рядок, що представляє атрибут, який буде калібруватися.minяк число, що представляє мінімальні значення атрибуту, які служать нижньою межею для калібрування.minIncludedяк булеве значення, що вказує, чи включати мінімальне значення.maxяк число, що представляє максимальні значення атрибуту, які служать верхньою межею для калібрування.maxIncludedяк булеве значення, що вказує, чи включати максимальне значення.
cleanActionяк об’єкт, що включає специфіку конфігурації, пов’язану зОЧИСТИТИоперацією.conditionAutoCleanяк об’єкт, що включає налаштування, специфічні для алгоритму автoочищення.targetAttributeяк рядок, що представляє цільові значення Yield.excludedAttributesяк масив рядків, що визначають атрибути, які не впливають на операцію очищення.
conditionMinMaxCleanяк масив об’єктів, що містять описані правила очищення; кожен об’єкт включає такі параметри.cleanAttribute як рядок, що вказує назву стовпця для правила.
minяк число, що вказує мінімальне значення.maxяк число, що вказує максимальне значення.
Щоб переглянути вхідні дані та отримати доступ до останніх доступних значень перерахувань (наприклад, операцій), рекомендується використовувати Altair.
Документація: запит YieldDataset
Як споживач GeoPard API, ви можете отримати деталі щодо коригувань, застосованих до YieldDatasets, через атрибути appliedCorrections та appliedCorrectionsVersion. Перший надає список внесених коригувань (наприклад, КАЛІБРУВАТИ та ОЧИСТИТИ), порядок виконання яких позначається їх послідовністю в масиві. Натомість appliedCorrectionsVersion вказує версію застосованого алгоритму.
Last updated
Was this helpful?