84. Мутация: калибровка и очистка набора данных урожайности
API-вызовы для очистки и калибровки наборов данных урожайности
Калибровка "YieldDataset" — это функция, которая корректирует распределение значений в соответствии с математическими принципами, повышая общую целостность данных. Она улучшает качество принятия решений и делает набор данных ценным для дальнейшего глубокого анализа.
Типичные варианты использования этой функции включают:
Синхронизацию данных, когда несколько комбайнов работали одновременно или в течение нескольких дней, обеспечивая согласованность.
Сделать набор данных более однородным и точным путем сглаживания вариаций.
Удаление шума данных и лишней информации, которые могут искажать инсайты.
Исключение разворотов или аномальных геометрий, которые могут искажать реальные закономерности и тенденции на поле.
Корректировку данных урожайности в соответствии с установленными средними значениями или суммами для каждого атрибута.
Для более детального изучения и примеров, пожалуйста, обратитесь к нашему Калибровка и очистка урожайности примеру использования.
Оригинальный YieldDataset с атрибутом WetMass
Пять комбайнов работали параллельно на показанном ниже поле площадью 30 га. Калибровка одного из комбайнов не была синхронизирована с другими, в результате чего образовались оранжевый участки, указывающие на то, что дополнительно ТРЕБУЕТСЯ КАЛИБРОВКА Кроме того, имеются многочисленные развороты красные участки ближе к краям "Поля", которые необходимо устранить.

Откалиброванный и очищенный YieldDataset с атрибутом WetMass
Ниже показан результат набора данных после применения автоматических КАЛИБРОВАТЬ и ОЧИСТИТЬ операций с использованием параметров по умолчанию. Получившийся "YieldDataset" стал однородным, без выбросов или резких изменений между соседними геометриями.

Варианты: по путям vs по среднему/итогу vs условная
Калибровка по путям соответствует следам машины. Каждый след машины обрабатывается как отдельная область для целей калибровки. Команда GeoPard предлагает использовать этот метод в качестве стандартного подхода.
Калибровка по среднему/итогу ориентируется на перераспределение значений атрибутов. Если геопространственные закономерности точны, но абсолютные показатели отличаются от фактических, этот метод оказывается полезным. Для достижения оптимальных результатов GeoPard советует комбинировать его с калибровкой по путям: сначала применять калибровку по путям, затем корректировать до известных средних/итоговых значений.
Условная калибровка корректирует значения атрибутов на основе заданных минимальных и максимальных порогов. Этот метод особенно ценен, когда геопространственные закономерности точны, но распределение значений требует корректировок, особенно если известны минимальные и максимальные значения. Для лучших результатов GeoPard рекомендует сочетать его с калибровкой по путям: начинать с калибровки по путям, затем выполнять корректировки для согласования с известными мин/макс значениями.
Подсказки
Подсказка по аномалиям данных
Если пользователь сталкивается с аномалиями в данных, такими как значения, равные или близкие к нулю, или необычно большие значения (например, среднее 10 при максимуме 8000), рекомендуется использовать Рабочий процесс Очистка и Калибровка Он настраивается с помощью параметров actions: [CLEAN, CALIBRATE].
Предпочтение очистки данных перед калибровкой гарантирует удаление ошибок, отсутствующих значений или несоответствий, что повышает качество и точность данных.
Подсказка для данных без первоначальных ошибок
Для наборов данных, изначально свободных от ошибок, отсутствующих значений или несоответствий, и когда известно, что задействованы несколько комбайнов, рассмотрите возможность использования Калибровка и Очистка Рабочий процесс настраивается с помощью параметров actions: [CALIBRATE, CLEAN].
Очистка данных после калибровки помогает дополнительно улучшить набор данных, потенциально устраняя артефакты, возникшие в процессе калибровки.
Документация: детали мутации
Конфигурация по умолчанию включает автоматическую калибровку и очистку "YieldDataset".
Более продвинутый пример предоставляет ручной контроль диапазонов мин/макс и включает дополнительные атрибуты.
Чтобы следовать протоколу USDA для этой ОЧИСТИТЬ операции, вы должны либо указать ВСЕ столбцы в cleanAction -> conditionMinMaxClean или указать их часть в cleanAction -> conditionMinMaxClean и оставшиеся в condtionAutoClean -> excludedAttributes.
Входные параметры:
actionsв виде массива, позволяющего выбирать корректирующие действия и их последовательность применения; поддерживаемые значения включаютОЧИСТИТЬиКАЛИБРОВАТЬ.calibrateActionв виде объекта, содержащего детали конфигурации, связанные сКАЛИБРОВАТЬоперацией.calibrationAttributesв виде массива атрибутов, требующих калибровки, обычно связанных со столбцом урожая.smoothWindowSizeв виде нечетного целого числа, которое сглаживает результирующие значения, уменьшая резкие скачки в значениях.conditionPathwiseCalibrationв виде объекта с По путям калибровка соответствует следам машины. Каждый след машины обрабатывается как отдельная область для целей калибровки.calibrationBasisв виде строки, представляющей атрибут, используемый в качестве основы для калибровки.maxHomogeneityRegionв виде булева значения, указывающего, используется ли регион максимальной однородности в качестве опорного региона для калибровки.syntheticMachinePathв виде булева значения, указывающего моделирование маршрутов машины; полезно, когда точный атрибут пути машины отсутствует и требуется его симуляция на основе меток времени или подобного атрибута.
conditionAvgTotalCalibrationв виде объекта с Среднее/Итог калибровка ориентируется на перераспределение значений атрибутов. Если геопространственные закономерности точны, но абсолютные показатели отличаются от фактических, этот метод оказывается полезным.calibrationAttributeв виде строки, представляющей атрибут, который будет откалиброван.averageв виде числа, представляющего средние значения атрибута; значения атрибута должны соответствовать этому среднему. В каждый момент используется только одна опция: либоaverageилиtotal, следует использовать только одну из опций одновременно.totalв виде числа, представляющего суммарное значение атрибута; сумма этих значений должна соответствовать итогу. В каждый момент используется только одна опция: либоaverageилиtotal, следует использовать только одну из опций одновременно.
conditionMinMaxCalibrationв виде объекта с Условная калибровка корректирует значения атрибутов на основе заданных минимальных и максимальных порогов.calibrationAttributeв виде строки, представляющей атрибут, который будет откалиброван.minв виде числа, представляющего минимальные значения атрибута и служащего нижней границей для калибровки.minIncludedв виде булева значения, указывающего, включать ли минимальное значение или нетmaxв виде числа, представляющего максимальные значения атрибута и служащего верхней границей для калибровки.maxIncludedв виде булева значения, указывающего, включать ли максимальное значение или нет.
cleanActionв виде объекта, который включает конкретные настройки, связанные сОЧИСТИТЬоперацией.conditionAutoCleanв виде объекта, включающего настройки, специфичные для алгоритма автоочистки.targetAttributeв виде строки, представляющей целевые значения урожайности.excludedAttributesв виде массива строк, определяющих атрибуты, которые не влияют на операцию очистки.
conditionMinMaxCleanв виде массива объектов, содержащих описанные правила очистки; каждый объект включает следующие параметры.cleanAttribute в виде строки, указывающей имя столбца для правила.
minв виде числа, указывающего минимальное значение.maxв виде числа, указывающего максимальное значение.
Чтобы просмотреть входы и получить доступ к последним доступным значениям перечислений (таких как операции), рекомендуется использовать Altair.
Документация: запрос YieldDataset
Как потребитель API GeoPard, вы можете получить сведения о корректировках, примененных к YieldDatasets, через атрибуты appliedCorrections и appliedCorrectionsVersion. Первый предоставляет список внесенных корректировок (например, КАЛИБРОВАТЬ и ОЧИСТИТЬ), порядок выполнения которых определяется их последовательностью в массиве. В то время как appliedCorrectionsVersion указывает на версию используемого алгоритма.
Последнее обновление
Это было полезно?