84. Mutation: Calibrar e Limpar YieldDataset
Chamadas de API para limpar e calibrar conjuntos de dados de produtividade
Calibrar o "YieldDataset" é uma funcionalidade que corrige a distribuição de valores em alinhamento com princípios matemáticos, aprimorando a integridade geral dos dados. Isso fortalece a qualidade da tomada de decisões e torna o conjunto de dados valioso para análises aprofundadas posteriores.
Casos de uso comuns para essa funcionalidade incluem:
Sincronizar dados quando várias colheitadeiras trabalharam simultaneamente ou ao longo de vários dias, garantindo consistência.
Tornar o conjunto de dados mais homogêneo e preciso, suavizando variações.
Remover ruído de dados e informações extraneous que podem obscurecer insights.
Eliminar manobras de retorno ou geometrias anormais, que podem distorcer os padrões e tendências reais no campo.
Ajustar os dados de produtividade para corresponder às médias ou totais estabelecidos para cada atributo.
Para uma exploração mais detalhada e exemplos, consulte nosso Calibração & Limpeza de Produtividade caso de uso.
YieldDataset original com o atributo WetMass
Cinco colheitadeiras trabalharam em paralelo no Campo de 30 ha mostrado abaixo. A calibração de uma das colheitadeiras não foi sincronizada com as outras, resultando em laranja pontos, indicando que é necessário CALIBRAÇÃO Além disso, existem numerosas manobras de retorno vermelhas mais próximas das bordas do "Campo" que precisam ser eliminadas.

YieldDataset calibrado e limpo com o atributo WetMass
O resultado abaixo mostra o conjunto de dados após aplicar operações automáticas de CALIBRAR e LIMPAR usando parâmetros padrão. O "YieldDataset" resultante tornou-se homogêneo, sem outliers ou mudanças abruptas entre geometrias vizinhas.

Opções Caminho-da-máquina vs Média/Total vs Condicional
Calibração por caminho-da-máquina corresponde às trilhas da máquina. Cada trilha da máquina é processada como uma região individual para fins de calibração. A equipe GeoPard sugere usar este método como abordagem padrão.
Calibração Média/Total foca na redistribuição dos valores dos atributos. Se os padrões geoespaciais estiverem corretos, mas os números absolutos divergirem dos reais, esse método é benéfico. Para resultados ideais, a GeoPard aconselha combiná-lo com a calibração por caminho-da-máquina: aplique primeiro Caminho-da-máquina e depois ajuste para valores Médios/Total conhecidos.
Calibração Condicional ajusta os valores dos atributos com base em limites mínimo e máximo fornecidos. Esse método é especialmente valioso quando os padrões geoespaciais são precisos, mas a distribuição de valores requer ajustes, particularmente quando existem valores mínimos e máximos conhecidos. Para melhores resultados, a GeoPard recomenda combiná-lo com a calibração por caminho-da-máquina: começando com Caminho-da-máquina, seguido por ajustes para alinhar com os valores mínimo e máximo conhecidos.
Dicas
Dica para Anomalias de Dados
Se um usuário encontrar anomalias nos dados, como valores em ou próximos de zero, ou valores incomumente grandes (por exemplo, uma média de 10 com um máximo de 8000), o fluxo de trabalho Limpeza & Calibração é aconselhado. Ele é configurado usando parâmetros ações: [CLEAN, CALIBRATE].
Priorizar a Limpeza dos dados antes da Calibração assegura a remoção de erros, valores ausentes ou inconsistências, melhorando assim a qualidade e a precisão dos dados.
Dica para Dados sem Erros Iniciais
Para conjuntos de dados inicialmente livres de erros, valores ausentes ou inconsistências, e quando se sabe que múltiplas colheitadeiras estão envolvidas, considere o fluxo de trabalho Calibração & Limpeza Ele é configurado usando parâmetros ações: [CALIBRATE, CLEAN].
Limpar os dados após a calibração ajuda a refinar ainda mais o conjunto de dados, potencialmente eliminando quaisquer artefatos introduzidos durante a calibração.
Documentação: Detalhes da Mutação
A configuração padrão padrão habilita a auto calibração e limpeza do "YieldDataset".
Uma amostra mais avançada fornece controle manual de faixas mín./máx. e incorpora atributos adicionais.
Para seguir o protocolo do USDA para a LIMPAR operação, você deve mencionar TODAS as colunas em cleanAction -> conditionMinMaxClean ou especificar uma parte delas em cleanAction -> conditionMinMaxClean e as restantes em condtionAutoClean -> excludedAttributes.
Parâmetros de entrada:
açõescomo um array, permitindo que você escolha as ações corretivas e sua sequência de aplicação; os valores suportados incluemLIMPAReCALIBRAR.calibrateActioncomo um objeto contendo detalhes de configuração relacionados àCALIBRARoperação.calibrationAttributescomo um array de atributos que precisam de calibração, tipicamente vinculados à coluna Yield.smoothWindowSizecomo um inteiro ímpar que suaviza os valores resultantes, reduzindo saltos abruptos nos valores.conditionPathwiseCalibrationcomo um objeto com a Caminho-da-máquina a calibração corresponde às trilhas da máquina. Cada trilha da máquina é processada como uma região individual para fins de calibração.calibrationBasiscomo uma string que representa o atributo usado como base para calibração.maxHomogeneityRegioncomo um booleano que indica se a região de máxima homogeneidade é usada como a região de referência para calibração.syntheticMachinePathcomo um booleano que indica a simulação de rotas de máquinas, é benéfico quando o atributo de caminho preciso da máquina está ausente e precisa ser simulado com base em timestamps ou em um atributo similar.
conditionAvgTotalCalibrationcomo um objeto com a Média/Total a calibração foca na redistribuição dos valores dos atributos. Se os padrões geoespaciais estiverem corretos, mas os números absolutos divergirem dos reais, esse método é benéfico.calibrationAttributecomo uma string que representa o atributo a ser calibrado.averagecomo um número que representa os valores médios do atributo; os valores do atributo devem alinhar-se com essa média. Deve-se utilizar apenas uma opção, sejaaverageoutotal, por vez.totalcomo um número que representa a soma total dos valores do atributo; o agregado desses valores deve corresponder ao total. Deve-se utilizar apenas uma opção, sejaaverageoutotal, por vez.
conditionMinMaxCalibrationcomo um objeto com a Condicional a calibração ajusta os valores dos atributos com base em limites mínimo e máximo fornecidos.calibrationAttributecomo uma string que representa o atributo a ser calibrado.mincomo um número que representa os valores mínimos do atributo, servindo como o menor intervalo para calibração.minIncludedcomo um booleano indicando se deve ou não incluir o valor mínimomaxcomo um número que representa os valores máximos do atributo, servindo como o maior intervalo para calibração.maxIncludedcomo um booleano indicando se deve ou não incluir o valor máximo.
cleanActioncomo um objeto que inclui as especificações de configuração vinculadas àLIMPARoperação.conditionAutoCleancomo um objeto que inclui as configurações específicas do algoritmo de limpeza automática.targetAttributecomo uma string que representa os valores alvo de Yield.excludedAttributescomo um array de strings definindo atributos que não influenciam a operação de limpeza.
conditionMinMaxCleancomo um array de objetos contendo as regras de limpeza descritas; cada objeto inclui os seguintes parâmetros.cleanAttribute como uma string especificando o nome da coluna para a regra.
mincomo um número indicando o valor mínimo.maxcomo um número indicando o valor máximo.
Para ver as entradas e acessar os valores mais recentes disponíveis de enumerações (como operações), é recomendado utilizar Altair.
Documentação: consulta YieldDataset
Como consumidor da API GeoPard, você pode recuperar detalhes sobre as correções aplicadas aos YieldDatasets através dos atributos appliedCorrections e appliedCorrectionsVersion. O primeiro fornece uma lista de correções feitas (por exemplo, CALIBRAR e LIMPAR), com a ordem de execução denotada pela sequência no array. Enquanto isso, appliedCorrectionsVersion indica a versão do algoritmo empregada.
Atualizado
Isto foi útil?