84. Mutation : calibrer et nettoyer un YieldDataset
Appels API pour nettoyer et calibrer les jeux de données de rendement
Calibrer le "YieldDataset" est une fonctionnalité qui corrige la distribution des valeurs en accord avec des principes mathématiques, renforçant l'intégrité globale des données. Elle améliore la qualité de la prise de décision et rend le jeu de données précieux pour des analyses approfondies ultérieures.
Les cas d'utilisation courants de cette fonctionnalité incluent :
Synchroniser les données lorsque plusieurs moissonneuses ont travaillé soit simultanément soit sur plusieurs jours, en garantissant la cohérence.
Rendre le jeu de données plus homogène et précis en lissant les variations.
Éliminer le bruit des données et les informations superflues qui peuvent obscurcir les analyses.
Supprimer les demi-tours ou géométries anormales, qui peuvent déformer les motifs et tendances réels dans la parcelle.
Ajuster les données de rendement pour correspondre aux moyennes ou totaux établis pour chaque attribut.
Pour une exploration plus détaillée et des exemples, veuillez consulter notre Cas d'utilisation Calibration & Nettoyage des Rendements d'utilisation.
YieldDataset d'origine avec l'attribut WetMass
Cinq moissonneuses ont travaillé en parallèle sur la parcelle de 30 ha illustrée ci-dessous. La calibration de l'une des moissonneuses n'a pas été synchronisée avec les autres, entraînant orange points, indiquant que des CALIBRATIONS sont nécessaires. De plus, il y a de nombreux demi-tours rouges plus proches des bords du "Field" qui doivent être éliminés.

YieldDataset calibré et nettoyé avec l'attribut WetMass
Le résultat ci-dessous montre le jeu de données après application automatique des opérations de CALIBRAGE et NETTOYAGE en utilisant les paramètres par défaut. Le "YieldDataset" résultant est devenu homogène, sans valeurs aberrantes ni changements brusques entre géométries voisines.

Options Chemin par chemin vs Moyenne/Total vs Conditionnel
La calibration chemin par chemin correspond aux traces de la machine. Chaque trace de machine est traitée comme une région individuelle à des fins de calibration. L'équipe GeoPard suggère d'utiliser cette méthode comme approche standard.
La calibration Moyenne/Total se concentre sur la redistribution des valeurs d'attribut. Si les motifs géospatiaux sont exacts mais que les chiffres absolus s'écartent des valeurs réelles, cette méthode s'avère bénéfique. Pour des résultats optimaux, GeoPard conseille de la combiner avec la calibration chemin par chemin : appliquer d'abord la méthode chemin par chemin, puis ajuster selon les valeurs Moyenne/Total connues.
La calibration conditionnelle ajuste les valeurs d'attribut en fonction des seuils min et max fournis. Cette méthode est particulièrement utile lorsque les motifs géospatiaux sont précis, mais que la distribution des valeurs nécessite des ajustements, notamment lorsqu'il existe des valeurs min et max connues. Pour les meilleurs résultats, GeoPard recommande de la coupler avec la calibration chemin par chemin : commencer par chemin par chemin, suivi d'ajustements pour aligner avec les valeurs min et max connues.
Conseils
Conseil pour les anomalies de données
Si un utilisateur rencontre des anomalies dans les données, telles que des valeurs nulles ou proches de zéro, ou des valeurs exceptionnellement élevées (par exemple, une moyenne de 10 avec un maximum de 8000), le workflow Nettoyage & Calibration est conseillé. Il est configuré à l'aide des paramètres actions : [NETTOYER, CALIBRER].
Donner la priorité au nettoyage des données avant la calibration garantit la suppression des erreurs, des valeurs manquantes ou des incohérences, améliorant ainsi la qualité et la précision des données.
Conseil pour les données sans erreurs initiales
Pour les jeux de données initialement exempts d'erreurs, de valeurs manquantes ou d'incohérences, et lorsque plusieurs moissonneuses sont connues pour avoir été impliquées, envisagez le workflow Calibration & Nettoyage Il est configuré à l'aide des paramètres actions : [CALIBRER, NETTOYER].
Nettoyer les données après la calibration permet d'affiner davantage le jeu de données en éliminant potentiellement les artefacts introduits lors de la calibration.
Documentation : Détails de la mutation
La configuration standard par défaut active l'auto-calibration et le nettoyage automatique du "YieldDataset".
Un exemple plus avancé fournit un contrôle manuel des plages min/max et incorpore des attributs supplémentaires.
Pour suivre le protocole USDA pour l' NETTOYAGE opération, vous devez soit mentionner TOUTES les colonnes dans la cleanAction -> conditionMinMaxClean ou spécifier une partie d'entre elles dans cleanAction -> conditionMinMaxClean et les restantes dans condtionAutoClean -> excludedAttributes.
Paramètres d'entrée :
actionscomme un tableau, vous permettant de choisir les actions de correction et leur séquence d'application ; les valeurs prises en charge incluentNETTOYAGEetCALIBRAGE.calibrateActioncomme un objet contenant les détails de configuration liés à l'CALIBRAGEopération.calibrationAttributescomme un tableau d'attributs nécessitant une calibration, généralement liés à la colonne Rendement.smoothWindowSizecomme un entier impair qui lisse les valeurs résultantes, réduisant les sauts brusques des valeurs.conditionPathwiseCalibrationcomme un objet avec la Pathwise la calibration chemin par chemin correspond aux traces de la machine. Chaque trace de machine est traitée comme une région individuelle à des fins de calibration.calibrationBasiscomme une chaîne représentant l'attribut utilisé comme base de calibration.maxHomogeneityRegioncomme un booléen indiquant si la région de homogeneité maximale est utilisée comme région de référence pour la calibration.syntheticMachinePathcomme un booléen indiquant la simulation des itinéraires de la machine ; c'est utile lorsque l'attribut de chemin de machine précis est absent et doit être simulé à partir des horodatages ou d'un attribut similaire.
conditionAvgTotalCalibrationcomme un objet avec la Moyenne/Total la calibration se concentre sur la redistribution des valeurs d'attribut. Si les motifs géospatiaux sont exacts mais que les chiffres absolus s'écartent des réels, cette méthode est bénéfique.calibrationAttributecomme une chaîne représentant l'attribut à calibrer.averagecomme un nombre représentant les valeurs moyennes de l'attribut ; les valeurs de l'attribut doivent s'aligner sur cette moyenne. Une seule option, soitaverageoutotal, doit être utilisée à la fois.totalcomme un nombre représentant la somme totale des valeurs de l'attribut ; l'agrégat de ces valeurs doit correspondre au total. Une seule option, soitaverageoutotal, doit être utilisée à la fois.
conditionMinMaxCalibrationcomme un objet avec la Conditionnel la calibration ajuste les valeurs d'attribut en fonction des seuils min et max fournis.calibrationAttributecomme une chaîne représentant l'attribut à calibrer.mincomme un nombre représentant les valeurs minimales de l'attribut, servant de borne inférieure pour la calibration.minIncludedcomme un booléen indiquant s'il faut inclure ou non la valeur minimalemaxcomme un nombre représentant les valeurs maximales de l'attribut, servant de borne supérieure pour la calibration.maxIncludedcomme un booléen indiquant s'il faut inclure ou non la valeur maximale.
cleanActioncomme un objet qui inclut les spécificités de configuration liées à laNETTOYAGEopération.conditionAutoCleancomme un objet qui inclut les configurations spécifiques à l'algorithme de nettoyage automatique.targetAttributecomme une chaîne représentant les valeurs cibles de Rendement.excludedAttributescomme un tableau de chaînes définissant les attributs qui n'influencent pas l'opération de nettoyage.
conditionMinMaxCleancomme un tableau d'objets contenant les règles de nettoyage décrites, chaque objet inclut les paramètres suivants.cleanAttribute en tant que chaîne spécifiant le nom de colonne pour la règle.
mincomme un nombre indiquant la valeur minimale.maxcomme un nombre indiquant la valeur maximale.
Pour afficher les entrées et accéder aux dernières valeurs disponibles des énumérations (telles que operations), il est recommandé d'utiliser Altair.
Documentation : requête YieldDataset
En tant que consommateur de l'API GeoPard, vous pouvez récupérer des détails concernant les corrections appliquées aux YieldDatasets via les attributs appliedCorrections et appliedCorrectionsVersion. Le premier fournit une liste des corrections effectuées (par ex., CALIBRAGE et NETTOYAGE), l'ordre d'exécution étant indiqué par leur séquence dans le tableau. Pendant ce temps, appliedCorrectionsVersion indique la version de l'algorithme employé.
Mis à jour
Ce contenu vous a-t-il été utile ?