84. Mutation: Calibrar y limpiar YieldDataset
Llamadas API para limpiar y calibrar conjuntos de datos de rendimiento
Calibrar el "YieldDataset" es una funcionalidad que corrige la distribución de valores en alineación con principios matemáticos, mejorando la integridad general de los datos. Refuerza la calidad de la toma de decisiones y convierte el conjunto de datos en algo valioso para análisis más profundos.
Casos de uso comunes para esta funcionalidad incluyen:
Sincronizar datos cuando múltiples cosechadoras han trabajado ya sea simultáneamente o durante varios días, asegurando consistencia.
Hacer que el conjunto de datos sea más homogéneo y preciso suavizando las variaciones.
Eliminar ruido de datos e información extránea que puede enturbiar los conocimientos.
Eliminar giros de vuelta o geometrías anormales, que pueden distorsionar los patrones y tendencias reales en el campo.
Ajustar los datos de rendimiento para que correspondan con promedios o totales establecidos para cada atributo.
Para una exploración más detallada y ejemplos, por favor consulte nuestro Caso de uso: Calibración y Limpieza de Rendimiento de caso.
YieldDataset original con el atributo WetMass
Cinco cosechadoras trabajaron en paralelo en el campo de 30 ha mostrado abajo. La calibración de una de las cosechadoras no se sincronizó con las demás, resultando en naranja puntos, indicando que se requieren más CALIBRACIÓN Adicionalmente, hay numerosos giros de vuelta rojos puntos más cerca de los bordes del "Field" que deben ser eliminados.

YieldDataset calibrado y limpiado con el atributo WetMass
El resultado a continuación muestra el conjunto de datos después de aplicar automáticamente CALIBRAR y LIMPIAR operaciones usando parámetros por defecto. El "YieldDataset" resultante se ha vuelto homogéneo, sin valores atípicos ni cambios abruptos entre geometrías vecinas.

Opciones Ruta por ruta vs Promedio/Total vs Condicional
Calibración ruta por ruta corresponde a las trazas de la máquina. Cada traza de la máquina se procesa como una región individual con fines de calibración. El equipo de GeoPard sugiere usar este método como el enfoque estándar.
Calibración Promedio/Total se centra en redistribuir los valores de los atributos. Si los patrones geoespaciales son precisos pero las cifras absolutas se desvían de la realidad, este método resulta beneficioso. Para resultados óptimos, GeoPard recomienda combinarlo con la calibración ruta por ruta: aplicar primero Ruta por ruta y luego ajustar a los valores conocidos de Promedio/Total.
Calibración condicional ajusta los valores de los atributos basándose en umbrales mínimos y máximos proporcionados. Este método es especialmente valioso cuando los patrones geoespaciales son precisos, pero la distribución de valores requiere ajustes, particularmente cuando existen valores mínimos y máximos conocidos. Para los mejores resultados, GeoPard recomienda emparejarlo con la calibración ruta por ruta: comenzar con Ruta por ruta y luego ajustar para alinearse con los valores mínimos y máximos conocidos.
Consejos
Consejo para anomalías de datos
Si un usuario encuentra anomalías en los datos, como valores en o cerca de cero, o valores inusualmente grandes (por ejemplo, un promedio de 10 con un máximo de 8000), se aconseja el flujo de trabajo Limpieza y Calibración Se configura usando los parámetros acciones: [LIMPIAR, CALIBRAR].
Priorizar la Limpieza de datos antes de la Calibración asegura la eliminación de errores, valores faltantes o inconsistencias, mejorando así la calidad y precisión de los datos.
Consejo para datos sin errores iniciales
Para conjuntos de datos inicialmente libres de errores, valores faltantes o inconsistencias, y cuando se sabe que participaron múltiples cosechadoras, considere el flujo de trabajo Calibración y Limpieza Se configura usando los parámetros acciones: [CALIBRAR, LIMPIAR].
Limpiar los datos después de la calibración ayuda a refinar aún más el conjunto de datos al eliminar potencialmente artefactos introducidos durante la calibración.
Documentación: Detalles de la mutación
La configuración estándar por defecto habilita la autocilibración y limpieza del "YieldDataset".
Una muestra más avanzada proporciona control manual de los rangos mínimo/máximo e incorpora atributos adicionales.
Para seguir el protocolo del USDA para la LIMPIAR operación, debe mencionar TODAS las columnas en la cleanAction -> conditionMinMaxClean o especificar una parte de ellas en cleanAction -> conditionMinMaxClean y las restantes en condtionAutoClean -> excludedAttributes.
Parámetros de entrada:
accionescomo un arreglo, permitiéndole elegir las acciones correctivas y su secuencia de aplicación; los valores soportados incluyenLIMPIARyCALIBRAR.calibrateActioncomo un objeto que contiene detalles de configuración relacionados con laCALIBRARoperación.calibrationAttributescomo un arreglo de atributos que requieren calibración, típicamente vinculados a la columna Yield.smoothWindowSizecomo un entero impar que suaviza los valores resultantes, reduciendo saltos abruptos en los valores.conditionPathwiseCalibrationcomo un objeto con la Ruta por ruta la calibración corresponde a las trazas de la máquina. Cada traza de la máquina se procesa como una región individual con fines de calibración.calibrationBasiscomo una cadena que representa el atributo usado como base para la calibración.maxHomogeneityRegioncomo un booleano que indica si la región de máxima homogeneidad se usa como la región de referencia para la calibración.syntheticMachinePathcomo un booleano que indica la simulación de las rutas de la máquina; es beneficioso cuando el atributo de la ruta precisa de la máquina está ausente y necesita simularse a partir de marcas temporales u otro atributo similar.
conditionAvgTotalCalibrationcomo un objeto con la Promedio/Total la calibración se centra en redistribuir los valores de los atributos. Si los patrones geoespaciales son precisos pero las cifras absolutas se desvían de la realidad, este método resulta beneficioso.calibrationAttributecomo una cadena que representa el atributo que se va a calibrar.averagecomo un número que representa los valores promedio del atributo; los valores del atributo deben alinearse con este promedio. Sólo una opción, ya seaaverageototal, debe utilizarse a la vez.totalcomo un número que representa la suma total de los valores del atributo; el agregado de estos valores debe coincidir con el total. Sólo una opción, ya seaaverageototal, debe utilizarse a la vez.
conditionMinMaxCalibrationcomo un objeto con la Condicional la calibración ajusta los valores de los atributos basándose en los umbrales mínimos y máximos proporcionados.calibrationAttributecomo una cadena que representa el atributo que se va a calibrar.mincomo un número que representa los valores mínimos del atributo, sirviendo como el rango más bajo para la calibración.minIncludedcomo un booleano que indica si incluir o no el valor mínimomaxcomo un número que representa los valores máximos del atributo, sirviendo como el rango más alto para la calibración.maxIncludedcomo un booleano que indica si incluir o no el valor máximo.
cleanActioncomo un objeto que incluye las especificaciones de configuración vinculadas a laLIMPIARoperación.conditionAutoCleancomo un objeto que incluye las configuraciones específicas del algoritmo de limpieza automática.targetAttributecomo una cadena que representa los valores objetivo de Yield.excludedAttributescomo un arreglo de cadenas que definen atributos que no influyen en la operación de limpieza.
conditionMinMaxCleancomo un arreglo de objetos que contienen las reglas de limpieza descritas; cada objeto incluye los siguientes parámetros.cleanAttribute como una cadena que especifica el nombre de la columna para la regla.
mincomo un número que indica el valor mínimo.maxcomo un número que indica el valor máximo.
Para ver las entradas y acceder a los valores disponibles más recientes de enumeraciones (como operaciones), se recomienda utilizar Altair.
Documentación: consulta YieldDataset
Como consumidor de la API de GeoPard, puede recuperar detalles sobre las correcciones aplicadas a YieldDatasets a través de los atributos appliedCorrections y appliedCorrectionsVersion. El primero proporciona una lista de correcciones realizadas (por ejemplo, CALIBRAR y LIMPIAR), con el orden de ejecución denotado por su secuencia en el arreglo. Mientras tanto, appliedCorrectionsVersion indica la versión del algoritmo empleado.
Última actualización
¿Te fue útil?