84. Mutation: Calibra e pulisci YieldDataset
Chiamate API per pulire e calibrare i dataset di resa
La calibrazione del "YieldDataset" è una funzionalità che corregge la distribuzione dei valori in conformità con principi matematici, migliorando l'integrità complessiva dei dati. Rafforza la qualità delle decisioni e rende il dataset utile per analisi approfondite successive.
I casi d'uso comuni per questa funzionalità includono:
Sincronizzare i dati quando più mietitrebbiatrici hanno lavorato contemporaneamente o in giorni diversi, garantendo coerenza.
Rendere il dataset più omogeneo e accurato attenuando le variazioni.
Rimuovere il rumore nei dati e le informazioni estranee che possono offuscare le intuizioni.
Eliminare inversioni di marcia o geometrie anomale, che potrebbero distorcere i reali modelli e trend nel campo.
Regolare i dati di resa per corrispondere a medie o totali stabiliti per ciascun attributo.
Per un'esplorazione più dettagliata ed esempi, fare riferimento al nostro Caso d'uso: Calibrazione e Pulizia della Resa uso.
YieldDataset originale con attributo WetMass
Cinque mietitrebbiatrici hanno lavorato in parallelo nel campo di 30 ha mostrato di seguito. La calibrazione di una delle mietitrebbiatrici non è stata sincronizzata con le altre, risultando in arancione punti, indicando che è necessaria ulteriore CALIBRAZIONE Inoltre, ci sono numerose inversioni di marcia rosse più vicine ai bordi del "Campo" che devono essere eliminate.

YieldDataset calibrato e pulito con attributo WetMass
Il risultato sotto mostra il dataset dopo l'applicazione automatica di CALIBRA e PULISCI operazioni utilizzando i parametri predefiniti. Il "YieldDataset" risultante è diventato omogeneo, senza outlier o cambiamenti bruschi tra geometrie adiacenti.

Opzioni Percorso macchina vs Media/Totale vs Condizionale
Calibrazione per percorso macchina corrisponde alle tracce della macchina. Ogni traccia macchina viene trattata come una regione individuale ai fini della calibrazione. Il team GeoPard suggerisce di usare questo metodo come approccio standard.
Calibrazione media/totale si concentra sulla ridistribuzione dei valori degli attributi. Se i pattern geospaziali sono corretti ma le cifre assolute deviano dai valori reali, questo metodo risulta utile. Per risultati ottimali, GeoPard consiglia di combinarlo con la calibrazione per percorso macchina: applicare prima il percorso macchina, quindi regolare sui valori noti di Media/Totale.
Calibrazione condizionale regola i valori degli attributi in base alle soglie minime e massime fornite. Questo metodo è particolarmente prezioso quando i pattern geospaziali sono precisi, ma la distribuzione dei valori richiede aggiustamenti, specialmente se esistono valori minimi e massimi noti. Per i migliori risultati, GeoPard raccomanda di abbinarlo alla calibrazione per percorso macchina: iniziare con il percorso macchina e poi adattare i valori per allinearsi ai minimi e massimi noti.
Suggerimenti
Suggerimento per anomalie nei dati
Se un utente riscontra anomalie nei dati, come valori pari o prossimi a zero, o valori insolitamente elevati (per esempio una media di 10 con un massimo di 8000), è consigliato il flusso di lavoro Pulizia & Calibrazione È configurato utilizzando i parametri azioni: [PULISCI, CALIBRA].
Dare priorità alla Pulizia dei dati prima della Calibrazione assicura la rimozione di errori, valori mancanti o incoerenze, migliorando così la qualità e l'accuratezza dei dati.
Suggerimento per dati senza errori iniziali
Per dataset inizialmente privi di errori, valori mancanti o incoerenze, e quando è noto che sono coinvolte più mietitrebbiatrici, considerare il flusso di lavoro Calibrazione & Pulizia È configurato utilizzando i parametri azioni: [CALIBRA, PULISCI].
Pulire i dati dopo la calibrazione aiuta a perfezionare ulteriormente il dataset eliminando potenzialmente eventuali artefatti introdotti durante la calibrazione.
Documentazione: dettagli della mutation
La configurazione standard predefinita abilita l'auto-calibrazione e la pulizia del "YieldDataset".
Un esempio più avanzato fornisce controllo manuale degli intervalli min/max e incorpora attributi aggiuntivi.
Per seguire il protocollo USDA per l' PULISCI operazione, è necessario menzionare TUTTE le colonne in cleanAction -> conditionMinMaxClean o specificare una parte di esse in cleanAction -> conditionMinMaxClean e le restanti in condtionAutoClean -> excludedAttributes.
Parametri di input:
azionicome array, permettendo di scegliere le azioni correttive e la loro sequenza di applicazione; i valori supportati includonoPULISCIeCALIBRA.calibrateActioncome oggetto contenente dettagli di configurazione legati all'CALIBRAoperazione.calibrationAttributescome array di attributi che richiedono calibrazione, tipicamente collegati alla colonna Yield.smoothWindowSizecome un intero dispari che smussa i valori risultanti, riducendo salti bruschi nei valori.conditionPathwiseCalibrationcome oggetto con la Calibrazione per percorso macchina la calibrazione corrisponde alle tracce della macchina. Ogni traccia macchina viene processata come una regione individuale ai fini della calibrazione.calibrationBasiscome stringa che rappresenta l'attributo utilizzato come base per la calibrazione.maxHomogeneityRegioncome booleano che indica se la regione di massima omogeneità è usata come regione di riferimento per la calibrazione.syntheticMachinePathcome booleano che indica la simulazione delle rotte della macchina; è utile quando l'attributo di percorso macchina preciso è assente e necessita di essere simulato basandosi su timestamp o attributi simili.
conditionAvgTotalCalibrationcome oggetto con la Calibrazione Media/Totale la calibrazione si concentra sulla ridistribuzione dei valori degli attributi. Se i pattern geospaziali sono accurati ma le cifre assolute differiscono dai valori reali, questo metodo risulta vantaggioso.calibrationAttributecome stringa che rappresenta l'attributo da calibrare.averagecome numero che rappresenta i valori medi dell'attributo; i valori dell'attributo dovrebbero allinearsi a questa media. Deve essere utilizzata una sola opzione alla volta, oaverageototal, dovrebbe essere utilizzata una sola opzione alla volta.totalcome numero che rappresenta la somma totale dei valori dell'attributo; l'aggregato di questi valori dovrebbe corrispondere al totale. Deve essere utilizzata una sola opzione alla volta, oaverageototal, dovrebbe essere utilizzata una sola opzione alla volta.
conditionMinMaxCalibrationcome oggetto con la Calibrazione Condizionale la calibrazione regola i valori degli attributi basandosi sulle soglie minime e massime fornite.calibrationAttributecome stringa che rappresenta l'attributo da calibrare.mincome numero che rappresenta i valori minimi dell'attributo, servendo come limite inferiore per la calibrazione.minIncludedcome booleano che indica se includere o meno il valore minimomaxcome numero che rappresenta i valori massimi dell'attributo, servendo come limite superiore per la calibrazione.maxIncludedcome booleano che indica se includere o meno il valore massimo.
cleanActioncome oggetto che include le specifiche di configurazione legate aPULISCIoperazione.conditionAutoCleancome oggetto che include le configurazioni specifiche all'algoritmo di pulizia automatica.targetAttributecome stringa che rappresenta i valori di resa target.excludedAttributescome array di stringhe che definiscono attributi che non influenzano l'operazione di pulizia.
conditionMinMaxCleancome array di oggetti contenenti le regole di pulizia descritte; ogni oggetto include i seguenti parametri.cleanAttribute come stringa che specifica il nome della colonna per la regola.
mincome numero che indica il valore minimo.maxcome numero che indica il valore massimo.
Per visualizzare gli input e accedere ai valori più recenti disponibili delle enumerazioni (come operazioni), è consigliato utilizzare Altair.
Documentazione: query YieldDataset
Come consumatore dell'API GeoPard, puoi recuperare dettagli riguardanti le correzioni applicate ai YieldDataset tramite gli attributi appliedCorrections e appliedCorrectionsVersion. Il primo fornisce un elenco delle correzioni effettuate (es., CALIBRA e PULISCI), con l'ordine di esecuzione indicato dalla loro sequenza nell'array. Nel frattempo, appliedCorrectionsVersion indica la versione dell'algoritmo impiegato.
Ultimo aggiornamento
È stato utile?