84. म्यूटेशन: YieldDataset कैलिब्रेट और क्लीन करें
यील्ड डेटासेट को साफ़ और कैलिब्रेट करने के लिए API कॉल्स
“YieldDataset” का कैलिब्रेशन एक ऐसी सुविधा है जो मानों के वितरण को गणितीय सिद्धांतों के अनुरूप सही करती है, जिससे डेटा की समग्र अखंडता बढ़ती है। यह निर्णय लेने की गुणवत्ता को मजबूत करता है और आगे गहन विश्लेषण के लिए dataset को उपयोगी बनाता है।
इस कार्यक्षमता के सामान्य उपयोग के मामले निम्नलिखित हैं:
जब कई हार्वेस्टर एक साथ या कई दिनों में काम करते हैं तो डेटा को सिंक्रोनाइज़ करना, ताकि संगति सुनिश्चित हो सके।
वैरिएशन को समतल करके dataset को अधिक समरूप और सटीक बनाना।
डेटा शोर और अतिरिक्त जानकारी को हटाना जो अंतर्दृष्टियों को धुंधला कर सकते हैं।
टर्नअराउंड या असामान्य ज्यामितियों को समाप्त करना, जो खेत में वास्तविक पैटर्न और रुझानों को विकृत कर सकती हैं।
हर एट्रिब्यूट के लिए स्थापित औसत या कुल के अनुरूप उपज (yield) डेटा को समायोजित करना।
विस्तृत अन्वेषण और उदाहरणों के लिए, कृपया हमारे Yield Calibration & Cleaning use case.
मूल WetMass एट्रिब्यूट वाला YieldDataset
नीचे दिखाए गए 30 हेक्टेयर फ़ील्ड में पाँच हार्वेस्टर समानांतर में काम कर रहे थे। इन में से एक हार्वेस्टर का कैलिब्रेशन दूसरों के साथ सिंक्रोनाइज़ नहीं था, जिसके परिणामस्वरूप नारंगी स्थानों ने संकेत दिया, जो बताता है कि अतिरिक्त CALIBRATION आवश्यक है। साथ ही, कई टर्न-अराउंड लाल फ़ील्ड की सीमाओं के पास निकटवर्ती स्थान हैं जिन्हें हटाने की आवश्यकता है।

WetMass एट्रिब्यूट वाला कैलिब्रेटेड और क्लीन किया गया YieldDataset
नीचे परिणाम दिखाता है कि डिफ़ॉल्ट पैरामीटरों का उपयोग करके स्वचालित CALIBRATE और CLEAN ऑपरेशन्स लागू करने के बाद dataset कैसा दिखता है। परिणामस्वरूप "YieldDataset" समरूप हो गया है, बिना आउट्लायर्स या पड़ोसी ज्यामितियों के बीच अचानक परिवर्तनों के।

Pathwise बनाम Average/Total बनाम Conditional विकल्प
Pathwise कैलिब्रेशन मशीन के ट्रैकों के अनुरूप होता है। प्रत्येक मशीन ट्रैक को कैलिब्रेशन उद्देश्यों के लिए एक अलग क्षेत्र के रूप में संसाधित किया जाता है। GeoPard टीम इस विधि को मानक दृष्टिकोण के रूप में उपयोग करने का सुझाव देती है।
Average/Total कैलिब्रेशन एट्रिब्यूट मानों के पुनर्वितरण पर केंद्रित होता है। यदि भौगोलिक पैटर्न सही हैं लेकिन निरपेक्ष आंकड़े वास्तविकों से भिन्न हैं, तो यह विधि फायदेमंद होती है। सर्वोत्तम परिणामों के लिए GeoPard सुझाव देता है कि इसे Pathwise कैलिब्रेशन के साथ संयोजित करें: पहले Pathwise लागू करें, फिर ज्ञात Average/Total मानों के अनुसार समायोजित करें।
Conditional कैलिब्रेशन प्रदान किए गए न्यूनतम और अधिकतम थ्रेशोल्ड्स के आधार पर एट्रिब्यूट मानों को समायोजित करता है। यह विधि तब विशेष रूप से उपयोगी है जब भौगोलिक पैटर्न सही हों, लेकिन मानों का वितरण समायोजन की मांग करता हो, खासकर जब ज्ञात मिन और मैक्स मान मौजूद हों। सर्वोत्तम परिणामों के लिए GeoPard सुझाव देता है कि इसे Pathwise कैलिब्रेशन के साथ जोड़ा जाए: Pathwise से शुरू करें, फिर ज्ञात मिन और मैक्स मानों के अनुरूप समायोजन करें।
संकेत
डेटा विसंगतियों के लिए संकेत
यदि किसी उपयोगकर्ता को डेटा में विसंगतियाँ मिलती हैं, जैसे कि शून्य के पास मान, या असामान्य रूप से बड़े मान (उदाहरण के लिए औसत 10 पर अधिकतम 8000), तो Clean & Calibration वर्कफ़्लो की सलाह दी जाती है। यह पैरामीटरों का उपयोग करके कॉन्फ़िगर किया जाता है actions: [CLEAN, CALIBRATE].
कैलिब्रेशन से पहले डेटा क्लीनिंग को प्राथमिकता देने से त्रुटियों, गायब मानों या असंगतियों को हटाया जा सकता है, जिससे डेटा की गुणवत्ता और सटीकता बेहतर होती है।
प्रारंभिक त्रुटियों के बिना डेटा के लिए संकेत
उन datasets के लिए जो प्रारंभ में त्रुटि-रहित, गायब मानों या असंगतियों से मुक्त हों, और जब ज्ञात हो कि कई हार्वेस्टर शामिल थे, तो विचार करें Calibration & Clean वर्कफ़्लो। इसे पैरामीटरों का उपयोग करके कॉन्फ़िगर किया गया है actions: [CALIBRATE, CLEAN].
कैलिब्रेशन के बाद डेटा की सफाई करने से कैलिब्रेशन के दौरान उत्पन्न किसी भी आर्टिफैक्ट को हटाकर dataset को और परिष्कृत करने में मदद मिलती है।
दस्तावेज़ीकरण: म्यूटेशन विवरण
डिफ़ॉल्ट मानक कॉन्फ़िगरेशन "YieldDataset" के ऑटो कैलिब्रेशन और क्लीनिंग को सक्षम करता है।
एक अधिक उन्नत उदाहरण मिन/मैक्स रेंज पर मैन्युअल नियंत्रण प्रदान करता है और अतिरिक्त एट्रिब्यूट्स को शामिल करता है।
USDA प्रोटोकॉल का पालन करने के लिए, CLEAN ऑपरेशन के लिए, आपको या तो सभी कॉलम का उल्लेख करना होगा cleanAction -> conditionMinMaxClean या उनमें से एक भाग का निर्दिष्ट करना होगा cleanAction -> conditionMinMaxClean और शेष को निर्दिष्ट करना होगा condtionAutoClean -> excludedAttributes.
इनपुट पैरामीटर:
actionsएक ऐरे के रूप में, जो आपको चुनने की अनुमति देता है सही करने वाली क्रियाओं और उनके आवेदन के क्रम को समर्थित मानों में शामिल हैंCLEANऔरCALIBRATE.calibrateActionएक ऑब्जेक्ट के रूप में जिसमें उस ऑपरेशन से संबंधित कॉन्फ़िगरेशन विवरण होते हैं।CALIBRATEcalibrationAttributesएक ऐरे के रूप में उन एट्रिब्यूट्स की जो कैलिब्रेशन की आवश्यकता होती है, जो आमतौर पर Yield कॉलम से जुड़े होते हैं।smoothWindowSizeएक विषम पूर्णांक के रूप में जो परिणाम मानों को स्मूद करता है, मानों में अचानक उछाल को कम करता है।conditionPathwiseCalibrationएक ऑब्जेक्ट के रूप में जिसमेंPathwise का विवरण होता है। कैलिब्रेशन मशीन के ट्रैकों के अनुरूप होता है। प्रत्येक मशीन ट्रैक को कैलिब्रेशन उद्देश्यों के लिए एक अलग क्षेत्र के रूप में संसाधित किया जाता है।calibrationBasisएक स्ट्रिंग के रूप में जो उस एट्रिब्यूट का प्रतिनिधित्व करती है जिसे कैलिब्रेशन के आधार के रूप में उपयोग किया जाता है।maxHomogeneityRegionएक बूलियन के रूप में जो संकेत करता है कि क्या अधिकतम समरूपता वाला क्षेत्र कैलिब्रेशन के संदर्भित क्षेत्र के रूप में उपयोग किया जा रहा है।syntheticMachinePathएक बूलियन के रूप में जो मशीन रूट्स के सिमुलेशन को इंगित करता है; यह तब उपयोगी होता है जब सटीक मशीन पथ एट्रिब्यूट अनुपस्थित हो और टाइमस्टैम्प या समान एट्रिब्यूट के आधार पर सिमुलेशन की आवश्यकता हो।
conditionAvgTotalCalibrationPathwise Average/Total कैलिब्रेशन एट्रिब्यूट मानों के पुनर्वितरण पर केंद्रित होता है। यदि भौगोलिक पैटर्न सही हैं लेकिन निरपेक्ष आंकड़े वास्तविकों से भिन्न हैं, तो यह विधि फायदेमंद होती है।calibrationAttributeएक स्ट्रिंग के रूप में जो उस एट्रिब्यूट का प्रतिनिधित्व करती है जिसे कैलिब्रेट किया जाना है।averageएक संख्या के रूप में जो एट्रिब्यूट के औसत मानों का प्रतिनिधित्व करती है; एट्रिब्यूट मानों को इस औसत के अनुरूप होना चाहिए। एक समय में केवल एक विकल्प, या तोaverageयाtotal, का उपयोग किया जाना चाहिए।totalएक संख्या के रूप में जो एट्रिब्यूट मानों के कुल योग का प्रतिनिधित्व करती है; इन मानों का समेकित योग कुल के अनुरूप होना चाहिए। एक समय में केवल एक विकल्प, या तोaverageयाtotal, का उपयोग किया जाना चाहिए।
conditionMinMaxCalibrationPathwise Conditional कैलिब्रेशन प्रदान किए गए मिन और मैक्स थ्रेशोल्ड्स के आधार पर एट्रिब्यूट मानों को समायोजित करता है।calibrationAttributeएक स्ट्रिंग के रूप में जो उस एट्रिब्यूट का प्रतिनिधित्व करती है जिसे कैलिब्रेट किया जाना है।minएक संख्या के रूप में जो एट्रिब्यूट के न्यूनतम मानों का प्रतिनिधित्व करती है, और कैलिब्रेशन के लिए निचला रेंज निर्धारित करती है।minIncludedएक बूलियन के रूप में जो यह संकेत करता है कि क्या न्यूनतम मान को शामिल किया जाना चाहिए या नहीं।maxएक संख्या के रूप में जो एट्रिब्यूट के अधिकतम मानों का प्रतिनिधित्व करती है, और कैलिब्रेशन के लिए ऊपरी रेंज निर्धारित करती है।maxIncludedएक बूलियन के रूप में जो यह संकेत करता है कि क्या अधिकतम मान को शामिल किया जाना चाहिए या नहीं।
cleanActionएक ऑब्जेक्ट के रूप में जिसमें उस ऑपरेशन से जुड़ी कॉन्फ़िगरेशन विशिष्टताएँ शामिल होती हैं।CLEANcalibrationAttributesconditionAutoCleanएक ऑब्जेक्ट के रूप में जिसमें ऑटो-क्लीन एल्गोरिथ्म से संबंधित कॉन्फ़िगरेशन शामिल होते हैं।targetAttributeएक स्ट्रिंग के रूप में जो लक्ष्य Yield मानों का प्रतिनिधित्व करती है।excludedAttributesएक स्ट्रिंग्स की ऐरे के रूप में जो उन एट्रिब्यूट्स को परिभाषित करती है जो क्लीनिंग ऑपरेशन को प्रभावित नहीं करते।
conditionMinMaxCleanवर्णित क्लीनिंग नियमों वाले ऑब्जेक्ट्स की एक ऐरे के रूप में, हर ऑब्जेक्ट में निम्न पैरामीटर शामिल होते हैं।cleanAttribute को नियम के लिए कॉलम नाम निर्दिष्ट करने वाली एक स्ट्रिंग के रूप में।
minएक संख्या के रूप में जो न्यूनतम मान को सूचित करती है।maxएक संख्या के रूप में जो अधिकतम मान को सूचित करती है।
इनपुट देखने और एनेमरेशन (जैसे operations) के नवीनतम उपलब्ध मानों तक पहुँचने के लिए, सलाह दी जाती है कि आप उपयोग करें Altair.
दस्तावेज़ीकरण: YieldDataset क्वेरी
एक GeoPard API उपभोक्ता के रूप में, आप उन सुधारों के बारे में विवरण प्राप्त कर सकते हैं जो YieldDatasets पर लागू किए गए हैं, निम्न एट्रिब्यूट्स के माध्यम से appliedCorrections और appliedCorrectionsVersion। पूर्व वाला किए गए सुधारों की सूची प्रदान करता है (उदाहरण के लिए, CALIBRATE और CLEAN), जहाँ निष्पादन का क्रम ऐरे में उनके क्रम द्वारा प्रदर्शित होता है। इस बीच, appliedCorrectionsVersion उपयोग किए गए एल्गोरिथ्म के संस्करण का संकेत देता है।
Last updated
Was this helpful?