84. म्यूटेशन: YieldDataset कैलिब्रेट और क्लीन करें

यील्ड डेटासेट को साफ़ और कैलिब्रेट करने के लिए API कॉल्स

“YieldDataset” का कैलिब्रेशन एक ऐसी सुविधा है जो मानों के वितरण को गणितीय सिद्धांतों के अनुरूप सही करती है, जिससे डेटा की समग्र अखंडता बढ़ती है। यह निर्णय लेने की गुणवत्ता को मजबूत करता है और आगे गहन विश्लेषण के लिए dataset को उपयोगी बनाता है।

इस कार्यक्षमता के सामान्य उपयोग के मामले निम्नलिखित हैं:

  • जब कई हार्वेस्टर एक साथ या कई दिनों में काम करते हैं तो डेटा को सिंक्रोनाइज़ करना, ताकि संगति सुनिश्चित हो सके।

  • वैरिएशन को समतल करके dataset को अधिक समरूप और सटीक बनाना।

  • डेटा शोर और अतिरिक्त जानकारी को हटाना जो अंतर्दृष्टियों को धुंधला कर सकते हैं।

  • टर्नअराउंड या असामान्य ज्यामितियों को समाप्त करना, जो खेत में वास्तविक पैटर्न और रुझानों को विकृत कर सकती हैं।

  • हर एट्रिब्यूट के लिए स्थापित औसत या कुल के अनुरूप उपज (yield) डेटा को समायोजित करना।

विस्तृत अन्वेषण और उदाहरणों के लिए, कृपया हमारे Yield Calibration & Cleaning use case.

मूल WetMass एट्रिब्यूट वाला YieldDataset

नीचे दिखाए गए 30 हेक्टेयर फ़ील्ड में पाँच हार्वेस्टर समानांतर में काम कर रहे थे। इन में से एक हार्वेस्टर का कैलिब्रेशन दूसरों के साथ सिंक्रोनाइज़ नहीं था, जिसके परिणामस्वरूप नारंगी स्थानों ने संकेत दिया, जो बताता है कि अतिरिक्त CALIBRATION आवश्यक है। साथ ही, कई टर्न-अराउंड लाल फ़ील्ड की सीमाओं के पास निकटवर्ती स्थान हैं जिन्हें हटाने की आवश्यकता है।

मूल WetMass एट्रिब्यूट वाला YieldDataset

WetMass एट्रिब्यूट वाला कैलिब्रेटेड और क्लीन किया गया YieldDataset

नीचे परिणाम दिखाता है कि डिफ़ॉल्ट पैरामीटरों का उपयोग करके स्वचालित CALIBRATE और CLEAN ऑपरेशन्स लागू करने के बाद dataset कैसा दिखता है। परिणामस्वरूप "YieldDataset" समरूप हो गया है, बिना आउट्लायर्स या पड़ोसी ज्यामितियों के बीच अचानक परिवर्तनों के।

WetMass एट्रिब्यूट वाला कैलिब्रेटेड और क्लीन किया गया YieldDataset

Pathwise बनाम Average/Total बनाम Conditional विकल्प

Pathwise कैलिब्रेशन मशीन के ट्रैकों के अनुरूप होता है। प्रत्येक मशीन ट्रैक को कैलिब्रेशन उद्देश्यों के लिए एक अलग क्षेत्र के रूप में संसाधित किया जाता है। GeoPard टीम इस विधि को मानक दृष्टिकोण के रूप में उपयोग करने का सुझाव देती है।

Average/Total कैलिब्रेशन एट्रिब्यूट मानों के पुनर्वितरण पर केंद्रित होता है। यदि भौगोलिक पैटर्न सही हैं लेकिन निरपेक्ष आंकड़े वास्तविकों से भिन्न हैं, तो यह विधि फायदेमंद होती है। सर्वोत्तम परिणामों के लिए GeoPard सुझाव देता है कि इसे Pathwise कैलिब्रेशन के साथ संयोजित करें: पहले Pathwise लागू करें, फिर ज्ञात Average/Total मानों के अनुसार समायोजित करें।

Conditional कैलिब्रेशन प्रदान किए गए न्यूनतम और अधिकतम थ्रेशोल्ड्स के आधार पर एट्रिब्यूट मानों को समायोजित करता है। यह विधि तब विशेष रूप से उपयोगी है जब भौगोलिक पैटर्न सही हों, लेकिन मानों का वितरण समायोजन की मांग करता हो, खासकर जब ज्ञात मिन और मैक्स मान मौजूद हों। सर्वोत्तम परिणामों के लिए GeoPard सुझाव देता है कि इसे Pathwise कैलिब्रेशन के साथ जोड़ा जाए: Pathwise से शुरू करें, फिर ज्ञात मिन और मैक्स मानों के अनुरूप समायोजन करें।

संकेत

circle-exclamation
circle-exclamation

दस्तावेज़ीकरण: म्यूटेशन विवरण

डिफ़ॉल्ट मानक कॉन्फ़िगरेशन "YieldDataset" के ऑटो कैलिब्रेशन और क्लीनिंग को सक्षम करता है।

एक अधिक उन्नत उदाहरण मिन/मैक्स रेंज पर मैन्युअल नियंत्रण प्रदान करता है और अतिरिक्त एट्रिब्यूट्स को शामिल करता है।

circle-info

USDA प्रोटोकॉल का पालन करने के लिए, CLEAN ऑपरेशन के लिए, आपको या तो सभी कॉलम का उल्लेख करना होगा cleanAction -> conditionMinMaxClean या उनमें से एक भाग का निर्दिष्ट करना होगा cleanAction -> conditionMinMaxClean और शेष को निर्दिष्ट करना होगा condtionAutoClean -> excludedAttributes.

इनपुट पैरामीटर:

  • actions एक ऐरे के रूप में, जो आपको चुनने की अनुमति देता है सही करने वाली क्रियाओं और उनके आवेदन के क्रम को समर्थित मानों में शामिल हैं CLEAN और CALIBRATE.

  • calibrateAction एक ऑब्जेक्ट के रूप में जिसमें उस ऑपरेशन से संबंधित कॉन्फ़िगरेशन विवरण होते हैं। CALIBRATE calibrationAttributes

    • एक ऐरे के रूप में उन एट्रिब्यूट्स की जो कैलिब्रेशन की आवश्यकता होती है, जो आमतौर पर Yield कॉलम से जुड़े होते हैं। smoothWindowSize

    • एक विषम पूर्णांक के रूप में जो परिणाम मानों को स्मूद करता है, मानों में अचानक उछाल को कम करता है। conditionPathwiseCalibration

    • एक ऑब्जेक्ट के रूप में जिसमें Pathwise का विवरण होता है। कैलिब्रेशन मशीन के ट्रैकों के अनुरूप होता है। प्रत्येक मशीन ट्रैक को कैलिब्रेशन उद्देश्यों के लिए एक अलग क्षेत्र के रूप में संसाधित किया जाता है।

      • calibrationBasis एक स्ट्रिंग के रूप में जो उस एट्रिब्यूट का प्रतिनिधित्व करती है जिसे कैलिब्रेशन के आधार के रूप में उपयोग किया जाता है।

      • maxHomogeneityRegion एक बूलियन के रूप में जो संकेत करता है कि क्या अधिकतम समरूपता वाला क्षेत्र कैलिब्रेशन के संदर्भित क्षेत्र के रूप में उपयोग किया जा रहा है।

      • syntheticMachinePath एक बूलियन के रूप में जो मशीन रूट्स के सिमुलेशन को इंगित करता है; यह तब उपयोगी होता है जब सटीक मशीन पथ एट्रिब्यूट अनुपस्थित हो और टाइमस्टैम्प या समान एट्रिब्यूट के आधार पर सिमुलेशन की आवश्यकता हो।

    • conditionAvgTotalCalibration Pathwise Average/Total कैलिब्रेशन एट्रिब्यूट मानों के पुनर्वितरण पर केंद्रित होता है। यदि भौगोलिक पैटर्न सही हैं लेकिन निरपेक्ष आंकड़े वास्तविकों से भिन्न हैं, तो यह विधि फायदेमंद होती है।

      • calibrationAttribute एक स्ट्रिंग के रूप में जो उस एट्रिब्यूट का प्रतिनिधित्व करती है जिसे कैलिब्रेट किया जाना है।

      • average एक संख्या के रूप में जो एट्रिब्यूट के औसत मानों का प्रतिनिधित्व करती है; एट्रिब्यूट मानों को इस औसत के अनुरूप होना चाहिए। एक समय में केवल एक विकल्प, या तो average या total, का उपयोग किया जाना चाहिए।

      • total एक संख्या के रूप में जो एट्रिब्यूट मानों के कुल योग का प्रतिनिधित्व करती है; इन मानों का समेकित योग कुल के अनुरूप होना चाहिए। एक समय में केवल एक विकल्प, या तो average या total, का उपयोग किया जाना चाहिए।

    • conditionMinMaxCalibration Pathwise Conditional कैलिब्रेशन प्रदान किए गए मिन और मैक्स थ्रेशोल्ड्स के आधार पर एट्रिब्यूट मानों को समायोजित करता है।

      • calibrationAttribute एक स्ट्रिंग के रूप में जो उस एट्रिब्यूट का प्रतिनिधित्व करती है जिसे कैलिब्रेट किया जाना है।

      • min एक संख्या के रूप में जो एट्रिब्यूट के न्यूनतम मानों का प्रतिनिधित्व करती है, और कैलिब्रेशन के लिए निचला रेंज निर्धारित करती है।

      • minIncluded एक बूलियन के रूप में जो यह संकेत करता है कि क्या न्यूनतम मान को शामिल किया जाना चाहिए या नहीं।

      • max एक संख्या के रूप में जो एट्रिब्यूट के अधिकतम मानों का प्रतिनिधित्व करती है, और कैलिब्रेशन के लिए ऊपरी रेंज निर्धारित करती है।

      • maxIncluded एक बूलियन के रूप में जो यह संकेत करता है कि क्या अधिकतम मान को शामिल किया जाना चाहिए या नहीं।

  • cleanAction एक ऑब्जेक्ट के रूप में जिसमें उस ऑपरेशन से जुड़ी कॉन्फ़िगरेशन विशिष्टताएँ शामिल होती हैं। CLEAN calibrationAttributes

    • conditionAutoClean एक ऑब्जेक्ट के रूप में जिसमें ऑटो-क्लीन एल्गोरिथ्म से संबंधित कॉन्फ़िगरेशन शामिल होते हैं।

      • targetAttribute एक स्ट्रिंग के रूप में जो लक्ष्य Yield मानों का प्रतिनिधित्व करती है।

      • excludedAttributes एक स्ट्रिंग्स की ऐरे के रूप में जो उन एट्रिब्यूट्स को परिभाषित करती है जो क्लीनिंग ऑपरेशन को प्रभावित नहीं करते।

    • conditionMinMaxClean वर्णित क्लीनिंग नियमों वाले ऑब्जेक्ट्स की एक ऐरे के रूप में, हर ऑब्जेक्ट में निम्न पैरामीटर शामिल होते हैं।

      • cleanAttribute को नियम के लिए कॉलम नाम निर्दिष्ट करने वाली एक स्ट्रिंग के रूप में।

      • min एक संख्या के रूप में जो न्यूनतम मान को सूचित करती है।

      • max एक संख्या के रूप में जो अधिकतम मान को सूचित करती है।

circle-info

इनपुट देखने और एनेमरेशन (जैसे operations) के नवीनतम उपलब्ध मानों तक पहुँचने के लिए, सलाह दी जाती है कि आप उपयोग करें Altair.

दस्तावेज़ीकरण: YieldDataset क्वेरी

एक GeoPard API उपभोक्ता के रूप में, आप उन सुधारों के बारे में विवरण प्राप्त कर सकते हैं जो YieldDatasets पर लागू किए गए हैं, निम्न एट्रिब्यूट्स के माध्यम से appliedCorrections और appliedCorrectionsVersion। पूर्व वाला किए गए सुधारों की सूची प्रदान करता है (उदाहरण के लिए, CALIBRATE और CLEAN), जहाँ निष्पादन का क्रम ऐरे में उनके क्रम द्वारा प्रदर्शित होता है। इस बीच, appliedCorrectionsVersion उपयोग किए गए एल्गोरिथ्म के संस्करण का संकेत देता है।

Last updated

Was this helpful?