84. طفرية: معايرة وتنظيف مجموعة بيانات الغلة
استدعاءات API لتنظيف ومعايرة مجموعات بيانات الغلة
معايرة "مجموعة بيانات الغلة" هي وظيفة تصحح توزيع القيم بما يتوافق مع المبادئ الرياضية، مما يعزز التكامل العام للبيانات. إنها تعزز جودة اتخاذ القرار وتجعل مجموعة البيانات ذات قيمة لمزيد من التحليل المتعمق.
حالات الاستخدام الشائعة لهذه الوظيفة تشمل:
مزامنة البيانات عندما تعمل عدة آلات حصاد إما في الوقت نفسه أو على مدى عدة أيام، لضمان الاتساق.
جعل مجموعة البيانات أكثر تجانسًا ودقة عن طريق تنعيم التباينات.
إزالة ضوضاء البيانات والمعلومات الزائدة التي قد تغطي على الرؤى.
القضاء على دورانات أو هندسات غير طبيعية، والتي قد تشوّه الأنماط والاتجاهات الفعلية في الحقل.
تعديل بيانات الغلة لتتوافق مع المتوسطات أو الإجماليات المعروفة لكل سمة.
لمزيد من الاستكشاف التفصيلي والأمثلة، يرجى الرجوع إلى حالة استخدام معايرة وتنظيف الغلة .
مجموعة بيانات الغلة الأصلية مع سمة الكتلة الرطبة
عملت خمس آلات حصاد بالتوازي في الحقل الذي تبلغ مساحته 30 هكتارًا الموضح أدناه. لم تكن معايرة إحدى آلات الحصاد متزامنة مع الباقي، مما أدى إلى وجود برتقالي نقاط، مما يشير إلى أن هناك حاجة إلى المعايرة . بالإضافة إلى ذلك، توجد العديد من الدورانات الحمراء القريبة من حدود "الحقل" التي تحتاج إلى الإزالة.

مجموعة بيانات الغلة المعايرة والمُنقحة مع سمة الكتلة الرطبة
يعرض الناتج أدناه مجموعة البيانات بعد تطبيق عمليات المعايرة و التنظيف الأوتوماتيكية باستخدام المعلمات الافتراضية. أصبحت "مجموعة بيانات الغلة" الناتجة متجانسة، بدون قيم شاذة أو تغيّرات مفاجئة بين الهندسات المتجاورة.

خيارات على مستوى المسار مقابل المتوسط/الإجمالي مقابل الشرطي
المعايرة على مستوى المسار تتوافق مع آثار مرور الآلة. يتم معالجة كل أثر آلة كمنطقة فردية لأغراض المعايرة. تقترح فريق GeoPard استخدام هذه الطريقة كنهج قياسي.
المعايرة المتوسطة/الإجمالية تركز على إعادة توزيع قيم السمات. إذا كانت الأنماط الجغرافية المكانية صحيحة لكن الأرقام المطلقة تختلف عن القيم الفعلية، فهذه الطريقة مفيدة. للحصول على أفضل النتائج، توصي GeoPard بدمجها مع معايرة المسار: تطبيق المعايرة على مستوى المسار أولاً، ثم التعديل إلى القيم المعروفة للمتوسط/الإجمالي.
المعايرة الشرطية تعدل قيم السمات بناءً على حدود دنيا وعليا مقدمة. تكون هذه الطريقة ذات قيمة خاصة عندما تكون الأنماط الجغرافية المكانية دقيقة، لكن توزيع القيم يحتاج إلى تعديلات، خاصة عند وجود قيم دنيا وعليا معروفة. للحصول على أفضل النتائج، توصي GeoPard بمزاوجتها مع معايرة المسار: بدءًا بمعايرة المسار، ثم إجراء التعديلات لمواءمة القيم مع الحدود الدنيا والعليا المعروفة.
تلميحات
تلميح بخصوص شذوذات البيانات
إذا واجه المستخدم شذوذات في البيانات، مثل قيم عند الصفر أو قريبة منه، أو قيم كبيرة غير معتادة (على سبيل المثال، متوسط 10 مع حد أقصى 8000)، يُنصح باستخدام تدفق العمل "التنظيف والمعايرة" . يتم تكوينه باستخدام معلمات الإجراءات: [CLEAN, CALIBRATE].
إعطاء الأولوية لتنظيف البيانات قبل المعايرة يضمن إزالة الأخطاء أو القيم المفقودة أو التناقضات، مما يعزز جودة ودقة البيانات.
تلميح للبيانات الخالية من الأخطاء في البداية
بالنسبة لمجموعات البيانات الخالية مبدئيًا من الأخطاء أو القيم المفقودة أو التناقضات، وعندما يُعرف أن عدة آلات حصاد شاركت، ضع في الاعتبار تدفق عمل المعايرة والتنظيف . يتم تكوينه باستخدام معلمات الإجراءات: [CALIBRATE, CLEAN].
يساعد تنظيف البيانات بعد المعايرة على تنقية مجموعة البيانات بشكل إضافي من خلال التخلص المحتمل من أي شوائب تم إدخالها أثناء المعايرة.
التوثيق: تفاصيل الطفرة (الميوتيشن)
يُمكّن التكوين الافتراضي القياسي المعايرة الذاتية والتنظيف التلقائي لـ "مجموعة بيانات الغلة".
يوفر مثال أكثر تقدمًا تحكمًا يدويًا في نطاقات الحد الأدنى/الحد الأقصى ويشمل سمات إضافية.
لمتابعة بروتوكول وزارة الزراعة الأمريكية للعملية التنظيف ، يجب عليك إما ذكر جميع الأعمدة في cleanAction -> conditionMinMaxClean أو تحديد جزء منها في cleanAction -> conditionMinMaxClean وإدراج الباقي في condtionAutoClean -> excludedAttributes.
معلمات الإدخال:
الإجراءاتكمصفوفة، مما يتيح لك اختيار إجراءات التصحيح وتسلسل التطبيق؛ القيم المدعومة تشملالتنظيفوالمعايرة.calibrateActionبوصفها كائناً يحتوي على تفاصيل التكوين المتعلقة بـالمعايرةالعملية.calibrationAttributesكمصفوفة من السمات التي تتطلب المعايرة، عادةً المرتبطة بعمود الغلة.smoothWindowSizeبوصفه عددًا فرديًا يعمل على تنعيم القيم الناتجة، مما يقلل من القفزات الحادة في القيم.conditionPathwiseCalibrationبوصفه كائناً مع المعايرة على مستوى المسار تتوافق مع آثار مرور الآلة. يتم معالجة كل أثر آلة كمنطقة فردية لأغراض المعايرة.calibrationBasisبوصفه سلسلة نصية تمثل السمة المستخدمة كأساس للمعايرة.maxHomogeneityRegionبوصفه قيمة منطقية تشير إلى ما إذا كانت منطقة التجانس القصوى تُستخدم كمنطقة مرجعية للمعايرة.syntheticMachinePathبوصفه قيمة منطقية تشير إلى محاكاة مسارات الآلة، وهو مفيد عندما تكون سمة المسار الدقيق للآلة غائبة وتحتاج إلى محاكاة بناءً على الطوابع الزمنية أو سمة مماثلة.
conditionAvgTotalCalibrationبوصفه كائناً مع المعايرة المتوسطة/الإجمالية تركز المعايرة على مستوى المتوسط/الإجمالي على إعادة توزيع قيم السمات. إذا كانت الأنماط الجغرافية المكانية دقيقة لكن الأرقام المطلقة تنحرف عن القيم الفعلية، تكون هذه الطريقة مفيدة.calibrationAttributeبوصفها سلسلة نصية تمثل السمة المراد معايرتها.averageبوصفه رقمًا يمثل متوسط قيم السمة؛ يجب أن تتوافق قيم السمة مع هذا المتوسط. يجب استخدام خيار واحد فقط، إماaverageأوtotal، في كل مرة.totalبوصفه رقمًا يمثل المجموع الكلي لقيم السمة؛ يجب أن يتطابق مجموع هذه القيم مع الإجمالي. يجب استخدام خيار واحد فقط، إماaverageأوtotal، في كل مرة.
conditionMinMaxCalibrationبوصفه كائناً مع المعايرة الشرطية تعدل المعايرة الشرطية قيم السمات بناءً على حدود دنيا وعليا مقدمة.calibrationAttributeبوصفها سلسلة نصية تمثل السمة المراد معايرتها.minبوصفه رقمًا يمثل القيم الدنيا للسمة، ويعمل كنطاق أدنى للمعايرة.minIncludedبوصفه قيمة منطقية تشير إلى ما إذا كان يجب تضمين القيمة الدنيا أم لاmaxبوصفه رقمًا يمثل القيم العليا للسمة، ويعمل كنطاق أعلى للمعايرة.maxIncludedبوصفه قيمة منطقية تشير إلى ما إذا كان يجب تضمين القيمة العليا أم لا.
cleanActionبوصفه كائنًا يتضمن تفاصيل التكوين المرتبطة بـالتنظيفالعملية.conditionAutoCleanبوصفه كائنًا يتضمن التكوينات الخاصة بخوارزمية التنظيف التلقائي.targetAttributeبوصفها سلسلة نصية تمثل قيم الغلة المستهدفة.excludedAttributesكمصفوفة من السلاسل النصية التي تحدد السمات التي لا تؤثر على عملية التنظيف.
conditionMinMaxCleanكمصفوفة من الكائنات التي تحتوي على قواعد التنظيف الموصوفة، كل كائن يتضمن المعلمات التالية.cleanAttribute كسلسلة نصية تحدد اسم العمود للقانون.
minبوصفه رقمًا يشير إلى القيمة الدنيا.maxبوصفه رقمًا يشير إلى القيمة العليا.
لعرض المدخلات والوصول إلى أحدث القيم المتاحة للتعدادات (مثل العمليات)، يُنصح باستخدام Altair.
التوثيق: استعلام مجموعة بيانات الغلة
كمستهلك لواجهة برمجة تطبيقات GeoPard، يمكنك استرداد تفاصيل التصحيحات المطبقة على مجموعات بيانات الغلة عبر السمات appliedCorrections و appliedCorrectionsVersion. يقدّم الأول قائمة بالتصحيحات المُجراة (مثل المعايرة و التنظيف)، مع ترتيب التنفيذ المشار إليه بتسلسلها في المصفوفة. في غضون ذلك، appliedCorrectionsVersion يشير إلى إصدار الخوارزمية المستخدمة.
Last updated
Was this helpful?