# Порівняння наборів даних урожайності

## Контекст

Сучасне прийняття рішень в сільському господарстві значною мірою залежить від наборів даних урожайності, які відображають зібрану продукцію й складають значну частину доходів господарств. Ці набори даних повинні бути точними та високої якості, щоб інформувати про управління витратними ресурсами та оптимізувати майбутні стратегії посіву й удобрення.

Дані про урожайність зазвичай збираються збиральним обладнанням, проте сирі показники часто є неповними, містять помилки або потребують калібрування для усунення невідповідностей сенсорів та змінних польових умов. Щоб подолати ці проблеми, фахівці зазвичай використовують методи очищення, калібрування та синтетичної генерації наборів даних для отримання надійних і порівнюваних даних про урожайність.

Обидва[ Очищення та калібрування урожайності](https://docs.geopard.tech/geopard-tutorials/ukrainian/agronomiya/kalibruvannya-ta-ochishennya-vrozhainosti) та [Синтетичне відновлення даних про урожайність](https://docs.geopard.tech/geopard-tutorials/ukrainian/agronomiya/sintetichna-karta-vrozhainosti) підтримуються GeoPard.

<mark style="color:за замовчуванням;background-color:yellow;">Порівняння наборів даних урожайності з різних років забезпечує цінну інформацію, допомагає перевірити практики управління, підтвердити точність сенсорів і покращити стратегії на наступні сезони.</mark> Ці порівняння також спрямовують до вдосконалення рекомендацій щодо внесення добрив і норми висіву, забезпечуючи, що кожне рішення базується на достовірній інформації.

## Підхід до порівняння (з використанням рівняння подібності)

Для кількісного порівняння наборів даних урожайності ми використовуємо заздалегідь збережене рівняння під назвою <mark style="color:за замовчуванням;background-color:yellow;">Просторова кореляція (Схожість шарів даних)</mark> яке вимірює подібність між атрибутами, пов’язаними з урожайністю, з наборів даних урожайності на просторовій основі.

Це рівняння присвоює оцінку подібності, що вказує, наскільки тісно один набір даних відповідає іншому за просторовим візерунком і розподілом значень.&#x20;

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2F9O2baZdOVQWoiJrJqPdv%2Fimage.png?alt=media&#x26;token=4014a70b-804e-46fa-8206-19f58cc345cd" alt=""><figcaption><p>Знайти існуючу формулу схожості шарів даних</p></figcaption></figure>

<mark style="color:за замовчуванням;background-color:yellow;">Значення схожості коливаються від 0 до 1, де 0 означає відсутність співпадіння, а 1 позначає 100% просторове співпадіння значень</mark>Іншими словами, чим ближче оцінка подібності до 1, тим більш схожі атрибути урожайності.&#x20;

## **Реальний набір даних урожайності (2015** Соя **проти 2018** Со&#x44F;**)**

У цьому випадку ми починаємо з сирих даних про урожайність, зібраних у два різні вегетаційні сезони — 2015 і 2018 років з тією ж культурою — соєю. Початкові набори даних містять аномально високі та низькі ділянки, особливо на початку/в кінці проходів комбайна, і дані потребують незначного перекалібрування.

Після застосування інструментів очищення та калібрування GeoPard отриманий набір даних стає більш однорідним, послідовним і легшим для інтерпретації.

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FDTbHLvB354jBMO3fub2W%2Fimage.png?alt=media&#x26;token=6ca5f428-021b-453d-b6c7-330038294e0c" alt=""><figcaption><p>Соя 2015: Оригінальні vs Очищені та Калібровані дані про урожайність</p></figcaption></figure>

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FaiDl2niPiQyUwQ6kDTdW%2Fimage.png?alt=media&#x26;token=7bb1ccdb-b41c-4590-b47f-a803cdbe8e01" alt=""><figcaption><p>Соя 2018: Оригінальні vs Очищені та Калібровані дані про урожайність</p></figcaption></figure>

Нижче наведено карту виконання рівняння подібності у вигляді скріншота.

З точки зору статистики, вона показує високе середнє (0.869) та медіану (0.876), що вказує на те, <mark style="color:за замовчуванням;background-color:yellow;">що візерунки урожайності сої 2018 року сильно схожі на ті, що були в 2015 році</mark>. Хоча в деяких ділянках значення опускаються до 0.599, низька варіація (0.005) і помірне стандартне відхилення (0.073) підтверджують <mark style="color:за замовчуванням;background-color:yellow;">загальну послідовність</mark>.&#x20;

З агрономічної точки зору, <mark style="color:за замовчуванням;background-color:yellow;">ця стабільність свідчить про те, що базові умови поля та реакції на заходи управління залишалися переважно без змін</mark>.

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FAyZjM18FRfT03KXUX2yW%2Fimage.png?alt=media&#x26;token=d48c86e2-0aa0-4eb4-b626-29e645399a77" alt=""><figcaption><p>Порівняння подібності урожайності: Соя 2015 vs Соя 2018</p></figcaption></figure>

## **Реальний набір даних урожайності (2022** Кукурудза **проти 2024** Кукурудз&#x430;**)**

У цьому сценарії ми починаємо з сирих даних про урожайність з двох сезонів кукурудзи — 2022 і 2024 років. Початкові набори даних містять аномалії, такі як аномально високі або низькі показники, перехресні проходи та вигнуті траєкторії, що вказує на необхідність перекалібрування сенсорів.&#x20;

Після застосування інструментів очищення та калібрування GeoPard набори даних стають більш надійними, що дозволяє здійснювати автоматизований аналіз і приймати обґрунтовані рішення.

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FrCMUu65DPZjqVmuvoUvM%2Fimage.png?alt=media&#x26;token=00c11d5e-70b7-49ea-9943-0e4ac5b2b990" alt=""><figcaption><p>Кукурудза 2022: Оригінальні vs Очищені та Калібровані дані про урожайність</p></figcaption></figure>

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Ff53cGgbe2gWO4LbW2OUN%2Fimage.png?alt=media&#x26;token=f48408bd-662e-44f8-9fca-c334b23324b8" alt=""><figcaption><p>Кукурудза 2024: Оригінальні vs Очищені та Калібровані дані про урожайність</p></figcaption></figure>

Нижче наведено карту виконання рівняння подібності у вигляді скріншота.

З точки зору статистики, середнє 0.791 та медіана 0.799 показують, <mark style="color:за замовчуванням;background-color:yellow;">що врожаї кукурудзи 2024 року в цілому схожі на 2022 рік</mark>, хоча ділянки з рівнем до 0.413 вказують на варіабельність. Стандартне відхилення 0.115 підтверджує <mark style="color:за замовчуванням;background-color:yellow;">наявність деяких відмінностей по полю</mark>.

З агрономічної точки зору, <mark style="color:за замовчуванням;background-color:yellow;">послідовні візерунки свідчать про стабільні умови та ефективне управління впродовж часу</mark>. Однак локалізовані <mark style="color:за замовчуванням;background-color:yellow;">зони з нижчою подібністю можуть потребувати цільових коригувань для покращення майбутньої продуктивності урожаю</mark>.

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FhOWLFRX43inp21kga5y9%2Fimage.png?alt=media&#x26;token=308de900-e22a-4330-b517-a88ca89c5012" alt=""><figcaption><p>Порівняння подібності урожайності: Кукурудза 2022 vs Кукурудза 2024</p></figcaption></figure>

## **Синтетичний vs Реальний набір даних урожайності (2023** Ріпак)

У цьому сценарії ми починаємо з сирого набору даних урожайності за сезон ріпаку 2023 року та синтетично згенерованого набору даних урожайності для тієї ж культури й того ж року 2023. <mark style="color:за замовчуванням;background-color:yellow;">Мета — оцінити просторову точність реального порівняно з синтетичним урожаєм, що дає можливість заповнити незаписані дані, усунути прогалини в даних про урожайність і виправити аномалії за допомогою синтетичних значень</mark>. Реальний набір даних урожайності містить проблеми, такі як аномально високі або низькі показники, перехресні проходи, вигнуті траєкторії та нульові проходи, що всі вказують на необхідність перекалібрування сенсорів.

Після застосування інструментів GeoPard [Очищення та Калібрування](https://docs.geopard.tech/geopard-tutorials/ukrainian/agronomiya/kalibruvannya-ta-ochishennya-vrozhainosti) до реальних даних про урожайність і створення [Синтетичного Урожаю](https://docs.geopard.tech/geopard-tutorials/ukrainian/agronomiya/sintetichna-karta-vrozhainosti) для ріпаку ми можемо розпочати змістовне порівняння їх подібності.

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FwkCRiie2suhom6bxWKCJ%2Fimage.png?alt=media&#x26;token=f4752a43-55e2-431c-a667-8363c8f742c6" alt=""><figcaption><p>Ріпак 2023: Оригінальні vs Очищені та Калібровані дані про урожайність</p></figcaption></figure>

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2Fz427malsrdHAQOCNjQyh%2Fimage.png?alt=media&#x26;token=26a63983-2a7f-48b2-bfc9-3e40a883582a" alt=""><figcaption><p>Синтетичний урожай ріпаку 2023</p></figcaption></figure>

Нижче наведено карту виконання рівняння подібності у вигляді скріншота.

З точки зору статистики, високі середнє (0.889) та медіана (0.904) вказують на те, що <mark style="color:за замовчуванням;background-color:yellow;">в цілому синтетичний набір даних урожайності тісно відповідає просторовим візерункам реального врожаю ріпаку 2023 року</mark>. Хоча в одній ділянці значення опускається до 0.291, низька варіація (0.006) і помірне стандартне відхилення (0.08) свідчать про те, що <mark style="color:за замовчуванням;background-color:yellow;">більшість частин поля тісно збігаються між реальними та синтетичними наборами даних, з дуже малою кількістю викидів</mark>.

З агрономічної точки зору, така висока подібність означає, що <mark style="color:за замовчуванням;background-color:yellow;">синтетичні дані про урожайність можуть служити надійним замінником реальних польових умов</mark>, підкріплюючи довіру до використання змодельованих сценаріїв для прийняття рішень. <mark style="color:за замовчуванням;background-color:yellow;">Агрономічні практики, відображені в реальних даних про урожайність, добре відтворюються моделлю синтетичного урожаю</mark>, що дозволяє здійснювати більш обґрунтоване та послідовне планування майбутніх стратегій управління.

<figure><img src="https://2650431644-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FYICBELdyAXXebKAzfLOR%2Fuploads%2FZT4vMwtGPgMFsmWAsIb4%2Fimage.png?alt=media&#x26;token=bf195514-380e-43fb-bbee-5922dd92b769" alt=""><figcaption><p>Порівняння подібності урожайності ріпаку: Фактичний 2023 vs Синтетичний 2023</p></figcaption></figure>
