Zašto potpora u poljoprivredi?

Pitanje potpora u poljoprivredi uvijek je aktualno. U slučaju da imate zadatak izraditi analizu poljoprivrednih potpora naći ćete se pred izazovom. U daljnjem tekstu pojasniti ćemo korake kako pristupiti izazovu koji obuhvaća nekoliko koraka.

Kako prikupiti podatke

Agencija za plaćanja u poljoprivredi, ribarstvu i ruralnom razvoju objavljuje na internet stranicama http://isplate.apprrr.hr, informacije o korisnicima potpora u poljoprivredi. Korištenje filtera na stranicama dozvoljava jednostavno pretraživanje baze podataka. Ako je cilj saznati informacije o određenom korisniku to je moguće učiniti elegantno.

Što kada želimo saznati informacije o isplaćenim potporama po korisnicima na razini države, županije ili mjesta? Zbog ograničenja vezano za maksimalan broj prikaza podataka o korisnicima potpora po stranici ( do 100 korisnika ), analiza podataka traži drugačiji pristup.

Pretpostavimo da imamo za cilj saznati sve korisnike potpora u poljoprivredi Splitsko – dalmatinske županije. Korištenje filtera omogućava da brzo dobijemo rezultat. Rezultat će biti na nekoliko desetaka stranica.

Kako iskoristiti rezultate pretrage za analizu podataka? Kako podatke spremiti u format pogodan za analizu podataka? Kopiranje sadržaja stranicu po stranicu? Nakon nekoliko stranica kopiranih u Excel, brzo možemo zaključiti kako to nije produktivan pristup.

Jedan od načina pristupa tom problemu je kreiranje skripte kako bi se proces prikupljanja podataka automatizirao. Želimo li proširiti analizu s 2015. godinu na 2016.godinu pisanje koda jedina opcija je što preostaje. U svakom drugom slučaju, s obzirom da podaci nisu javno dostupni u formatu pogodnom za analizu podataka, posao prikupljanja podataka je gubljenje vremena.

Struktura podataka na internet stranici Agnecije uvjetovala je kod skripte. Koristeći se kodom za potrebe projekta prikupljanja podataka kreiran je dokument na dvije razine ( prva s podacima o korisniku, i druga s podacima o vrstama potpore po svakom korisniku ).

Sređivanje podataka

Nakon što su podaci prikupljeni, slijedeći korak je čišćenje (filriranje) podataka. Zapis informacija prema definiranom kodu obuhvatio je dodatne elemente, a zbog čega je bilo potrebno uložiti dodatni napor.

Riječ je o filtriranju podataka i to na način da se uklone oni podaci koji nisu relevantni za analizu. U konkretnom slučaju valjalo je ukloniti sintaktičke pogreške. S obzirom na relevantnost podataka za analizu potpora u poljoprivredi, dio podataka poput godine, valute je bio brisan.

Sređivanje podataka napravljeno je korištenjem alata Notepad ++. Praćenjem jednostavnih uputa koje je moguće pronaći na internetu, baza podataka relativno brzo pripremljena je za uvoz u program za analizu podataka.

Uvoz i analiza podataka

Projekt je napravljen u Pythonu – programskom jeziku ( korištenjem modula za obradu i vizualizaciju podataka ).

S obzirom na 99.801 korisnika potpora u poljoprivredi za 2015.godinu bilo je važno da bazične operacije zbrajanja, oduzimanja, množenja i dijeljenja budu bez grešaka ili izostavljanja dijela informacija. To je razlog zbog čega uvoz podataka nije napravljen u Excelu. Set podataka za 2015.godinu na kojem je odrađena analiza imao je 499.005 podataka.

Identičan način uvoza podataka napravljen je za 2016.godinu. Ukupan broj korisnika potpora 103.914, ukupan set iznosio je 519.570 podataka. Vrijeme potrebno da se analizira set podataka bio je iznimno kratak jednom kada je model podešen.

Važno je dodati detalj o tipu podataka koji se uvozi. Nerijetko je potrebno promijeniti tip podataka ( iz teksta u broj ) kako bi bilo moguće odraditi matematičke operacije kako u Excelu, tako i u Pythonu. Korištenjem jednostavnih uputa i formula izračunati su parametri potrebni za analizu i vizualizaciju podataka.

Vizualizacija podataka

Cilj članka je da učinimo korak dalje u vizualizaciji podataka u odnosu na Excel. Što kada želimo prikazati na karti Hrvatske kako izgleda raspodijela potpora prema broju korisnika po županijama?

Na identičan način kod možemo koristiti kako bi dobili vizualizacije za 2015. ( broj korisnika, iznos isplaćenih potpora po županijama ) i 2016.godinu ( broj korisnika, iznos isplaćenih potpora po županijama ).

Raspored korisnika poljoprivrednih potpora prema županijama

Broj korisnika potpore u poljoprivredi 2015.godine

Najveći broj korisnika potpore 2015.godine bilo je u Bjelovarsko-bilogorskoj, Koprivničko-križevačkoj i Zagrebačkoj županiji. Najmanje korisnika potpore u poljoprivredi imala je Primorsko-goranska županija.

Broj korisnika potpora u poljoprivredi 2016.godine

Tijekom 2016.godine vodeća županija po broju korisnika potpora u poljoprivredi ostala je Bjelovarsko-bilogorska, Zagrebačka županija zabilježila je rast broja korisnika, i zauzela je drugo mjesto. Na trećem mjestu se smjestila Koprivničko – križevačka županija.

Raspored poljoprivrednih poticija prema iznosu po županijama

Financijski iznosi potpora u poljoprivredi prema županijama 2015.godina

Najviše sredstava isplaćeno je korisnicima u Osječko-baranjskoj županiji, Vukovarsko – srijemskoj, Bjelovarsko-bilogorskoj županiji. Šibensko-kninska županija nalazi se na začelju isplaćenih potpora korisnicima u poljoprivredi.

Financijski iznosi potpora prema županijama u 2016.godini

Prema isplaćenim financijskim sredstvima u poljoprivredi 2016.godine najveći dio povukle su Osječko – baranjska, Vukovarsko – srijemska i Virovitičko – podravska županije. U odnosu na 2015.godine najmanji iznos sredstava isplaćeno je korisnicma potpore Dubrovačko – neretvanske županije.

Usporedba podataka 2015.godina i 2016.godina u poljoprivredi

Novi korisnici potpora u 2016.godini

Tamnija boja na karti signalizira područja gdje su evidentirani novi korisnici potpora u poljoprivredi u 2016.godini u odnosu na 2015.godinu. Izraženo u postotcima ( % ) bilježi se porast od 4,12 % u odnosu na prethodno razdoblje.

Razlika u financijskim iznosima

Tamnija područja signaliziraju povećanje iznosa isplate potpora u odnosu na prethodno razdoblje.

Zaključak

U projektu su korišteni javno dostupni podaci Agencije za plaćanja u poljoprivredi, ribarstvu i ruralnom razvoju. Analiza podataka nije bila izvediva zbog ograničenja u prikazu podataka, zbog čega je bilo potrebno napisati skriptu čime je automatiziran proces. Sređivanje podataka napravljeno je pomoću Notepad ++ kako bi se omogućio uvoz podataka prema željenim parametrima. Pomoću Python modula razinu vizualizacije podigli smo na razinu više, te smo kreirali zanimljivu prezentaciju podataka.

Za sva pitanja vezano za analizu i vizualizaciju podataka obratite se na email: ponistra@net.hr