Osnovna stranica

Metodologija obrade podataka

Priprema podataka

Iako smo se prethodnim aktivnostima značajno približili samom procesu modeliranja, preostaje nam još i konačna priprema podataka za proces modeliranja. Ugrubo ta se priprema može podijeliti u četiri faze: odabir podataka, 'čišćenje' podataka, formiranje novih atributa ili primjera, te formatiranje podataka.

Odabir podataka

Ovaj korak predviđa odabir podskupa podataka prikupljenih u prethodnoj fazi, na bazi kriterija kvalitete podataka i tehničkih ograničenja:

Čišćenje podataka

Ovaj je korak komplementaran prethodnom a može biti vremenski vrlo zahtjevan s obzirom na mnoštvo mogućih tehnika koje se mogu primijeniti na podatke:

Konstrukcija novih podataka

Primjeri konstrukcije novih podataka iz odabranih i 'očišćenih podataka su:

Formatiranje podataka

Konačni korak u pripremi podataka jest transformacija podataka u format diktiran odabranom tehnikom modeliranja. Formatiranje podataka uključuje:

Napomena

Svaka od tehnika modeliranja u principu ima svoj vlastiti format podataka. Štoviše, neke od tehnika prihvaćaju samo određen tip atributa, bilo nominalni ili numerički. U tom smislu moguće je posebno transformirati podatke u tzv. standardni format podataka koji efektivno može koristiti vrlo širok spektar tehnika. Standardni format podataka definira dva tipa atributa: Prilikom transformiranja nominalnih atributa u binarni tip, svaka pojedina vrijednost nominalnog atributa predstavlja jedan binarni atribut u standardnom formatu. To znači da se nominalni atribut koji poprima -m- različitih vrijednosti transformira u -m- binarnih atributa u standardnom formatu.© 2001 LIS - Institut Rudjer Bošković
Posljednja izmjena: September 08 2015 09:28:57.