Kaj je rudarjenje prostorskih podatkov?

Rudarjenje prostorskih podatkov je proces, s katerim poskušamo najti vzorce v geografskih podatkih. Najpogosteje se uporablja v maloprodaji, prerasel je iz področja podatkovnega rudarjenja, ki se je sprva osredotočalo na iskanje vzorcev v besedilnih in številčnih elektronskih informacijah. Rudarjenje prostorskih podatkov velja za bolj zapleten izziv kot tradicionalno rudarjenje zaradi težav, povezanih z analizo objektov s konkretnimi obstoji v prostoru in času.

Tako kot pri standardnem rudarjenju podatkov se tudi rudarjenje prostorskih podatkov uporablja predvsem v svetu trženja in maloprodaje. Je tehnika za sprejemanje odločitev, kje odpreti kakšno trgovino. Lahko pomaga pri sprejemanju teh odločitev z obdelavo že obstoječih podatkov o tem, kateri dejavniki motivirajo potrošnike, da gredo na eno mesto in ne na drugo.

Recimo, da želi Ashley odpreti nočni klub v določenem mestnem bloku. Če bi imela dostop do ustreznih podatkov, bi lahko z rudarjenjem prostorskih podatkov ugotovila, kateri prostorski dejavniki naredijo nočne klube uspešne. Lahko bi postavila vprašanja, kot so: Ali bo več ljudi prišlo v klub, če je v bližini javni prevoz? Kakšna oddaljenost od drugih prizorišč nočnega življenja poveča pokroviteljstvo? Je bližina bencinskih črpalk plus ali minus?

Ashley bi morda želela tudi zagotoviti, da bodo ljudje, ki pridejo v njen nočni klub, enakomerno razporejeni skozi posamezno noč. Uporabila bi lahko tudi rudarjenje prostorskih podatkov – morda natančneje, prostorsko-časovno podatkovno rudarjenje –, da bi ugotovila, kako se ljudje ob določenih časih premikajo po mestu. Isti postopek bi lahko uporabili za pokroviteljstvo ob različnih nočeh v tednu.

Težave te metode so posledica kompleksnosti sveta onkraj interneta. Medtem ko so pretekla prizadevanja za rudarjenje podatkov običajno imela baze podatkov, zrele za analizo, vhodi, ki so na voljo za rudarjenje prostorskih podatkov, niso mreže informacij, ampak zemljevidi. Ti zemljevidi imajo različne vrste predmetov, kot so ceste, prebivalstvo, podjetja itd.

Ugotavljanje, ali je nekaj »blizu« nečemu drugemu, se spremeni iz diskretne v neprekinjeno spremenljivko. To močno poveča kompleksnost, ki je potrebna za analizo. Neverjetno, to je ena izmed bolj preprostih vrst odnosov, ki so na voljo nekomu, ki poskuša rudariti prostorske podatke.
S problemom lažnih pozitivnih rezultatov se sooča tudi rudarjenje prostorskih podatkov. V procesu iskanja podatkov, ki iščejo razmerja, se bodo pojavili številni očitni trendi kot posledica statističnih lažnih pozitivnih rezultatov. Ta težava obstaja tudi pri nalogi rudarjenja preprostejše baze podatkov, vendar se poveča zaradi količine podatkov, ki so na voljo rudarju podatkov. Navsezadnje je treba trend, ki ga identificira rudarjenje podatkov, potrditi s postopkom razlage in dodatnih raziskav.