Koeficient determinacije je matematični izračun kvadrata korelacijskega koeficienta. Korelacijski koeficient je izračun točnosti modela. Ti izrazi se uporabljajo v statistični analizi za razlago dokaj logičnih izračunov.
V statistiki je naloga analitika, da si ogleda podatke, zbrane iz določenega scenarija ali dogodka, in ustvari matematični model, ki razloži podatke. Da bi ustvarili ta model, je treba upoštevati določena dejstva.
Pri vsakem izračunu in zbiranju podatkov obstaja možnost napake. Ker je to dosledno, je treba stopnjo napake vključiti v model. Z upoštevanjem te napake ni več pomembno za ugotavljanje, ali predlagani model zagotavlja trdno razlago za podatke.
Dejanski izračun koeficienta determinacije je
R2 = vsota kvadratov napak
Vsota kvadratov napak + regresijska vsota kvadratov
To je izračun točnosti modela pri razlagi podatkov.
Ta vrednost, ki se uporablja v statistični analizi, zagotavlja vpogled v “dobro prileganja” statističnega modela podatkom. Vrednost koeficienta je med 0 in 1. Popolno prileganje modela za razlago variacije je 1, 0 pa je vrednost, ko model variacije sploh ne razloži.
Koeficient določanja upošteva napake s podatki ali izstope in regresijsko vsoto kvadratov. Za to vrednost ni enote, saj je v bistvu razmerje in ni popolnoma povezano z velikostjo vzorca. Višja kot je vrednost, ki se približuje 1, boljšo razlago variacije zagotavlja model.
Preprost način za vizualizacijo tega koncepta je, da ustvarite graf vseh podatkov, ki obkrožajo določen dogodek. V jedilnico postavite tri pladnje s piškoti, čokolado, mandlji in arašidi. Opazujte, ko ljudje pridejo v jedilnico in zapišejo, koliko piškotov vzamejo, kakšne vrste in v kakšnem vrstnem redu. Te podatke narišite na graf.
Ustvarite formulo okoli predvidenega vedenja. Primer bi bil napovedati, da je vsaka oseba, ki je vzela 1 čokoladni piškotek, vzela tudi 2 mandlja, vendar brez arašidov. Na podlagi te predpostavke je mogoče napisati preprosto linearno enačbo in jo grafično prikazati.
Narišite črto, ki predstavlja linearno enačbo te napovedi. Primerjajte vrstico z dejansko zbirko podatkov v vašem opazovanju. Izračunajte koeficient determinacije, da zagotovite merilo natančnosti predvidenega vedenja v primerjavi z dejanskimi podatki.
Koeficient determinacije označuje količino razpršenosti podatkov okoli črte. Kaže, kako dobra ali slaba je bila napoved v primerjavi z dejanskimi vrednostmi. Koeficient determinacije omogoča uporabnikom, da uporabijo »preverjanje realnosti« za podatke, predlagane v statističnem modelu. Obstajata dve vrednosti, opazovane ali dejanske vrednosti in modelirane ali predvidene vrednosti.
Ta vrsta statistične analize je zelo pogosta tako v znanosti kot v poslovanju. Številne poslovne odločitve temeljijo na napovedih prihodnjega vedenja. Pomembno je analizirati dejanske rezultate in jih primerjati z napovedmi. Ta postopek izboljša naslednji model in s tem natančnost napovedi.