Pri računalniških operacijah napaka opisuje nepredviden izpad ali izgubo storitve znotraj aplikacije. Spremljanje napak je postopek, ki se uporablja za spremljanje vseh konfiguracij strojne, programske in omrežne opreme glede morebitnih odstopanj od normalnih delovnih pogojev. Ta postopek spremljanja običajno vključuje večje in manjše spremembe pričakovane pasovne širine, zmogljivosti in izkoriščenosti uveljavljenega računalniškega okolja.
Uspešna implementacija računalniške programske opreme zahteva znatno infrastrukturo na področju strojne, programske opreme in omrežij. Ta kompleksna integracija in sodelovanje med interoperabilnimi komponentami vodi do številnih napak v okolju aplikacije. Da bi zmanjšali čas izpadov, proaktivno spremljanje napak zagotavlja hitro obveščanje in ublažitev okoljskih napak računalnika.
Raven proaktivnega spremljanja računalniškega okolja mora temeljiti na pomembnosti infrastrukture. Predhodni postopki spremljanja napak lahko postanejo dragi in dolgotrajni. Poskrbeti je treba za zagotovitev, da je pravilna raven spremljanja zasnovana na podlagi kakovosti storitve, ki je potrebna za zbirko aplikacij.
Preprost postopek spremljanja lahko vključuje pregled dnevnikov napak v dnevniški datoteki aplikacije ali operacijskem sistemu. To vrsto spremljanja je mogoče avtomatizirati za obveščanje v realnem času, ko pride do napak. Ko se napake razširijo, lahko skrbniki hitro uporabijo strategije za ublažitev, da odpravijo ugotovljeno težavo.
V aplikacijskih okoljih podjetja se običajno izvaja vnaprejšnje spremljanje napak, ki vključuje vse ravni spremljanja. Ta okolja so ključnega pomena za podjetje, saj izpad sistema vpliva na prihodke. Ta vrsta spremljanja običajno vključuje podatkovni center podjetja z vnaprejšnjo introspekcijo vseh vidikov konfiguracije podjetja.
Z vnaprejšnjimi konfiguracijami za spremljanje napak se hitro odkrijejo morebitna odstopanja od običajnih in se izvajajo strategije za ublažitev. Primer vnaprejšnjega spremljanja napak je zmožnost prepoznavanja nenormalnih skokov v omrežnem prometu. Ko je promet identificiran, se lahko proaktivno usmeri na dodatne strežnike in omrežne poti, da se zagotovi ohranjanje kakovosti storitve.
Računalniške aplikacije se zanašajo na strojno opremo in omrežja, ki bodo sčasoma neizogibno imela hudo okvaro ali okvaro. Povprečni čas med okvarami je računalniški izraz, ki se uporablja za napovedovanje časa med vsako težko okvaro na podlagi trenutne konfiguracije. Spremljanje napak je tehnika, ki se uporablja za prepoznavanje napak in hitro sprejemanje protiukrepov, ko pride do neizogibne napake.