Koreferenca je pojav v jeziku, kjer ima več besed ali besednih zvez enak referenčni element. To pomeni, da se oba nanašata na isto osebo, kraj, stvar ali drug ustrezen samostalnik. Ta element jezikovne analize pomaga pri preučevanju načinov uporabe jezika. Uporaben je tudi pri sodobnejšem študiju obdelave naravnega jezika, ki deluje kot temelj za različne računalniške modele, ki analizirajo govor.
Nekaj preprostih primerov koreferenc bo začetnikom pomagalo razumeti, kaj sestavlja tovrstni jezikovni vzorec. Na primer, če nekdo reče »si mislil, da bi lahko dosegel cilj«, se dva primera zaimka, »ti«, oba nanašata na isto osebo, zato je to oblika povezovanja. V teh primerih ni nujno, da sta obe besedi enaki. Na primer, nekdo, ki reče: »John je mislil, da bi lahko dosegel cilj«, še vedno ustvarja povezavo z besedama »Janez« in »on«, ki se spet nanašata na isto osebo.
V tehničnem jezikoslovju je koreferenca primer neke vrste anafore, ki je primer, ko se en izraz nanaša na drugega. Nekateri strokovnjaki to razdelijo na dve podkategoriji, pri čemer je anafora primer izraza, ki se nanaša na naslednji izraz, drugi izraz, katafora, pa se uporablja za izraz, ki se nanaša na prejšnji izraz. Koreferenca kot kategorija anafore kaže tudi, kako so lahko nekateri izrazi, zlasti zaimki, precej dvoumni in potrebujejo kontekst za obdelavo.
Ko se koreferenca uporablja v službi obdelave naravnega jezika, je lahko videti precej drugače kot če je del splošne študije govora. Računalniki uporabljajo zelo napredne algoritme za doseganje obdelave naravnega jezika v vseh njegovih oblikah. Za razčlenitev govora s tehnološkega vidika je potrebna izredno zapletena in zapletena logika, preprosto zato, ker se velik del jezika vrti okoli sposobnosti enega človeka, da razlaga besede in besedne zveze drugega.
Da bi se izognili težavam pri podvajanju razumevanja naravnega jezika z računalniki, lahko oblikovalci in razvijalci uporabijo koncept, ki se imenuje ločljivost coreference. Ta tehnika omogoča, da tehnologija postane bolj inteligentna v smislu obdelave naravnega jezika z delom s koreferencami na določen način. Nekateri strokovnjaki bi proces koreferenčne resolucije opisali kot proces, kjer računalnik označi vse izraze in jih nato organizira ali kategorizira v nek koherenten rezultat.