Referenčni izraz je vsaka beseda ali besedna zveza, katere namen je identificirati določeno osebo, kraj ali stvar. Na splošno je samostalnik, samostalniška besedna zveza ali zaimek. V jezikoslovju je prepoznavanje referenčnih izrazov in njihovega odnosa do predmetov resničnega sveta, na katere se nanašajo, del študija pragmatike, ki opisuje razmerje med jezikom in resničnimi situacijami, ki jih jezik opisuje. Generiranje referenčnih izrazov je podpolje generiranja naravnega jezika, ki uporablja računalnike za izdelavo besedila, ki čim bolj posnema človeški jezik.
V slovničnem smislu se vsi samostalniki nanašajo na ljudi, kraje, stvari ali ideje, vendar niso vsi izrazi. Na primer, stavek »Beagle je pasma psa« vsebuje tri samostalnike: »beagle«, »pasma« in »pes«. Vsaka od teh pa se nanaša na razred stvari in ne na katero koli specifično stvar, zato se noben ne nanaša na izraze. Če ga izrazimo drugače, je namen stavka podati informacije o beaglih na splošno in ne usmeriti pozornost bralca na določenega beagla. Po drugi strani pa je v stavku »Ta pes je beagle« »ta pes« referenčni izraz, ker opozarja na določenega psa in daje informacije o njem.
V angleščini bo referenčni izraz pogosto vseboval določen člen, »the« ali pokazni zaimek, kot je »that« ali »those«, tako da fraza loči določen predmet od vseh drugih podobnih. Na primer, izraz »ta mamut« bi jasno opozoril na določenega mamuta in bi bil zato referenčni izraz, medtem ko bi »mamut« ne. Občasno pa slovnična struktura posameznega stavka ni dovolj, da bi ugotovili, ali je besedna zveza referenčni izraz. V stavku »Mamut je jedel predvsem travo« se lahko »mamut« nanaša na določenega mamuta ali pa je opis mamutov na splošno, odvisno od njegovega konteksta.
Ena praktična uporaba pragmatike je ustvarjanje naravnega jezika. Za ustvarjanje referenčnih izrazov, ki jasno in nedvoumno označujejo predvidenega referenta, morajo programerji naravnega jezika upoštevati tako slovnična kot kontekstualna vprašanja. Na primer, računalniško ustvarjen jezik, kot je človeški jezik, ne bi smel vsebovati nobenih zaimkov, ki bi se lahko slovnično ali logično nanašali na več kot en samostalnik ali predmet iz resničnega sveta. Na ta način je generiranje referenčnih izrazov obratna stran ločljivosti anafore, ki uporablja različne algoritme za določanje referenc zaimkov v besedilu, ki ga ustvari računalnik ali človek.