Aina ei ole mielekästä etsiä hahmon tarkkoja esiintymiä, vaan
tekstistä pyritään löytämään tekstin osajonot, jotka ovat riittävän
lähellä hahmoa . Tekstihaussa tällaista hakua tarvitaan, kun
haettavat avainsanat esiintyvät tekstissä taivutetussa
muodossa tai kun samalla sanalla saattaa olla useita kirjoitusasuja.
Jälkimmäinen tapaus esiintyy yleisesti silloin, kun haun suorittaja
tuntee henkilön nimen ääntämisasun, mutta ei kirjoistusasua.
Jotta tällaisia osajonoja voidaan hakea,
tarvitaan mitta kahden merkkijonon samankaltaisuudella. Yleisimmin
käytetty
tällainen mitta on editointietäisyys. Kahden merkkijonon
ja
välisellä editointietäisyydellä tarkoitetaan pienintä
editointioperaatioiden lukumäärää, joka tarvitaan muuttamaan
merkkijono
merkkijonoksi
. Editointioperaatioita ovat
Likimääräinen hahmonsovitus on kokonaan oma merkkijonomenetelmien osajoukko. Sen soveltuvuusalue tekstihakuihin on kuitenkin rajattu ja käytännön tekstihaun sovelletuksissa sitä käytetään harvoin. Taivutettujen sanojen tapauksessa haku sanan alkuosan perusteella on yleensä riittävä hakukriteeri. Tapaukset, joissa sanalla on useita eri kirjoitusasuja, ovat harvinaisia, erityisesti suomenkielisessä tekstissä.