Poziom podobieństwa jest to parametr dostępny dla Administratorów systemu w zakładce Ustawienia – Parametry wyniku.

Funkcjonalność ta wpływa na wrażliwość algorytmu detekcji na zbieżność tekstów. Służy do dokładnego określenia przez jednostkę czy i w jakim stopniu system ma wskazywać fragmenty będące sparafrazowanym odpowiednikiem znalezionego źródła. Dlatego też skala, na jakiej można zmieniać wartość jest czterostopniowa, a poziom można ustawić na: niski (wartość rekomendowana), średni, wysoki oraz bardzo wysoki.

Parametr ten nie wpływa na algorytm detekcji. System określa wskazania fragmentów w trakcie badania, zaś zmiany parametru wpływają na to, czy jednostka chce zobaczyć je wszystkie.

Wartość parametru niski, w kontekście powyższego, odnosi się do tego, czy fragment wskazywany przez system posiada na tyle niski stopień podobieństwa z fragmentem źródłowym, aby można go było określić mianem parafrazy, a przy tym wykazuje podobieństwo na tyle istotne, by uznać go za podobny i możliwie zaczerpnięty z tekstu źródłowego (stopień ten określany jest przez algorytm JSA i nie podlega on zmianom). Wartość ta jest rekomendowana ze względu na większe prawdopodobieństwo wykrycia plagiatu, który uwzględnia świadome zmiany tekstu czy różnicowanie stylów.

Kolejna wartość parametru: średni koryguje wskazania fragmentów przez system w ten sposób, że jest mniej wyczulony na parafrazy tekstu niż poziom niski. A zatem, jeżeli w tym samym fragmencie tekstu jego początek i koniec są bardziej zmodyfikowane (parafraza, przestawny szyk, dodane wyrazy) to części te nie zostaną wykazane w badaniu. Wynik uwzględniać będzie tylko te części fragmentów, które są nieco bardziej zbliżone do kopii.

Wysoki poziom ma służyć dalszemu odsianiu fragmentów podobnych, których podobieństwo do kopii jest zdecydowanie widoczne, jednak wciąż dopuszcza w niewielkim stopniu różnice w porównaniu do tekstu źródłowego.

Ostatnia wartość parametru tj. bardzo wysoki poziom podobieństwa modyfikuje wskazania fragmentów w ten sposób, iż pomija znalezione fragmenty zawierające parafrazy i inne modyfikacje lingwistyczne (pomimo ich ewentualnego znalezienia w trakcie badania), tym samym prezentując w raporcie tylko takie fragmenty, które są idealną kopią lub zawierają minimalne różnice względem tekstu źródłowego.

Grafika poniżej ma na celu orientacyjne wyjaśnienie zagadnienia: