Interpretacja wyników

Z Otwarty System Antyplagiatowy
Wersja z dnia 09:54, 8 paź 2015 autorstwa Acacko (dyskusja | edycje) (NACZELNA ZASADA)

Skocz do: nawigacja, szukaj

Interpretacja wyników jest procesem analizy przez promotora (bądź inną osobę odpowiedzialną za kontrolę antyplagiatową) informacji prezentowanych przez system OSA. Wynikiem takiej kontroli powinno być stwierdzenie przez taką osobę czy praca ma znamiona nielegalnych nadużyć bądź nie.

Sposoby wykrywania plagiatu

System OSA dostarcza narzędzi do stwierdzenia z dużym prawdopodobieństwem czy praca została napisana niesamodzielnie. Służą do tego raporty prezentowane promotorowi wygenerowane po dodaniu dokumentu do systemu. Narzędziami tymi są:

  1. Informacje zawarte w widoku szczegółów pracy, w tym:
    1. Tabeli statystyk wyrazów
    2. Wskaźników PRWC dla prac podejrzanych
  2. Analiza szczegółowego porównania prac podejrzanych o zapożyczenia, bądź skorzystanie z ujednoliconego szczegółowego porównania

W dalszej części zostaną omówione sposoby rozumowania przy analizie poszczególnych wyników.

Tabela statystyk wyrazów

Przykładowa statystyka słów

Statystyka wyrazów może nieść ze sobą bardzo dużą wiedzę na temat prób oszustwa przez osobę piszącą pracę. Dla osoby sprawdzającej pracę podejrzanie powinny być następujące sytuacje:

  1. Bardzo mała liczba słów w całym dokumencie - podejrzenie, że autor pracy stosował białe znaki zamiast spacji by oszukać system antyplagiatowy
  2. Bardzo mała słów rozpoznanych jako słownikowe - podejrzenie o stosowanie liter wyglądających jak polskie (np. z alfabetu greckiego)
  3. Bardzo mała liczba unikatowych rozpoznanych słów - ubogie słownictwo, podejrzenie o wybiórcze stosowanie podmiany czcionek
  4. Niezerowa liczba słów z podstawionymi czcionkami
  5. Bardzo mały stosunek liczby nierozpoznanych słów do rozpoznanych bądź liczby unikatowych nierozpoznanych słów do unikatowych rozpoznanych (wykresy kołowe)

Często jest tak, że próby oszustwa na czcionkach bądź podstawienia białych znaków przystankowych powoduje, że pozostałe moduły antyplagiatowe nie są w stanie znaleźć zapożyczeń. No bo jak znaleźć podobieństwo pracy gdzie jest jeden długi wyraz z pozostałą bazą dokumentów? Stąd statystyka wyrazów jest bardzo ważną informacją, która może być jedynym śladem prowadzącym do podejrzenia o nielegalne działania.

Wskaźniki PRWC

O wskaźnikach więcej zostało powiedziane w tym artykule. W pewnym sensie, wskaźnik ten pokazuje jak wiele zawartości jednej pracy znajduje się w drugiej. Reprezentuje on w postaci liczby to co możemy znaleźć w wynikach szczegółowego porównania.

Zasada jest tutaj dość prosta: jeśli wskaźnik ten jest wysoko - oznacza to, że zachodzi duże podejrzenie stosowania zapożyczeń z innymi pracami.

W tabeli prezentującej listę prac z zapożyczeniami oprócz wskaźnika PRWC znajdują się też wyniki "Liczba identycznych fraz"' oraz "Najdłuższa identyczna fraza". Warto tutaj użyć opcji sortowania po tych kolumnach i przyjrzeć się kilku pierwszym wynikom.

Uwagi

Nie jest wcale powiedziane, że duża wartość PRWC wskazuje na plagiat, ani nie jest powiedziane, że małe wskaźniki PRWC taki plagiat wykluczają. Może się przecież zdarzyć, że wskaźnik PRWC jest wysoki a praca zawiera fragmenty Konstytucji (a to plagiatem nie jest o ile praca dotyczy pewnych aspektów prawnych).

Szczegółowe porównania

Widoki szczegółowego porównania oraz ujednoliconego szczegółowego porównania służą jako pomocnicze narzędzie ukazania naocznego, które fragmenty sprawdzanej pracy są wspólne z innymi dokumentami. W zamyśle strony te mają pomóc promotorowi pokazać dowody na stosowanie zapożyczeń. Promotor taki powinien takie fragmenty przejrzeć i przeanalizować czy może być to przypadek czy świadome działania autora pracy.

NACZELNA ZASADA

System OSA nie może warunkować o popełnieniu plagiatu. OSA jest tylko narzędziem, które pomaga taką decyzję podjąć promotorowi/osobie decyzyjnej. Bardzo wiele podejrzeń o plagiat okazać się może cytowaniami, przypadkowymi zbitkami słów, które wystąpiły w innych pracach bądź bardzo popularnymi zwrotami bądź akapitami, które występują powszechnie w pracach. Z jednej strony może to być wspomniana wcześniej praca na temat interpretacji konstytucji gdzie zostanie znalezione bardzo dużo wspólnych z konstytucją na którą autor się powołuje w pracy, z drugiej strony może to być praca matematyka gdzie zapożyczenie będzie główną tezą pracy. Komputer takich rzeczy nigdy nie będzie w stanie poprawnie zinterpretować.

Ostateczna decyzja ZAWSZE należy do człowieka. Nie możemy więc podać w instrukcji sprawdzania (jak to robią inne konkurencyjne programy), że od PRWC powyżej 20 praca jest plagiatem - gdyż nie da się tego stwierdzić bez ingerencji człowieka.