Wersja 5.0.0: Różnice pomiędzy wersjami

Z Otwarty System Antyplagiatowy
Skocz do: nawigacja, szukaj
 
(Nie pokazano 15 wersji utworzonych przez 2 użytkowników)
Linia 1: Linia 1:
Jest to artykuł dotyczący wersji OSY w fazie testów. Jego treść może ulegać częstym zmianom
 
 
 
{| class="wikitable" style="text-align:left;"
 
{| class="wikitable" style="text-align:left;"
 
|+Parametry
 
|+Parametry
Linia 8: Linia 6:
 
|-
 
|-
 
! scope="row"| Data wydania
 
! scope="row"| Data wydania
| 9 luty 2018
+
| 9 luty 2018 (beta)
 +
|-
 +
! scope="row"| Data wydania
 +
| 10 maja 2018
 +
|-
 +
! scope="row"| Następna wersja
 +
| [[Wersja 5.1.0|5.1.0]]
 +
|-
 +
! scope="row"| Poprzednia wersja
 +
| [[Wersja 4.2.1|4.2.1]]
 
|-
 
|-
 
|}
 
|}
  
OSA 5 - wersja systemu antyplagiatowego, któremu motywem przewodnim jest współpraca między poszczególnymi instancjami systemu na poszczególnych uczelniach. Zaletą takiego podejścia jest zwiększenie bazy porównawczej a tym samym zwiększenie jakości zwracanych wyników przez system.
+
'''OSA 5''' - wersja systemu antyplagiatowego, któremu motywem przewodnim jest współpraca między poszczególnymi instancjami systemu na poszczególnych uczelniach. Zaletą takiego podejścia jest zwiększenie bazy porównawczej a tym samym zwiększenie jakości zwracanych wyników przez system.
  
 
= Geneza zmian =
 
= Geneza zmian =
System OSA osiągnął swoją stabilność w wersji 4. Ilość awarii samych '''lokalnych''' instancji na poszczególnych uczelniach spadła niemalże do zera. Jakość przetwarzania OSY zawsze była wysoka. Algorytmy zastosowane w systemie zawsze wyprzedzały rynek, który często zapożyczał rozwiązania do własnych produktów. Cieszy nas to - gdyż OSA jako projekt naukowy miał za zadanie podnieść jakość kształcenia na polskich uczelniach właśnie poprzez wdrożenie lepszej jakości sprawdzania antyplagiatowego niż było to przed powstaniem OSY. Misja powiodła się - rozwiązania komercyjnie ostatecznie przyznały rację i również wprowadziły podobne rozwiązania polepszając jakość kształcenia w całej Polsce.
+
System osiągnął swoją stabilność w wersji 4. Ilość awarii samych '''lokalnych''' instancji na poszczególnych uczelniach spadła niemalże do zera. Jakość przetwarzania systemu zawsze była wysoka. Zastosowane w nim algorytmy okazały się bardziej skuteczne i szybsze od komercyjnych rozwiązań, niejednokrotnie wyznaczając pułap dążeń. Cieszy nas to, gdyż OSA jako projekt naukowy miał za zadanie podnieść jakość kształcenia na polskich uczelniach właśnie poprzez wdrożenie możliwie najlepszych metod weryfikacji antyplagiatowej. Misja powiodła się - rozwiązania komercyjne także podniosły jakość takiej weryfikacji przyczyniając się do polepszenia jakości kształcenia w Polsce.
  
Jakość sprawdzania plagiatowego wynika z dwóch elementów:
+
Źródłami sukcesu sprawdzania antyplagiatowego niezmiennie pozostają
* jakości algorytmów wyszukujących
+
* jakość algorytmów wyszukujących podobieństwa dokumentów
* odpowiednio wielkiej bazy w której można wyszukiwać plagiaty
+
* wielkość baz referencyjnych, w których tych podobieństw należy szukać.
  
Jakość algorytmów jest w OSIE ciągle rozwijana i należy do jednych z najlepszych (jeśli nie najlepsza) w obecnie użytkowanych systemach. Baza dokumentów z kolei wynika z ograniczeń prawnych i została ograniczona do bazy obrazu polskiego Internetu [[System NEKST|NEKST]] oraz do bazy własnej danej uczelni. Udostępnianie podmiotom zewnętrznym swoich zbiorów prac magisterskich po analizach prawnych jest niemożliwa, gdyż uczelnie nie są właścicielami prac i nawet umowy między Uczelnią a systemem antyplagiatowym nic nie pomogą.  
+
Przyjęty w algorytmicznych rozwiązaniach systemu model podobieństwa tekstów jest systematycznie poszerzany i jest już bardzo rozległy. Jest najrozleglejszy wśród systemów antyplagiatowych stosowanych na polskich uczelniach.
 +
Jednakże bazy referencyjne, z powodu restrykcji prawnych, zostały ograniczone do obrazu polskiego Internetu [[System NEKST|NEKST]] oraz do bazy własnej danej uczelni, składającej się z cyfrowych oryginałów obronionych na niej prac dyplomowych. Więzy prawne nie pozwalają uczelniom na przekazywanie en bloc tych oryginałów podmiotom zewnętrznym.  
  
Zespół OSY jednak postanowił zdziałać w tej materii tyle na ile pozwala prawo. Tak powstała OSA 5 wraz z jej nowymi funkcjonalnościami.
+
Zespół OSA znalazł jednak rozwiązanie mieszczące się w granicach prawnych i umożliwiające integrację danych znajdujących się we własnych bazach partnerskich uczelni. Dane te buduje się jedynie z tych elementów oryginalnych tekstów, które są wystarczające dla skutecznej weryfikacji antyplagiatowej i tak dobrane, że nie można z nich odtworzyć żadnego oryginału.  Doprowadziło to do inicjacji Międzyuniwersyteckiego Programu Udostępnienia MAP i powstania najnowszej (piątej) wersji systemu wraz z jego nowymi funkcjonalnościami.
  
 
= Szczegółowy wykaz zmian =
 
= Szczegółowy wykaz zmian =
 
Poniżej zamieszczono nowe funkcjonalności, które zostały zaimplementowane w OSA 5.  
 
Poniżej zamieszczono nowe funkcjonalności, które zostały zaimplementowane w OSA 5.  
  
== Moduł wymiany MAP ==
+
== Moduł wymiany map ==
Nie można udostępniać podmiotom komercyjnym swoich prac magisterskich. OSA swoje działanie opiera o przetwarzanie danych z których nie da się odzyskać treści pracy. Z analiz prawniczych okazało się, że dane mogą zostać wyeksportowane poza uczelnię bez obaw o to, że dane osobowe zostały udostępnione oraz nie zostały złamane prawa autorskie studentów.  
+
Algorytmiczny trzon OSA opiera swoje działanie opiera na przetwarzanie danych, z których nie da się odzyskać treści badanych prac. Są o tzw. mapy. Z analiz prawniczych wynika, że mapy, mogą zostać wyeksportowane poza uczelnię bez obaw o to, że zostaną złamane prawa autorskie studentów (lub innych twórców).  
  
Moduł ten pozwala na znalezienie zapożyczeń między dowolnymi pracami znajdującymi się w OSAch lokalnych w całym kraju bez potrzeby udostępniania treści swoich prac przez uniwersytety. W ten sposób baza dokumentów w których OSA wyszukuje zapożyczenia zwiększa się znacznie - uniemożliwiając obronę tych samych prac magisterskich na kilku różnych uczelniach (proceder sprzedaży prac magisterskich)
+
Moduł ten pozwala na znalezienie zapożyczeń między dowolnymi pracami znajdującymi się w lokalnych zasobach uczelni.
 +
Dzięki niemu zaplecze informacyjne, w którym OSA wyszukuje zapożyczenia znacznie się zwiększy i może - nawet w skali
 +
całego kraju - objąć mapy dowolnych dokumentów, które uczelnie zdecydują się udostępnić, bez ograniczeń dotyczących np. dat ich powstania i charakteru, jak to ma miejsce w odniesieniu do ORPPD. 
  
 
  Więcej przeczytasz w oddzielnym artykule: [[Międzyuniwersytecki Program Udostępnienia Map]]
 
  Więcej przeczytasz w oddzielnym artykule: [[Międzyuniwersytecki Program Udostępnienia Map]]
  
 
== Moduł wymiany statystyk wyrazów ==
 
== Moduł wymiany statystyk wyrazów ==
Do poprawnego wyliczenia niektórych miar jakościowych w porównywaniu antyplagiatowym wymagane jest posiadanie odpowiednio dużego korpusu danych statystycznych występowania słów w danym języku. Jeśli OSA lokalna posiadała mało prac obronionych - zbiór ten był bardzo ubogi - a statystyki wyrazów były niskiej jakości. Objawiało się to pogorszeniem jakości wykrywania plagiatów oraz dość zgrubnym oszacowaniem poziomu plagiatu w analizowanym dokumencie. W wersji OSY 5 statystyki występowania wyrazów są współdzielone z pozostałymi instancjami. Raz na jakiś czas każda OSA komunikuje się z serwerem centralnym i udostępnia mu swoje statystyki występowania słów. Miary te są uogólnione za wszystkie prace i nie niosą ze sobą żadnej informacji "wrażliwej". Po zagregowaniu danych ze wszystkich uczelni - miary te są przetwarzane na serwerze centralnym i udostępniane OSOm lokalnym. Tym samym każda OSA posiada znacznie większy korpus danych na temat statystycznego występowania słów w danym języku, niż mogłaby go posiadać na podstawie tylko prac w swojej bazie.
+
Do poprawnego wyliczenia niektórych miar jakościowych w porównywaniu antyplagiatowym wymagane jest posiadanie odpowiednio dużego korpusu danych statystycznych używania słów w danym języku. Jeśli lokalna instancja OSA posiadała mało prac obronionych - zbiór ten był bardzo ubogi - i tym samym statystyki wyrazów były niskiej jakości. . W piątej wersji OSA statystyki występowania wyrazów są współdzielone z pozostałymi instancjami. Raz na jakiś czas każda instancja komunikuje się z serwerem centralnym i udostępnia mu swoje statystyki występowania słów. Miary te są średnimi wyliczanymi na podstawie zawartości prac i nie niosą ze sobą żadnej informacji wrażliwej. Po zagregowaniu dane te są przetwarzane na serwerze centralnym i udostępniane instancjom lokalnym. Dzięki temu każda instancja może posiadać znacznie większy korpus danych na temat statystycznego używania słów w danym języku, niż mogłaby go posiadać na podstawie prac z własnej bazy.
  
== Moduł współdzielenia treści pracy między Uniwersytytetami ==
+
== Moduł współdzielenia treści pracy między uczelniami ==
Moduł umożliwia wysłanie zapytania przez promotora uczelni X o treść pracy pochodzącej z uczelni Y, w której OSA znalazła pewne zapożyczenia. Mechanizm (za zgodą uczelni Y) dostarczy tylko do wglądu promotorowi uczelni X treść pracy w celu weryfikacji skali plagiatu. Moduł ten jest częścią wcześniej wspomnianego [[Międzyuniwersytecki Program Udostępnienia Map|programu udostępniania map]] (tam można przeczytać o szczegółach i założeniach tego modułu)
+
Moduł umożliwia wysłanie zapytania przez promotora uczelni X o treść pracy pochodzącej z uczelni Y, w której system znalazł elementy wspólne. Mechanizm (za zgodą uczelni Y) dostarczy tylko do wglądu promotorowi uczelni X treść pracy w celu pogłębienia informacji o podobieństwie prac. Moduł ten jest częścią wcześniej wspomnianego [[Międzyuniwersytecki Program Udostępnienia Map|programu udostępniania map]] (tam można przeczytać o szczegółach i założeniach tego modułu)
  
== Moduł komunikacji z użytkownikami OS lokalnych ==
+
== Moduł komunikacji z użytkownikami lokalnych instancji systemu ==
Moduł powiadamiania użytkowników został całkowicie przebudowany. Wcześniej był dość rzadko wykorzystywany ze względu na swoją prostotę. Rozbudowany moduł umożliwia wysłanie przez twórców OSY dowolnej informacji do użytkowników lub administratorów konkretnej OSY, ustalaniu czasu ważności komunikatów itp. Dzięki temu narzędzie te będzie wykorzystywane dużo częściej (np. podczas awarii części centralnej systemu)
+
Moduł powiadamiania użytkowników został całkowicie przebudowany. Wcześniej był dość rzadko wykorzystywany ze względu na swoją prostotę. Po przebudowie umożliwia wysłanie przez twórców OSA dowolnej informacji do użytkowników lub administratorów lokalny instancji, ustalaniu czasu ważności komunikatów itp. Narzędzie te będzie wykorzystywane dużo częściej (np. w przypadku awarii centralnej części systemu).
  
 
== Moduł zbierania danych diagnostycznych ==
 
== Moduł zbierania danych diagnostycznych ==
Każda OSA lokalna raz dziennie będzie wysyłać na serwer centralne dane diagnostyczne, służące wykrywaniu anomalii w działaniu całego systemu. Dane te mają charakter statystyczny. Nie są przesyłane żadne dane wrażliwe czy też informacje o działaniu lokalnych administratorów.
+
Każda lokalna instancja systemu raz dziennie będzie wysyłać na serwer centralny dane diagnostyczne, służące wykrywaniu anomalii w działaniu. Dane te mają wyłącznie charakter statystyczny. Nie są przesyłane żadne dane wrażliwe lub informacje o działaniach lokalnych administratorów. Chodzi tu o dane typu: ilość prac w OSA, ilość dokonanych sprawdzeń, ilość aktywnych kont w systemie, itp.
  
== Moduł analizy sylometrii ==   
+
== Moduł analizy sylometrycznej ==   
OSA rozwija wiele różnych rozwiązań dotyczących analizy pracy. Jeden z nich jest na tyle rozwinięty, że można opublikować go jako wersja beta w celu umożliwienia korzystania z niego przez użytkowników OSY. Należy jednak pamiętać, że moduł ten jest tylko jako narzędzie jeszcze niedopracowane. Należy je traktować jako narzędzie pomocnicze w analizie tekstów - jednakże nie wyrokować na ich podstawie żadnych zarzutów.  
+
W module znajdują się pomocnicze narzędzie pomocnicze analizy tekstów, które nie korzystają z żadnych baz referencyjnych i odnoszą się jedynie do badanej pracy. Na ich podstawie nie należy wyrokować o popełnieniu plagiatu, bez odwoływania się do analiz popartych informacjami z baz referencyjnych.  
  
Stylometria jest narzędziem umożliwiającym stwierdzenie czy dana praca jest pisana przez tą samą osobę tj. czy całość pracy nie jest kompilacją kilku prac pisanych przez różne osoby. Sposób pisania prac, stosowane słownictwo, długości zdań, kolejności pewnych sformułowań są charakterystyczne dla każdej osoby. Można więc spróbować zbadać czy cała praca odznacza się podobnymi miarami czy też część pracy zdaje się być napisana przez kogoś innego.  
+
Stylometria jest narzędziem umożliwiającym stwierdzenie, czy dana praca jest pisana przez tą samą osobę tj. czy całość pracy nie jest kompilacją tekstów pisanych przez różne osoby. Sposób pisania prac, stosowane słownictwo, długości zdań, kolejności pewnych sformułowań są charakterystyczne dla każdej osoby. Można więc badać czy cała praca odznacza się harmonią stylistyczną.  
 
OSA udostępnia dwa różne moduły stylometrii:
 
OSA udostępnia dwa różne moduły stylometrii:
* Stylometria oparta o dane lingwistyczne - poprzez wyliczenie wielu miar wynikających ze stylu pisania danej pracy. Analiza polega na zbadaniu miar jakości wyrazów/zdań/akapitów pod względem lingwistycznym i próbie odnalezienia takich fragmentów, które znacząco odbiegają od "stylu" pozostałej części pracy
+
* Stylometria bazująca na danych lingwistycznych. Analiza polega na wyliczeniu i porównaniu miar występowania  wyrazów, zdań, fraz, akapitów, etc. we fragmentach pracy i próbie odnalezienia tych, których miary znacząco odbiegają od miar wyliczonych dla pozostałych części.
* Stylometria oparta o współczynnik Alfa - poprzez analizę częstości występowania słów charakterystycznych we fragmentach pracy i porównaniu wyników z pozostałymi częściami pracy. Jeśli ktoś w danej części pracy stosuje dość ubogie słownictwo a nagle posługuje się wyrazami bardzo skomplikowanymi - jest to podejrzenie o stosowanie kompilacji treści innego autorstwa.
+
* Stylometria "Alfa". Analiza polega na ustaleniu częstości użycia wyrazów słownikowych (tzw. lematów) we fragmentach pracy (jest to tzw. parametr "alfa") i porównaniu wyników odnoszących się do pozostałych części. Istotne różnice miedzy tymi parametrami zazwyczaj wskazują na kompilację.
 +
 
 +
Więcej: [[Analiza stylometryczna]]
  
 
== Indywidualne klucze dla każdej uczelni ==
 
== Indywidualne klucze dla każdej uczelni ==
Moduł był zapowiedziany w [[Wersja_4.0.0|wersji 4]] jednakże konieczność jego wdrożenia zainstniała dopiero w wersji OSY 5 gdzie należy obligatoryjnie rozróżniać poszczególne instancje między sobą. Więcej: [[Uzyskanie dostępu do API NEKST]]
+
Moduł był zapowiedziany w [[Wersja_4.0.0|wersji 4]] jednakże konieczność jego wdrożenia pojawiła się dopiero w wersji 5 wymagającej rozróżnienia poszczególnych lokalnych instancji systemu. Więcej: [[Uzyskanie dostępu do Bazy Centralnej]]
 +
 
 +
== Rezygnacja z usługi NEKST ==
 +
Z dniem 1 kwietnia 2018 OSA zaprzestała korzystać z obrazu Internetu NEKST. W jego miejsce weszła baza Internetu pozyskana poprzez crawlowanie Internetu przez zespół OSA. Zbiór prac zgromadzonych w bazie jest porównywalny z zasobami NEKST'u i ciągle rośnie. OSY 4 i 5 od tego dnia korzystają już z bazy własnej projektu - co jest niezauważalne dla użytkowników końcowych. Nie ma konieczności konfigurowania. Domyślnie wszystkie OSY korzystają z Internetu OSY a nie NEKST.
  
 
== Inne mniejsze ==
 
== Inne mniejsze ==
OSA posiada również wiele zmian, które wynikały z potrzeb implementacyjnych poszczególnych uczelni, bądź naprawy błędów wykrytych podczas pracy OSY 4.X.  
+
W wersji 5 wprowadzono również wiele zmian będących odpowiedzią na zgłoszone zapotrzebowanie poszczególnych uczelni, bądź błędy wykryte w poprzednich wersjach.
  
 
= Prace badawcze =
 
= Prace badawcze =
Pracownicy OSY opracowują również inne rozwiązania nowatorskie w skali światowej - jednakże na tą chwilę nie mogą jeszcze zostać opublikowane. Prosimy uzbroić się w cierpliwość.
+
Znaczna część pracy zespołu OSA ma charakter badawczy. Wyniki tych badań będą sukcesywnie publikowane.  
 +
 
 +
= Zobacz też =
 +
* [[Aktualizacja OSY do wersji 5]]
 +
* [[Uzyskanie dostępu do Bazy Centralnej]]
 +
* [[Konfiguracja]]
 +
* [[Spis parametrów konfiguracyjnych]]
  
 
[[Category:Informacje o systemie]]
 
[[Category:Informacje o systemie]]

Aktualna wersja na dzień 16:14, 1 mar 2019

Parametry
Wersja 5.0.0 (prerelease)
Data wydania 9 luty 2018 (beta)
Data wydania 10 maja 2018
Następna wersja 5.1.0
Poprzednia wersja 4.2.1

OSA 5 - wersja systemu antyplagiatowego, któremu motywem przewodnim jest współpraca między poszczególnymi instancjami systemu na poszczególnych uczelniach. Zaletą takiego podejścia jest zwiększenie bazy porównawczej a tym samym zwiększenie jakości zwracanych wyników przez system.

Geneza zmian

System osiągnął swoją stabilność w wersji 4. Ilość awarii samych lokalnych instancji na poszczególnych uczelniach spadła niemalże do zera. Jakość przetwarzania systemu zawsze była wysoka. Zastosowane w nim algorytmy okazały się bardziej skuteczne i szybsze od komercyjnych rozwiązań, niejednokrotnie wyznaczając pułap dążeń. Cieszy nas to, gdyż OSA jako projekt naukowy miał za zadanie podnieść jakość kształcenia na polskich uczelniach właśnie poprzez wdrożenie możliwie najlepszych metod weryfikacji antyplagiatowej. Misja powiodła się - rozwiązania komercyjne także podniosły jakość takiej weryfikacji przyczyniając się do polepszenia jakości kształcenia w Polsce.

Źródłami sukcesu sprawdzania antyplagiatowego niezmiennie pozostają

  • jakość algorytmów wyszukujących podobieństwa dokumentów
  • wielkość baz referencyjnych, w których tych podobieństw należy szukać.

Przyjęty w algorytmicznych rozwiązaniach systemu model podobieństwa tekstów jest systematycznie poszerzany i jest już bardzo rozległy. Jest najrozleglejszy wśród systemów antyplagiatowych stosowanych na polskich uczelniach. Jednakże bazy referencyjne, z powodu restrykcji prawnych, zostały ograniczone do obrazu polskiego Internetu NEKST oraz do bazy własnej danej uczelni, składającej się z cyfrowych oryginałów obronionych na niej prac dyplomowych. Więzy prawne nie pozwalają uczelniom na przekazywanie en bloc tych oryginałów podmiotom zewnętrznym.

Zespół OSA znalazł jednak rozwiązanie mieszczące się w granicach prawnych i umożliwiające integrację danych znajdujących się we własnych bazach partnerskich uczelni. Dane te buduje się jedynie z tych elementów oryginalnych tekstów, które są wystarczające dla skutecznej weryfikacji antyplagiatowej i tak dobrane, że nie można z nich odtworzyć żadnego oryginału. Doprowadziło to do inicjacji Międzyuniwersyteckiego Programu Udostępnienia MAP i powstania najnowszej (piątej) wersji systemu wraz z jego nowymi funkcjonalnościami.

Szczegółowy wykaz zmian

Poniżej zamieszczono nowe funkcjonalności, które zostały zaimplementowane w OSA 5.

Moduł wymiany map

Algorytmiczny trzon OSA opiera swoje działanie opiera na przetwarzanie danych, z których nie da się odzyskać treści badanych prac. Są o tzw. mapy. Z analiz prawniczych wynika, że mapy, mogą zostać wyeksportowane poza uczelnię bez obaw o to, że zostaną złamane prawa autorskie studentów (lub innych twórców).

Moduł ten pozwala na znalezienie zapożyczeń między dowolnymi pracami znajdującymi się w lokalnych zasobach uczelni. Dzięki niemu zaplecze informacyjne, w którym OSA wyszukuje zapożyczenia znacznie się zwiększy i może - nawet w skali całego kraju - objąć mapy dowolnych dokumentów, które uczelnie zdecydują się udostępnić, bez ograniczeń dotyczących np. dat ich powstania i charakteru, jak to ma miejsce w odniesieniu do ORPPD.

Więcej przeczytasz w oddzielnym artykule: Międzyuniwersytecki Program Udostępnienia Map

Moduł wymiany statystyk wyrazów

Do poprawnego wyliczenia niektórych miar jakościowych w porównywaniu antyplagiatowym wymagane jest posiadanie odpowiednio dużego korpusu danych statystycznych używania słów w danym języku. Jeśli lokalna instancja OSA posiadała mało prac obronionych - zbiór ten był bardzo ubogi - i tym samym statystyki wyrazów były niskiej jakości. . W piątej wersji OSA statystyki występowania wyrazów są współdzielone z pozostałymi instancjami. Raz na jakiś czas każda instancja komunikuje się z serwerem centralnym i udostępnia mu swoje statystyki występowania słów. Miary te są średnimi wyliczanymi na podstawie zawartości prac i nie niosą ze sobą żadnej informacji wrażliwej. Po zagregowaniu dane te są przetwarzane na serwerze centralnym i udostępniane instancjom lokalnym. Dzięki temu każda instancja może posiadać znacznie większy korpus danych na temat statystycznego używania słów w danym języku, niż mogłaby go posiadać na podstawie prac z własnej bazy.

Moduł współdzielenia treści pracy między uczelniami

Moduł umożliwia wysłanie zapytania przez promotora uczelni X o treść pracy pochodzącej z uczelni Y, w której system znalazł elementy wspólne. Mechanizm (za zgodą uczelni Y) dostarczy tylko do wglądu promotorowi uczelni X treść pracy w celu pogłębienia informacji o podobieństwie prac. Moduł ten jest częścią wcześniej wspomnianego programu udostępniania map (tam można przeczytać o szczegółach i założeniach tego modułu)

Moduł komunikacji z użytkownikami lokalnych instancji systemu

Moduł powiadamiania użytkowników został całkowicie przebudowany. Wcześniej był dość rzadko wykorzystywany ze względu na swoją prostotę. Po przebudowie umożliwia wysłanie przez twórców OSA dowolnej informacji do użytkowników lub administratorów lokalny instancji, ustalaniu czasu ważności komunikatów itp. Narzędzie te będzie wykorzystywane dużo częściej (np. w przypadku awarii centralnej części systemu).

Moduł zbierania danych diagnostycznych

Każda lokalna instancja systemu raz dziennie będzie wysyłać na serwer centralny dane diagnostyczne, służące wykrywaniu anomalii w działaniu. Dane te mają wyłącznie charakter statystyczny. Nie są przesyłane żadne dane wrażliwe lub informacje o działaniach lokalnych administratorów. Chodzi tu o dane typu: ilość prac w OSA, ilość dokonanych sprawdzeń, ilość aktywnych kont w systemie, itp.

Moduł analizy sylometrycznej

W module znajdują się pomocnicze narzędzie pomocnicze analizy tekstów, które nie korzystają z żadnych baz referencyjnych i odnoszą się jedynie do badanej pracy. Na ich podstawie nie należy wyrokować o popełnieniu plagiatu, bez odwoływania się do analiz popartych informacjami z baz referencyjnych.

Stylometria jest narzędziem umożliwiającym stwierdzenie, czy dana praca jest pisana przez tą samą osobę tj. czy całość pracy nie jest kompilacją tekstów pisanych przez różne osoby. Sposób pisania prac, stosowane słownictwo, długości zdań, kolejności pewnych sformułowań są charakterystyczne dla każdej osoby. Można więc badać czy cała praca odznacza się harmonią stylistyczną. OSA udostępnia dwa różne moduły stylometrii:

  • Stylometria bazująca na danych lingwistycznych. Analiza polega na wyliczeniu i porównaniu miar występowania wyrazów, zdań, fraz, akapitów, etc. we fragmentach pracy i próbie odnalezienia tych, których miary znacząco odbiegają od miar wyliczonych dla pozostałych części.
  • Stylometria "Alfa". Analiza polega na ustaleniu częstości użycia wyrazów słownikowych (tzw. lematów) we fragmentach pracy (jest to tzw. parametr "alfa") i porównaniu wyników odnoszących się do pozostałych części. Istotne różnice miedzy tymi parametrami zazwyczaj wskazują na kompilację.
Więcej: Analiza stylometryczna

Indywidualne klucze dla każdej uczelni

Moduł był zapowiedziany w wersji 4 jednakże konieczność jego wdrożenia pojawiła się dopiero w wersji 5 wymagającej rozróżnienia poszczególnych lokalnych instancji systemu. Więcej: Uzyskanie dostępu do Bazy Centralnej

Rezygnacja z usługi NEKST

Z dniem 1 kwietnia 2018 OSA zaprzestała korzystać z obrazu Internetu NEKST. W jego miejsce weszła baza Internetu pozyskana poprzez crawlowanie Internetu przez zespół OSA. Zbiór prac zgromadzonych w bazie jest porównywalny z zasobami NEKST'u i ciągle rośnie. OSY 4 i 5 od tego dnia korzystają już z bazy własnej projektu - co jest niezauważalne dla użytkowników końcowych. Nie ma konieczności konfigurowania. Domyślnie wszystkie OSY korzystają z Internetu OSY a nie NEKST.

Inne mniejsze

W wersji 5 wprowadzono również wiele zmian będących odpowiedzią na zgłoszone zapotrzebowanie poszczególnych uczelni, bądź błędy wykryte w poprzednich wersjach.

Prace badawcze

Znaczna część pracy zespołu OSA ma charakter badawczy. Wyniki tych badań będą sukcesywnie publikowane.

Zobacz też