Miedzyuniwersytecki Program Udostępniania Map: Różnice pomiędzy wersjami

Z Otwarty System Antyplagiatowy
Skocz do: nawigacja, szukaj
(Praca OSY od strony użytkownika)
Linia 1: Linia 1:
 
  To jest draft artykułu
 
  To jest draft artykułu
  
'''Miedzyuniwersytecki Program Udostępniania Map''' - jest to inicjatywa w ramach uczelni wchodzących w skład MUCI polegająca na stworzeniu centralnego repozytorium map prac dyplomowych. W repozytorium tym są przechowywane wszystkie mapy prac obronionych na każdej uczelni używającej OSY.
+
'''Miedzyuniwersytecki Program Udostępniania Map''' jest inicjatywą uczelni zrzeszonych w MUCI polegającą na stworzeniu centralnego repozytorium map prac dyplomowych.  
  
 
=== Geneza ===
 
=== Geneza ===
Głównym problemem tworzenia repozytoriów prac pisemnych w Polsce jest problem ochrony praw autorskich. Uczelnie z tego powodu boją się udostępniać prace swoich studentów poza swoje mury. Na tej kanwie powstała OSA, która instalowana jest na każdej uczelni, zarządzana jest przez jej pracowników a treści prac nie opuszczają maszyny OSA nawet podczas sprawdzania względem zapożyczeń z Internetu. Nikt poza administratorami lokalnych OS nie ma wglądu w treści prac - nawet developerzy OSY po stronie serwera centralnego.  
+
Głównym problemem tworzenia repozytoriów prac akademickich w Polsce jest ochrona praw autorskich. Uczelnie z tego powodu obawiają się udostępniania prac studenckich poza swoje mury. Dlatego Otwarty System Antyplagiatowy jest lokalnie instalowany na każdej partnerskiej uczelni z gwarancją tego, że oryginalne treści prac nie opuszczą uczelnianych zasobów nawet podczas sprawdzania względem zapożyczeń z Internetu. Nikt poza administratorami lokalnych instancji systemu nie ma wglądu w treści prac, nawet developerzy OSA po stronie serwera centralnego. Podstawą działania systemu są mapy (zwane też haszami) będące nieodwracalnymi skrótami prac. Na podstawie map nie ma realnej możliwości odtworzenie oryginalnych treści, ale na bazie oryginału badanej pracy i jej mapy oraz map tekstów referencyjnych można zidentyfikować ew. zapożyczenia. 
 +
Stało się to kanwą utworzenia Centralnego Repozytorium Map. Skoro z map nie da się odtworzyć ich źródeł - można je wyeksportować na zewnątrz uczelni. '''Ekspertyza prawna wykazała, że nie będzie to naruszać ustawy z dnia 4 lutego 1994 o prawie autorskim i prawach pośrednich (Dz. U. z 2017 r. poz. 880)'''. Wyeksportowanie map z każdej lokalnej instancji OSA do Centralnego Repozytorium spowoduje, że przy weryfikacji pracy, której oryginalna treść niezmiennie pozostaje w lokalnych zasobach, będzie można wskazać jej ew. podobieństwa do prac, których mapy znajdują się w tym repozytorium.  
  
Powstał pomysł, żeby na podobnej zasadzie stworzyć Centralne Repozytorium Map. Skoro z samej mapy (hashy) nie da się odtworzyć treści pracy - można ją wyeksportować na zewnątrz uczelni. '''Ze względu na prawa autorskie jest to bezpieczne (posiadamy analizę prawną)'''. Wyeksportowanie map wszystkich obronionych dokumentów z każdej OSY do Centralnego Repozytorium spowoduje, że będzie możliwość znalezienia fragmentów zbieżnych z pracą której treść znamy (praca sprawdzana przez lokalną OSĘ) - ale jednocześnie nie będziemy w stanie "odgadnąć" treści całej pracy z repozytorium. 
 
  
 
=== Mechanizm działania ===
 
=== Mechanizm działania ===
OSA 5 raz na jakiś czas łączyć się będzie z serwerem centralnym by przesłać mapy (hashe) prac obronionych na macierzystej uczelni. Jako, że proces ten nie powoduje przekazania żadnych wrażliwych danych - mechanizm ten będzie włączony dla każdej OSY (wstępnie zakładamy, że nie da się go wyłączyć, choć jeśli będzie silny negatywny odzew - wprowadzimy możliwość wyłączenia funckcjonalności). Wierzymy jednak, że takowy odzew będzie jedynie spowodowany niezrozumieniem zasady działania repozytorium a nie faktyczną obawą o utratę danych, którymi uczelnie nie chcą się dzielić.
+
OSA 5 raz na jakiś czas będzie się łączyć z serwerem centralnym, by przesłać mapy prac obronionych na macierzystej uczelni. Ponieważ proces ten nie powoduje przekazania żadnych wrażliwych danych, mechanizm ten będzie domyślnie włączony dla każdej lokalnej instancji OSA.
  
 
Co zostanie przekazane?
 
Co zostanie przekazane?
 
# Zbiór wygenerowanych map (hashy) danej pracy
 
# Zbiór wygenerowanych map (hashy) danej pracy
# Id pracy w OSIE lokalnej
+
# Id pracy
# Język w jakiej została napisana praca
+
# Język w jakim została napisana praca
# Id uczelni z której pochodzi praca
+
# Id uczelni, z której pochodzi praca
  
 
Co '''NIE''' zostanie przekazane?
 
Co '''NIE''' zostanie przekazane?
 
# Treść pracy
 
# Treść pracy
# Pozostałe metadane takie jak autor, promotor itp (te które mogą budzić wątpliwości prawników co do prac autorskich)
+
# Pozostałe metadane takie jak autor, promotor itp., których przesłanie mogłoyby budzić wątpliwości prawne
  
Tak działający mechanizm jest bezpieczny dla Uczelni jak również dla developerów OSY. Mapy nie niosą w sobie żadnej użytecznej informacji dla osoby, która włamałaby się na serwer centralny i wykradła dane Centralnego Repozytorium Map. Jest to po prostu wielki zbiór nic nie znaczących liczb, z których nawet programiści OSY nie potrafią zamienić z powrotem na oryginalną treść.
+
Tak działający mechanizm jest bezpieczny zarówno z punktu widzenia uczelni, jak i deweloperów systemu. Podkreślamy, że nawet ew. włamanie do Centralnego Repozytorium nie stwarza zagrożenia wycieku wrażliwych danych, gdyż mapy są bezużyteczne dla włamywacza. Nawet deweloperzy systemu nie są w stanie odtworzyć z nich na oryginalnych treści.
  
Od tej pory mechanizm sprawdzania w każdej lokalnej OSIe będzie składał się z następujących kroków:
+
Od wersji 5.0.0 mechanizm sprawdzania w każdej lokalnej instancji OSA będzie składał się z następujących kroków:
 
# Promotor/APD przekazuje pracę do sprawdzenia
 
# Promotor/APD przekazuje pracę do sprawdzenia
 
# OSA zapisuje treść i metadane w lokalnej bazie
 
# OSA zapisuje treść i metadane w lokalnej bazie
# OSA generuje mapę (hashe) pracy i przystępuje do wyszukiwania dokumentów-kandydatów swoim własnym zbiorze prac obronionych (zaakceptowanych). Potem następuje właściwe, bardziej dokładne znajdowanie wspólnych fragmentów między pracami
+
# OSA generuje mapę (hasz) pracy i przystępuje do wyszukiwania dokumentów-kandydatów swoim własnym zbiorze prac obronionych (zaakceptowanych). Potem następuje właściwe, bardziej dokładne znajdowanie wspólnych fragmentów między pracami
# Wygenerowana wcześniej mapa przesyłana jest na serwer centralny jako zlecenie sprawdzenia z Internetem '''i innymi dokumentami (mapami) pozostałych uczelni'''
+
# Wygenerowana wcześniej mapa trafia na serwer centralny jako zlecenie sprawdzenia z Internetem '''i innymi mapami dokumentów z pozostałych uczelni'''
# Do OSY spływają wyniki treści stron Internetowych posiadających części wspólne z dokumentem sprawdzanym '''oraz lista hashy, które pokryły się z dokumentami z pozostałych uczelni'''
+
# Do lokalnej instancji OSA spływają treści wyselekcjonowanych stron internetowych (posiadających części wspólne z dokumentem sprawdzanym) '''oraz lista wyselekcjonowanych map z pozostałych uczelni'''
  
Pogrubionymi fragmentami zaznaczono różnicę między OSĄ 4 a 5. '''Proszę zauważyć, że zawsze mapa pracy była wysyłana na serwer centralny celem przeprowadzenia sprawdzania z Internetem.''' Wynika z tego, że jedyna różnica między OSĄ 4 a 5 jest w tym, że przesłana mapa zostanie zapisana na serwerze centralnym zamiast zostać wykasowana po odebraniu wyników przez OSĘ lokalną. OSA 5 nie będzie więc wysyłać na serwer centralny innych danych niż robiła to w wersji 4. Zmienia się jedynie polityka przetrzymywania/przetwarzania tych danych.
+
Pogrubionymi fragmentami zaznaczono różnicę między OSĄ 4 a 5. '''Prosimy zauważyć, że zawsze mapa pracy była wysyłana na serwer centralny celem przeprowadzenia sprawdzania z Internetem.''' Wynika z tego, że jedyna różnica między OSĄ 4 a 5 leży w tym, że przesłana mapa zostanie zapisana na serwerze centralnym zamiast zostać wykasowana po odebraniu wyników przez OSĘ lokalną. OSA 5 nie będzie więc wysyłać na serwer centralny innych danych niż robiła to w wersji 4. Zmienia się jedynie procedura przetrzymywania/przetwarzania tych danych.
  
 
=== Praca OSY od strony użytkownika ===
 
=== Praca OSY od strony użytkownika ===
Linia 44: Linia 44:
 
'''Uwaga!'''
 
'''Uwaga!'''
  
'''To czy przycisk będzie dostępny będzie zależało od polityki danej Uczelni. Uczelnia, która posiada możliwość poproszenia o dostęp do treści pracy jednocześnie sama automatycznie akceptuje takie prośby ze strony innych uczelni wysyłając im treść pracy wraz z metadanymi.''' Treść tej pracy zostanie zapisana TYLKO w bazie lokalnej OSY proszącej o treść i widoczna tylko dla promotora. Pozyskanie treści pracy z innej uczelni oznaczać będzie uruchomienie dokładniejszego przeszukania względem zapożyczeń z nowo pozyskaną pracą.
+
'''Dostępność przycisku będzie będzie zależeć od polityki danej Uczelni. Przyjmujemy, że uczelnia, która ma możliwość poproszenia o dostęp do treści pracy jednocześnie sama automatycznie akceptuje takie prośby ze strony innych uczelni partnerskich wysyłając im treść pracy wraz z metadanymi.''' Treść tej pracy zostanie zapisana TYLKO w bazie lokalnej instancji OSA uczelni proszącej o treść i będzie widoczna tylko dla osoby przeprowadzającej sprawdzenie. Pozyskanie treści pracy z innej uczelni będzie skutkować uruchomieniem pogłębionej analizy zapożyczeń i wizualizację jej wyników wykorzystującą pozyskaną treść.
  
 
Aktualnie pracujemy nad mechanizmem, który ograniczy nadużywanie wysyłania próśb o treści pracy.
 
Aktualnie pracujemy nad mechanizmem, który ograniczy nadużywanie wysyłania próśb o treści pracy.
  
Proces wymiany treści prac między OSAmi lokalnymi będzie odbywał się za pośrednictwem serwera centralnego i trwać może kilkadziesiąt minut.
+
Proces wymiany treści prac między lokalnymi instancjami OSA będzie odbywał się za pośrednictwem serwera centralnego i trwać może trwać kilkadziesiąt minut.
  
 
=== Zasady uczestnictwa w programie ===
 
=== Zasady uczestnictwa w programie ===
# Uczestnictwo w samym programie udostępniania map będzie obowiązkowe dla każdej OSY. Jak zostało to wyjaśnione w tekście powyżej - nie powinno to budzić obaw ze strony władz uczelni.
+
# Uczestnictwo w programie udostępniania map będzie '''domyślne włączone''' dla każdej instancji OSA. Jak zostało to wyjaśnione w tekście powyżej - nie powinno to budzić obaw ze strony władz uczelni.
# Uczestnictwo w programie wzajemnej wymiany treści prac  między OSAmi '''domyślnie będzie wyłączone''' - będzie można to włączyć odpowiednim przełącznikiem przez administratora.
+
# Administrator każdej instancji OSA będzie mógł zmienić tę opcję na '''domyślnie wyłączone'''.
  
 
[[Category:Informacje o systemie]]
 
[[Category:Informacje o systemie]]

Wersja z 11:15, 8 gru 2017

To jest draft artykułu

Miedzyuniwersytecki Program Udostępniania Map jest inicjatywą uczelni zrzeszonych w MUCI polegającą na stworzeniu centralnego repozytorium map prac dyplomowych.

Geneza

Głównym problemem tworzenia repozytoriów prac akademickich w Polsce jest ochrona praw autorskich. Uczelnie z tego powodu obawiają się udostępniania prac studenckich poza swoje mury. Dlatego Otwarty System Antyplagiatowy jest lokalnie instalowany na każdej partnerskiej uczelni z gwarancją tego, że oryginalne treści prac nie opuszczą uczelnianych zasobów nawet podczas sprawdzania względem zapożyczeń z Internetu. Nikt poza administratorami lokalnych instancji systemu nie ma wglądu w treści prac, nawet developerzy OSA po stronie serwera centralnego. Podstawą działania systemu są mapy (zwane też haszami) będące nieodwracalnymi skrótami prac. Na podstawie map nie ma realnej możliwości odtworzenie oryginalnych treści, ale na bazie oryginału badanej pracy i jej mapy oraz map tekstów referencyjnych można zidentyfikować ew. zapożyczenia. Stało się to kanwą utworzenia Centralnego Repozytorium Map. Skoro z map nie da się odtworzyć ich źródeł - można je wyeksportować na zewnątrz uczelni. Ekspertyza prawna wykazała, że nie będzie to naruszać ustawy z dnia 4 lutego 1994 o prawie autorskim i prawach pośrednich (Dz. U. z 2017 r. poz. 880). Wyeksportowanie map z każdej lokalnej instancji OSA do Centralnego Repozytorium spowoduje, że przy weryfikacji pracy, której oryginalna treść niezmiennie pozostaje w lokalnych zasobach, będzie można wskazać jej ew. podobieństwa do prac, których mapy znajdują się w tym repozytorium.


Mechanizm działania

OSA 5 raz na jakiś czas będzie się łączyć z serwerem centralnym, by przesłać mapy prac obronionych na macierzystej uczelni. Ponieważ proces ten nie powoduje przekazania żadnych wrażliwych danych, mechanizm ten będzie domyślnie włączony dla każdej lokalnej instancji OSA.

Co zostanie przekazane?

  1. Zbiór wygenerowanych map (hashy) danej pracy
  2. Id pracy
  3. Język w jakim została napisana praca
  4. Id uczelni, z której pochodzi praca

Co NIE zostanie przekazane?

  1. Treść pracy
  2. Pozostałe metadane takie jak autor, promotor itp., których przesłanie mogłoyby budzić wątpliwości prawne

Tak działający mechanizm jest bezpieczny zarówno z punktu widzenia uczelni, jak i deweloperów systemu. Podkreślamy, że nawet ew. włamanie do Centralnego Repozytorium nie stwarza zagrożenia wycieku wrażliwych danych, gdyż mapy są bezużyteczne dla włamywacza. Nawet deweloperzy systemu nie są w stanie odtworzyć z nich na oryginalnych treści.

Od wersji 5.0.0 mechanizm sprawdzania w każdej lokalnej instancji OSA będzie składał się z następujących kroków:

  1. Promotor/APD przekazuje pracę do sprawdzenia
  2. OSA zapisuje treść i metadane w lokalnej bazie
  3. OSA generuje mapę (hasz) pracy i przystępuje do wyszukiwania dokumentów-kandydatów swoim własnym zbiorze prac obronionych (zaakceptowanych). Potem następuje właściwe, bardziej dokładne znajdowanie wspólnych fragmentów między pracami
  4. Wygenerowana wcześniej mapa trafia na serwer centralny jako zlecenie sprawdzenia z Internetem i innymi mapami dokumentów z pozostałych uczelni
  5. Do lokalnej instancji OSA spływają treści wyselekcjonowanych stron internetowych (posiadających części wspólne z dokumentem sprawdzanym) oraz lista wyselekcjonowanych map z pozostałych uczelni

Pogrubionymi fragmentami zaznaczono różnicę między OSĄ 4 a 5. Prosimy zauważyć, że zawsze mapa pracy była wysyłana na serwer centralny celem przeprowadzenia sprawdzania z Internetem. Wynika z tego, że jedyna różnica między OSĄ 4 a 5 leży w tym, że przesłana mapa zostanie zapisana na serwerze centralnym zamiast zostać wykasowana po odebraniu wyników przez OSĘ lokalną. OSA 5 nie będzie więc wysyłać na serwer centralny innych danych niż robiła to w wersji 4. Zmienia się jedynie procedura przetrzymywania/przetwarzania tych danych.

Praca OSY od strony użytkownika

Zdj. 1 - Widok wyników analizy
Zdj. 2 - Anonimowy dokument innej uczelni

Po zakończeniu przetwarzania dla promotora będą dostępne 3 rodzaje dokumentów do porównania (Zdj. 1):

  1. zbieżna praca z lokalnego repozytorium OSY (inny dokument z tej samej uczelni) - tak jak w OSA 4
  2. zbieżny dokument z Internetu - tak jak w OSA 4
  3. anonimowy dokument z innej uczelni o którym wiemy, że pochodzi z uczelni X oraz niektóre zaznaczone fragmenty pokryły się (NOWOŚĆ w OSA 5). Pokazane jest to na Zdj. 2.

Od tej chwili promotor będzie miał możliwość poproszenia zewnętrznej uczelni o oryginalną treść pracy (Przycisk: Poproś o dostęp).

Uwaga!

Dostępność przycisku będzie będzie zależeć od polityki danej Uczelni. Przyjmujemy, że uczelnia, która ma możliwość poproszenia o dostęp do treści pracy jednocześnie sama automatycznie akceptuje takie prośby ze strony innych uczelni partnerskich wysyłając im treść pracy wraz z metadanymi. Treść tej pracy zostanie zapisana TYLKO w bazie lokalnej instancji OSA uczelni proszącej o treść i będzie widoczna tylko dla osoby przeprowadzającej sprawdzenie. Pozyskanie treści pracy z innej uczelni będzie skutkować uruchomieniem pogłębionej analizy zapożyczeń i wizualizację jej wyników wykorzystującą pozyskaną treść.

Aktualnie pracujemy nad mechanizmem, który ograniczy nadużywanie wysyłania próśb o treści pracy.

Proces wymiany treści prac między lokalnymi instancjami OSA będzie odbywał się za pośrednictwem serwera centralnego i trwać może trwać kilkadziesiąt minut.

Zasady uczestnictwa w programie

  1. Uczestnictwo w programie udostępniania map będzie domyślne włączone dla każdej instancji OSA. Jak zostało to wyjaśnione w tekście powyżej - nie powinno to budzić obaw ze strony władz uczelni.
  2. Administrator każdej instancji OSA będzie mógł zmienić tę opcję na domyślnie wyłączone.