Międzyuniwersytecki Program Udostępnienia Map: Różnice pomiędzy wersjami

Z Otwarty System Antyplagiatowy
Skocz do: nawigacja, szukaj
(Utworzono nową stronę "skopiuj")
 
 
(Nie pokazano 3 wersji utworzonych przez jednego użytkownika)
Linia 1: Linia 1:
skopiuj
+
Funkcjonalność wprowadzona w OSA 5.0.0
 +
'''Międzyuniwersytecki Program Udostępnienia Map''' jest inicjatywą uczelni zrzeszonych w MUCI polegającą na stworzeniu centralnego repozytorium map prac dyplomowych.
 +
 
 +
=== Geneza ===
 +
Głównym problemem tworzenia repozytoriów prac akademickich w Polsce jest ochrona praw autorskich. Uczelnie z tego powodu obawiają się udostępniania prac studenckich poza swoje mury. Dlatego Otwarty System Antyplagiatowy jest lokalnie instalowany na każdej partnerskiej uczelni z gwarancją tego, że oryginalne treści prac nie opuszczą uczelnianych zasobów nawet podczas sprawdzania względem zapożyczeń z Internetu. Nikt poza administratorami lokalnych instancji systemu nie ma wglądu w treści prac, nawet deweloperzy OSA po stronie serwera centralnego. Podstawą działania systemu są mapy (zwane też haszami) będące nieodwracalnymi skrótami prac. Na podstawie map nie ma realnej możliwości odtworzenie oryginalnych treści, ale na bazie oryginału badanej pracy i jej mapy oraz map tekstów referencyjnych można zidentyfikować ew. zapożyczenia. 
 +
Stało się to kanwą utworzenia Centralnego Repozytorium Map. Skoro z map nie da się odtworzyć ich źródeł, można je wyeksportować na zewnątrz uczelni. '''Ekspertyza prawna wykazała, że nie będzie to naruszać ustawy z dnia 4 lutego 1994 o prawie autorskim i prawach pośrednich (Dz. U. z 2017 r. poz. 880)'''. Wyeksportowanie map z każdej lokalnej instancji OSA do Centralnego Repozytorium spowoduje, że przy weryfikacji pracy, której oryginalna treść niezmiennie pozostaje w lokalnych zasobach, będzie można wskazać jej ew. podobieństwa do prac, których mapy znajdują się w tym repozytorium.
 +
 
 +
=== Mechanizm działania ===
 +
OSA 5 raz na jakiś czas będzie się łączyć z serwerem centralnym, by przesłać mapy prac obronionych na macierzystej uczelni. Ponieważ ten mechanizm nie powoduje przekazania żadnych wrażliwych danych, będzie on domyślnie włączony dla każdej lokalnej instancji OSA.
 +
 
 +
Co zostanie przekazane?
 +
# Zbiór wygenerowanych map (haszy) danej pracy (pracy obronionej - zaakceptowanej)
 +
# Id pracy.
 +
# Język, w jakim została napisana praca.
 +
# Id uczelni, z której pochodzi praca.
 +
 
 +
Co '''NIE''' zostanie przekazane?
 +
# Treść pracy.
 +
# Pozostałe metadane takie jak autor, promotor itp., których przesłanie mogłoby budzić wątpliwości prawne.
 +
 
 +
Tak działający mechanizm jest bezpieczny zarówno z punktu widzenia uczelni, jak i deweloperów systemu. Podkreślamy, że nawet ew. włamanie do Centralnego Repozytorium nie stwarza zagrożenia wycieku wrażliwych danych, gdyż mapy są bezużyteczne dla włamywacza. Nawet deweloperzy systemu nie są w stanie odtworzyć z nich oryginalnych treści.
 +
 
 +
Od wersji 5.0.0 mechanizm sprawdzania w każdej lokalnej instancji OSA będzie składał się z następujących kroków:
 +
# użytkownik/APD przekazuje pracę do sprawdzenia,
 +
# OSA zapisuje treść i metadane w lokalnej bazie,
 +
# OSA generuje mapę (hasz) pracy i przystępuje do wyszukiwania podobnych dokumentów we własnym zbiorze prac obronionych (zaakceptowanych). Potem następuje właściwe, dokładniejsze znajdowanie wspólnych fragmentów między tekstami,
 +
# wygenerowana wcześniej mapa trafia na serwer centralny jako zlecenie sprawdzenia z Internetem '''i innymi mapami dokumentów z pozostałych uczelni''',
 +
# do lokalnej instancji OSA spływają treści wyselekcjonowanych stron internetowych (posiadających części wspólne z dokumentem sprawdzanym) '''oraz lista wyselekcjonowanych map z pozostałych uczelni'''.
 +
 
 +
Pogrubionymi fragmentami zaznaczono różnicę między 4. i 5. wersją OSA. '''Prosimy zauważyć, że zawsze mapa pracy była wysyłana na serwer centralny celem przeprowadzenia sprawdzania z Internetem.''' Wynika z tego, że główna różnica między wersjami 4. a 5. leży w tym, że przesłana mapa zostanie zapisana na serwerze centralnym zamiast zostać wykasowana po odebraniu wyników. OSA 5 nie będzie więc wysyłać na serwer centralny innych danych niż robiła to w wersji 4. Zmieni się jedynie procedura przetrzymywania i przetwarzania tych danych.
 +
 
 +
=== Praca systemu od strony użytkownika ===
 +
[[Plik:Ext-document.png|thumb|Zdj. 1 - Widok wyników analizy|500px|link={{filepath:Ext-document.png}}]]
 +
[[Plik:Ext-dokument-compare.png|thumb|Zdj. 2 - Anonimowy dokument innej uczelni|500px|link={{filepath:Ext-dokument-compare.png}}]]
 +
Po zakończeniu przetwarzania dla użytkownika będą dostępne 3 rodzaje dokumentów do porównania (zdj. 1):
 +
# zbieżna praca z lokalnego repozytorium OSY (inny dokument z tej samej uczelni) - tak jak w OSA 4,
 +
# zbieżny dokument z Internetu - tak jak w OSA 4,
 +
# anonimowy dokument z innej uczelni, o którym wiemy, że pochodzi z uczelni X oraz że są w nim fragmenty zbieżne z zaznaczonymi (NOWOŚĆ w OSA 5). Pokazane jest to na zdj. 2.
 +
 
 +
Od tej chwili użytkownik będzie miał możliwość poproszenia zewnętrznej uczelni o oryginalną treść pracy (Przycisk: Poproś o dostęp).
 +
 
 +
'''Uwaga!'''
 +
 
 +
'''Dostępność przycisku będzie będzie zależeć od polityki danej Uczelni. Przyjmujemy, że uczelnia, która ma możliwość poproszenia o dostęp do treści pracy jednocześnie sama automatycznie akceptuje takie prośby ze strony innych uczelni partnerskich wysyłając im treść pracy wraz z metadanymi.''' Treść tej pracy zostanie zapisana TYLKO w bazie lokalnej instancji OSA uczelni proszącej o treść i będzie widoczna tylko dla osoby przeprowadzającej sprawdzenie. Pozyskanie treści pracy z innej uczelni będzie skutkować uruchomieniem pogłębionej analizy zapożyczeń i wizualizację jej wyników wykorzystującą pozyskaną treść.
 +
 
 +
OSA 5 będzie mieć mechanizmem, który nie dopuści do nadużywanie próśb o dostęp.
 +
 
 +
Proces wymiany treści prac między lokalnymi instancjami OSA będzie odbywał się za pośrednictwem serwera centralnego i może trwać kilkadziesiąt minut.
 +
 
 +
=== Zasady uczestnictwa w programie ===
 +
# Dla każdej instancji OSA uczestnictwo w programie udostępniania map będzie '''domyślne włączone''' (bez możliwości jej wyłączenia), zaś automatyczna akceptacja próśb o udostępnienie treści - '''domyślne wyłączona'''.
 +
# Administrator każdej instancji OSA będzie mógł zmienić opcję automatycznej akceptacji próśb o udostępnienie treści na '''włączoną''' (domyślnie po instalacji OSA 5 - będzie ona w ustawieniach '''wyłączona''').
 +
 
 +
Nowa funkcjonalność systemu nie powinna więc budzić obaw ze strony władz uczelni.
 +
 
 +
=== Szczegóły techniczne ===
 +
 
 +
* Program udostępnienia map:
 +
Każda OSA 5 będzie wysyłać swoje mapy prac obronionych (zaakceptowanych) na serwer centralny. Czynność ta będzie odbywać się codziennie w nocy między godziną 24-6. OSA sprawdzi, które prace obronione doszły w ciągu dnia i przyrostowo dostarczy brakujące mapy. Jako, że po pierwszym zainstalowaniu OSY - proces ten oznaczałby przesłanie dużej ilości informacji o pracach obronionych - ustawiono limit maksymalnej ilości map (lub dokumentów) jakie mogą zostać przesłane podczas jednej nocy. W takiej sytuacji całkowity eksport map będzie trwał kilka kolejnych dni.
 +
 
 +
* Program udostępnienia treści:
 +
Jeśli OSA lokalna będzie miała uruchomiony moduł udostępniania treści prac - każdy promotor będzie posiadał przycisk "Poproś o dostęp" (jak na zdj. 2). Po jego naciśnięciu zostanie wysłane zapytanie o treść pracy do serwera centralnego. Jako, że OSY lokalne między uczelniami nie widzą się (mogą być za NAT'em) nie jest możliwa bezpośrednia komunikacja między maszynami na dwóch różnych uczelniach - stąd komunikacja będzie odbywać się poprzez serwer centralny.
 +
 
 +
Cykl życia prośby o treść pracy będzie wyglądał następująco:
 +
# Prośba promotora z uczelni X trafia na serwer centralny
 +
# OSA z uczelni Y łączy się z serwerem centralnym - dowiaduje się, że jest prośba o treść pracy z jej repozytorium (Raz na jakiś czas (15-30 minut) każda OSA będzie sprawdzała czy nie ma do niej próśb o treść pracy)
 +
# Jeśli OSA z uczelni Y ma wyłączoną opcję udostępniania - odrzuci ona prośbę - OSA z uczelni X uzyska odmowę
 +
# Jeśli OSA z uczelni Y ma włączoną opcję udostępniania treści - dostarcza treść, tytuł, autora, promotorów na serwer centralny
 +
# OSA z uczelni X zauważy, że dostarczono dane dla jaj pracy - ściągnie je
 +
# Zostanie uruchomione szczegółowe porównanie między pracami (jak dla standardowych prac)
 +
 
 +
Jako, że procedura ta wymaga synchronizacji poprzez serwer centralny - należy liczyć się z tym, że czynność będzie trwała jakiś czas (kompromis między ciągłym odpytywaniem serwera centralnego o prośby a wydajnością lokalnych instancji i serwera centralnego). Aktualnie rozważamy czasy całego obiegu informacji na ok. 30 min - 1h.
 +
 
 +
Procedury tutaj przedstawione będą z czasem optymalizowane. Jesteśmy również otwarci na propozycje.
 +
 
 +
[[Category:Informacje o systemie]]

Aktualna wersja na dzień 07:50, 1 sie 2019

Funkcjonalność wprowadzona w OSA 5.0.0

Międzyuniwersytecki Program Udostępnienia Map jest inicjatywą uczelni zrzeszonych w MUCI polegającą na stworzeniu centralnego repozytorium map prac dyplomowych.

Geneza

Głównym problemem tworzenia repozytoriów prac akademickich w Polsce jest ochrona praw autorskich. Uczelnie z tego powodu obawiają się udostępniania prac studenckich poza swoje mury. Dlatego Otwarty System Antyplagiatowy jest lokalnie instalowany na każdej partnerskiej uczelni z gwarancją tego, że oryginalne treści prac nie opuszczą uczelnianych zasobów nawet podczas sprawdzania względem zapożyczeń z Internetu. Nikt poza administratorami lokalnych instancji systemu nie ma wglądu w treści prac, nawet deweloperzy OSA po stronie serwera centralnego. Podstawą działania systemu są mapy (zwane też haszami) będące nieodwracalnymi skrótami prac. Na podstawie map nie ma realnej możliwości odtworzenie oryginalnych treści, ale na bazie oryginału badanej pracy i jej mapy oraz map tekstów referencyjnych można zidentyfikować ew. zapożyczenia. Stało się to kanwą utworzenia Centralnego Repozytorium Map. Skoro z map nie da się odtworzyć ich źródeł, można je wyeksportować na zewnątrz uczelni. Ekspertyza prawna wykazała, że nie będzie to naruszać ustawy z dnia 4 lutego 1994 o prawie autorskim i prawach pośrednich (Dz. U. z 2017 r. poz. 880). Wyeksportowanie map z każdej lokalnej instancji OSA do Centralnego Repozytorium spowoduje, że przy weryfikacji pracy, której oryginalna treść niezmiennie pozostaje w lokalnych zasobach, będzie można wskazać jej ew. podobieństwa do prac, których mapy znajdują się w tym repozytorium.

Mechanizm działania

OSA 5 raz na jakiś czas będzie się łączyć z serwerem centralnym, by przesłać mapy prac obronionych na macierzystej uczelni. Ponieważ ten mechanizm nie powoduje przekazania żadnych wrażliwych danych, będzie on domyślnie włączony dla każdej lokalnej instancji OSA.

Co zostanie przekazane?

  1. Zbiór wygenerowanych map (haszy) danej pracy (pracy obronionej - zaakceptowanej)
  2. Id pracy.
  3. Język, w jakim została napisana praca.
  4. Id uczelni, z której pochodzi praca.

Co NIE zostanie przekazane?

  1. Treść pracy.
  2. Pozostałe metadane takie jak autor, promotor itp., których przesłanie mogłoby budzić wątpliwości prawne.

Tak działający mechanizm jest bezpieczny zarówno z punktu widzenia uczelni, jak i deweloperów systemu. Podkreślamy, że nawet ew. włamanie do Centralnego Repozytorium nie stwarza zagrożenia wycieku wrażliwych danych, gdyż mapy są bezużyteczne dla włamywacza. Nawet deweloperzy systemu nie są w stanie odtworzyć z nich oryginalnych treści.

Od wersji 5.0.0 mechanizm sprawdzania w każdej lokalnej instancji OSA będzie składał się z następujących kroków:

  1. użytkownik/APD przekazuje pracę do sprawdzenia,
  2. OSA zapisuje treść i metadane w lokalnej bazie,
  3. OSA generuje mapę (hasz) pracy i przystępuje do wyszukiwania podobnych dokumentów we własnym zbiorze prac obronionych (zaakceptowanych). Potem następuje właściwe, dokładniejsze znajdowanie wspólnych fragmentów między tekstami,
  4. wygenerowana wcześniej mapa trafia na serwer centralny jako zlecenie sprawdzenia z Internetem i innymi mapami dokumentów z pozostałych uczelni,
  5. do lokalnej instancji OSA spływają treści wyselekcjonowanych stron internetowych (posiadających części wspólne z dokumentem sprawdzanym) oraz lista wyselekcjonowanych map z pozostałych uczelni.

Pogrubionymi fragmentami zaznaczono różnicę między 4. i 5. wersją OSA. Prosimy zauważyć, że zawsze mapa pracy była wysyłana na serwer centralny celem przeprowadzenia sprawdzania z Internetem. Wynika z tego, że główna różnica między wersjami 4. a 5. leży w tym, że przesłana mapa zostanie zapisana na serwerze centralnym zamiast zostać wykasowana po odebraniu wyników. OSA 5 nie będzie więc wysyłać na serwer centralny innych danych niż robiła to w wersji 4. Zmieni się jedynie procedura przetrzymywania i przetwarzania tych danych.

Praca systemu od strony użytkownika

Zdj. 1 - Widok wyników analizy
Zdj. 2 - Anonimowy dokument innej uczelni

Po zakończeniu przetwarzania dla użytkownika będą dostępne 3 rodzaje dokumentów do porównania (zdj. 1):

  1. zbieżna praca z lokalnego repozytorium OSY (inny dokument z tej samej uczelni) - tak jak w OSA 4,
  2. zbieżny dokument z Internetu - tak jak w OSA 4,
  3. anonimowy dokument z innej uczelni, o którym wiemy, że pochodzi z uczelni X oraz że są w nim fragmenty zbieżne z zaznaczonymi (NOWOŚĆ w OSA 5). Pokazane jest to na zdj. 2.

Od tej chwili użytkownik będzie miał możliwość poproszenia zewnętrznej uczelni o oryginalną treść pracy (Przycisk: Poproś o dostęp).

Uwaga!

Dostępność przycisku będzie będzie zależeć od polityki danej Uczelni. Przyjmujemy, że uczelnia, która ma możliwość poproszenia o dostęp do treści pracy jednocześnie sama automatycznie akceptuje takie prośby ze strony innych uczelni partnerskich wysyłając im treść pracy wraz z metadanymi. Treść tej pracy zostanie zapisana TYLKO w bazie lokalnej instancji OSA uczelni proszącej o treść i będzie widoczna tylko dla osoby przeprowadzającej sprawdzenie. Pozyskanie treści pracy z innej uczelni będzie skutkować uruchomieniem pogłębionej analizy zapożyczeń i wizualizację jej wyników wykorzystującą pozyskaną treść.

OSA 5 będzie mieć mechanizmem, który nie dopuści do nadużywanie próśb o dostęp.

Proces wymiany treści prac między lokalnymi instancjami OSA będzie odbywał się za pośrednictwem serwera centralnego i może trwać kilkadziesiąt minut.

Zasady uczestnictwa w programie

  1. Dla każdej instancji OSA uczestnictwo w programie udostępniania map będzie domyślne włączone (bez możliwości jej wyłączenia), zaś automatyczna akceptacja próśb o udostępnienie treści - domyślne wyłączona.
  2. Administrator każdej instancji OSA będzie mógł zmienić opcję automatycznej akceptacji próśb o udostępnienie treści na włączoną (domyślnie po instalacji OSA 5 - będzie ona w ustawieniach wyłączona).

Nowa funkcjonalność systemu nie powinna więc budzić obaw ze strony władz uczelni.

Szczegóły techniczne

  • Program udostępnienia map:

Każda OSA 5 będzie wysyłać swoje mapy prac obronionych (zaakceptowanych) na serwer centralny. Czynność ta będzie odbywać się codziennie w nocy między godziną 24-6. OSA sprawdzi, które prace obronione doszły w ciągu dnia i przyrostowo dostarczy brakujące mapy. Jako, że po pierwszym zainstalowaniu OSY - proces ten oznaczałby przesłanie dużej ilości informacji o pracach obronionych - ustawiono limit maksymalnej ilości map (lub dokumentów) jakie mogą zostać przesłane podczas jednej nocy. W takiej sytuacji całkowity eksport map będzie trwał kilka kolejnych dni.

  • Program udostępnienia treści:

Jeśli OSA lokalna będzie miała uruchomiony moduł udostępniania treści prac - każdy promotor będzie posiadał przycisk "Poproś o dostęp" (jak na zdj. 2). Po jego naciśnięciu zostanie wysłane zapytanie o treść pracy do serwera centralnego. Jako, że OSY lokalne między uczelniami nie widzą się (mogą być za NAT'em) nie jest możliwa bezpośrednia komunikacja między maszynami na dwóch różnych uczelniach - stąd komunikacja będzie odbywać się poprzez serwer centralny.

Cykl życia prośby o treść pracy będzie wyglądał następująco:

  1. Prośba promotora z uczelni X trafia na serwer centralny
  2. OSA z uczelni Y łączy się z serwerem centralnym - dowiaduje się, że jest prośba o treść pracy z jej repozytorium (Raz na jakiś czas (15-30 minut) każda OSA będzie sprawdzała czy nie ma do niej próśb o treść pracy)
  3. Jeśli OSA z uczelni Y ma wyłączoną opcję udostępniania - odrzuci ona prośbę - OSA z uczelni X uzyska odmowę
  4. Jeśli OSA z uczelni Y ma włączoną opcję udostępniania treści - dostarcza treść, tytuł, autora, promotorów na serwer centralny
  5. OSA z uczelni X zauważy, że dostarczono dane dla jaj pracy - ściągnie je
  6. Zostanie uruchomione szczegółowe porównanie między pracami (jak dla standardowych prac)

Jako, że procedura ta wymaga synchronizacji poprzez serwer centralny - należy liczyć się z tym, że czynność będzie trwała jakiś czas (kompromis między ciągłym odpytywaniem serwera centralnego o prośby a wydajnością lokalnych instancji i serwera centralnego). Aktualnie rozważamy czasy całego obiegu informacji na ok. 30 min - 1h.

Procedury tutaj przedstawione będą z czasem optymalizowane. Jesteśmy również otwarci na propozycje.