Latex

Z Otwarty System Antyplagiatowy
Skocz do: nawigacja, szukaj

LaTeX - jest językiem znaczników służącym do formatowania dokumentów tekstowo-graficznych. Tym samym mianem określa się też związane z tym językiem oprogramowanie. Zarówno język, jak i oprogramowanie są szczególnie przydatne do składu tekstów z obszarów nauk ścisłych, technicznych oraz przyrodniczych. Studenci wielu szkół wyższych wykorzystują je do pisania prac dyplomowych. Warto pamiętać, że LaTeX jest zestawem makr będących nadbudową systemu składu TEX i nie jest samodzielnym środowiskiem programistycznym.

Problem kodowania

Pliki języka LaTeX są de facto kodami źródłowymi właściwego dokumentu, którego uzyskanie wymaga kompilacji. Za jej sprawą otrzymuje się plik wynikowy w formacie DVI (ang. device independent), specyficznym dla systemu TEX. Plik DVI można następnie przetworzyć na jeden z popularnych formatów, takich jak PostScript, HTML lub PDF. W odniesieniu do prac dyplomowych otrzymanych z kodów źródłowych języka LaTeX powszechnie stosuje się format PDF. Sporadycznie pojawiają się jednak problemy z wyciągnięciem tekstu z takich plików. Spowodowane jest to tym, że każdy użytkownik może skonfigurować środowisko LaTeX w niemal dowolny sposób. Niektóre konfiguracje powodują błędne kodowanie pewnych grup znaków, a zwłaszcza liter z polskimi znakami diakrytycznymi.

Dokument PDF z nieprawidłowym kodowaniem znaków - w podglądzie na ekranie - ma często formę graficzną nie budzącą podejrzeń czytającego. Problem pojawia się przy kopiowaniu zaznaczonych fragmentów tekstu (copy-paste) do innych plików - część znaków okazuje się nieczytelna i wymaga ręcznej korekty. Ekstremalnym przykładem jest tu dokument http://sprout.dfki.de/documentations/api/Tokenization_in_Sprout.pdf. Próba skorzystania z copy-paste jest w zasadzie niemożliwa. Jest to dowód na to, że choć dokument wygląda poprawnie - sam sposób składu tekstu może być odmiennie inny niż się tego spodziewamy.

LaTeX a OSA

OSA przy wczytywaniu plików zakłada system kodowania UTF-8 (zob. https://pl.wikipedia.org/wiki/UTF-8) i automatycznie poprawia najczęściej pojawiające się błędne znaki spoza tego systemu. Nie zapewnia jednak korekty wszystkich błędów tego rodzaju, zwłaszcza w odniesieniu do plików PDF, których źródłem jest LaTeX. Sposobów skonfigurowania środowiska Latexa jest po prostu zbyt duża żeby udało się odwzorować wszystkie możliwości.

Zapobieganie błędom kodowania

Zachęcamy uczelnie do stosowania odpowiednio zdefiniowanych szablonów (prologu, klasy, preambuły), które zapewniają poprawne kodowanie i ułatwiają studentom przygotowanie prac dyplomowych w LaTeX'u. Rekomendujemy też upowszechnienie internetowego edytora ShareLaTeX, https://www.sharelatex.com. Przykładowy - przetestowany w ShareLaTeX - szablon zamieszczamy na

Stosowanie się do tych zaleceń spowoduje, że trafiające do OSA pliki PDF, których źródłem jest LaTeX, będą wolne od błędów kodowania.