09-11-2023, 14:31
(07-11-2023, 20:20)Waldek napisał(a): Dzięki za udostępnienie słowników. Myślę, że mógłbyś spróbować rozreklamować je na katedrach filologii węgierskiej - według mojej wiedzy są one na Uniwersytecie Warszawskiem, Jagielońskim i w Poznaniu. Mogliby oni udostępniać te treści.Z tego, co się orientuję, to wykładowcy te słowniki w zeskanowanej formie studentom udostępniali na pierwszym roku (przynajmniej kiedyś tak było) - na pewno o nich wiedzą, bo skan powstał ok. 2005 r.
Pewnie katedry mają jakieś modniejsze nazwy niż trywialna filologia węgierska.
Może ktoś ma jakiś pomysł jak ze skanów Wielkich Słowników stworzyć prawdziwy słownik elektroniczny. Wiadomo potrzebny jest odpowiedni program. Najlepiej bezpłatny z otwartą licencją.
Z drugiej strony jak wygląda sprawa praw autorskich?
Jak wygląda prawo przy przeróbce skanu na tekst - nie mam pojęcia. Podejrzewam, że tak jak przy zwykłym skanowaniu: nie jest niezgodne z prawem, o ile robimy to na własny użytek; ale rozpowszechnianie może już być nielegalne, a zarabianie na rozpowszechnianiu jest już na pewno nielegalne. Podejrzewam, że wykładowcy właśnie dlatego "nie obnoszą się" z tymi zeskanowanymi słownikami Ale co mają zrobić? Zostawić studentów bez słownika? Reychmanna można wprawdzie kupić, ale nie zawsze jest to łatwe. Nakład jest dawno wyczerpany, więc i tak wydawnictwo by na nich nie zarobiło - ja tam korzystam z czystym sumieniem
Istnieją oczywiście takie programy, technologia nazywa się OCR - jak wpiszesz w google, to znajdziesz darmowe i płatne opcje. Ja próbowałem on-line na i2ocr(kropka)com - rozpoznaje i węgierski i polski, tylko że można zaznaczyć jeden język, który ma być rozpoznawany. W efekcie w tekście wyjściowym trzeba poprawiać znaki specjalne: albo polskie, albo węgierskie. Oprócz tego wygląda to całkiem ładnie. Minusem tej strony jest to, że można załadować tylko stosunkowo mały plik - w takim wypadku najpierw trzeba by porozdzielać pdf-y na mniejsze pliki... Przy całym słowniku doprowadzenie wszystkich stron do stanu podobnego do papierowego słownika zajęłoby więc sporo czasu. Być może w programie darmowym, który trzeba zainstalować, albo w płatnych programach jest opcja wyboru rozpoznawania dwóch języków na raz i wtedy efekt takiej digitalizacji jest bardziej zadowalający. Tylko najpierw trzeba by te programy przetestować...
Myślę, że to bardzo dobry pomysł, żeby doprowadzić zeskanowany słownik do postaci pdf z możliwością wyszukiwania - jak się dobry program nie znajdzie, to można tym topornym i2ocr Tylko wydaje mi się, że warto by to zrobić w kilka osób, żeby było choć trochę szybciej. Jak pomyślę, że miałbym to zrobić samodzielnie, to jest to trochę przytłaczająca perspektywa. A tak na marginesie to na pewno dobra okazja do poznania nowych słówek.