Diskuse k Wikislovníku:Korpusy

Poslední komentář: před 1 rokem od uživatele Dan Polansky v tématu „Zda musí být korpus anotovaný

Zda je Google Books korpus

editovat

Z toho se zdá, že se slovo "corpus" užívá v širším i užším slova smyslu. --Dan Polansky (diskuse) 18. 5. 2023, 12:52 (CEST)Odpovědět

Zda jsou korpusy ručně anotované

editovat
  • https://wiki.korpus.cz/doku.php/pojmy:anotace
    "Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní údaje a/nebo metatextové údaje k textovým datům korpusu." Italika/kurzíva ode mne.

--Dan Polansky (diskuse) 18. 5. 2023, 12:18 (CEST)Odpovědět

Co je korpus

editovat
  • https://wiki.korpus.cz/doku.php/pojmy:korpus
    "Jazykový korpus (z lat. corpus „tělo, těleso“) je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby v něm bylo možné jednoduše vyhledávat jazykové jevy, zejména slova a slovní spojení (kolokace)."

--Dan Polansky (diskuse) 20. 5. 2023, 08:07 (CEST)Odpovědět

Další odkazy odpovídající na otázku:

--Dan Polansky (diskuse) 20. 5. 2023, 08:18 (CEST)Odpovědět

Zda musí být korpus anotovaný

editovat

Korpusy mohou být a) neanotované, b) ručně anotované, a c) automaticky/strojově anotované. --Dan Polansky (diskuse) 20. 5. 2023, 09:29 (CEST)Odpovědět

Vrátit se na projektovou stránku „Korpusy“.