Uživatel:Dan Polansky/Etymologicky související

Tato stránka popisuje koncepci oddílu "související" v českém Wikislovníku založenou na představě, že má obsahovat slova etymologicky související, včetně morfologických souvislostí. Tato představa se opírá o en wikt a o užití slov "odvozená" a "příbuzná" v WS:FH#Související.

Kodifikace v českém Wikislovníku

editovat

V cs wikt není jasně specifikováno či koncipováno, co do oddílu patří, dle WS:FH#Související. Oddíl dokonce obsahuje větu "V této sekci můžete uvést seznam slov, která s daným heslem nějak souvisejí", pro účely specifikace zcela nevyhovující. Oddíl obsahuje následující:


V této sekci můžete uvést seznam slov, která s daným heslem nějak souvisejí. Obvykle se jedná o odvozená a příbuzná slova, např. u hesel o podstatných jménech o spřežky, u hesel o slovesech o verbální substantiva atd. Třeba u hesla reflexe sekce „související“ může vypadat takto:

==== související ====
* [[reflex]]
* [[reflektor]]
* [[reflexní]]
* [[reflektovat]]
* [[autoreflexe]]
* [[sebereflexe]]

Oddíl se nepokouší téměř jinak než příkladem podrobněji stanovit, jak jej koncipovat. Dle příkladů připouští možnost etymologické souvislosti bez sémantické souvislosti ("reflex", "reflektor") a připouští přidání prefixu ("sebereflexe"). Otázku, zda např. "verbum" smí být vztaženo k "univerbizace", ponechává otevřenou. V tom ohledu, že oddíl invokuje slova "odvozená" (derived) a "příbuzná" (related) naznačuje, že je sloučením oddílů "Derived terms" a "Related terms" z en wikt. Přitom však takových slov může být velmi mnoho, takže je lépe formátovat seznamy vícesloupcově, což se však nyní neděje. Slov odvozených může být obrovské množství zejména u afixů, pročež je zatím praxe tyto seznamy pro afixy uvádět ručně v přílohách.

Ani v en wikt není jasně specifikováno, v jakém rozsahu slova etymologicky související určit. Různí lidé proto k tématu přistupují různě.

Status quo

editovat

Podívejme se na status quo, na současnou praxi v hlavním jmenném prostoru, kterou jsem nezavedl já.

Příklady vztahů, které nejsou morfologicky odvozovací v češtině či angličtině nýbrž etymologické:

Koncepční poznámky

editovat

Jeden z přístupů či koncepcí jsem rozvinul zde:

Jsou zde popsány jakoby axiomaticky jisté principy. Jsou tu i jakési case studies pro volbu hesel, kde ringy koncentrovat. V českém Wikislovníku však nejspíš bude odpor k myšlence, že by se mimo ring napsalo pouze "* Viz slovo" pro omezení masivní duplikace a údržbového vícenákladu typického pro údržbu ringů; uvidíme.

Jiný přístup je slova sledovat nikoli pouze do latinského či řeckého kořenu nýbrž až do praindoevropštiny (PIE, Proto-Indo-European). To je realizováno v některých heslech v en wikt skrze seznam automaticky generovaný z kategorie.

Obecně je cílem návrhu koncepce dosáhnout zajímavě dlouhých seznamů, ale zase ne nepříjemně dlouhých.

Přístup, kde se slova cizího původu sledují do latinských a řeckých generujících kořenů, dorovnává typickou délku seznamu s délkou seznamů, které jsou slovanské, například dlouhý seznam pro "být". To, co je pro plnočeská slova dáno morfologicky/tvaroslovně, je pro cizí slova dáno etymologicky/ohledně původu slova. I tak nejsou seznamy pro slova latinského původu obvykle tak dlouhé, jako seznam pro "být".

Při mé koncepci mohou být seznamy relativně dlouhé, a je lepší je formátovat vícesloupcovou sazbou. Pokud by se kořeny sledovaly do PIE, byly by seznamy ještě delší.

Tento druh obsahu představuje unikátní diferenciátor: české slovníky online ho nevedou. Čtenář pro tento obsah musí jít na Wikislovník.

Omezení duplikace

editovat

Duplikaci seznamů či ringů jsem omezil pomocí jakýchsi hubů, čili hesel, která seznam hostí, s tím, že ostatní hesla v ringu odkazují na hub pomocí něčeho jako "* Viz hub". To je přímočará a jednoduchá technika někdy užívaná v literatuře. Přitom není vždy nuté omezit seznam na "* Viz hub", nýbrž lze jmenovat některá těsněji související slova duplikovaně.

Alternativou by bylo seznamy či ringy umístit do šablon a tyto transkludovat: tím by ring byl přímo ukázán ve všech svých členech. Jinou alternativou by bylo umístit je do kategorií a ukázaný seznam generovat z obsahu kategorie; to se částečně udělalo v en wikt pro ringy generované základem z PIE spíš než z latiny či řečtiny.

Není třeba úzkostlivě předem rozhodnout, která z možností výše se vybere a proč. Sice možné pozdější předělání dá práci navíc, ale důležité je začít něco dělat a nezadrhnout se na tom, že se člověk či skupina nemůže rozhodnout. Pokud se dosud toto řešilo bez šablon a kategorií, potom je řešení skrze huby a "* Viz hub" méně revoluční, a může se jím začít.

Případy použití

editovat

Případ: Nemůžu si vzpomenout na slovo, jenom se mi něco mate, že je to něco s "chron". Vzpomenu si na slovo "synchronní", najedu na heslo, to nejspíš nebude hub, takže bude obsahovat "* Viz hub", naviguji se do hubu, a tam mám seznam různých slov ze společného řeckého základu, včetně chronologie, chronický, diachronní, diachronie, aj.

Příklady slovanské

editovat

být:

Zda má být seznam výše, vytvořený v en wikt někým jiným než mnou, takto rozsáhlý, je diskutabilní/na zvážení. Například verbální substantiva *ání a adjektivální příčestí/participia *ící by tam nemusely být, coby poměrně triviální deriváty. Umístěny tam byly nejspíš proto, že byť triviální deriváty jsou pořád považována jaksi za lemmata, byť právěže tyto dvě skupiny zahrnují spíše kvazilemmata a slovníky je coby samostatná hesla někdy nevedou. Na druhé straně je otázka, proč by způsobová příslovce *ě, též triviální deriváty, nemohla být též považována za kvazilemmata.

jmout, tak jak je nyní v cs wikt:

Seznam výše pro "jmout" je však koncipován méně úplně než ten výše pro "být" (jenž je snad od Jana Kameníčka): chybí zazší deriváty včetně pojem, příjem, příjemce, zájem, zájemce, objímka, výjimka, výjimečný, aj. Jakmile si člověk zvykne na to, že seznam je delší, a že se na heslo obsahující seznam odkazuje z derivátů skrze "* Viz X", může po troše odporu přijmout i myšlenku, že se uvede kompletnější seznam derivací. A onen kompletnější seznam je docela zajímavý, byť si někdo na něj musí zvyknout (já jsem se asi zprvu zarazil, když jsem to viděl) a první reakcí může být pochybnost či odpor. Já jsem do en wikt vložil podobně krátký seznam, neboť jsem to viděl tak, že ty zazší deriváty jsou odkázány pouze nepřímo.

Příklady latinské

editovat

verbum (slova odvozená od latinského "verbum"):

Seznam není nijak předlouhý. Není však nejspíš úplný: dle hesla univerbizace chybí multiverbizace, univerbizační, univerbální, univerbizovaný, a univerbizát. Chybějících je dost možná více. Paulova v jednom okamžiku vznesená námitka, že slova musí souviset nejen etymologicky ale i sémanticky, by se neuplatnila pro většinu položek, kdyby coby hub bylo zvoleno slovo "verbální", jehož jeden význam je související s pojmem slova. Zaseknout se na tom, že české verbum se týká pouze pojmu slovesa zatímco mnohé ostatní položky se týkají pojmu slova, se zdá být komplikace, kterou se nic moc hodnotného nedosáhne: seznam se rozpadne na dva a nebo dokonce pro hub zvolený coby "verbální" to bude stejně jeden seznam, neboť "verbální" má ve svém významu jak pojem slova tak pojem slovesa. Zesložitění výběrového kritéria o sémantickou shodu práci znesnadňuje, přitom ta je už tak náročná pro nutnost pracovat s etymologickým slovníkem. Navíc přimícháním sémantického kritéria se naruší čistě etymologický charakter vztahu.

mise (z latinského mitto):

Seznam není nijak předlouhý.

Příklady řecké

editovat

fón z řeckého φωνή:

Seznam je poněkud delší, ale nikoli delší než seznam pro "být".

Dohledatelnost

editovat

Do oddílů používajících tento princip vkládám do komentáře text "značka: ety-souv". Díky tomu může projekt později snadno všechny takové seznamy najít a jakoby je prořezat k užšímu pojetí, hledáním: Special:Search/insource:/ety-souv.

V tuto chvíli je značka nalezena v heslech verbum, mise a flexe.

Znění nadpisu

editovat

Znění aneb název nadpisu:

  • Nyní je "související", což je nejednoznačné
  • Možnost: "etymologicky související" -- lepší, vhodné vedle "významově související"
  • Možnost: "původem související" -- lepší, vhodné vedle "významově související", navíc plnočeské

Námitka: horší nalezitelnost

editovat

Bylo namítnuto, že dle koncepce širší etymologické souvislosti vzniknou předlouhé seznamy, ve kterých pak jeden hůře najde, co hledal. Odpověď/reakce na námitku:

  • Délka seznamu dle koncepce širší etymologické souvislosti není obvykle větší než délka seznamu v hesle "být", který čítá v tuto chvíli 89 položek a neopírá se o odvozovací vztahy mimo slovanské jazyky.
  • V příloze en:Appendix:English words by Latin antecedents má nejdelší seznam délku 64 položek, pro základ agere/ago. Jiný dlouhý seznam je pro capere/capio, délky 42 položek. Obojí je méně že oněch 89 položek pro české být. Zde se sice jedná o anglické ringy/skupiny a nikoli české, nicméně je odhadnout, že v češtině bude situace podobná, nikoli řádově jiná, možná i kratší, neboť angličtina je i ve své jádrové slovní zásobě prosáklá slovy latinského původu více než čeština.
  • Nalézt položky dle užšího pojetí lze obvykle tak, že jeden hledá v abecedním pořadí od počátečního písmene stejného jako u daného slova; tedy např. ke slovu "reflex" mohu hledat v seznamu od "r" a nevšímat si okolí.

Diskuze

editovat

Zde: