Uživatel:Dan Polansky/Kolokace
Toto je stránka pokrývající vkládání kolokací do českého Wikislovníku.
Obliba kolokací
editovatCo svědčí o oblibě kolokací:
- Kolokace má en wikt, pl wikt i de wikt. V en wikt k tomu bylo v roce 2022 hlasování s účastí hodně lidí, s výsledkem 22-4-3.
- V en wikt jsem založil čtyři šablony pro slovníky kolokací: en:T:R:Macmillan Collocations, en:T:R:Cambridge Collocations, en:T:R:Ozdic, en:T:R:WordReference Collocations. Našel jsem tedy čtyři weby kolokací pro angličtinu od lidí, které to živí, tedy to čtenáři opravdu chtějí. Každý ten web je koncipován trochu jinak; zajímavé.
- Již dříve byly publikovány slovníky kolokací, vyjmenované např. zde: en:User:Dan Polansky/Collocation: LTP Dictionary of Selected Collocations, Language Teaching Publications, 1997; Oxford Collocations Dictionary, Oxford University Press, 2002; Oxford Collocations Dictionary, Oxford University Press, 2007; Oxford Collocations Dictionary, Oxford University Press, 2009; English Collocations in Use, Cambridge University Press, 2008; A Collocation Inventory for Beginners, LAP Lambert Academic Publishing, 2009.
Proč v cs wikt
editovatProč kolokace v českém Wikislovníku:
- Lidé jak se zdá mají kolokace rádi, tak proč ne.
- Nevíme o online veřejně přístupném slovníku kolokací pro češtinu (nebo snad ano?), takže je to i unikátní diferenciátor Wikislovníku, poskytující něco, co jinde není.
- Lidé, kteří nechtějí dělat definice, mohou chtít dělat kolokace.
- Někdo by si myslel, že dát dohromady kolokace je triviální po paměti a tedy bez informační hodnoty, ale když si jeden zkusí dát seznam kolokací pro jisté heslo na svůj náklad dohromady, tak ho ten dojem přejde.
- Kolokace někdy generují něco jako seznam významově souvisejících. Chci třeba najít slovo alternativní k slově "piplačka", a pokud soudím, že "nevděčná piplačka" je běžná kolokace, mohu zkusit štěstí v hesle "nevděčný" a podívat se, zda mi neposlouží jedno z kolokujících podstatných jmen. Naopak pokud tam jako běžná kolokace uvedena není, pak se mohu zamyslet, zda nepoužívám zvláštní slovní spojení a zda skutečně chci.
Odkazy:
Formát kolokací
editovat- Nově: formátovat jako seznamy čárkou oddělených výrazů, dokud nebude zprovozněna vícesloupcová sazba. Seznamy bývají natolik dlouhé, že při jednosloupcovém odrážkovém formátování by mnohé rušily a způsobily nejspíš neoblibu kolokací.
- Zatím do oddílu/sekce úrovně 4, kolokace, za oddílem "související"
- Nejspíš časem formátovat vícesloupcově, neb takto to bude roztahané. K tomu stačí jedna šablona na začátku seznamu a jedna na konci.
- Kolokace vkládat jako páry, tedy např. "* correct argument", s položkou na odrážku, tedy co kolokace, to nová odrážka. To je po vzoru en wikt.
- Alternativní formát je umístit kolokace do čárkovaného seznamu, jako jsem to v hesle argument udělal pro angličtinu. Výhodou je velká kompaktnost i bez vícesloupcové sazby pro dlouhý seznam.
- Do en wikt jsem je původně vkládal, např. pro slovo argument, jako "correct, convincing, plausible, [...]", ale od toho se upustilo skrze hlasování, ve prospěch opakování i toho modifikovaného slova a ve prospěch odrážkového seznamu.
- De wikt a pl wikt to mají na jednom řádku; to by byla alternativa.
- Pl wikt to ještě nějak sdružuje; např. v pl:shameless mají "shameless person / woman / man / thing / hussy / creature • shameless way / behavior / exploitation / display • shameless flirt / words / lies / plug • shameless advantage". To je náročnější na vytvoření, ale není to vůbec špatné.
- V en wikt dávají heslo tučně, ale to bych nedělal: naopak má být zdůrazněno slovo modifikující, nikoli heslo. Takže nikoli "* correct '''argument'''" nýbrž "* correct argument".
- Modifikující slova by nebylo špatné linkovat, ale povinnost při iniciálním zadání bych z toho nedělal.
Výběrová kritéria
editovat- Nejspíš podle frekvence. Pro angličtinu jsem používal Google Ngram Viewer pro odhalení nejčastějších kolokací. Pro češtinu tu bude větší oříšek.
- I kdyby kritéria byla hůře definovaná, lepší nějaké kolokace než žádné, a kdyby nějaká zněla hodně nepřirozeně, lze prověřit frekvenci Googlem a případně odstranit.
Druhy kolokací
editovat- modifikace podstatného přídavným, např. korektní argument
- vazba podstatného na sloveso, např. odeslat poštu, napsat dopis
- vazba příslovce na přídavné
Příkladová hesla v cs wikt
editovat- argument
- kolokace
- planý argument, pádný argument, chybný argument, chabý argument, slabý argument, silný argument, ubohý argument
- kolokace
- good argument, bad argument, valid argument, invalid argument, correct argument, incorrect argument, right argument, wrong argument, sound argument, unsound argument, strong argument, weak argument, convincing argument, unconvincing argument, plausible argument, implausible argument, conclusive argument, inconclusive argument, fallacious argument, erroneous argument, simple argument, complicated argument, straightforward argument, subtle argument, tricky argument, inductive argument, deductive argument, logical argument, illogical argument, absurd argument, specious argument, flawed argument, honest argument, dishonest argument, sincere argument, deceptive argument, stupid argument, silly argument, spurious argument
- kolokace, varianta bez opakování lemmatu
- good, bad, valid, invalid, correct, incorrect, right, wrong, sound, unsound, strong, weak, convincing, unconvincing, plausible, implausible, conclusive, inconclusive, fallacious, erroneous, simple, complicated, straightforward, subtle, tricky, inductive, deductive, logical, illogical, absurd, specious, flawed, honest, dishonest, sincere, deceptive, stupid, silly, spurious
- kolokace, varianta s lemmatem zkratkou ~
- good ~, bad ~, valid ~, invalid ~, correct ~, incorrect ~, right ~, wrong ~, sound ~, unsound ~, strong ~, weak ~, convincing ~, unconvincing ~, plausible ~, implausible ~, conclusive ~, inconclusive ~, fallacious ~, erroneous ~, simple ~, complicated ~, straightforward ~, subtle ~, tricky ~, inductive ~, deductive ~, logical ~, illogical ~, absurd ~, specious ~, flawed ~, honest ~, dishonest ~, sincere ~, deceptive ~, stupid ~, silly ~, spurious ~
- kolokace, varianta s lemmatem zkratkou a.
- good a., bad a., valid a., invalid a., correct a., incorrect a., right a., wrong a., sound a., unsound a., strong a., weak a., convincing a., unconvincing a., plausible a., implausible a., conclusive a., inconclusive a., fallacious a., erroneous a., simple a., complicated a., straightforward a., subtle a., tricky a., inductive a., deductive a., logical a., illogical a., absurd a., specious a., flawed a., honest a., dishonest a., sincere a., deceptive a., stupid a., silly a., spurious a.
- kolokace, varianta s lemmatem u jediné položky, zde poslední
- good, bad, valid, invalid, correct, incorrect, right, wrong, sound, unsound, strong, weak, convincing, unconvincing, plausible, implausible, conclusive, inconclusive, fallacious, erroneous, simple, complicated, straightforward, subtle, tricky, inductive, deductive, logical, illogical, absurd, specious, flawed, honest, dishonest, sincere, deceptive, stupid, silly, spurious argument
- kolokace
- ostře
- kolokace
- ostře nesouhlasit, ostře odmítnout, ostře odsoudit, ostře kritizovat, ostře protestovat, ostře se podívat, ostře kontrastovat, ostře řezané rysy
- kolokace, varianta s lemmatem zkratkou ~
- ~ nesouhlasit, ~ odmítnout, ~ odsoudit, ~ kritizovat, ~ protestovat, ~ se podívat, ~ kontrastovat, ~ řezané rysy
- kolokace
Příkladová hesla v en wikt
editovat- en:argument
- Jeden z největších přispěvatelů do en wikt, byť jakýsi rarášek ovládající mnoho účtů, mě za kolokace v en wikt pochválil: "Hey, Wonderfool here. I just realised it was you who was adding loads of collocations to our English entries. All of them that I've seen are great! I've been changing some to fit them under a Collocations heading, like in this edit. It has the advantage that it gets categorized in Category:English terms with collocations. Perhaps you'd like to use this in future (if you ever actually return, that is. And if you do, consider getting a new username)."
- en:Category:English terms with collocations je zahlcená kolokacemi, které nejsou formátované jako oddělený seznam kolokací nýbrž jako fragmenty příkladů použití přímo pod hesly.
- Najít opravdové seznamy kolokací v en wikt lze takto: en:Special:Search/insource:/==Coll/, což 14. května 2023 dává 495 stránek; nebo skrze užití šablony "co-top".
Příkladová hesla v de wikt
editovat{{Charakteristische Wortkombinationen}} :[1] ''kočka'' [[mňoukat|mňouká]] — die ''Katze'' [[miauen|miaut]], ''kočka'' [[škrábat|škrábe]] — die ''Katze'' [[kratzen|kratzt]], ''kočka'' [[příst|přede]] — die ''Katze'' [[schnurren|schnurrt]]
{{Charakteristische Wortkombinationen}} :[1] [[denní]] ''motýl'' – [[Tagfalter]]; [[noční]] ''motýl'' — [[Nachtfalter]] :[1] [[síťka]] na ''motýly'' — [[Schmetterlingsnetz]]; [[sbírka]] ''motýlů – [[Schmetterlingssammlung]] :[1] [[chytat]] ''motýly'' — ''Schmetterlinge'' [[fangen]]
- de:Mensch
- Charakteristische Wortkombinationen:
- "guter, schlechter, böser, gebildeter, jeder halbwegs vernünftige, dummer, junger, alter, neuer, armer, edler Mensch"
- Charakteristische Wortkombinationen:
Příkladová hesla v pl wikt
editovat- pl:shameless
- collocations:
- (1.1) shameless person / woman / man / thing / hussy / creature • shameless way / behavior / exploitation / display • shameless flirt / words / lies / plug • shameless advantage
- collocations:
Kolokace v českých slovnících
editovatČeské definiční/výkladové slovníky v řadě hesel uvádějí několik kolokací, byť jim tak neříkají. Subjektivně, je to prima, byť někdy hledání v Google Books ukáže, že daná kolokace je k nalezení v užití zřídka či vůbec.
ASSČ:
- ASSČ má v heslech někdy příkladové věty a někdy něco jako kolokace.
- Např. v hesle "bránit" má ASSČ mj. bránit hranice / území, bránit čest rodiny, a bránit své zájmy.
- Např. v hesle "činit" má činit rozhodnutí / opatření, činit pokání, činit si nárok, činit výčitky a činit si výčitky.
ASCS:
- Např. v hesle "proces" má ASCS[1] coby první význam: "1. zákonité, postupně na sebe navazující a vnitřně vzájemně spojené změny jevů, věcí a systémů: historický, společenský p. vývoj; tvůrčí p.; výrobní p. postup; chemický p. pochod, reakce; kyb. matematický model v čase se vyvíjející náhodné veličiny ". Vede tedy kolokace historický proces, společenský porces, tvůrčí proces, výrobní proces, a chemický proces.
IJP:
- Např. v hesle "komunikativní" má IJP uvedeny kolokace "komunikativní člověk" a "komunikativní formát" jako příklady.
SSJČ:
- Např. v hesle "příkrý" má SSJČ[2] tyto kolokace: "3. prudký 4, 5, silný; náhlý 1, nenadálý: p. rozpor, nesoulad; p-é nerovnosti majetkové (R. právo); názory jsou v p-ém protikladu; - p. vzestup teploty; p. postup (na město) (Vach.)". Tedy jsou tam kolokace příkrý rozpor, příkrý nesouhlad, příkré nerovnosti majetkové, aj.
- Např. v hesle "letitý" má SSJČ[3] toto: "l. muž; l-á žena, lípa, stavba; l-á zkušenost; l-é přátelství".
SSČ:
- Např. v hesle "příkře" má SSČ[4] tyto kolokace: "příkře klesající; — jednat příkře; — příkře kontrastovat;".
Lingea SSČ 2018:
- Např. v hesle "pitvorný": pitvorný trpaslík/skřet/šašek; pitvorná grimasa; pitvorná karikatura.
- Např. v hesle "strojový"[5] má celou řadu kolokací coby příkladů pod definicemi: 5 + 3 + 5 kolokací; další kolokace jsou dole na stránce modrým písmem.
- Např. v hesle "nacionální"[6]: nacionální uvědomění/rozdíly/hesla/vášně; nacionální zájmy/soužití; nacionální opozice
Kolokace v nečeských slovnících
editovatDWDS:
- heimlich
- "als Adjektivattribut: ein heimlicher Liebhaber, Plan, Traum, Vaterschaftstest, Wunsch; eine heimliche Hoffnung, Liebe, Sehnsucht"
- "als Adverbialbestimmung: heimlich heiraten, rauchen; jmdn., etw. heimlich beobachten, filmen, fotografieren, schmuggeln; heimlich wegschleichen, verschwinden"
Kolokace vs. příklady
editovat- Velká kompaktnost kolokací: Formátovat kolokace jako příklady bude obecně zabírat příliš mnoho místa, pokud každá kolokace bude mít svůj příklad a tedy bude na novém řádku. Odrážkové kolokace v dedikovaném oddílu/sekci lze formátovat vícesloupcově a čárkami oddělené kolokace jsou vůbec velmi kompaktní. Kolokace tak umožňují dát velmi kompaktní agregovaný obraz o nejčastějších ale i méně častých vazbách, čítající třeba až 40 položek; navíc směřují pozornost k vazbám a pryč od částí příkladu, které nejsou tolik hodnotné/sdělné.
- Reprezentativnost kolokací: příklad si nečiní nárok být reprezentativní ohledně frekvence případné kolokace či vazby v něm obsažené; kolokace jsou oproti tomu filtrované dle frekvence: ne každá byť jen jednou se vyskytnuvší kolokace se má v seznamu objevit.
- Celé věty v příkladech: Příklady použití obvykle ukazují celé věty, často s trasováním do citovaného zdroje.
- Menší pracnost na položku: kolokace se netrasují do zdrojů výskytu, díky čemuž je násobně méně pracné je zadat když jde o psaní na klávesnici.
- Menší obava o vkusnost výběru: u příkladu z literatury je k řešení otázka, zda je příklad jeden z nejvhodnějších, nejvkusnějších, nezastaralých apod. U kolokace je hlavní otázka po její frekvenci či obvyklosti.
Metoda zavádění
editovat- Zamyslet se, zanalyzovat a začít vkládat. Žádný velký proces; žádné velké koncepce, kromě této stránky.
- Když to budou chtít lidé dělat jinak, lze předělat.
- Když se to znelíbí, může se to zcela odmazat poměrně přímočaře, i botem.
- Když začne jeden vkládat, druzí se možná přidají, a získají dojem, o co jde, a zda se jim to líbí. Empiricismus, ne spekulacionismus; postupně získaná zkušenost, nikoli jen pohled do vlastní hlavy před získáním zkušenosti a abstraktní, na zkušenosti nezaložená argumentace.
Naléhavost odstraňování
editovat- Nechme přece ty vkládané kolokace chvíli na pokoji. Když se nebudou líbit, je poměrně přímočaré je hromadně odstranit.
Můj vztah ke kolokacím
editovat- Kolokace jsem do en wikt začal zadávat před mnoha lety.
- Příklad: Adjectives often used with "knowledge": extensive, deep, superficial, theoretical, practical, useful, working, encyclopedic, public, private, scientific, tacit, explicit, general, specialized, special, broad, declarative, procedural, innate, etc.
- Zdá se, že se za ty dlouhé roky nikdo nepřidal, nebo jenom málokdo.
- Mám kolokace moc rád. Fascinují mě ony čtyři anglické kolokační slovníky výše. Ale je to taková nevděčná piplačka. Málokdo bude obdivovat přidavače kolokací za intelektuální výkon či sémantickou zdatnost. Proč taky; s trochou pečlivosti může kolokace přidávat každý rodilý mluvčí a někdy i nerodilý, když k danému jazyku existuje dobrý nástroj jako Google Ngram Viewer.
Příklady hesel
editovatHeslo argument:
Čeština, formátovaná odrážkově:
- planý argument
- pádný argument
- chybný argument
- chabý argument
- slabý argument
- silný argument
- ubohý argument
Tento seznam je spíše slabší pro svoji krátkost, ale lepší než nic.
Angličtina:
- good argument, bad argument, valid argument, invalid argument, correct argument, incorrect argument, right argument, wrong argument, sound argument, unsound argument, strong argument, weak argument, convincing argument, unconvincing argument, plausible argument, implausible argument, conclusive argument, inconclusive argument, fallacious argument, erroneous argument, simple argument, complicated argument, straightforward argument, subtle argument, tricky argument, inductive argument, deductive argument, logical argument, illogical argument, absurd argument, specious argument, flawed argument, honest argument, dishonest argument, sincere argument, deceptive argument, stupid argument, silly argument, spurious argument
Ten seznam pro angličtinu byl natolik dlouhý, že jsem si netroufl ho formátovat odrážkově, dokud nebude rozchozena vícesloupcová sazba.
Prolinkovat adjektiva mi přijde dobré, ale nechtělo se mi s tím piplat.
Další hesla vedoucí oddíl kolokace: problém.
ČNK
editovatČNK má něco jako strojově určené kolokace, ukázané jako oddíl např. pro heslo pejsek nebo pobuřující. Nahodilé shlédnutí však ukazuje, že výsledek je spíše nezajímavý či nepoužitelný. O to více mají hodnotu člověkem ručně vybrané kolokace.
Hesla vedoucí kolokace
editovatVyhledávání insource:/== kolokace/.
- Stav k 6. červenci 2023: argument, problém, kvalita, nápad, držitel, vlídný, hrubě, problem, grave, analysis, pustý, nestoudný, ostře, rule, závadný, nonsense, despicable, demagogie, irony, nepodložený, shameless, tahanice, změnový, duševně, pekelně, záštiplný, blatant, dlužno, objective, precedentní, hnusně, návrhový, pohoršující, untrue, pobuřující, falsely, strojově, do nebe volající, argumentace, nepřesvědčivý, do očí bijící, nepravdivý, glaring, neslušný, obrazně, overriding, způsobilý, shoddy, výstřih, тщательный, galantně, seriózně, defektní, flagrantní, objectionable, způsobilost, pied de nez, příkře, kolosální, nedbalostní
- Stav k 22. června 2024 (152 hesel): problém, kvalita, morální, naléhavý, nápad, argument, držitel, vlídný, drzost, hrubě, sentence, problem, position, grave, pohledávka, analysis, pustý, nestoudný, ostře, rule, impression, behavior, závadný, despicable, powerful, nonsense, statement, ženština, analogue, demagogie, adopt, pejorativní, orgie, defect, flawed, valid, irony, nepodložený, onus, lamentable, scestný, unfortunate, patently, shameless, pampeliškový, insoluble, ideology, kolosální, pekelně, objectionable, Fehleinschätzung, do nebe volající, neslušný, teoretizování, malicious, protistátní, miraculous, misrepresentation, contrast, z trošku jiného soudku, тщательный, způsobilost, nepřesvědčivý, pohoršující, truthful, duševně, záštiplný, do očí bijící, parádní, tussenoorlogs, příkře, pied de nez, crackpot, baseless, seriózně, návrhový, blunt, náruživý, overt, pobuřující, flagrantní, plakat nad rozlitým mlékem, Kauderwelsch, predicate, nebetyčný, výstřih, pustě, blatant, mismanagement, hurdle, tahanice, argumentace, faulty, untruth, zlotřilý, unintuitive, zhovadilý, unhelpful, gigantic, způsobilý, ridiculously, velkoústý, hořekovat, glaring, overriding, veracity, Itävalta-Unkari, neetický, velkopanský, zpacifikovat, blatantly, combative, nepravdivý, nonsensical, bias, untrue, kalamita, insurmountable, mindless, colossal, zadawać, precedentní, normative, nedbalostní, změnový, prolhaný, defektní, grossly, hnusně, unsubstantiated, galantně, shoddy, mendacious, relentless, obrazně, strojově, substantiate, falsely, dlužno, velkohubý, deemed, Ptolemaic, objective, rozum brát, unpalatable, approximation, counterintuitive, glaringly, neúcta, prásknout, zhasnout, upírat.
- Další jednotlivě: křehký, inkriminující, nejapný, vydržovaný.
Kolokace od Pyprilescu: v heslech pohledávka (zde) náruživý, neúcta, do očí bijící, plakat nad rozlitým mlékem, Itävalta-Unkari, тщательный, tussenoorlogs a Kauderwelsch (břez. 2024). Dále snůška, uštědřit, dojem, vydržovaný a puberťák.
Odkazy
editovat- en:User:Dan Polansky/Collocation -- mé koncepční poznámky ke kolokacím pro en wikt
- en:Wiktionary:Votes/pl-2022-02/Adding Collocations -- hlasování, jež kolokace kodifikovalo a zavedlo pro ně normované formátování
- en:Wiktionary:Reference templates -- jmenuje kolokační šablony
- en:Wiktionary:Beer parlour/2022/November#Replacing bare lists of adjectives & nouns in usage notes -- lidé, kteří chtějí opakování lemmatu: Theknightwho, Fytcha, MuDavid; argumentuji, že formát s opakovaným lemmatem je o moc horší
- Wikiversity:en: Should Wiktionary have entry sections for collocations? -- analýza argumentů pro a proti ve formátu Wikidebaty