Uživatel:Shlomo/Na slovíčko/na kus řeči

Tato stránka slouží ke komunitní diskusi o jazycích a obecných jazykovědných a lexikografických tématech

Další tématické podstránky editovat

Na slovíčko
všeobecná nebo nezařaditelná témata, oznámení
Na slovíčko o pravidlech
návrhy, tvorba, a aplikace pravidel, debata o obvyklých a vhodných postupech
Na slovíčko o technice
technické dotazy, problémy a požadavky
Na kus řeči
obecná lexikologická a lingvistická témata
Na slovíčko o lidech
prevence hrozících a urovnávání vzniklých konfliktů a řešení jiných problémů s uživateli
Na slovíčko o slovíčku
diskuse o ověření, smazání nebo obnovení hesla

Guernseyština a jerseyština editovat

Předkládám k diskusi jeden problém a sice guernseyštinu a jerseyštinu - hlavně, co se týká překladových šablon - co totiž s nimi, neboť jsem nenašel jejich jazykový kód. Nabízí se několik řešení:

  • podle některých jazykovědců se jedná o dialekty normanského jazyka, tudíž zavést jazykový kód nrm s tím, že by přístup mohl podobný jako k uvádění srbských překladů v latince a v cyrilici,
  • podle jiných jazykovědců je možné je považovat za dialekty francouzštiny (ostatně, oba používají francouzský pravopis), takže je přiřazovat k francouzským překladům, s poznámkou, že se jedná o guernseyštinu resp. jerseyštinu,
  • vytvořit pro ně speciální jazykové kódy,
  • slova z těchto jazyků neuvádět - řešení sice nejjednodušší, ale podle mě nejméně vhodné.

Jenom podotýkám, že třeba na anglickém wikislovníku slova v těchto jazycích mezi překlady mají. --Standazx (diskuse) 28. 12. 2014, 09:06 (UTC)

Aniž bych predikoval, kterou z ostatních tří cest se vybrat, tak v žádném případě to nepůjde tou třetí, neboť jazykové kódy jsou definovány normou.
Danny B. ( diskusemail přehled příspěvků ) 11. 1. 2015, 01:15 (UTC)
Tak ani tou první se nepůjde vydat, neboť jednak nrm je ISO kód pro naromštinu (můj pokus o překlad "Narom language"), jednak žádný ISO kód pro normanský jazyk neexistuje.
Danny B. ( diskusemail přehled příspěvků ) 11. 1. 2015, 02:19 (UTC)
Podle enwikt i hrwikt je Guernseyština roa-grn
Jerseyština dle en, hr, lt i nds je roa-jer
Ostatně, již delší dobu uvažuji o obnovení Šablona:Jazyková kategorie, kde by se kód uváděl, aby se zmenšila možnost záměny dvou (názvem) podobných jazyků (nejen v češtině) (skotština/skotská gaelština; litevština/lotyština, čeština/čečenština...) JAn Dudík (diskuse) 12. 1. 2015, 08:00 (UTC)
Já jsem jednoznačně pro. --Palu (diskuse) 12. 1. 2015, 08:22 (UTC)
To ale nejsou normované kódy, na nichž tu stojí celý systém, nýbrž umělé konstrukty wikikomunity. Každopádně od včerejška je v platnosti kód nrf pro jerseyštinu i guernseyštinu zároveň, neb to jsou oba dialekty pocházející ze staré normanské francouzštiny.
Danny B. ( diskusemail přehled příspěvků ) 12. 1. 2015, 23:56 (UTC)

Lužické srbštiny editovat

Máme zde dvě kategorie o podobných jazycích s různým jménem:

Soudím, že by se měly názvy sjednotit. Jaká je podle vás vhodnější varianta?

  1. Kategorie:Dolnolužičtina‎ a Kategorie:Hornolužičtina‎
    • nebo
  2. Kategorie:Dolnolužická srbština‎ a Kategorie:Hornolužická srbština‎

? JAn Dudík (diskuse) 8. 1. 2015, 22:06 (UTC)

Na Wikipedii se používají delší názvy a Modul:Languages (který je vytvořen na základě normativních názvů jazyků a od nějž se tu mají všechny příslušné věci odvíjet) je má rovněž, takže myslím, že je to jasné...
Danny B. ( diskusemail přehled příspěvků ) 8. 1. 2015, 22:18 (UTC)

Pomnožnost a podvojnost editovat

Prosím o pomoc s terminologickým problémem: Jak označovat slova, která se vyskytují pouze v dvojném čísle. Napadlo mě použít označení "podvojné" jako analogie k "pomnožné", nicméně není mi známo, že by se v češtině tento termín v tomto významu vyskytoval. Což může být způsobeno tím, že v češtině se nevyskytuje ani tento gramatický jev a učebnice jazyků, kde se vyskytuje (co vím tak he, ar) nejdou do takové terminologické hloubky.--Shlomo (diskuse) 13. 1. 2015, 11:28 (UTC)

Slovo odpovídá slovotvorbě, viz toto (bohužel pro slovenštinu, ale analogické s češtinou). Bod III, 3: "nachádzajúci sa, vyskytujúci sa, dejúci sa na mieste označenom základom, charakteristický pre isté prostredie", čili dějící se na něčem dvojném, tedy podle definice slova dvojný taktéž v duálu.
Podle mě je tak tohle slovo vhodné přesto, že není konkrétně doloženo v tomto konkrétním kontextu slovníkem. Jsem zastáncem toho, že je-li slovo utvořeno korektně podle pravidel slovotvorby, je korektní - nezávisle na doložení ve slovníku. Alternativu pro tento kontext neznám. --Palu (diskuse) 13. 1. 2015, 12:20 (UTC)
Alternativa je rozepsat to na "pouze ve dvojném čísle", resp. "pouze v duálu". Je to možné, ale moc se mi to nelíbí.--Shlomo (diskuse) 13. 1. 2015, 12:24 (UTC)
Podle (staré) Mluvnice hebrejštiny a aramejštiny (autoři dr. Otakar Klíma, dr. Stanislav Segert, Nakladatelství Československé akademie věd, Praha, 1956, str. 81) jsou jména vyskytující se jen v duále, jako třeba מאֹזְנַיִם nebo מֶלְקָחַיִם, zvána dualia tantum. --Lexiq (diskuse) 13. 1. 2015, 18:51 (UTC)
Souhlasím s Lexiq|Lexiqem a navrhuji dualia. --Kusurija (diskuse) 20. 1. 2015, 19:11 (UTC)

Vždy mne zaujme, když se tu někteří, nemajíce zcela zjevně ani zbla ponětí o příslušné věci, musejí za každou cenu "sofistikovaně" vyjádřit, ba co víc, přispěchat s nějakým novem, případně rádoby (definitivním) řešením, tváříce se přitom, že strkají do kapsy celou lingvistickou obec...

Správný lingvistický termín je duale tantum (pl. dualia tantum), což znamená "pouze (po)dvojné". Duale samo o sobě je v češtině označováno "duál", "číslo dvojné", ale i "číslo podvojné", tedy není možné to použít pro zmiňovaný účel. "Čistě český" termín ekvivalentní k jednotné, množné, pomnožné, hromadné, (po)dvojné neexistuje.

Čímž opět narážíme na fakt, kvůli němuž jsem tu několikrát - avšak neúspěšně - navrhoval používat důsledně latinskou terminologii, resp. její "počeštěné" tvary (tj. např. plurál namísto plurale, duál namísto duale ap.), a totiž to, že ne všechny termíny mají "čistě český" ekvivalent. Pro příklad netřeba chodit daleko: narazí se zcela stejně u slov, která mají tvar pouze jednotného čísla (tj. singulare tantum) a přitom nejsou hromadná (tj. kolektiva) - pro ně rovněž není "čistě české" označení.

Danny B. ( diskusemail přehled příspěvků ) 21. 1. 2015, 00:46 (UTC)

Ex-post poznámka ke shrnutí tohoto příspěvku: Omlouvám se, omylem mi tam zůstalo původní shrnutí podle toho, jak jsem původně reagoval zvlášť na první a poslední příspěvek této diskuse. Nakonec jsem se po jejím opětovném přečtení rozhodl reagovat souhrnně na vše výše uvedené, takže to shrnutí neodpovídá.
Danny B. ( diskusemail přehled příspěvků ) 21. 1. 2015, 08:27 (UTC)

Názvy jazyků editovat

Nedostalo se mi odpovědi na mé otázky, resp. námitky v diskuzi u modulu Languages, proto bych se chtěl obrátit na „širší veřejnost” (pokud zde není na tuto diskuzi správné místo, prosím přesunout jinam).

Zjistil jsem následující rozpory mezi CLDR (ve verzi 27β) a „modulem Languages”:

kód Wikislovník CLDR
alt jižní altajština altajština (jižní)
ang stará angličtina staroangličtina
as asámština ásámština
azb jižní ázerbájdžánština ázerbájdžánština (jižní)
bjn bandžárština bandžarština
ckb středokurdština kurdština (sorání)
crh krymská tatarština turečtina (krymská)
dv divehi (maledivština) maledivština
frr severofríština fríština (severní)
fur furlandština furlanština
gmh střední horní němčina hornoněmčina (středověká)
gsw švýcarská němčina němčina (Švýcarsko)
guz gusiština gusii
izh ižorština ingrijština
kea kapverdská kreolština kapverdština
lg lugandština gandština
mdf mokša mokšanština
myv erzja erzjanština
nso severní sotština sotština (severní)
nv navaho navažština
ny čičevština ňandžština
om oromo oromština
pa pandžábština paňdžábština
pam pampangau papangau
pap papiamentština papiamento
pms piemontština piemonština
ps paštunština paštština
rap rapanuiština rapanujština
rw rwandština kiňarwandština
sc sardinština sardština
se severní sámština sámština (severní)
sli slezská němčina němčina (slezská)
su sundánština sundština
tl tagalština tagalog
tog malavská tongština tonžština (nyasa)
tum tumbučtina tumbukština
twi ťwiština twi

Je opravdu nutné lpět na označování „židovské španělštiny” jako „ladinštiny” jen kvůli chybě v CLDR, když jiných odlišností oproti „normativnímu” seznamu je velmi mnoho (jak doloženo výše)?

Vedle toho, tyto jazyky jsou v modulu vícekrát:

  • ee (eweština), ewe (eweština)
  • lad (ladinština), lld (ladinština)

a některé názvy dle dle Wikipedie označují tentýž jazyk:

Další pochybnosti mám ohledně některých názvů, které jsou dle Googlu používány jen na Wikislovníku:

kód jazyk
ckb středokurdština
dgd dagaari dioulou
guz gusisština

Tyto jazyky jsou v modulu a nejsou v CLDR:

kód jazyk
abe abenakština
als alsaština
atv severní altajština
bcl bikolanština
dgd dagaari dioulou
fkv kvenština
hat haitská kreolština
hnd hidko
jpa židovská palestinská aramejština
kim tofalarština
kjh chakaština
lbe lakština
mrh mara
mww bíla hmongština
nah aztéčtina
nij ngadžuština
pnb paňdžábština (shahmukhi)
pox polabština
rmy vlašská romština
sgd surigaononština
src lugudorská sardinština
sro sardinština
tmr židovská babylonská aramejština
wah watubela
wym vilamovština

V modulu obsažené „mrtvé” jazyky:

kód jazyk
ang stará angličtina / staroangličtina
cu staroslověnština
gmh střední horní němčina / hornoněmčina (středověká)
got gótština
grc starořečtina
hit chetitština
jpa židovská palestinská aramejština
la latina
pox polabština
prg pruština
sa sanskrt (zařazení sporné)
sux sumerština
syr syrština
tmr židovská babylonská aramejština

Proč není možné přidat akkadštinu? --Lexiq (diskuse) 25. 1. 2015, 22:59 (UTC)

Díky, že jste mi ušetřil půl námahy. Polovinu této revize jsem měl už hotovu, tak tu jste si zase mohl ušetřit vy, kdybyste se třeba zeptal... Jinak odpovědi se vám doposud nedostalo právě kvůli této revizi a dalším rešerším.

Vezmu to popořádku:

  1. Ad nesrovanalost s CLDR: Pominu-li fakt, že používáte beta verzi, tedy ještě nevydanou, a tudíž nesměrodatnou, je třeba si uvědomit, kdy seznam vznikal a že od té doby ke dnešku bylo několik aktualizací. Je fakt, že to po těch aktualizacích už nikdo neaktualizoval tady, takže je skvělé, že jste to takhle sepsal, aspoň se to bude moci zaktualizovat. I když, vlastně nevím, protože jste použil betu a regulérní vydaná verze se může lišit. No, budeme doufat, že ne o tolik.
  2. Ad jazyky vícekrát:
    • ee ≡ ewe (ISO 639-1 vs. ISO 639-3; po kontrole a případné opravě výskytů ponecháme jen první)
    • lad ≠ lld Dva rozdílné jazyky (zde již několikráte omílaná známá chyba v českém překladu CLDR)
    • ht ≡ hat (ISO 639-1 vs. ISO 639-3; po kontrole a případné opravě výskytů ponecháme jen první)
    • ast ≠ mwl Dva rozdílné jazyky (Wikipedie není věrohodný zdroj)
  3. Ad názvy nejsoucí v CLDR: Dokud tam nejsou, tak není žádná kolize. Až tam budou, případně se upraví. Standardní řešení jako kdekoliv jinde. Naprosto souhlasím, že některé ty překlady jsou značně podivné, ale to je třeba se obrátit na jejich vkladatele sem (připomínám, že před vznikem modulu tu bylo mnoho samostatných šablon, takže při jeho založení se posbírala a pročistila data z nich), odkud čerpali. (Zpravidla u většiny těchto jazyků narazíte na tutéž osobu, můžete si tipnout, kterou...)
  4. Ad mrtvé jazyky: Z výše uvedených má klasifikaci mrtvého (přesněji vymřelého) pouze polabština (je tam od počátku zjevně kvůli přehlédnutí) a židovská babylonská aramejština (přidal jsem, když bylo potřeba narychlo upřesnit aramejská slova, s jejichž vkládáním přišel Shlomo). Syrština je klasifikována jako živý(!) makrojazyk, ostatní jazyky jsou klasifikovány buď jako historické nebo starověké. Nikdo neříká, že tam akkadštinu (klasifikovánu jako starověký jazyk) přidat nejde, chtěl jsem k tomu pouze vyjádření od jiných uživatelů, protože co si pamatuji, tak většinou byly jazyky s klasifikací historické či starověké diskutovány a mj. byl i argument, že pakliže nemůže v daném jazyce vzniknout Wikipedie (potažmo další projekty, částečnou výjimkou jsou ze své podstaty Wikizdroje), nebudeme zde takový jazyk používat.

Už jak se objevila diskuse u modulu, začal jsem dělat na nástroji pro automatické zpracování CLDR a též pro umožnění transparentního lokálního doplnění příslušných dat. Tedy, přesněji jsem k tomu začal dělat koncept už dříve, a to v okamžiku, kdy se ukázalo, že není vhodné vázat směr sazby přímo na samotný jazyk.

Jinak si stále stojím za tím, že jestliže MediaWiki, majíc data z CLDR, vrací pro lad ladinština, je třeba to ponechat do té doby, než to bude v CLDR opraveno a následně převzeto do MediaWiki. Uvědomte si, prosím, že český Wikislovník není zdaleka jediným projektem běžícím na MediaWiki, a to nejen v rámci projektů Wikimedia, ale i obecně.

Danny B. ( diskusemail přehled příspěvků ) 26. 1. 2015, 00:44 (UTC)

Dvě věci mi na tom nejsou moc jasné:
  1. Jestliže musíme mít data shodná s CLDR a CLDR je zapracováno do softwaru MediaWiki, k čemu potřebujeme ručně udržovaný seznam, který tyto data kopíruje a při každé aktualizaci se musí zkontrolovat a opravit? Nebylo by lepší místo toho použít přímo příslušnou funkci parseru?
  2. Pokud je přípustné lokálně doplnit názvy jazyků, které v "normativním" (?) seznamu nejsou, do doby, než tam budou, proč je nepřípustné lokálně přepsat názvy jazyků, které jsou v "normativním" seznamu evidentně chybně, do doby, než tam budou opraveny? Jaké konkrétní technické či praktické potíže by taková odchylka způsobila? - Potíže, které může způsobit výskyt dvou "ladinštin" v seznamu je nasnadě: v kategorii Kategorie:Údržba:Deminimalizovat/ladinština se nám budou míchat hesla ze dvou nesouvisejících jazyků, v sekci "překlady" nebude čtenář tušit, do které "ladinštiny" se vlastně překladá (zvlášť pokud se mu nezobrazuje ani kód jazyka).--Shlomo (diskuse) 26. 1. 2015, 01:27 (UTC)
Jak jste vpisoval dovnitř textu, tak jsem to přehlédl, takže reaguji až teď...
Na první otázku si sám odpovídáte tou druhou. Osobně bych byl také raději, kdyby vše bylo vestavěno v MW, ale není, a vzhledem k tomu, že tu jsou ty jazyky používány, tak se používá příslušný modul (který navíc obsahuje i další informace, které v MW vestavěny nejsou). O doplňování jsem psal výše. Potíže to způsobí právě při použití vestavěné parser funkce a zároveň modulu. Dvě ladinštiny jsou zatím vaše pouhá hypotetická úvaha, neboť z lld tu nemáme ani heslo, ani překlady. A do doby, než tu (pokud kdy vůbec) něco z toho vznikne(*), bude jistě CLDR již patřičně opraveno - jak už jsem vám psal na jiném místě: Pokud se vám některá jména v CLDR nelíbí, nebo je tam postrádáte, dejte (mi) podnět k úpravě a já ji tam v květnu zanesu. Beta by mohla vyjít tak v červenci či srpnu, v polovině září pak finální verze.
A pro jistotu ještě jednou opakuji to, co už jsem také psal jinde: Já proti změně jako takové nic nemám, důvody pro ni jsou zřejmé. (A jak píši výše, přispějte klidně dalšími.) Ale je třeba ji dělat správně, tj. u zdroje. Pokud se věci dělají správně, lze dosáhnout spousty zajímavých důsledků - nejtypičtěji zjednodušování práce, možnosti rozdílných zobrazení dle vůle uživatele, či zjednodušení údržby.
Danny B. ( diskusemail přehled příspěvků ) 6. 2. 2015, 00:20 (UTC)
  • Na první otázku si neodpovídám druhou. První otázka je "Proč používáme kšandy i pásek, když by stačilo jedno?" a druhá otázka je "Jsou vadné kšandy důvodem k tomu, abychom si k nim brali i vadný pásek?". Nešlo by to třeba vyřešit tak, že modul bude ve formě "ručního" seznamu obsahovat pouze "opravy a doplňky" oproti CLDR/parseru a v ostatních případech bude volat parserovou funkci? A až bude CLDR opraveno/doplněno, tak se příslušný záznam z "ručního" seznamu ručně odmaže?
  • A používá se fakticky někde vestavěná parserová funkce a zároveň modul? Nebo je to také jen hypotetická úvaha?
  • Na žádnou další zásadní chybu krom "ladinštiny" jsem v CLDR zatím nenarazil, ale procházel jsem ho jen zběžně a taky neznám všechny jazyky. Jen jsem si všiml v překladech "nedodělků" typu "fr-CA" jakožto český název pro "Canadian French", ale to určitě vidíte sám. Pokud se pokusíte zařídit opravu ladina, budu rád a budu Vám držet palce.--Shlomo (diskuse) 6. 2. 2015, 08:52 (UTC)
(*) Aktualizace: Tak vzhledem k posledním editacím jednoho opakovaně blokovaného, opakovaně a masivně loutkařícího, opakovaně provokujícího, opakovaně urážejícího, a tudíž obecně soustavně wikietiketu porušujícího uživatele už to futurum neplatí. Konstruktivnost tohoto kroku - provedeného pouhou hodinu poté, co jsem to sem psal, a směřujícího nyní k vámi zmiňovaným potížím - pro další vývoj jak této diskuse, tak dalších prací, a jeho vliv na zdejší bohužel již tak napjaté ovzduší nechť si uváží každý sám...
Danny B. ( diskusemail přehled příspěvků ) 6. 2. 2015, 02:05 (UTC)
Nemohu si pomoci, ale mám dojem, že jste si o vytvoření tohoto hesla svým předchozím příspěvkem tak trochu řekl. Jak jste očekával, že zmíněný uživatel zareaguje, když se vyjádříte ve smyslu "to, že vám chybný název lad vadí, je pro mě irelevantní a dokud tu nebude heslo v lld, tak se tím zabývat nehodlám"?--Shlomo (diskuse) 6. 2. 2015, 08:52 (UTC)

Ještě k neživým (= historickým, starověkým a vymřelým) jazykům (syrština ponechána, když už byla zmíněna) - myslím, že aktuální počty překladů hovoří samy za sebe, a pokud se u nich (s výjimkou latiny) vyžádá zdroj, tak nepochybuji, že budou konvergovat k nule:

ang 40
cu 102
gmh 8
got 3
grc 75
hit 1
jpa 0
la 2 207
pox 1
prg 4
sa 19
sux 1
syr 12
tmr 21

Danny B. ( diskusemail přehled příspěvků ) 26. 1. 2015, 00:59 (UTC)

Co se týče syrštiny a aramejštiny, jsem myslím schopen s dozdrojováním účinně pomoci.--Shlomo (diskuse) 26. 1. 2015, 01:27 (UTC)
O syrštinu přeci vůbec nešlo. Ale k aramejštině klidně doplňte. Díky.
Danny B. ( diskusemail přehled příspěvků ) 6. 2. 2015, 00:20 (UTC)
Zmíněna byla, tak jsem předpokládal, že i o ni šlo. Každopádně ozdrojování jim také neuškodí ;) Na aramejštinu příležitostně kouknu, konečně jsem dovybalil knihy po stěhování, tak to půjde o něco líp; chcete-li něco ověřit přednostně, neváhejte to označit šablonou (pokud mohu prosit, tak šablonou {{Doplňte zdroj}}, ne {{Ověřit}}).

Ty duplicity ISO 639-1 vs. ISO 639-3 jsem již srovnal.

Danny B. ( diskusemail přehled příspěvků ) 26. 1. 2015, 01:04 (UTC)

Díky za odpověď a za první „zásah”. Co se týče pojmu „mrtvý jazyk”, vycházel jsem z definice „nemající rodilé mluvčí”. Za syrštinu, v CLDR „Syriac”, je na anglické Wikipedii považován dialekt „Middle Aramaic”, který vyšel z užívání ve středověku. Nikoli dnešní dialekty.
Ohledně ladinštiny mi připadá menší zlo „neshoda s CLDR” než chybné uvádění úplně jiného jazyka. Momentálně tam je „neshod” 37 a domnívam se, že kdybych vás na ně neupozornil, byly by tam třeba ještě velmi dlouho. Takže bych neřekl, že to je věc, která „hoří”. Oproti tomu záměnu dvou jazyků by si žádný kvalitní a respektovaný slovník (nebo jazykový projekt) neměl dovolit. Je to nepřípustné. Přirovnal bych to k situaci, kdy před lety v Edenu před mezistátním fotbalovým utkáním místo litevské hymny zahráli lotyšskou... --Lexiq (diskuse) 26. 1. 2015, 03:55 (UTC)
Ad syrština: Wikipedie není věrohodný zdroj. Je třeba se přidržet ISO normy. Ad neshody: Vaše ničím nepodložené domněnky nekorelují se skutečností, neb jak jsem již výše psal, už před nějakou dobou jsem začal pracovat na nástroji pro (polo)automatické přebírání CLDR, takže by to s nejbližším vydáním bylo synchronizováno. A jak jsem už někde také psal, neshody podle všeho vznikly updaty v MW, resp. CLDR, neboť původní modul vznikl na základě dat vracených tehdy parser funkcí MW a doplněním o tehdy nevracené jazyky.
Danny B. ( diskusemail přehled příspěvků ) 6. 2. 2015, 00:37 (UTC)
Obávám se, že vaše ujištění, že na něčem "nějakou dobu pracujete" nebo že něco "bude v nejbližší době", už asi málokdo bere vážně. Tím nezpochybňuji Vaši dobrou vůli, chápu, že dnešní multitaskingový život občas přináší situace, kdy je třeba něco jiného upřednostnit. Sám s tím rovněž zápasím :( --Shlomo (diskuse) 6. 2. 2015, 08:52 (UTC)

Ještě bych podotknul, že se občas i liší název existující kategorie od CLDR. Od toho tam chci vkládat výše uvedenou šablonu, takže prosím ty, kteří k tomu ještě něco mají, aby připomínkovali. JAn Dudík (diskuse) 26. 1. 2015, 08:12 (UTC)

Ano, liší, protože kategorie jsou zakládány živelně ručně a nepoužívají ani parser funkci ani modul. Je to mj. dáno tím, že tu stále bohužel není možné využít maximální automatizaci (mající mj. za důsledek konzistenci názvů jazyků), protože tu někteří uživatelé neustále blokují kroky k jejímu zavedení potřebné. :-/
Danny B. ( diskusemail přehled příspěvků ) 6. 2. 2015, 00:25 (UTC)

A zase ta idiomatičnost editovat

A propos idiomatičnost, řešená tentokráte u hesla SICAV: Řekl bych, že celá problematika "idiomatičnosti" je ve Wikislovník:PZH popsána poněkud zmateně. "Idiomatický" nebo "idiomatičnost" označují vlastnosti nebo vztah k idiomům (takto SSJČ), tedy slovním spojením (a v tomto smyslu ji trefně popisuje Wikislovník:PZH#Idiomatičnost, i když příklad z češtiny by byl na tomto projektu vhodnější...), na druhou stranu Wikislovník:PZH#Široce užívané „termíny“ uvádí, že do Wikislovníku patří nejen idiomy, ale i víceslovné termíny, přísloví, zkratky, akronymy, iniciály, prefixy, sufixy, znaky a mj. také "slova v obvyklém významu" Na tyto kategorie kritérium idiomatičnosti (tak jak ji popisuje SSJČ nebo příklad s bank parking lot) nesedí. Ovšem Wikislovník:PZH#Obecná pravidla požadují splnění kritéria "idiomatičnosti" u všech výše uvedených "termínů". Což nedává smysl. Zkoumejme idiomatičnost u idiomů, a u ostatních typů přípustných hesel nadefinujme smysluplná kritéria, která lze splnit.--Shlomo (diskuse) 3. 9. 2014, 17:26 (UTC) [druhé vydání: 9. 2. 2015]

Kolega mi mluví z duše. Je to takový prima klacek na téměř libovolného spolueditora. On se tady, mimochodem, o něco takového pokoušel před pár měsíci (a možná že ne poprvé) kolega Aeromix. Mně jeho argumentace připadala velmi přesvědčivá. Celkové vyznění navazující diskuze ale místy působilo tak, jako by tím hlavním bylo nedat mu za pravdu. Tzn. nedat za pravdu právě jemu. (Připouštím, že nějaká demagogie by se asi našla na obou stranách sporu, nicméně já v tomto nejsem žádný arbitr.) Konstruktivního z mojí strany prozatím nic, ale chtěl jsem se přece nějak ozvat na Shlomovu poznámku naznačující, že to zde nikoho netrápí. Trápí.--Pyprilescu (diskuse) 7. 10. 2014, 12:05 (UTC)

Budeme pokračovat? --Shlomo (diskuse) 9. 2. 2015, 15:52 (UTC)

Nemám momentálně čas se tímto blíže zabývat (např. hledat literaturu), ale co si pamatuju z nahlížení do literatury loni na jaře, ten význam např. v hesle idiom nebo na Wikipedii (viz první ref) je převzat/přeložen z angličtiny, kde je idiom nahlížen úplně jinak než v češtině. Profesor Čermák řeší jen skutečné, pravé idiomy, nikoli „idiomatická slovní spojení“. To je anglicismus, pro češtinu nevhodný. Prostě v angličtině má pojem idiom jiný význam než v češtině a zde se vychází z toho anglického pojetí, což je principiálně špatně. A jestliže na tom jsou založená pravidla, protože byla mechanicky přeložena z anglického Wikislovníku někým, kdo evidentně není expert na češtinu, tak ta pravidla už principiálně musí být špatná a ty spory jsou toho jen důsledek. Je nutné upravit pravidla tak, aby vycházely z vlastností daného jazyka, nikoli z jazyka z úplně jiné skupiny. --AuvajsAuvajs (diskuse) 9. 2. 2015, 16:11 (UTC)
EDIT: význam slova idiom jsem zde opravil. Rovněž by to chtělo opravit na Wikipedii. --AuvajsAuvajs (diskuse) 9. 2. 2015, 16:33 (UTC)

Správné jméno pro ng editovat

Jan Dudík narazil na problém dvojího českého pojmenování jazyka, jehož zkratka je ng. Tedy jak správně tento jazyk pojmenovávat v češtině, jestli ndonga, nebo ndogština, nebo dokonce oshiwambo. Nepředpokládám, že by to tu někdo věděl, spíš mne zajímá, jakým způsobem určit jeho správný český název?--Juandev (diskuse) 9. 2. 2015, 16:40 (UTC)

Heh. Tady vládne Danny B. a ten ze své panovnické pozice rozhodl, že názvy jazyků jsou podle tohodle seznamu i v případě, že obsahuje chyby, viz název ladinština pro jazyk ladino. Takže v tomhle máš asi smůlu - musí to být „ndondština“. Konec diskuze. Danny B. má přeci pravdu. (A já za tenhle příspěvek nejspíš budu zablokovanej, takže se na pár dní až týdnů loučím.) --AuvajsAuvajs (diskuse) 9. 2. 2015, 16:55 (UTC)

To jsem psal již Janu Dudíkovi, že mi nepřipadá nějakej "ajťáckej" dokument pro tohle jako směrodatný. Spíše bych hledal nějaký lingvistický dokument, nebo bych se přinejhorším zeptal na nějaké vysoké škole, kde s tím mají zkušenosti.

Co se týče Dannyho B. je pravda, že jsem zaznamenal podobné tendence jinde. Wikislovník je ale otevřený projekt a rozhodnutí se tady tvoří na základě konsenzu komunity. Těm co tomu nevěří, je potřeba to stále opakovat.--Juandev (diskuse) 9. 2. 2015, 17:02 (UTC)

Ve snu jsem si vzpomněl, že existovala publikace jazyky/nepo písmo v edici Oko od albatrosu. To by mohlo pousloužit jako vodítko.--Juandev (diskuse) 10. 2. 2015, 07:50 (UTC)

CLDR editovat

Kromě výše zmiňovaných Ladinštiny a Ndondšiny nacházím v CLDR několik dalších sporných (oproti očekávanosti či jazykovému cítění) názvů (staroangličtina/stará angličtina, xhoština/xhosa, zuluština/zulština, kiňarwandština/rwandština), nemluvě o závorkách (altajština (jižní)/jižní altajština) nebo o čárkách (javánština/jávanština). Ideální by bylo najít k příslušným řečem dobrý externí zdroj - nějakou odbornou publikaci, která uvádí české názvy takovýchto jazyků.

Zatím máme použity na Wikislovníku tyto nesrovnalosti (zkontrolováno jen pár kategorií):

Co s nimi?

BTW, na některých Wikislovnících mají v kategorii jazyka i podkategorii typu překlady do jazyka XY. Kdybychom vhodně pojmenovali naše monitorovací kategorie a zařadili je tamtéž, měli bychom na Wikislovníku ne 160, ale 261 jazyků. JAn Dudík (diskuse) 9. 2. 2015, 20:59 (UTC)

Podle mne nejlépe zjistit, jak ty jazyky pojmenovává česká odborná literatura a pokud to nezjistíme, pak zvolit nejčastěji uživaný výraz dle Googlu. Ono se to lehce roboticky přejmenovat ne.--Juandev (diskuse) 9. 2. 2015, 21:03 (UTC)
Rozpory mezi CLDR a modulem a jazyky chybějící v CLDR máš tady pod Lípou o pár sekcí výš. Jen těch chyb bylo 37. Vycházel jsem teda z beta verze CLDR 27, ale snad ty rozdíly nebudou velký. --AuvajsAuvajs (diskuse) 9. 2. 2015, 21:11 (UTC)
Já neřeším ani tak moduly, jako kategorie. Nesporné případy v brzké době přejmenuji, trochu problém je s vytvářením (ověřením tvarů) přídavných jmen z některých jazyků. Zůstanou sporné/míchané. JAn Dudík (diskuse) 9. 2. 2015, 22:43 (UTC)
A abych nezůstal úplně nepochopen: nemá někdo odbornou literaturu, ve která by se daly sporné případy ověřit? JAn Dudík (diskuse) 9. 2. 2015, 22:46 (UTC)
Atlas jazyků světa, Albatros, 2007: altajština (žádná severní, jižní, ale nedělí ani romštinu), nahuatl, čerkezština, ladino, xhosa, zulu.--Zdenekk2 (diskuse) 10. 2. 2015, 09:29 (UTC)
Čerkezština snad ne. Určitě jste se díval na indiánské jazyky a ne na kavkazské?--Shlomo (diskuse) 11. 2. 2015, 16:38 (UTC)
Klégr, Zíma a kol.: Světem jazyků, Albatros, 1989: altajština/ojrotština, nahuatl, jazyk Čerokézů, ladino (pro lad i lld), xhoština, zulština.--Shlomo (diskuse) 11. 2. 2015, 16:38 (UTC)
  • Altajština: Altajštiny jsou dvě - severní a jižní, naopak není žádná "samotná" altajština, ergo je kategorie "Altajština" sama o sobě špatná.
  • Aztéčtina: Nesprávný nepřesný název. Správně je nahuatl. Modul vkládá aztéčtina.
  • Čérokézština: Zjevný překlep od zakladatele. Ostatně i podkategorie je s krátkým.
  • Ladinština: Netřeba mlátit dokola prázdnou slámu.
  • Xhosa: Řídit se dle CLDR, tj. xhoština.
  • Zulština: Nesprávný/nepřesný název. Používat zuluština.

Kdyby se tu používal mj. systém podstránek podle jazyků, k těmto problémům by nedocházelo. Ale to by nesměl být - podobně jako jiné další návrhy vedoucí k unifikaci a systematizaci a v konečném důsledku ke zjednodušení vkládání hesel a práce s nimi - a priori zamítán z většiny na základě subjektivních pocitů nebo dokonce osobních antipatií.
Danny B. ( diskusemail přehled příspěvků ) 9. 2. 2015, 23:20 (UTC)

Opravdu si nemyslím, že by jsme se měli řídit, podle nějakého ajťáckého dokumentu. Jsme na projektu lingvistickém, řiďme se tedy lingvistickými dokumenty. Dolož prosím svá výše uvedené tvrzení, mijo jiné i pro xhosa a zulu. Uvádí to tak lingvistická literatura? Která literatura to tak uvádí.--Juandev (diskuse) 9. 2. 2015, 23:26 (UTC)
Taky by mě zajímalo, kde bere Danny B. zdroje pro svoje tvrzení. Odkazy na lingvistickou literaturu nedává. Jediné, co z jeho příspěvku cítím, je imperativní mód, snaha autoritativně nařizovat názvy jazyků. Takže vážený Danny B., tímto vás upozorňuji na to, že tento projekt není vaším vlastnictvím a už vůbec ne vaším vladařstvím. Zde se rozhoduje na základě konsensu a nikoli na základě vašeho úradku. AD ladinština: JE třeba mlátit prázdnou slámu dokola a dokola. Protože jste to jedině vy, kdo pořád dokola a dokola zatvrzele a nesmyslně prosazuje chybný název jazyka i když ostatních rozporů mezi modulem a CLDR je 37. Zřejmě nemáte odvahu přiznat, že se mýlíte. --AuvajsAuvajs (diskuse) 10. 2. 2015, 09:40 (UTC)
Méně konfrontačního tónu, více konstruktivního tónu, díky.--Zdenekk2 (diskuse) 10. 2. 2015, 09:51 (UTC)

Tak já navím, mohl by se někdo z vás stavit v knihovně nebo na Filosofické fakultě a dodat k tomu nějakou literaturu?--Juandev (diskuse) 10. 2. 2015, 10:22 (UTC)

Další várka

Z dosud zkontrolovaných kategorií mi vychází jeden poznatek: Bylo by dobré v modulu (v mediawiki?) upravit názvy jazyků, které jsou v CLDR vedeny se závorkovým rozlišovačem, aby se zobrazovaly v očekávaném formátu. tedy turečtina (krymská) - > krymská turečtina. JAn Dudík (diskuse) 11. 2. 2015, 20:31 (UTC)

  • Kategorie:Střední horní němčina. CLDR tvrdí Hornoněmčina (středověká). Zde jsou minimálně dva rozpory - střední nebo středověká? horní nebo horno- ? Obdobně staro-/stará.
    CLDR stojí za starou bačkou, protože je často špatně nebo aspoň divně. Vůbec nevím, kdo to vytvářel a překládal, ale jestli nějaký dobrovolník bez znalostí, tak to tomu odpovídá. V tomhle konkrétním případě je to takhle: Střední horní němčina (je stará, střední a nová horní němčina, tohle je ta střední a označit ji za středověkou mi přijde zavádějící). --Palu (diskuse) 16. 2. 2015, 07:13 (UTC)
    CLDR je alespoň nějaká autorita, na rozdíl od Wikipedie. CLDR is maintained by the CLDR technical committee, which includes organizations from IBM, Apple, Sun Microsystems and some government based organizations což mi nepřijde jako spolek dobrovolníků. Navíc je to projekt organizace UNICODE a data z něj využívají i operační systémy nebo různé programy, včetně MediaWiki. Jen zřejmě u některých méně známých jazyků nebyl použit nejrozšířenější název. Proto bych rád, aby se k těmto případům našel ještě nějaký jiný věrohodný zdroj a případně se na CLDR navrhla úprava některých názvů. JAn Dudík (diskuse) 16. 2. 2015, 08:50 (UTC)
    Spolek dobrovolníků (nezávisle na tom jak honosných) to je, pakliže za tímhle účelem nezaměstnávají lingvistické odborníky na každý z těch jazyků. Jistě si každý uvědomuje, že IBM nepodniká v lingvistice, ale v IT. V češtině je řádově užitečnější a věrohodnější autorita toto (+ "jazyk" nebo změna -ský/-cký na -ština/-čtina). A pro případy, kdy toto není pro komplikace názvu jednoznačné (název např. v sobě obsahuje geograficko historické rozlišení, jako třeba střední horní němčina) je lepší sáhnout standardně po dostupných českých zdrojích. CLDR lze k tomu brát pouze jako nějaký nástřel k vyhledávání zdrojů, nikoliv jako zdroj. V tom se neliší od Wikipedie. --Palu (diskuse) 16. 2. 2015, 09:42 (UTC)
  • Kategorie:Tofalarština - CLDR ani modul neobsahují
  • Kategorie:Tagalština - CLDR tvrdí, že jde o tagalog.

JAn Dudík (diskuse) 15. 2. 2015, 21:49 (UTC)

Altajština vyměněna za jižní altajštinu (dle fr.wikt), kategorie by měla být smazána. Na ty ostatní se časem taky podívám. --Auvajs (diskuse) 5. 4. 2015, 12:47 (UTC)

Nespisovné tvary editovat

Až doposud se na Wikislovníku neuváděly nespisovné tvary (nezaměňovat s častými chybami (lyžiny, vyjímka, apod.) či hyperkorektností (by jsme apod.)).

Kde, kdy a na základě čeho se dohodlo, že je možné sem ony nespisovné tvary (tj. hesla typu bílej, koukaj, přemejšlej apod.) vkládat?

Díky.

Danny B. ( diskusemail přehled příspěvků ) 10. 2. 2015, 15:20 (UTC)

Kde (a jestli vůbec) se to dohodlo, nevím. Jejich uvádění však zmiňuje Wikislovník:FH#Varianty. A některé nespisovné tvary se tu viskitují už pomněrně dlouho ;)
BTW jak vlastně rozlišit "nespisovné tvary" od "častých chyb"?--Shlomo (diskuse) 10. 2. 2015, 16:55 (UTC)
Tak když už se o tom rozběhla diskuse, tak já jsem pro, aby se tu vyskytovaly i nespisovné tvary. Je potřeba je ale označit za nespisovné.--Juandev (diskuse) 10. 2. 2015, 17:04 (UTC)
Taky myslím, že jestliže má Wikislovník za cíl popsat všechna slova všech jazyků, tak je nutné mezi to řadit i nespisovné tvary. Nicméně u většiny asi bude problém v dokládání, takže to místní Ref Nazis asi budou mazat. --AuvajsAuvajs (diskuse) 10. 2. 2015, 17:10 (UTC)
Problém je, že zatímco spisovných tvarů je definované množství, nespisovné je per definitio "vše, co není spisovné", tedy v podstatě neomezené množství. Proto pokud by se nespisovné tvary měly/mohly uvádět, je třeba obzvláště dbát na jejich doložitelnost. Nakolik je třeba dělat dusno i kolem zjevně existujících a doložitelných tvarů ponechám na jiných, ale u všech jen trochu sporných případů se k Ref Nazi oddílům hrdě hlásím.--Shlomo (diskuse) 10. 2. 2015, 17:27 (UTC)
Takže třeba se slovem "krutopřísnej" byste neměl problém, protože to asi podle googlu doložit jde, ale co slovo "trapáckej", který je na googlu leda na nějakejch blogískách? Nebo i to hezké slovo "blogísek". A co třeba tvar "na fejsu"? (na Facebooku), nebo "děfka"?--AuvajsAuvajs (diskuse) 10. 2. 2015, 17:45 (UTC)
Ano mám stejný dotaz na Shloma. Musí se to dokládat literaturou. Nestačí na to uplatit Google test? Mně přijde divné, že tu nemohou existovat slova, která běžně existují, ale jen proto že nejsou v důvěryhodných slovnících, tak tu nejsou.--Juandev (diskuse) 10. 2. 2015, 19:41 (UTC)
Nevím, co přesně myslíte "Google testem", ale myslím, že nestačí. Viz pravidla pro dokládání. Výskyt ovšem není nezbytné dokládat odbornou literaturou nebo slovníkem, viz zejména body 2 a 4.--Shlomo (diskuse) 10. 2. 2015, 20:56 (UTC)

Tady prosím vypište odbornou literaturu pro nespisovné tvary:

...

Díky --Dubicko (diskuse) 10. 2. 2015, 17:14 (UTC)

Proč?--Juandev (diskuse) 10. 2. 2015, 17:19 (UTC)
Proč?--Shlomo (diskuse) 10. 2. 2015, 17:27 (UTC)
Protože kromě SNČ žádný pořádný neznám a nevím, co tedy chcete zakládat. --Dubicko (diskuse) 10. 2. 2015, 17:39 (UTC)
Sice to nikde není výslovně uvedeno, ale přesto mám dojem, že dokládat je třeba pouze hesla již existující, resp. vznikající. Ne hesla, o kterých uvažujeme, že bychom je někdy v budoucnu třeba mohli vytvořit. Jinak jste si částečně odpověděla sama (SNČ), jistě se najde i řada odborných článků věnujících se té či oné oblasti nespisovné terminologie, jednotlivé výrazy označené jako nespisovné či hovorové lze najít i ve slovnících věnujících se převážně spisovné slovní zásobě (z toho, co mám teď hned po ruce, mohu uvést Váša-Trávníček). --Shlomo (diskuse) 10. 2. 2015, 18:13 (UTC)
Jsou nespisovné tvary a nespisovné tvary. Měly by být doložitelné věrohodnými zdroji. Což u tvarů slov, kde je koncové (nebo i prostřední) nahrazeno za -ej (pěkný/pěknej, býk/bejk) nebo před počáteční o vloženo v (okno/vokno) pravděpodobně doložit půjde. Stejně tak půjde doložit hantec či nářečí. Tím se pokryje určitá část slov. U zbylých se pak uplatní pravidla jako na méně známá slova - máš zdroj? OK. Ne? {{Ověřit}}. JAn Dudík (diskuse) 10. 2. 2015, 19:47 (UTC)
Vidím tady jiný problém: Dejme tomu, že doložím výskyt tvaru "pěknej". Je to základní tvar (nom. sg. masc.), tedy lemma. Mám zde uvádět i "nespisovnou" ohýbací tabulku (...pěknýho - pěknýmu - ...)? Nebo to není lemma, alébrž nespisovný tvar, který uvedeme pouze s odkazem na tvar spisovný (popř. na lemma spisovného tvaru), a výskyt každého jednotlivého flexního tvaru je třeba doložit samostatně (... což se u spisovných tvarů nevyžaduje, nebo alespoň podle stávajících pravidel by se vyžadovat nemělo)?--Shlomo (diskuse) 10. 2. 2015, 20:56 (UTC)

Adjektiva z názvů jazyků editovat

Narazil jsem na další problém s názvy jazyků. Zatímco na samotné názvy máme jistou autoritu (CLDR, i když má třeba své mouchy), na odvozená adjektiva už zdroje chybí. Jak správně pojmenovat třeba kategorii substantiv k jazyku ng (Ndondština)? Ndondská? Ndongská? k Zuluštině (zu)? Zuluská? Zulská? ke Xhoštině (xh) Xhoská? Existuje na toto nějaký zdroj? JAn Dudík (diskuse) 10. 2. 2015, 20:01 (UTC)

Honzo proč je to téma rozsekané již do 3. příspěvku? Furt se přeci řeší to samé. Tak to řešme na jednom místě. A dejme tomu čas.--Juandev (diskuse) 10. 2. 2015, 20:04 (UTC)
Protože jste sem ty a slimák vtrhli a začali diskutovat vrchem spodem a mé původní příspěvky jen pár hodin staré jsou někde nahoře. Navíc, teď už neřeším názvy jazyků, ale názvy odvozených adjektiv, což považuji za nové téma. JAn Dudík (diskuse) 10. 2. 2015, 21:26 (UTC)
No dobrá. Ale ty neumíš diskutovat do textu?--Juandev (diskuse) 10. 2. 2015, 21:28 (UTC)

Současné kategorizační názvosloví je z různých důvodů nevhodné, a toto je právě jeden z těch důvodů. Nicméně i zde platí stejně jako výše: Kdyby se tu používal mj. systém podstránek podle jazyků a další automatizační systémy, k těmto problémům by nedocházelo. Ale to by nesměly být - podobně jako jiné další návrhy vedoucí k unifikaci a systematizaci a v konečném důsledku ke zjednodušení vkládání hesel a práce s nimi - a priori zamítán z většiny na základě subjektivních pocitů nebo dokonce osobních antipatií.
Danny B. ( diskusemail přehled příspěvků ) 17. 2. 2015, 15:14 (UTC)

Příznaky editovat

Ptal jsem se AuvajsAuvajs ohledně příznaků, protože to tu není nikde podrobně vysvětleno. Jak je tedy chápat. Mě to připadá jako označení nuancí jazyka (lístek - malý list, ale v botanice konkrétní hmatatelná věc) - což ne vždy tvoří jasnou hranici.--Juandev (diskuse) 16. 2. 2015, 13:29 (UTC)

Jelikož se mi nedostává odpovědí na moje otázky, vytvořil jsem k této problematice studijní výzkum na Wikiverzitě. Cílem je to dohloubky pochopit a pak k tomu tady na Wikislovníku vytvořit nápovědu.--Juandev (diskuse) 19. 2. 2015, 11:22 (UTC)
Příznak je upřesnění, za jakých podmínek se daný výraz používá.--Zdenekk2 (diskuse) 19. 2. 2015, 12:01 (UTC)
To mi nepřipadá moc přesně řečeno. Pokusím se navrhnout vlastní formulaci, jen co proniknu do problematiky trochu víc.--Juandev (diskuse) 19. 2. 2015, 13:16 (UTC)
Tak přesně: u odborných výrazů se příznakem uvádí obor, ve kterém se daný výraz v daném významu používá, u slohově příznakových výrazů se příznakem uvádí příslušná stylová charakteristika.--Zdenekk2 (diskuse) 19. 2. 2015, 22:01 (UTC)
A pak jsou ještě výrazy, kde oboje... Např. někdy nestačí, že je slovo označeno jako slang, protože může být používáno třeba i v desítkách různých, na sobě nezávislých slangů (a ve všech mít naprosto jiné významy). --AuvajsAuvajs (diskuse) 20. 2. 2015, 04:50 (UTC)
Dobře to AuvajsAuvajs vypíchl, to je důležitá okolnost. Jenže, jelikož mezi zdejšími špičkami není příliš oblíbený, bude to smeteno se stolu, pokud ne přímo zablokován (pochopitelně při jiné, vhodnější příležitosti, aby to nebylo tak okaté). Těm, kteří by chtěli tento povzdech onačit za trolling bych doporučoval, aby mírnili svoje cenzorské choutky, někteří jich už tu máme plné zuby. Raději pojďme svobodně tvořit a zdokonalovat - v tomto případě příznaky a případnou nápovědu k nim. --Kusurija (diskuse) 20. 2. 2015, 05:29 (UTC)
Ano, dobře to vypíchl. Zvláště důležité je to slovo oboje, které přesně vystihuje povahu dané situace.
Danny B. ( diskusemail přehled příspěvků ) 20. 2. 2015, 05:39 (UTC)
Svou reakcí na Zdenkka2 jsem narážel na to, že na en se to vysvětluje takto: A context label identifies a definition which only applies in a restricted context. Což je podle mne zcela jednoznačné (i když se může stát, že jeden význam má více příznaků). Já si to vykládám tak, že se příznakem na en označují ta slova, která se nevyskytují v běžné mluvě ale právě jen v určité oblasti(ech). Zatímco Vaše definice jsou úplně opačné (slovo se vyskytuje v oblasti) a tím podle mne neříkají celou informaci. Ale je dobře, že o tom hovoříme, protože abychom to tak používali, tak bychom tomu měli rozumět.--Juandev (diskuse) 20. 2. 2015, 08:27 (UTC)

Slovní spojení / Fráze / Idiomy editovat

Při řešení interwiki jsem narazil na jeden problém českého Wikislovníku. Víceslovná hesla jsou zařazena v jedné či dvou z těchto kategorií:

Ovšem jiné Wikislovníky rozlišují maximálně idiomy a fráze/slovní spojení. Výjimečně je pro některý jazyk někde k dispozici celá trojice odpovídajících kategorií. Napadají mne dvě řešení:

  1. zrušit kategorii frází. hesla zařadit buď jako idiomy nebo jako slovní spojení. např. acheter chat en poche je zařazeno jak ve frázích, tak v idiomech.
    • nebo sloučit fráze se slovními spojeními, beztak je fráze ustálené slovní spojení
  2. zařadit kategorii frází pod kategorii slovních spojení a nechat bez interwiki.

Sám nemám vyhraněný názor, krom toho, že je v tom zmatek. Názory ostatních? JAn Dudík (diskuse) 4. 3. 2015, 11:37 (UTC)

Viz také článek Kolokace. Problém je v tom, že na české Wikipedii jsou povolena jen idiomatická slovní spojení, ostatní ustálená slovní spojení jako neidiomatické odborné termíny apod. mají smůlu. Kritizováno to bylo mnohokrát, ale správci požadavky na zařazení vytrvale blokují. Výrazy idiom a frazém jsou, pokud se nemýlím, v našem smyslu synonymy. Přitom ale idiom je přesnější, protože nenavádí k dalším snadno zaměnitelným významům toho slova (fráze může být také bezobsažná fráze a nebo slovní obrat). Čili pokud bychom chtěli být přesní a jednoznační, správně by bylo přejmenovat současnou kategorii slovní spojení na "idiomatická slovní spojení" a fráze na "idiomy" (tedy sloučit tyto kategorie). --Palu (diskuse) 4. 3. 2015, 12:00 (UTC)
To je poněkud nepřesné. Na Wikislovníku jsou povolena i neidiomatická slovní spojení jako poštovní známka, pouze se u nich požaduje, aby byla idiomatická. Což samozřejmě nedává smysl a vyvolává nekonečné a neřešitelné spory.
Také není zcela přesné, že neidiomatická slovní spojení mají smůlu. Mají smůlu jen tehdy, pokud se znelíbí některému z editorů s privilegovaným postavením idio-arbitra. Neidiomatická slovní spojení vytvořená či akceptovaná těmito editory tu samozřejmě zůstávají a je potřeba je rovněž někde kategorizovat.--Shlomo (diskuse) 4. 3. 2015, 14:06 (UTC)
O usurpování privilegií k rozhodování o mazání správci se právě vede diskuse. --Palu (diskuse) 4. 3. 2015, 14:18 (UTC)
To je samozřejmě dobře. Jen jsem chtěl upozornit, že neidiomatická slovní spojení zde přes občasné silácké výroky jsou a bohdá ještě nějakou dobu budou, takže při kategorizaci je třeba s nimi počítat.--Shlomo (diskuse) 4. 3. 2015, 14:57 (UTC)
Rychlá, předběžná reakce: Já v tom problém neshledávám, ba ani zmatek. (A prozatím jsem ani nepochopil, jak to může vadit při interwiki.) Podle mého vzdělání je idiom nadmnožinou frází, ale také přísloví, rčení, pořekadel, možná i některých přirovnání. (Je-li tedy něco příslovím, automaticky je to i idiomem.) Slovní spojení oproti tomu může být pouhým běžným spojením slov, tedy, jak píše Palu|kolega Palu, kolokací. Navíc fráze může být také konverzačním obratem neidiomatickým. Tudíž slučovat to by mi přišlo matoucí a nesprávné. (Možná tady říkám jinými slovy totéž, co Palu.) Ať se, prosím, vyjádří i kolegové Milda a AuvajsAuvajs|Lexiq - ti to budou mít ještě lépe nastudované, hádám. --Pyprilescu (diskuse) 4. 3. 2015, 14:16 (UTC)
O tom, že je to nadmnožinou, jsem nevěděl. Ale ke kolokaci je mi známo, že ta je nadmnožinou všech slovních spojení nezávisle na idiomatičnosti. Možná by se měl někde zpracovat nějaký strom vztahů mezi všemi těmito termíny, aby byla problematika jasnější. Třeba jako příloha. --Palu (diskuse) 4. 3. 2015, 14:22 (UTC)
Jasně, o tom, že kolokace je nadmnožinou nejvyšší, "žádná". ;-) Však taky jedním z doslovných významů collocatio je postavení/umístění vedle sebe (v tomto případě dvou a více slov). To s tím stromem je docela dobrý nápad, ale za sebe rovnou říkám, že já se toho skoro určitě nezhostím. --89.92.157.19 4. 3. 2015, 14:27 (UTC)
Stránku jsem vytvořil, prosím o případnou kontrolu a korekci. --Palu (diskuse) 4. 3. 2015, 15:19 (UTC)

Dle Čermákovy učebnice Jazyk a jazykověda, strany cca 210-215, ISBN 978-80-246-1946-0:

  1. Frazém, resp. idiom je "každá ustálená anomální kombinace dvou či více prvků (morfémů, slov, popř. kolokací), z nichž alespoň jeden je členem extrémně omezeného a uzavřeného paradigmatu (třídy)".
  2. "Oba pojmy, frazém a idiom, se prakticky překrývají, první však je označením formálních aspektů jevů, druhý aspektů sémantických".
  3. Kolokace je "smysluplná lexikální kombinace slov (syntagmata, spojení slov)".
  4. Kolokace se v zásadě dělí na neustálené (tvrdý chléb) a ustálené (žitný chléb). (Ústálené) kolokace dále na termíny (žitný chléb), frazémy (chléb náš vezdejší) a propria (Hradec Králové).
  5. "Kolokací je v lexikonu mnohonásobně víc než prostých slov." (..) "Úhrn termínů včetně víceslovných je mnohonásobně větší než úhrn jednoslovných lexémů, jen sama terminologie chemická je větší než celý běžný neutrální lexikon." --AuvajsAuvajs (diskuse) 4. 3. 2015, 14:58 (UTC)

Prosím, nezatahujte sem nesouvisející problém, jaká slovní spojení zde mají místo. Problém je v tom, že:

  • Idiomy - kategorie existuje ve více jazycích
  • slovní spojení - kategorie existuje např. na de, es, fr, ru nebo pt slovníku
  • fráze - kategorie se slovem fráze v názvu existují jen na en, sv a nl slovníku

Jediným jazykem, kde se vyskytují vedle sebe slovní spojení i fráze je tedy čeština. A jde mi o to, zda to dělit na dvě skupiny (což znamená, že na en.wikt budou mít odkazy jen do tří jazyků) nebo dát všechny jazyky ke slovním spojením, a pak je zde otázka, co s frázemi JAn Dudík (diskuse) 4. 3. 2015, 20:36 (UTC)

S tím právě souvisí to, abychom si nejprve ty pojmy definovali (co který vlastně znamená), definovali si k tomu které pojmy sem zařazujeme podle současných pravidel a dali to dohromady - vytvořili vhodnou kateogorizaci. --Palu (diskuse) 4. 3. 2015, 21:25 (UTC)
Připouštíme-li existenci jednoslovných idiomů (kočkopes, černoprdelník ...?) nebo jednoslovných frází („Zdravíčko.“ „Děkuji.“ „Prosím.“ „Prosím?“), pak je nelze slučovat se slovními spojeními. Pokud považujeme idiomy za podmnožinu frází, pak můžou být příslušné kategorie sloučeny, nebo raději vnořeny. Další otázka je, zda kategorizaci idiomů a frází potřebujeme/chceme. Odpovědi na tyto otázky závisí na tom, jak si nadefinujeme idiom, frázi a slovní spojení. Stávající doporučení odkazuje na neexistující Wikislovník:Kategorizace, takže editorům nezbývá než improvizovat.
Já dosud používal kategorii (a nadpis 3. úrovně) "slovní spojení" čistě formálně, tedy pro jakýkoli "termín" (ve smyslu Wikislovník:PZH tvořený více než jedním slovem a netvořící celou větu. "Termíny" tvořící celou větu (bez ohledu na počet slov) jsem zpravidla kategorizoval jako fráze (popřípadě úsloví, rčení, pořekadla, přísloví, což jsou IMHO podmnožiny frází). Idiomy jsem kategorizoval pouze do kategorie idiomů - což odpovídá chápání idiomů jako podmnožiny "slovních spojení", s vyloučením "jednoslovných" idiomů. Připustíme-li jednoslovné (resp. složeninové) idiomy, pak by měl každý idiom být kategorizován navíc buď jako slovní spojení, nebo jako příslušný slovní druh; a informace, že jde o idiom, by se neměla objevit jako nadpis 3. úrovně (===idiom===), nýbrž pod ním jako mluvnická kategorie (* ''idiomatické'').
Každopádně si myslím, že to, kolik interwiki odkazů budou mít při takovém či onakém řešení na anglickém (nebo jakémkoli jiném) wikislovníku, bychom při rozhodování neměli brát v potaz.--Shlomo (diskuse) 4. 3. 2015, 23:47 (UTC)

Staročeština vedená jako samostatný jazyk? editovat

Nestálo by za to vést staročeštinu jako samostatný jazyk? Liší se slovníkem, ale také skloňováním, výslovností, zápisem, atd. Viz kokot, kur (kurzy), kokeš (kokše, ne kokeše), kohút (ne kohout). Přijde mi, že to míchání současného vývojového stupně češtiny s předešlými historickými stupni (mezník je asi národní obrození?) může v některých situacích působit dost zmatečným dojmem a je potřeba zbytečně mnoho to rozličně komentovat. --Palu (diskuse) 9. 3. 2015, 09:22 (UTC)

Jako samostatný jazyk ji nelze dát, protože nemá vlastní ISO kód.
Ostatně, jak bys chtěl charakterizovat staročeštinu? od jakého okamžiku už nejde o staročeštinu ale o moderní češtinu? Jak chceš věrohodně dokládat, že jde o staročeštinu a ne o archaický výraz? °°°°JAn Dudík (diskuse) 9. 3. 2015, 09:25 (UTC)Přesunuto z Diskuse s uživatelem:Palu#Staročeština.--Juandev (diskuse) 9. 3. 2015, 09:30 (UTC)
Já osobně bych byl velmi pro, napadlo mě to už několikrát. Ten mezník by ale bylo opravdu potřeba vymezit. Imho, národní obrození mi připadá příliš pozdě. Osobně, jakožto téměř naprostý nebohemista, bych ale řekl, že to bude ještě někde relativně hluboko před kraličtinou - tzn. další minim. dvě století hlouběji. Díky za iniciativu.
(@JAnDudík: Neexistence kódu mi nepřipadá jako nepřekonatelná překážka - to ostatně může být dočasná záležitost.) --Pyprilescu (diskuse) 9. 3. 2015, 09:37 (UTC)
Co to ale je staročeština?--Juandev (diskuse) 9. 3. 2015, 09:29 (UTC)
Pomocí staročeských slovníků lze zdrojovat jednotlivosti (jednotlivá slova) a nějaká definice staročeštiny by se určitě našla. Prací o vývoji češtiny bude spousta. Vývojová fáze se běžně definuje i jinde, například stará angličtina, starořečtina, střední latina, střední horní němčina apod. Teď v rychlosti nacházím jenom články na Wikipedii, třeba tento. Podle toho lze brát starou češtinu asi do 15. století v kontextu stará, střední, obrozenecká, moderní. Myslím, že tak to berou i ony staročeské slovníky. U ESSČ píší, že hesla jsou rekonstruována do podoby předpokládané v roce 1300, a MSS většinou uvádí tvary slov k počátku 14. století, někdy ale i pozdější. Index Slovníku staročeských osobních jmen Jana Svobody uvádí jména do 1419. Každopádně rozdílů oproti současné češtině je velmi mnoho. --Palu (diskuse) 9. 3. 2015, 09:58 (UTC)
stará angličtina (ang) a střední angličtina (enm) mají definovaný ISO kód. Viz též Wikislovník:Podmínky_pro_zařazení_hesla#Zařazované_jazyky.
Osobně si myslím, že jako příznak a související kategorie ano, jako samostatný jazyk (uváděný např. v sekce překlady) ne. JAn Dudík (diskuse) 9. 3. 2015, 10:20 (UTC)
V překladech skutečně ne, protože jde o archaický jazyk, ale všechno ostatní je myslím možné vkládat. Rozdíl by byl jen v tom, že se to nebude motat v současné češtině. Skoro každá informace o staročeském slově zařazená do novočeského hesla musí být nějakým způsobem okomentována, což je ve výsledku dost nepřehledné a taky náročné pro editora. Jinak co se týče PZH, tak tam nevidím problém z pohledu toho, že neexistuje iso. Akceptovatelné jsou všechny přirozené jazyky. Ztohoto pohledu je k diskusi jen to, jestli lze brát starou češtinu za zvláštní jazyk, jiný než moderní češtinu. A podle mě kvůli vážným odlišnostem hlubším než např. u nářečí ano. --Palu (diskuse) 9. 3. 2015, 10:42 (UTC)

OK, tak staročeština tu nemůže být oficiálně vedena ani jako součást češtiny a je potřeba to obcházet mimo modul. Danny B. to jednomyslně rozhodl. To je úroveň. --Palu (diskuse) 9. 3. 2015, 10:50 (UTC)

@Palu: tak o to mi právě šlo. O nějaké časové vymezení. Význam slov se posunuje a kdyby staročeštinou byl úsek 1000 let, tak to je moc dlouho. Pokud je to ale úsek 100-200 let, tak je to ještě snesitelné. Je ještě otázka, proč to nazývat staročeštinou? Venkovská čeština 18. století by se pak nazýval jak?--Juandev (diskuse) 9. 3. 2015, 10:52 (UTC)
Staročeština má odbornou definici a tu je potřeba přejmout, pak bude vše v pořádku. Zatím to vypadá na češtinu od nejstarštích dob do 15. století. --Palu (diskuse) 9. 3. 2015, 10:57 (UTC)

Souhlasím, ale jen pod podmínkou, že někde pojem "staročeština" bude přesně definován, a pokud možno i vysvětlen, ať nedochází ke sporům a nejasnostem. --AuvajsAuvajs (diskuse) 10. 3. 2015, 00:16 (UTC)

Zařazení slovinčtiny editovat

Slovinčtina je vymřelý jazyk, který se v tuto chvíli vyskytuje na 3 Wikislovnících (en, lt, pl). Nemá ale přidělen samostatný ISO kód, na en má kód zlw-slv (zlw-západoslovanština + slv, které je ale samostatně úplně jiná slovinština, což je trochu zavádějící), na lt má zase kód csb-slv, protože je brána jako dialekt kašubštiny ([1]). Někdy je ale považována za dialekt pomořančtiny, polštiny a nebo samostatný jazyk, proto je anglická verze neutrálnější a přesnější. Souhlasí komunita s tímto kódem pro začlenění jazyka do českého Wikislovníku? --Palu (diskuse) 10. 5. 2015, 15:56 (UTC)

S jakým kódem? --Auvajs (diskuse) 13. 5. 2015, 00:01 (UTC)
S kódem z anglické verze, který je podle mě neutrálnější z výše uvedených důvodů. Takže "zlw-slv." --Palu (diskuse) 13. 5. 2015, 06:53 (UTC)

Není ISO kód - není samostatný jazyk - nezařazovat vůbec. (Mj. k tomu nikdy nevznikne samostatný Wikislovník ani jiný projekt Wikimedia.)
A nelíbí se mi manipulativní způsob dotazu - jedná se vůbec o to, zda takový jazyk přijmout, a nikoliv o to, pod jakým kódem - to je až sekundární záležitost a vzhledem k výše uvedenému podružná.
Danny B. ( diskusemail přehled příspěvků ) 28. 5. 2015, 21:21 (UTC)

Hovorová čeština editovat

Dovoluji si všechny upozornit, že hovorová čeština není nespisovná, ale je mluvenou formou spisovné češtiny. Proto slova jako hajzl, fotrovatět atd. rozhodně nejsou hovorová slova. Slova, která patří do hovorové češtiny, by měla být kodifikována některým ze slovníků spisovné češtiny nebo podobnými zdroji. Dávejte si na to prosím pozor. --Okino (diskuse) 18. 5. 2015, 16:59 (UTC)

hovorová čeština je na rozmezí ... a má různou míru "nespisovnosti" (citace snč).. a ano... tento příznak by měl být podložen akademickým zdrojem... --Dubicko (diskuse) 18. 5. 2015, 17:04 (UTC)
Podrobněji zde. Též "Následující přehled snad může ilustrovat pojmy hovorová čeština a obecná čeština, mezi nimiž vede hranice spisovného a nespisovného jazyka." nebo "Hovorové výrazy, na rozdíl od spisovných v užším smyslu, mají různou míru „nespisovnosti“." Tedy i podle toho je hovorový jazyk skutečně spisovný a opravdu se nemůže plést s obecným jazykem, jak se tu děje.
Mimochodem, všiml jsem si také, že hovorovost je vedena také u některých dalších jazyků, kde to ale vůbec nechápu. Osobně se domnívám, že nejméně u několika z těch jazyků, jde o ryzí vlastní výzkum, jelikož mám pocit, že třeba u angličtiny něco jako "hovorová angličtina" jako zavedený lingvistický termín vlastně neexistuje (stejně jako neexistuje "spisovná angličtina"); a tam, kde ho někdo zavádí (např. zde), má to velmi odlišný význam ve srovnání s hovorovou češtinou. Mám pocit, že tady by to chtělo nějakou odbornou radu... --Okino (diskuse) 24. 5. 2015, 19:31 (UTC)
Colloquial English je zavedený lingvistický termín a slovníky ho někdy užívají (obvykle hovorové výrazy označují zkratkou colloq., mám doma slovník, který to vyznačuje výrazem spoken). Jan.Kamenicek (diskuse) 24. 5. 2015, 20:51 (UTC)
Tento příznak užívá i en.wiktionary. Jiná věc ale je, jestli to lidé vkládají "pocitově" (vlastní výzkum) nebo podloženě. Domnívám se, že zejména u cizích jazyků by se tento příznak měl rozhodně zdrojovat. Jan.Kamenicek (diskuse) 24. 5. 2015, 21:23 (UTC)