Uživatel:Shlomo/Na slovíčko/na kus řeči

Tato stránka slouží ke komunitní diskusi o jazycích a obecných jazykovědných a lexikografických tématech

Další tématické podstránky

Na slovíčko: všeobecná nebo nezařaditelná témata, oznámení
Na slovíčko o pravidlech: návrhy, tvorba, a aplikace pravidel, debata o obvyklých a vhodných postupech
Na slovíčko o technice: technické dotazy, problémy a požadavky
Na kus řeči: obecná lexikologická a lingvistická témata
Na slovíčko o lidech: prevence hrozících a urovnávání vzniklých konfliktů a řešení jiných problémů s uživateli
Na slovíčko o slovíčku: diskuse o ověření, smazání nebo obnovení hesla

Guernseyština a jerseyština

Předkládám k diskusi jeden problém a sice guernseyštinu a jerseyštinu - hlavně, co se týká překladových šablon - co totiž s nimi, neboť jsem nenašel jejich jazykový kód. Nabízí se několik řešení:

podle některých jazykovědců se jedná o dialekty normanského jazyka, tudíž zavést jazykový kód nrm s tím, že by přístup mohl podobný jako k uvádění srbských překladů v latince a v cyrilici,
podle jiných jazykovědců je možné je považovat za dialekty francouzštiny (ostatně, oba používají francouzský pravopis), takže je přiřazovat k francouzským překladům, s poznámkou, že se jedná o guernseyštinu resp. jerseyštinu,
vytvořit pro ně speciální jazykové kódy,
slova z těchto jazyků neuvádět - řešení sice nejjednodušší, ale podle mě nejméně vhodné.

Jenom podotýkám, že třeba na anglickém wikislovníku slova v těchto jazycích mezi překlady mají. --Standazx (diskuse) 28. 12. 2014, 09:06 (UTC)

Aniž bych predikoval, kterou z ostatních tří cest se vybrat, tak v žádném případě to nepůjde tou třetí, neboť jazykové kódy jsou definovány normou.
— Danny B. diskuse • mail přehled příspěvků 11. 1. 2015, 01:15 (UTC)

Tak ani tou první se nepůjde vydat, neboť jednak nrm je ISO kód pro naromštinu (můj pokus o překlad "Narom language"), jednak žádný ISO kód pro normanský jazyk neexistuje.
— Danny B. diskuse • mail přehled příspěvků 11. 1. 2015, 02:19 (UTC)

Podle enwikt i hrwikt je Guernseyština roa-grn

Jerseyština dle en, hr, lt i nds je roa-jer

Ostatně, již delší dobu uvažuji o obnovení Šablona:Jazyková kategorie, kde by se kód uváděl, aby se zmenšila možnost záměny dvou (názvem) podobných jazyků (nejen v češtině) (skotština/skotská gaelština; litevština/lotyština, čeština/čečenština...) JAn Dudík (diskuse) 12. 1. 2015, 08:00 (UTC)

Já jsem jednoznačně pro. --Palu (diskuse) 12. 1. 2015, 08:22 (UTC)

To ale nejsou normované kódy, na nichž tu stojí celý systém, nýbrž umělé konstrukty wikikomunity. Každopádně od včerejška je v platnosti kód nrf pro jerseyštinu i guernseyštinu zároveň, neb to jsou oba dialekty pocházející ze staré normanské francouzštiny.
— Danny B. diskuse • mail přehled příspěvků 12. 1. 2015, 23:56 (UTC)

Lužické srbštiny

Máme zde dvě kategorie o podobných jazycích s různým jménem:

Soudím, že by se měly názvy sjednotit. Jaká je podle vás vhodnější varianta?

? JAn Dudík (diskuse) 8. 1. 2015, 22:06 (UTC)

Na Wikipedii se používají delší názvy a Modul:Languages (který je vytvořen na základě normativních názvů jazyků a od nějž se tu mají všechny příslušné věci odvíjet) je má rovněž, takže myslím, že je to jasné...
— Danny B. diskuse • mail přehled příspěvků 8. 1. 2015, 22:18 (UTC)

Pomnožnost a podvojnost

Prosím o pomoc s terminologickým problémem: Jak označovat slova, která se vyskytují pouze v dvojném čísle. Napadlo mě použít označení "podvojné" jako analogie k "pomnožné", nicméně není mi známo, že by se v češtině tento termín v tomto významu vyskytoval. Což může být způsobeno tím, že v češtině se nevyskytuje ani tento gramatický jev a učebnice jazyků, kde se vyskytuje (co vím tak he, ar) nejdou do takové terminologické hloubky.--Shlomo (diskuse) 13. 1. 2015, 11:28 (UTC)

Slovo odpovídá slovotvorbě, viz toto (bohužel pro slovenštinu, ale analogické s češtinou). Bod III, 3: "nachádzajúci sa, vyskytujúci sa, dejúci sa na mieste označenom základom, charakteristický pre isté prostredie", čili dějící se na něčem dvojném, tedy podle definice slova dvojný taktéž v duálu.

Podle mě je tak tohle slovo vhodné přesto, že není konkrétně doloženo v tomto konkrétním kontextu slovníkem. Jsem zastáncem toho, že je-li slovo utvořeno korektně podle pravidel slovotvorby, je korektní - nezávisle na doložení ve slovníku. Alternativu pro tento kontext neznám. --Palu (diskuse) 13. 1. 2015, 12:20 (UTC)

Alternativa je rozepsat to na "pouze ve dvojném čísle", resp. "pouze v duálu". Je to možné, ale moc se mi to nelíbí.--Shlomo (diskuse) 13. 1. 2015, 12:24 (UTC)

Podle (staré) Mluvnice hebrejštiny a aramejštiny (autoři dr. Otakar Klíma, dr. Stanislav Segert, Nakladatelství Československé akademie věd, Praha, 1956, str. 81) jsou jména vyskytující se jen v duále, jako třeba מאֹזְנַיִם nebo מֶלְקָחַיִם, zvána dualia tantum. --Lexiq (diskuse) 13. 1. 2015, 18:51 (UTC)

Souhlasím s Lexiq|Lexiqem a navrhuji dualia. --Kusurija (diskuse) 20. 1. 2015, 19:11 (UTC)

Vždy mne zaujme, když se tu někteří, nemajíce zcela zjevně ani zbla ponětí o příslušné věci, musejí za každou cenu "sofistikovaně" vyjádřit, ba co víc, přispěchat s nějakým novem, případně rádoby (definitivním) řešením, tváříce se přitom, že strkají do kapsy celou lingvistickou obec...

Správný lingvistický termín je duale tantum (pl. dualia tantum), což znamená "pouze (po)dvojné". Duale samo o sobě je v češtině označováno "duál", "číslo dvojné", ale i "číslo podvojné", tedy není možné to použít pro zmiňovaný účel. "Čistě český" termín ekvivalentní k jednotné, množné, pomnožné, hromadné, (po)dvojné neexistuje.

Čímž opět narážíme na fakt, kvůli němuž jsem tu několikrát - avšak neúspěšně - navrhoval používat důsledně latinskou terminologii, resp. její "počeštěné" tvary (tj. např. plurál namísto plurale, duál namísto duale ap.), a totiž to, že ne všechny termíny mají "čistě český" ekvivalent. Pro příklad netřeba chodit daleko: narazí se zcela stejně u slov, která mají tvar pouze jednotného čísla (tj. singulare tantum) a přitom nejsou hromadná (tj. kolektiva) - pro ně rovněž není "čistě české" označení.

— Danny B. ( diskuse • mail • přehled příspěvků ) 21. 1. 2015, 00:46 (UTC)

Ex-post poznámka ke shrnutí tohoto příspěvku: Omlouvám se, omylem mi tam zůstalo původní shrnutí podle toho, jak jsem původně reagoval zvlášť na první a poslední příspěvek této diskuse. Nakonec jsem se po jejím opětovném přečtení rozhodl reagovat souhrnně na vše výše uvedené, takže to shrnutí neodpovídá.
— Danny B. ( diskuse • mail • přehled příspěvků ) 21. 1. 2015, 08:27 (UTC)

Názvy jazyků

Nedostalo se mi odpovědi na mé otázky, resp. námitky v diskuzi u modulu Languages, proto bych se chtěl obrátit na „širší veřejnost” (pokud zde není na tuto diskuzi správné místo, prosím přesunout jinam).

Zjistil jsem následující rozpory mezi CLDR (ve verzi 27β) a „modulem Languages”:

kód	Wikislovník	CLDR
alt	jižní altajština	altajština (jižní)
ang	stará angličtina	staroangličtina
as	asámština	ásámština
azb	jižní ázerbájdžánština	ázerbájdžánština (jižní)
bjn	bandžárština	bandžarština
ckb	středokurdština	kurdština (sorání)
crh	krymská tatarština	turečtina (krymská)
dv	divehi (maledivština)	maledivština
frr	severofríština	fríština (severní)
fur	furlandština	furlanština
gmh	střední horní němčina	hornoněmčina (středověká)
gsw	švýcarská němčina	němčina (Švýcarsko)
guz	gusiština	gusii
izh	ižorština	ingrijština
kea	kapverdská kreolština	kapverdština
lg	lugandština	gandština
mdf	mokša	mokšanština
myv	erzja	erzjanština
nso	severní sotština	sotština (severní)
nv	navaho	navažština
ny	čičevština	ňandžština
om	oromo	oromština
pa	pandžábština	paňdžábština
pam	pampangau	papangau
pap	papiamentština	papiamento
pms	piemontština	piemonština
ps	paštunština	paštština
rap	rapanuiština	rapanujština
rw	rwandština	kiňarwandština
sc	sardinština	sardština
se	severní sámština	sámština (severní)
sli	slezská němčina	němčina (slezská)
su	sundánština	sundština
tl	tagalština	tagalog
tog	malavská tongština	tonžština (nyasa)
tum	tumbučtina	tumbukština
twi	ťwiština	twi

Je opravdu nutné lpět na označování „židovské španělštiny” jako „ladinštiny” jen kvůli chybě v CLDR, když jiných odlišností oproti „normativnímu” seznamu je velmi mnoho (jak doloženo výše)?

Vedle toho, tyto jazyky jsou v modulu vícekrát:

ee (eweština), ewe (eweština)
lad (ladinština), lld (ladinština)

a některé názvy dle dle Wikipedie označují tentýž jazyk:

hat (haitská kreolština), ht (haitština)
ast (asturština), mwl (mirandština)

Další pochybnosti mám ohledně některých názvů, které jsou dle Googlu používány jen na Wikislovníku:

kód	jazyk
ckb	středokurdština
dgd	dagaari dioulou
guz	gusisština

Tyto jazyky jsou v modulu a nejsou v CLDR:

kód	jazyk
abe	abenakština
als	alsaština
atv	severní altajština
bcl	bikolanština
dgd	dagaari dioulou
fkv	kvenština
hat	haitská kreolština
hnd	hidko
jpa	židovská palestinská aramejština
kim	tofalarština
kjh	chakaština
lbe	lakština
mrh	mara
mww	bíla hmongština
nah	aztéčtina
nij	ngadžuština
pnb	paňdžábština (shahmukhi)
pox	polabština
rmy	vlašská romština
sgd	surigaononština
src	lugudorská sardinština
sro	sardinština
tmr	židovská babylonská aramejština
wah	watubela
wym	vilamovština

V modulu obsažené „mrtvé” jazyky:

kód	jazyk
ang	stará angličtina / staroangličtina
cu	staroslověnština
gmh	střední horní němčina / hornoněmčina (středověká)
got	gótština
grc	starořečtina
hit	chetitština
jpa	židovská palestinská aramejština
la	latina
pox	polabština
prg	pruština
sa	sanskrt (zařazení sporné)
sux	sumerština
syr	syrština
tmr	židovská babylonská aramejština

Proč není možné přidat akkadštinu? --Lexiq (diskuse) 25. 1. 2015, 22:59 (UTC)

Díky, že jste mi ušetřil půl námahy. Polovinu této revize jsem měl už hotovu, tak tu jste si zase mohl ušetřit vy, kdybyste se třeba zeptal... Jinak odpovědi se vám doposud nedostalo právě kvůli této revizi a dalším rešerším.

Vezmu to popořádku:

Ad nesrovanalost s CLDR: Pominu-li fakt, že používáte beta verzi, tedy ještě nevydanou, a tudíž nesměrodatnou, je třeba si uvědomit, kdy seznam vznikal a že od té doby ke dnešku bylo několik aktualizací. Je fakt, že to po těch aktualizacích už nikdo neaktualizoval tady, takže je skvělé, že jste to takhle sepsal, aspoň se to bude moci zaktualizovat. I když, vlastně nevím, protože jste použil betu a regulérní vydaná verze se může lišit. No, budeme doufat, že ne o tolik.
Ad jazyky vícekrát:
- ee ≡ ewe (ISO 639-1 vs. ISO 639-3; po kontrole a případné opravě výskytů ponecháme jen první)
- lad ≠ lld Dva rozdílné jazyky (zde již několikráte omílaná známá chyba v českém překladu CLDR)
- ht ≡ hat (ISO 639-1 vs. ISO 639-3; po kontrole a případné opravě výskytů ponecháme jen první)
- ast ≠ mwl Dva rozdílné jazyky (Wikipedie není věrohodný zdroj)
Ad názvy nejsoucí v CLDR: Dokud tam nejsou, tak není žádná kolize. Až tam budou, případně se upraví. Standardní řešení jako kdekoliv jinde. Naprosto souhlasím, že některé ty překlady jsou značně podivné, ale to je třeba se obrátit na jejich vkladatele sem (připomínám, že před vznikem modulu tu bylo mnoho samostatných šablon, takže při jeho založení se posbírala a pročistila data z nich), odkud čerpali. (Zpravidla u většiny těchto jazyků narazíte na tutéž osobu, můžete si tipnout, kterou...)
Ad mrtvé jazyky: Z výše uvedených má klasifikaci mrtvého (přesněji vymřelého) pouze polabština (je tam od počátku zjevně kvůli přehlédnutí) a židovská babylonská aramejština (přidal jsem, když bylo potřeba narychlo upřesnit aramejská slova, s jejichž vkládáním přišel Shlomo). Syrština je klasifikována jako živý(!) makrojazyk, ostatní jazyky jsou klasifikovány buď jako historické nebo starověké. Nikdo neříká, že tam akkadštinu (klasifikovánu jako starověký jazyk) přidat nejde, chtěl jsem k tomu pouze vyjádření od jiných uživatelů, protože co si pamatuji, tak většinou byly jazyky s klasifikací historické či starověké diskutovány a mj. byl i argument, že pakliže nemůže v daném jazyce vzniknout Wikipedie (potažmo další projekty, částečnou výjimkou jsou ze své podstaty Wikizdroje), nebudeme zde takový jazyk používat.

Už jak se objevila diskuse u modulu, začal jsem dělat na nástroji pro automatické zpracování CLDR a též pro umožnění transparentního lokálního doplnění příslušných dat. Tedy, přesněji jsem k tomu začal dělat koncept už dříve, a to v okamžiku, kdy se ukázalo, že není vhodné vázat směr sazby přímo na samotný jazyk.

Jinak si stále stojím za tím, že jestliže MediaWiki, majíc data z CLDR, vrací pro lad ladinština, je třeba to ponechat do té doby, než to bude v CLDR opraveno a následně převzeto do MediaWiki. Uvědomte si, prosím, že český Wikislovník není zdaleka jediným projektem běžícím na MediaWiki, a to nejen v rámci projektů Wikimedia, ale i obecně.

— Danny B. ( diskuse • mail • přehled příspěvků ) 26. 1. 2015, 00:44 (UTC)

Dvě věci mi na tom nejsou moc jasné:

Jestliže musíme mít data shodná s CLDR a CLDR je zapracováno do softwaru MediaWiki, k čemu potřebujeme ručně udržovaný seznam, který tyto data kopíruje a při každé aktualizaci se musí zkontrolovat a opravit? Nebylo by lepší místo toho použít přímo příslušnou funkci parseru?
Pokud je přípustné lokálně doplnit názvy jazyků, které v "normativním" (?) seznamu nejsou, do doby, než tam budou, proč je nepřípustné lokálně přepsat názvy jazyků, které jsou v "normativním" seznamu evidentně chybně, do doby, než tam budou opraveny? Jaké konkrétní technické či praktické potíže by taková odchylka způsobila? - Potíže, které může způsobit výskyt dvou "ladinštin" v seznamu je nasnadě: v kategorii Kategorie:Údržba:Deminimalizovat/ladinština se nám budou míchat hesla ze dvou nesouvisejících jazyků, v sekci "překlady" nebude čtenář tušit, do které "ladinštiny" se vlastně překladá (zvlášť pokud se mu nezobrazuje ani kód jazyka).--Shlomo (diskuse) 26. 1. 2015, 01:27 (UTC)

Jak jste vpisoval dovnitř textu, tak jsem to přehlédl, takže reaguji až teď...
Na první otázku si sám odpovídáte tou druhou. Osobně bych byl také raději, kdyby vše bylo vestavěno v MW, ale není, a vzhledem k tomu, že tu jsou ty jazyky používány, tak se používá příslušný modul (který navíc obsahuje i další informace, které v MW vestavěny nejsou). O doplňování jsem psal výše. Potíže to způsobí právě při použití vestavěné parser funkce a zároveň modulu. Dvě ladinštiny jsou zatím vaše pouhá hypotetická úvaha, neboť z lld tu nemáme ani heslo, ani překlady. A do doby, než tu (pokud kdy vůbec) něco z toho vznikne(*), bude jistě CLDR již patřičně opraveno - jak už jsem vám psal na jiném místě: Pokud se vám některá jména v CLDR nelíbí, nebo je tam postrádáte, dejte (mi) podnět k úpravě a já ji tam v květnu zanesu. Beta by mohla vyjít tak v červenci či srpnu, v polovině září pak finální verze.
A pro jistotu ještě jednou opakuji to, co už jsem také psal jinde: Já proti změně jako takové nic nemám, důvody pro ni jsou zřejmé. (A jak píši výše, přispějte klidně dalšími.) Ale je třeba ji dělat správně, tj. u zdroje. Pokud se věci dělají správně, lze dosáhnout spousty zajímavých důsledků - nejtypičtěji zjednodušování práce, možnosti rozdílných zobrazení dle vůle uživatele, či zjednodušení údržby.
— Danny B. diskuse • mail přehled příspěvků 6. 2. 2015, 00:20 (UTC)

Na první otázku si neodpovídám druhou. První otázka je "Proč používáme kšandy i pásek, když by stačilo jedno?" a druhá otázka je "Jsou vadné kšandy důvodem k tomu, abychom si k nim brali i vadný pásek?". Nešlo by to třeba vyřešit tak, že modul bude ve formě "ručního" seznamu obsahovat pouze "opravy a doplňky" oproti CLDR/parseru a v ostatních případech bude volat parserovou funkci? A až bude CLDR opraveno/doplněno, tak se příslušný záznam z "ručního" seznamu ručně odmaže?
A používá se fakticky někde vestavěná parserová funkce a zároveň modul? Nebo je to také jen hypotetická úvaha?
Na žádnou další zásadní chybu krom "ladinštiny" jsem v CLDR zatím nenarazil, ale procházel jsem ho jen zběžně a taky neznám všechny jazyky. Jen jsem si všiml v překladech "nedodělků" typu "fr-CA" jakožto český název pro "Canadian French", ale to určitě vidíte sám. Pokud se pokusíte zařídit opravu ladina, budu rád a budu Vám držet palce.--Shlomo (diskuse) 6. 2. 2015, 08:52 (UTC)

(*) Aktualizace: Tak vzhledem k posledním editacím jednoho opakovaně blokovaného, opakovaně a masivně loutkařícího, opakovaně provokujícího, opakovaně urážejícího, a tudíž obecně soustavně wikietiketu porušujícího uživatele už to futurum neplatí. Konstruktivnost tohoto kroku - provedeného pouhou hodinu poté, co jsem to sem psal, a směřujícího nyní k vámi zmiňovaným potížím - pro další vývoj jak této diskuse, tak dalších prací, a jeho vliv na zdejší bohužel již tak napjaté ovzduší nechť si uváží každý sám...
— Danny B. diskuse • mail přehled příspěvků 6. 2. 2015, 02:05 (UTC)

Nemohu si pomoci, ale mám dojem, že jste si o vytvoření tohoto hesla svým předchozím příspěvkem tak trochu řekl. Jak jste očekával, že zmíněný uživatel zareaguje, když se vyjádříte ve smyslu "to, že vám chybný název lad vadí, je pro mě irelevantní a dokud tu nebude heslo v lld, tak se tím zabývat nehodlám"?--Shlomo (diskuse) 6. 2. 2015, 08:52 (UTC)

Ještě k neživým (= historickým, starověkým a vymřelým) jazykům (syrština ponechána, když už byla zmíněna) - myslím, že aktuální počty překladů hovoří samy za sebe, a pokud se u nich (s výjimkou latiny) vyžádá zdroj, tak nepochybuji, že budou konvergovat k nule:

ang	40
cu	102
gmh	8
got	3
grc	75
hit	1
jpa	0
la	2 207
pox	1
prg	4
sa	19
sux	1
syr	12
tmr	21

— Danny B. ( diskuse • mail • přehled příspěvků ) 26. 1. 2015, 00:59 (UTC)

Co se týče syrštiny a aramejštiny, jsem myslím schopen s dozdrojováním účinně pomoci.--Shlomo (diskuse) 26. 1. 2015, 01:27 (UTC)

O syrštinu přeci vůbec nešlo. Ale k aramejštině klidně doplňte. Díky.
— Danny B. diskuse • mail přehled příspěvků 6. 2. 2015, 00:20 (UTC)

Zmíněna byla, tak jsem předpokládal, že i o ni šlo. Každopádně ozdrojování jim také neuškodí ;) Na aramejštinu příležitostně kouknu, konečně jsem dovybalil knihy po stěhování, tak to půjde o něco líp; chcete-li něco ověřit přednostně, neváhejte to označit šablonou (pokud mohu prosit, tak šablonou {{Doplňte zdroj}}, ne {{Ověřit}}).

Ty duplicity ISO 639-1 vs. ISO 639-3 jsem již srovnal.

— Danny B. ( diskuse • mail • přehled příspěvků ) 26. 1. 2015, 01:04 (UTC)

Díky za odpověď a za první „zásah”. Co se týče pojmu „mrtvý jazyk”, vycházel jsem z definice „nemající rodilé mluvčí”. Za syrštinu, v CLDR „Syriac”, je na anglické Wikipedii považován dialekt „Middle Aramaic”, který vyšel z užívání ve středověku. Nikoli dnešní dialekty.

Ohledně ladinštiny mi připadá menší zlo „neshoda s CLDR” než chybné uvádění úplně jiného jazyka. Momentálně tam je „neshod” 37 a domnívam se, že kdybych vás na ně neupozornil, byly by tam třeba ještě velmi dlouho. Takže bych neřekl, že to je věc, která „hoří”. Oproti tomu záměnu dvou jazyků by si žádný kvalitní a respektovaný slovník (nebo jazykový projekt) neměl dovolit. Je to nepřípustné. Přirovnal bych to k situaci, kdy před lety v Edenu před mezistátním fotbalovým utkáním místo litevské hymny zahráli lotyšskou... --Lexiq (diskuse) 26. 1. 2015, 03:55 (UTC)

Ad syrština: Wikipedie není věrohodný zdroj. Je třeba se přidržet ISO normy. Ad neshody: Vaše ničím nepodložené domněnky nekorelují se skutečností, neb jak jsem již výše psal, už před nějakou dobou jsem začal pracovat na nástroji pro (polo)automatické přebírání CLDR, takže by to s nejbližším vydáním bylo synchronizováno. A jak jsem už někde také psal, neshody podle všeho vznikly updaty v MW, resp. CLDR, neboť původní modul vznikl na základě dat vracených tehdy parser funkcí MW a doplněním o tehdy nevracené jazyky.
— Danny B. diskuse • mail přehled příspěvků 6. 2. 2015, 00:37 (UTC)

Obávám se, že vaše ujištění, že na něčem "nějakou dobu pracujete" nebo že něco "bude v nejbližší době", už asi málokdo bere vážně. Tím nezpochybňuji Vaši dobrou vůli, chápu, že dnešní multitaskingový život občas přináší situace, kdy je třeba něco jiného upřednostnit. Sám s tím rovněž zápasím :( --Shlomo (diskuse) 6. 2. 2015, 08:52 (UTC)

Ještě bych podotknul, že se občas i liší název existující kategorie od CLDR. Od toho tam chci vkládat výše uvedenou šablonu, takže prosím ty, kteří k tomu ještě něco mají, aby připomínkovali. JAn Dudík (diskuse) 26. 1. 2015, 08:12 (UTC)

Ano, liší, protože kategorie jsou zakládány živelně ručně a nepoužívají ani parser funkci ani modul. Je to mj. dáno tím, že tu stále bohužel není možné využít maximální automatizaci (mající mj. za důsledek konzistenci názvů jazyků), protože tu někteří uživatelé neustále blokují kroky k jejímu zavedení potřebné. :-/
— Danny B. diskuse • mail přehled příspěvků 6. 2. 2015, 00:25 (UTC)

A zase ta idiomatičnost

A propos idiomatičnost, řešená tentokráte u hesla SICAV: Řekl bych, že celá problematika "idiomatičnosti" je ve Wikislovník:PZH popsána poněkud zmateně. "Idiomatický" nebo "idiomatičnost" označují vlastnosti nebo vztah k idiomům (takto SSJČ), tedy slovním spojením (a v tomto smyslu ji trefně popisuje Wikislovník:PZH#Idiomatičnost, i když příklad z češtiny by byl na tomto projektu vhodnější...), na druhou stranu Wikislovník:PZH#Široce užívané „termíny“ uvádí, že do Wikislovníku patří nejen idiomy, ale i víceslovné termíny, přísloví, zkratky, akronymy, iniciály, prefixy, sufixy, znaky a mj. také "slova v obvyklém významu" Na tyto kategorie kritérium idiomatičnosti (tak jak ji popisuje SSJČ nebo příklad s bank parking lot) nesedí. Ovšem Wikislovník:PZH#Obecná pravidla požadují splnění kritéria "idiomatičnosti" u všech výše uvedených "termínů". Což nedává smysl. Zkoumejme idiomatičnost u idiomů, a u ostatních typů přípustných hesel nadefinujme smysluplná kritéria, která lze splnit.--Shlomo (diskuse) 3. 9. 2014, 17:26 (UTC) [druhé vydání: 9. 2. 2015]

Kolega mi mluví z duše. Je to takový prima klacek na téměř libovolného spolueditora. On se tady, mimochodem, o něco takového pokoušel před pár měsíci (a možná že ne poprvé) kolega Aeromix. Mně jeho argumentace připadala velmi přesvědčivá. Celkové vyznění navazující diskuze ale místy působilo tak, jako by tím hlavním bylo nedat mu za pravdu. Tzn. nedat za pravdu právě jemu. (Připouštím, že nějaká demagogie by se asi našla na obou stranách sporu, nicméně já v tomto nejsem žádný arbitr.) Konstruktivního z mojí strany prozatím nic, ale chtěl jsem se přece nějak ozvat na Shlomovu poznámku naznačující, že to zde nikoho netrápí. Trápí.--Pyprilescu (diskuse) 7. 10. 2014, 12:05 (UTC)

Budeme pokračovat? --Shlomo (diskuse) 9. 2. 2015, 15:52 (UTC)

Nemám momentálně čas se tímto blíže zabývat (např. hledat literaturu), ale co si pamatuju z nahlížení do literatury loni na jaře, ten význam např. v hesle idiom nebo na Wikipedii (viz první ref) je převzat/přeložen z angličtiny, kde je idiom nahlížen úplně jinak než v češtině. Profesor Čermák řeší jen skutečné, pravé idiomy, nikoli „idiomatická slovní spojení“. To je anglicismus, pro češtinu nevhodný. Prostě v angličtině má pojem idiom jiný význam než v češtině a zde se vychází z toho anglického pojetí, což je principiálně špatně. A jestliže na tom jsou založená pravidla, protože byla mechanicky přeložena z anglického Wikislovníku někým, kdo evidentně není expert na češtinu, tak ta pravidla už principiálně musí být špatná a ty spory jsou toho jen důsledek. Je nutné upravit pravidla tak, aby vycházely z vlastností daného jazyka, nikoli z jazyka z úplně jiné skupiny. --AuvajsAuvajs (diskuse) 9. 2. 2015, 16:11 (UTC)

EDIT: význam slova idiom jsem zde opravil. Rovněž by to chtělo opravit na Wikipedii. --AuvajsAuvajs (diskuse) 9. 2. 2015, 16:33 (UTC)

Správné jméno pro ng

Jan Dudík narazil na problém dvojího českého pojmenování jazyka, jehož zkratka je ng. Tedy jak správně tento jazyk pojmenovávat v češtině, jestli ndonga, nebo ndogština, nebo dokonce oshiwambo. Nepředpokládám, že by to tu někdo věděl, spíš mne zajímá, jakým způsobem určit jeho správný český název?--Juandev (diskuse) 9. 2. 2015, 16:40 (UTC)

Heh. Tady vládne Danny B. a ten ze své panovnické pozice rozhodl, že názvy jazyků jsou podle tohodle seznamu i v případě, že obsahuje chyby, viz název ladinština pro jazyk ladino. Takže v tomhle máš asi smůlu - musí to být „ndondština“. Konec diskuze. Danny B. má přeci pravdu. (A já za tenhle příspěvek nejspíš budu zablokovanej, takže se na pár dní až týdnů loučím.) --AuvajsAuvajs (diskuse) 9. 2. 2015, 16:55 (UTC)

To jsem psal již Janu Dudíkovi, že mi nepřipadá nějakej "ajťáckej" dokument pro tohle jako směrodatný. Spíše bych hledal nějaký lingvistický dokument, nebo bych se přinejhorším zeptal na nějaké vysoké škole, kde s tím mají zkušenosti.

Co se týče Dannyho B. je pravda, že jsem zaznamenal podobné tendence jinde. Wikislovník je ale otevřený projekt a rozhodnutí se tady tvoří na základě konsenzu komunity. Těm co tomu nevěří, je potřeba to stále opakovat.--Juandev (diskuse) 9. 2. 2015, 17:02 (UTC)

Ve snu jsem si vzpomněl, že existovala publikace jazyky/nepo písmo v edici Oko od albatrosu. To by mohlo pousloužit jako vodítko.--Juandev (diskuse) 10. 2. 2015, 07:50 (UTC)

CLDR

Kromě výše zmiňovaných Ladinštiny a Ndondšiny nacházím v CLDR několik dalších sporných (oproti očekávanosti či jazykovému cítění) názvů (staroangličtina/stará angličtina, xhoština/xhosa, zuluština/zulština, kiňarwandština/rwandština), nemluvě o závorkách (altajština (jižní)/jižní altajština) nebo o čárkách (javánština/jávanština). Ideální by bylo najít k příslušným řečem dobrý externí zdroj - nějakou odbornou publikaci, která uvádí české názvy takovýchto jazyků.

Zatím máme použity na Wikislovníku tyto nesrovnalosti (zkontrolováno jen pár kategorií):

Kategorie:Altajština (CLDR zná jen altajšinu jižní)
Kategorie:Aztéčtina (CLDR nezná, na WP článek w:Nahuatl, modul vkládá Nāhuatl)
Kategorie:Čérokézština (CLDR říká krátce Čerokézština)
Kategorie:Ladinština (viz výše, CLDR ani modul nezná)
Kategorie:Xhosa (CLDR i WP říká xhoština)
Kategorie:Zulština (CLDR i WP říká zuluština)

Co s nimi?

BTW, na některých Wikislovnících mají v kategorii jazyka i podkategorii typu překlady do jazyka XY. Kdybychom vhodně pojmenovali naše monitorovací kategorie a zařadili je tamtéž, měli bychom na Wikislovníku ne 160, ale 261 jazyků. JAn Dudík (diskuse) 9. 2. 2015, 20:59 (UTC)

Podle mne nejlépe zjistit, jak ty jazyky pojmenovává česká odborná literatura a pokud to nezjistíme, pak zvolit nejčastěji uživaný výraz dle Googlu. Ono se to lehce roboticky přejmenovat ne.--Juandev (diskuse) 9. 2. 2015, 21:03 (UTC)

Rozpory mezi CLDR a modulem a jazyky chybějící v CLDR máš tady pod Lípou o pár sekcí výš. Jen těch chyb bylo 37. Vycházel jsem teda z beta verze CLDR 27, ale snad ty rozdíly nebudou velký. --AuvajsAuvajs (diskuse) 9. 2. 2015, 21:11 (UTC)

Já neřeším ani tak moduly, jako kategorie. Nesporné případy v brzké době přejmenuji, trochu problém je s vytvářením (ověřením tvarů) přídavných jmen z některých jazyků. Zůstanou sporné/míchané. JAn Dudík (diskuse) 9. 2. 2015, 22:43 (UTC)

A abych nezůstal úplně nepochopen: nemá někdo odbornou literaturu, ve která by se daly sporné případy ověřit? JAn Dudík (diskuse) 9. 2. 2015, 22:46 (UTC)

Atlas jazyků světa, Albatros, 2007: altajština (žádná severní, jižní, ale nedělí ani romštinu), nahuatl, čerkezština, ladino, xhosa, zulu.--Zdenekk2 (diskuse) 10. 2. 2015, 09:29 (UTC)

Čerkezština snad ne. Určitě jste se díval na indiánské jazyky a ne na kavkazské?--Shlomo (diskuse) 11. 2. 2015, 16:38 (UTC)

Klégr, Zíma a kol.: Světem jazyků, Albatros, 1989: altajština/ojrotština, nahuatl, jazyk Čerokézů, ladino (pro lad i lld), xhoština, zulština.--Shlomo (diskuse) 11. 2. 2015, 16:38 (UTC)

Altajština: Altajštiny jsou dvě - severní a jižní, naopak není žádná "samotná" altajština, ergo je kategorie "Altajština" sama o sobě špatná.
Aztéčtina: Nesprávný nepřesný název. Správně je nahuatl. Modul vkládá aztéčtina.
Čérokézština: Zjevný překlep od zakladatele. Ostatně i podkategorie je s krátkým.
Ladinština: Netřeba mlátit dokola prázdnou slámu.
Xhosa: Řídit se dle CLDR, tj. xhoština.
Zulština: Nesprávný/nepřesný název. Používat zuluština.

Kdyby se tu používal mj. systém podstránek podle jazyků, k těmto problémům by nedocházelo. Ale to by nesměl být - podobně jako jiné další návrhy vedoucí k unifikaci a systematizaci a v konečném důsledku ke zjednodušení vkládání hesel a práce s nimi - a priori zamítán z většiny na základě subjektivních pocitů nebo dokonce osobních antipatií.
— Danny B. ( diskuse • mail • přehled příspěvků ) 9. 2. 2015, 23:20 (UTC)

Opravdu si nemyslím, že by jsme se měli řídit, podle nějakého ajťáckého dokumentu. Jsme na projektu lingvistickém, řiďme se tedy lingvistickými dokumenty. Dolož prosím svá výše uvedené tvrzení, mijo jiné i pro xhosa a zulu. Uvádí to tak lingvistická literatura? Která literatura to tak uvádí.--Juandev (diskuse) 9. 2. 2015, 23:26 (UTC)

Taky by mě zajímalo, kde bere Danny B. zdroje pro svoje tvrzení. Odkazy na lingvistickou literaturu nedává. Jediné, co z jeho příspěvku cítím, je imperativní mód, snaha autoritativně nařizovat názvy jazyků. Takže vážený Danny B., tímto vás upozorňuji na to, že tento projekt není vaším vlastnictvím a už vůbec ne vaším vladařstvím. Zde se rozhoduje na základě konsensu a nikoli na základě vašeho úradku. AD ladinština: JE třeba mlátit prázdnou slámu dokola a dokola. Protože jste to jedině vy, kdo pořád dokola a dokola zatvrzele a nesmyslně prosazuje chybný název jazyka i když ostatních rozporů mezi modulem a CLDR je 37. Zřejmě nemáte odvahu přiznat, že se mýlíte. --AuvajsAuvajs (diskuse) 10. 2. 2015, 09:40 (UTC)

Méně konfrontačního tónu, více konstruktivního tónu, díky.--Zdenekk2 (diskuse) 10. 2. 2015, 09:51 (UTC)

Tak já navím, mohl by se někdo z vás stavit v knihovně nebo na Filosofické fakultě a dodat k tomu nějakou literaturu?--Juandev (diskuse) 10. 2. 2015, 10:22 (UTC)

Další várka

Kategorie:Krymská tatarština - CLDR tvrdí turečtina (krymská), což je sice synonymum, ale mám dojem, že tatarština je očekávanější
Kategorie:Kvenština - CLDR ani modul neobsahují
Kategorie:Guernseyština - CLDR prý nově obsahuje, ale jako Normandštinu.
Kategorie:Ingrijština - WP a původní název tvrdí Ižorština
Kategorie:Abauština - CLDR ani modul neobsahují
Kategorie:Meänkieli - CLDR říká finština (tornedalská)

Z dosud zkontrolovaných kategorií mi vychází jeden poznatek: Bylo by dobré v modulu (v mediawiki?) upravit názvy jazyků, které jsou v CLDR vedeny se závorkovým rozlišovačem, aby se zobrazovaly v očekávaném formátu. tedy turečtina (krymská) - > krymská turečtina. JAn Dudík (diskuse) 11. 2. 2015, 20:31 (UTC)

Kategorie:Střední horní němčina. CLDR tvrdí Hornoněmčina (středověká). Zde jsou minimálně dva rozpory - střední nebo středověká? horní nebo horno- ? Obdobně staro-/stará.
CLDR stojí za starou bačkou, protože je často špatně nebo aspoň divně. Vůbec nevím, kdo to vytvářel a překládal, ale jestli nějaký dobrovolník bez znalostí, tak to tomu odpovídá. V tomhle konkrétním případě je to takhle: Střední horní němčina (je stará, střední a nová horní němčina, tohle je ta střední a označit ji za středověkou mi přijde zavádějící). --Palu (diskuse) 16. 2. 2015, 07:13 (UTC)
CLDR je alespoň nějaká autorita, na rozdíl od Wikipedie. CLDR is maintained by the CLDR technical committee, which includes organizations from IBM, Apple, Sun Microsystems and some government based organizations což mi nepřijde jako spolek dobrovolníků. Navíc je to projekt organizace UNICODE a data z něj využívají i operační systémy nebo různé programy, včetně MediaWiki. Jen zřejmě u některých méně známých jazyků nebyl použit nejrozšířenější název. Proto bych rád, aby se k těmto případům našel ještě nějaký jiný věrohodný zdroj a případně se na CLDR navrhla úprava některých názvů. JAn Dudík (diskuse) 16. 2. 2015, 08:50 (UTC)
Spolek dobrovolníků (nezávisle na tom jak honosných) to je, pakliže za tímhle účelem nezaměstnávají lingvistické odborníky na každý z těch jazyků. Jistě si každý uvědomuje, že IBM nepodniká v lingvistice, ale v IT. V češtině je řádově užitečnější a věrohodnější autorita toto (+ "jazyk" nebo změna -ský/-cký na -ština/-čtina). A pro případy, kdy toto není pro komplikace názvu jednoznačné (název např. v sobě obsahuje geograficko historické rozlišení, jako třeba střední horní němčina) je lepší sáhnout standardně po dostupných českých zdrojích. CLDR lze k tomu brát pouze jako nějaký nástřel k vyhledávání zdrojů, nikoliv jako zdroj. V tom se neliší od Wikipedie. --Palu (diskuse) 16. 2. 2015, 09:42 (UTC)
Kategorie:Tofalarština - CLDR ani modul neobsahují
Kategorie:Tagalština - CLDR tvrdí, že jde o tagalog.

JAn Dudík (diskuse) 15. 2. 2015, 21:49 (UTC)

Altajština vyměněna za jižní altajštinu (dle fr.wikt), kategorie by měla být smazána. Na ty ostatní se časem taky podívám. --Auvajs (diskuse) 5. 4. 2015, 12:47 (UTC)

Nespisovné tvary

Až doposud se na Wikislovníku neuváděly nespisovné tvary (nezaměňovat s častými chybami (lyžiny, vyjímka, apod.) či hyperkorektností (by jsme apod.)).

Kde, kdy a na základě čeho se dohodlo, že je možné sem ony nespisovné tvary (tj. hesla typu bílej, koukaj, přemejšlej apod.) vkládat?

Díky.

— Danny B. ( diskuse • mail • přehled příspěvků ) 10. 2. 2015, 15:20 (UTC)

Kde (a jestli vůbec) se to dohodlo, nevím. Jejich uvádění však zmiňuje Wikislovník:FH#Varianty. A některé nespisovné tvary se tu viskitují už pomněrně dlouho ;)

BTW jak vlastně rozlišit "nespisovné tvary" od "častých chyb"?--Shlomo (diskuse) 10. 2. 2015, 16:55 (UTC)

Tak když už se o tom rozběhla diskuse, tak já jsem pro, aby se tu vyskytovaly i nespisovné tvary. Je potřeba je ale označit za nespisovné.--Juandev (diskuse) 10. 2. 2015, 17:04 (UTC)

Taky myslím, že jestliže má Wikislovník za cíl popsat všechna slova všech jazyků, tak je nutné mezi to řadit i nespisovné tvary. Nicméně u většiny asi bude problém v dokládání, takže to místní Ref Nazis asi budou mazat. --AuvajsAuvajs (diskuse) 10. 2. 2015, 17:10 (UTC)

Problém je, že zatímco spisovných tvarů je definované množství, nespisovné je per definitio "vše, co není spisovné", tedy v podstatě neomezené množství. Proto pokud by se nespisovné tvary měly/mohly uvádět, je třeba obzvláště dbát na jejich doložitelnost. Nakolik je třeba dělat dusno i kolem zjevně existujících a doložitelných tvarů ponechám na jiných, ale u všech jen trochu sporných případů se k Ref Nazi oddílům hrdě hlásím.--Shlomo (diskuse) 10. 2. 2015, 17:27 (UTC)

Takže třeba se slovem "krutopřísnej" byste neměl problém, protože to asi podle googlu doložit jde, ale co slovo "trapáckej", který je na googlu leda na nějakejch blogískách? Nebo i to hezké slovo "blogísek". A co třeba tvar "na fejsu"? (na Facebooku), nebo "děfka"?--AuvajsAuvajs (diskuse) 10. 2. 2015, 17:45 (UTC)

Ano mám stejný dotaz na Shloma. Musí se to dokládat literaturou. Nestačí na to uplatit Google test? Mně přijde divné, že tu nemohou existovat slova, která běžně existují, ale jen proto že nejsou v důvěryhodných slovnících, tak tu nejsou.--Juandev (diskuse) 10. 2. 2015, 19:41 (UTC)

Nevím, co přesně myslíte "Google testem", ale myslím, že nestačí. Viz pravidla pro dokládání. Výskyt ovšem není nezbytné dokládat odbornou literaturou nebo slovníkem, viz zejména body 2 a 4.--Shlomo (diskuse) 10. 2. 2015, 20:56 (UTC)

Tady prosím vypište odbornou literaturu pro nespisovné tvary:

...

Díky --Dubicko (diskuse) 10. 2. 2015, 17:14 (UTC)

Proč?--Juandev (diskuse) 10. 2. 2015, 17:19 (UTC)

Proč?--Shlomo (diskuse) 10. 2. 2015, 17:27 (UTC)

Protože kromě SNČ žádný pořádný neznám a nevím, co tedy chcete zakládat. --Dubicko (diskuse) 10. 2. 2015, 17:39 (UTC)

Sice to nikde není výslovně uvedeno, ale přesto mám dojem, že dokládat je třeba pouze hesla již existující, resp. vznikající. Ne hesla, o kterých uvažujeme, že bychom je někdy v budoucnu třeba mohli vytvořit. Jinak jste si částečně odpověděla sama (SNČ), jistě se najde i řada odborných článků věnujících se té či oné oblasti nespisovné terminologie, jednotlivé výrazy označené jako nespisovné či hovorové lze najít i ve slovnících věnujících se převážně spisovné slovní zásobě (z toho, co mám teď hned po ruce, mohu uvést Váša-Trávníček). --Shlomo (diskuse) 10. 2. 2015, 18:13 (UTC)

Jsou nespisovné tvary a nespisovné tvary. Měly by být doložitelné věrohodnými zdroji. Což u tvarů slov, kde je koncové (nebo i prostřední) -ý nahrazeno za -ej (pěkný/pěknej, býk/bejk) nebo před počáteční o vloženo v (okno/vokno) pravděpodobně doložit půjde. Stejně tak půjde doložit hantec či nářečí. Tím se pokryje určitá část slov. U zbylých se pak uplatní pravidla jako na méně známá slova - máš zdroj? OK. Ne? {{Ověřit}}. JAn Dudík (diskuse) 10. 2. 2015, 19:47 (UTC)

Vidím tady jiný problém: Dejme tomu, že doložím výskyt tvaru "pěknej". Je to základní tvar (nom. sg. masc.), tedy lemma. Mám zde uvádět i "nespisovnou" ohýbací tabulku (...pěknýho - pěknýmu - ...)? Nebo to není lemma, alébrž nespisovný tvar, který uvedeme pouze s odkazem na tvar spisovný (popř. na lemma spisovného tvaru), a výskyt každého jednotlivého flexního tvaru je třeba doložit samostatně (... což se u spisovných tvarů nevyžaduje, nebo alespoň podle stávajících pravidel by se vyžadovat nemělo)?--Shlomo (diskuse) 10. 2. 2015, 20:56 (UTC)

Adjektiva z názvů jazyků

Narazil jsem na další problém s názvy jazyků. Zatímco na samotné názvy máme jistou autoritu (CLDR, i když má třeba své mouchy), na odvozená adjektiva už zdroje chybí. Jak správně pojmenovat třeba kategorii substantiv k jazyku ng (Ndondština)? Ndondská? Ndongská? k Zuluštině (zu)? Zuluská? Zulská? ke Xhoštině (xh) Xhoská? Existuje na toto nějaký zdroj? JAn Dudík (diskuse) 10. 2. 2015, 20:01 (UTC)

Honzo proč je to téma rozsekané již do 3. příspěvku? Furt se přeci řeší to samé. Tak to řešme na jednom místě. A dejme tomu čas.--Juandev (diskuse) 10. 2. 2015, 20:04 (UTC)

Protože jste sem ty a slimák vtrhli a začali diskutovat vrchem spodem a mé původní příspěvky jen pár hodin staré jsou někde nahoře. Navíc, teď už neřeším názvy jazyků, ale názvy odvozených adjektiv, což považuji za nové téma. JAn Dudík (diskuse) 10. 2. 2015, 21:26 (UTC)

No dobrá. Ale ty neumíš diskutovat do textu?--Juandev (diskuse) 10. 2. 2015, 21:28 (UTC)

Současné kategorizační názvosloví je z různých důvodů nevhodné, a toto je právě jeden z těch důvodů. Nicméně i zde platí stejně jako výše: Kdyby se tu používal mj. systém podstránek podle jazyků a další automatizační systémy, k těmto problémům by nedocházelo. Ale to by nesměly být - podobně jako jiné další návrhy vedoucí k unifikaci a systematizaci a v konečném důsledku ke zjednodušení vkládání hesel a práce s nimi - a priori zamítán z většiny na základě subjektivních pocitů nebo dokonce osobních antipatií.
— Danny B. ( diskuse • mail • přehled příspěvků ) 17. 2. 2015, 15:14 (UTC)

Příznaky

Ptal jsem se AuvajsAuvajs ohledně příznaků, protože to tu není nikde podrobně vysvětleno. Jak je tedy chápat. Mě to připadá jako označení nuancí jazyka (lístek - malý list, ale v botanice konkrétní hmatatelná věc) - což ne vždy tvoří jasnou hranici.--Juandev (diskuse) 16. 2. 2015, 13:29 (UTC)

Jelikož se mi nedostává odpovědí na moje otázky, vytvořil jsem k této problematice studijní výzkum na Wikiverzitě. Cílem je to dohloubky pochopit a pak k tomu tady na Wikislovníku vytvořit nápovědu.--Juandev (diskuse) 19. 2. 2015, 11:22 (UTC)

Příznak je upřesnění, za jakých podmínek se daný výraz používá.--Zdenekk2 (diskuse) 19. 2. 2015, 12:01 (UTC)

To mi nepřipadá moc přesně řečeno. Pokusím se navrhnout vlastní formulaci, jen co proniknu do problematiky trochu víc.--Juandev (diskuse) 19. 2. 2015, 13:16 (UTC)

Tak přesně: u odborných výrazů se příznakem uvádí obor, ve kterém se daný výraz v daném významu používá, u slohově příznakových výrazů se příznakem uvádí příslušná stylová charakteristika.--Zdenekk2 (diskuse) 19. 2. 2015, 22:01 (UTC)

A pak jsou ještě výrazy, kde oboje... Např. někdy nestačí, že je slovo označeno jako slang, protože může být používáno třeba i v desítkách různých, na sobě nezávislých slangů (a ve všech mít naprosto jiné významy). --AuvajsAuvajs (diskuse) 20. 2. 2015, 04:50 (UTC)

Dobře to AuvajsAuvajs vypíchl, to je důležitá okolnost. Jenže, jelikož mezi zdejšími špičkami není příliš oblíbený, bude to smeteno se stolu, pokud ne přímo zablokován (pochopitelně při jiné, vhodnější příležitosti, aby to nebylo tak okaté). Těm, kteří by chtěli tento povzdech onačit za trolling bych doporučoval, aby mírnili svoje cenzorské choutky, někteří jich už tu máme plné zuby. Raději pojďme svobodně tvořit a zdokonalovat - v tomto případě příznaky a případnou nápovědu k nim. --Kusurija (diskuse) 20. 2. 2015, 05:29 (UTC)

Ano, dobře to vypíchl. Zvláště důležité je to slovo oboje, které přesně vystihuje povahu dané situace.
— Danny B. diskuse • mail přehled příspěvků 20. 2. 2015, 05:39 (UTC)

Svou reakcí na Zdenkka2 jsem narážel na to, že na en se to vysvětluje takto: A context label identifies a definition which only applies in a restricted context. Což je podle mne zcela jednoznačné (i když se může stát, že jeden význam má více příznaků). Já si to vykládám tak, že se příznakem na en označují ta slova, která se nevyskytují v běžné mluvě ale právě jen v určité oblasti(ech). Zatímco Vaše definice jsou úplně opačné (slovo se vyskytuje v oblasti) a tím podle mne neříkají celou informaci. Ale je dobře, že o tom hovoříme, protože abychom to tak používali, tak bychom tomu měli rozumět.--Juandev (diskuse) 20. 2. 2015, 08:27 (UTC)

Slovní spojení / Fráze / Idiomy

Při řešení interwiki jsem narazil na jeden problém českého Wikislovníku. Víceslovná hesla jsou zařazena v jedné či dvou z těchto kategorií:

Ovšem jiné Wikislovníky rozlišují maximálně idiomy a fráze/slovní spojení. Výjimečně je pro některý jazyk někde k dispozici celá trojice odpovídajících kategorií. Napadají mne dvě řešení:

zrušit kategorii frází. hesla zařadit buď jako idiomy nebo jako slovní spojení. např. acheter chat en poche je zařazeno jak ve frázích, tak v idiomech.
- nebo sloučit fráze se slovními spojeními, beztak je fráze ustálené slovní spojení
zařadit kategorii frází pod kategorii slovních spojení a nechat bez interwiki.

Sám nemám vyhraněný názor, krom toho, že je v tom zmatek. Názory ostatních? JAn Dudík (diskuse) 4. 3. 2015, 11:37 (UTC)

Viz také článek Kolokace. Problém je v tom, že na české Wikipedii jsou povolena jen idiomatická slovní spojení, ostatní ustálená slovní spojení jako neidiomatické odborné termíny apod. mají smůlu. Kritizováno to bylo mnohokrát, ale správci požadavky na zařazení vytrvale blokují. Výrazy idiom a frazém jsou, pokud se nemýlím, v našem smyslu synonymy. Přitom ale idiom je přesnější, protože nenavádí k dalším snadno zaměnitelným významům toho slova (fráze může být také bezobsažná fráze a nebo slovní obrat). Čili pokud bychom chtěli být přesní a jednoznační, správně by bylo přejmenovat současnou kategorii slovní spojení na "idiomatická slovní spojení" a fráze na "idiomy" (tedy sloučit tyto kategorie). --Palu (diskuse) 4. 3. 2015, 12:00 (UTC)

To je poněkud nepřesné. Na Wikislovníku jsou povolena i neidiomatická slovní spojení jako poštovní známka, pouze se u nich požaduje, aby byla idiomatická. Což samozřejmě nedává smysl a vyvolává nekonečné a neřešitelné spory.

Také není zcela přesné, že neidiomatická slovní spojení mají smůlu. Mají smůlu jen tehdy, pokud se znelíbí některému z editorů s privilegovaným postavením idio-arbitra. Neidiomatická slovní spojení vytvořená či akceptovaná těmito editory tu samozřejmě zůstávají a je potřeba je rovněž někde kategorizovat.--Shlomo (diskuse) 4. 3. 2015, 14:06 (UTC)

O usurpování privilegií k rozhodování o mazání správci se právě vede diskuse. --Palu (diskuse) 4. 3. 2015, 14:18 (UTC)

To je samozřejmě dobře. Jen jsem chtěl upozornit, že neidiomatická slovní spojení zde přes občasné silácké výroky jsou a bohdá ještě nějakou dobu budou, takže při kategorizaci je třeba s nimi počítat.--Shlomo (diskuse) 4. 3. 2015, 14:57 (UTC)

Rychlá, předběžná reakce: Já v tom problém neshledávám, ba ani zmatek. (A prozatím jsem ani nepochopil, jak to může vadit při interwiki.) Podle mého vzdělání je idiom nadmnožinou frází, ale také přísloví, rčení, pořekadel, možná i některých přirovnání. (Je-li tedy něco příslovím, automaticky je to i idiomem.) Slovní spojení oproti tomu může být pouhým běžným spojením slov, tedy, jak píše Palu|kolega Palu, kolokací. Navíc fráze může být také konverzačním obratem neidiomatickým. Tudíž slučovat to by mi přišlo matoucí a nesprávné. (Možná tady říkám jinými slovy totéž, co Palu.) Ať se, prosím, vyjádří i kolegové Milda a AuvajsAuvajs|Lexiq - ti to budou mít ještě lépe nastudované, hádám. --Pyprilescu (diskuse) 4. 3. 2015, 14:16 (UTC)

O tom, že je to nadmnožinou, jsem nevěděl. Ale ke kolokaci je mi známo, že ta je nadmnožinou všech slovních spojení nezávisle na idiomatičnosti. Možná by se měl někde zpracovat nějaký strom vztahů mezi všemi těmito termíny, aby byla problematika jasnější. Třeba jako příloha. --Palu (diskuse) 4. 3. 2015, 14:22 (UTC)

Jasně, o tom, že kolokace je nadmnožinou nejvyšší, "žádná". ;-) Však taky jedním z doslovných významů collocatio je postavení/umístění vedle sebe (v tomto případě dvou a více slov). To s tím stromem je docela dobrý nápad, ale za sebe rovnou říkám, že já se toho skoro určitě nezhostím. --89.92.157.19 4. 3. 2015, 14:27 (UTC)

Stránku jsem vytvořil, prosím o případnou kontrolu a korekci. --Palu (diskuse) 4. 3. 2015, 15:19 (UTC)

Dle Čermákovy učebnice Jazyk a jazykověda, strany cca 210-215, ISBN 978-80-246-1946-0:

Frazém, resp. idiom je "každá ustálená anomální kombinace dvou či více prvků (morfémů, slov, popř. kolokací), z nichž alespoň jeden je členem extrémně omezeného a uzavřeného paradigmatu (třídy)".
"Oba pojmy, frazém a idiom, se prakticky překrývají, první však je označením formálních aspektů jevů, druhý aspektů sémantických".
Kolokace je "smysluplná lexikální kombinace slov (syntagmata, spojení slov)".
Kolokace se v zásadě dělí na neustálené (tvrdý chléb) a ustálené (žitný chléb). (Ústálené) kolokace dále na termíny (žitný chléb), frazémy (chléb náš vezdejší) a propria (Hradec Králové).
"Kolokací je v lexikonu mnohonásobně víc než prostých slov." (..) "Úhrn termínů včetně víceslovných je mnohonásobně větší než úhrn jednoslovných lexémů, jen sama terminologie chemická je větší než celý běžný neutrální lexikon." --AuvajsAuvajs (diskuse) 4. 3. 2015, 14:58 (UTC)

Prosím, nezatahujte sem nesouvisející problém, jaká slovní spojení zde mají místo. Problém je v tom, že:

Idiomy - kategorie existuje ve více jazycích
slovní spojení - kategorie existuje např. na de, es, fr, ru nebo pt slovníku
fráze - kategorie se slovem fráze v názvu existují jen na en, sv a nl slovníku

Jediným jazykem, kde se vyskytují vedle sebe slovní spojení i fráze je tedy čeština. A jde mi o to, zda to dělit na dvě skupiny (což znamená, že na en.wikt budou mít odkazy jen do tří jazyků) nebo dát všechny jazyky ke slovním spojením, a pak je zde otázka, co s frázemi JAn Dudík (diskuse) 4. 3. 2015, 20:36 (UTC)

S tím právě souvisí to, abychom si nejprve ty pojmy definovali (co který vlastně znamená), definovali si k tomu které pojmy sem zařazujeme podle současných pravidel a dali to dohromady - vytvořili vhodnou kateogorizaci. --Palu (diskuse) 4. 3. 2015, 21:25 (UTC)

Připouštíme-li existenci jednoslovných idiomů (kočkopes, černoprdelník ...?) nebo jednoslovných frází („Zdravíčko.“ „Děkuji.“ „Prosím.“ „Prosím?“), pak je nelze slučovat se slovními spojeními. Pokud považujeme idiomy za podmnožinu frází, pak můžou být příslušné kategorie sloučeny, nebo raději vnořeny. Další otázka je, zda kategorizaci idiomů a frází potřebujeme/chceme. Odpovědi na tyto otázky závisí na tom, jak si nadefinujeme idiom, frázi a slovní spojení. Stávající doporučení odkazuje na neexistující Wikislovník:Kategorizace, takže editorům nezbývá než improvizovat.

Já dosud používal kategorii (a nadpis 3. úrovně) "slovní spojení" čistě formálně, tedy pro jakýkoli "termín" (ve smyslu Wikislovník:PZH tvořený více než jedním slovem a netvořící celou větu. "Termíny" tvořící celou větu (bez ohledu na počet slov) jsem zpravidla kategorizoval jako fráze (popřípadě úsloví, rčení, pořekadla, přísloví, což jsou IMHO podmnožiny frází). Idiomy jsem kategorizoval pouze do kategorie idiomů - což odpovídá chápání idiomů jako podmnožiny "slovních spojení", s vyloučením "jednoslovných" idiomů. Připustíme-li jednoslovné (resp. složeninové) idiomy, pak by měl každý idiom být kategorizován navíc buď jako slovní spojení, nebo jako příslušný slovní druh; a informace, že jde o idiom, by se neměla objevit jako nadpis 3. úrovně (===idiom===), nýbrž pod ním jako mluvnická kategorie (* ''idiomatické'').

Každopádně si myslím, že to, kolik interwiki odkazů budou mít při takovém či onakém řešení na anglickém (nebo jakémkoli jiném) wikislovníku, bychom při rozhodování neměli brát v potaz.--Shlomo (diskuse) 4. 3. 2015, 23:47 (UTC)

Staročeština vedená jako samostatný jazyk?

Nestálo by za to vést staročeštinu jako samostatný jazyk? Liší se slovníkem, ale také skloňováním, výslovností, zápisem, atd. Viz kokot, kur (kurzy), kokeš (kokše, ne kokeše), kohút (ne kohout). Přijde mi, že to míchání současného vývojového stupně češtiny s předešlými historickými stupni (mezník je asi národní obrození?) může v některých situacích působit dost zmatečným dojmem a je potřeba zbytečně mnoho to rozličně komentovat. --Palu (diskuse) 9. 3. 2015, 09:22 (UTC)

Jako samostatný jazyk ji nelze dát, protože nemá vlastní ISO kód.

Ostatně, jak bys chtěl charakterizovat staročeštinu? od jakého okamžiku už nejde o staročeštinu ale o moderní češtinu? Jak chceš věrohodně dokládat, že jde o staročeštinu a ne o archaický výraz? °°°°JAn Dudík (diskuse) 9. 3. 2015, 09:25 (UTC)Přesunuto z Diskuse s uživatelem:Palu#Staročeština.--Juandev (diskuse) 9. 3. 2015, 09:30 (UTC)

Já osobně bych byl velmi pro, napadlo mě to už několikrát. Ten mezník by ale bylo opravdu potřeba vymezit. Imho, národní obrození mi připadá příliš pozdě. Osobně, jakožto téměř naprostý nebohemista, bych ale řekl, že to bude ještě někde relativně hluboko před kraličtinou - tzn. další minim. dvě století hlouběji. Díky za iniciativu.
(@JAnDudík: Neexistence kódu mi nepřipadá jako nepřekonatelná překážka - to ostatně může být dočasná záležitost.) --Pyprilescu (diskuse) 9. 3. 2015, 09:37 (UTC)

Co to ale je staročeština?--Juandev (diskuse) 9. 3. 2015, 09:29 (UTC)

Pomocí staročeských slovníků lze zdrojovat jednotlivosti (jednotlivá slova) a nějaká definice staročeštiny by se určitě našla. Prací o vývoji češtiny bude spousta. Vývojová fáze se běžně definuje i jinde, například stará angličtina, starořečtina, střední latina, střední horní němčina apod. Teď v rychlosti nacházím jenom články na Wikipedii, třeba tento. Podle toho lze brát starou češtinu asi do 15. století v kontextu stará, střední, obrozenecká, moderní. Myslím, že tak to berou i ony staročeské slovníky. U ESSČ píší, že hesla jsou rekonstruována do podoby předpokládané v roce 1300, a MSS většinou uvádí tvary slov k počátku 14. století, někdy ale i pozdější. Index Slovníku staročeských osobních jmen Jana Svobody uvádí jména do 1419. Každopádně rozdílů oproti současné češtině je velmi mnoho. --Palu (diskuse) 9. 3. 2015, 09:58 (UTC)

stará angličtina (ang) a střední angličtina (enm) mají definovaný ISO kód. Viz též Wikislovník:Podmínky_pro_zařazení_hesla#Zařazované_jazyky.

Osobně si myslím, že jako příznak a související kategorie ano, jako samostatný jazyk (uváděný např. v sekce překlady) ne. JAn Dudík (diskuse) 9. 3. 2015, 10:20 (UTC)

V překladech skutečně ne, protože jde o archaický jazyk, ale všechno ostatní je myslím možné vkládat. Rozdíl by byl jen v tom, že se to nebude motat v současné češtině. Skoro každá informace o staročeském slově zařazená do novočeského hesla musí být nějakým způsobem okomentována, což je ve výsledku dost nepřehledné a taky náročné pro editora. Jinak co se týče PZH, tak tam nevidím problém z pohledu toho, že neexistuje iso. Akceptovatelné jsou všechny přirozené jazyky. Ztohoto pohledu je k diskusi jen to, jestli lze brát starou češtinu za zvláštní jazyk, jiný než moderní češtinu. A podle mě kvůli vážným odlišnostem hlubším než např. u nářečí ano. --Palu (diskuse) 9. 3. 2015, 10:42 (UTC)

OK, tak staročeština tu nemůže být oficiálně vedena ani jako součást češtiny a je potřeba to obcházet mimo modul. Danny B. to jednomyslně rozhodl. To je úroveň. --Palu (diskuse) 9. 3. 2015, 10:50 (UTC)

@Palu: tak o to mi právě šlo. O nějaké časové vymezení. Význam slov se posunuje a kdyby staročeštinou byl úsek 1000 let, tak to je moc dlouho. Pokud je to ale úsek 100-200 let, tak je to ještě snesitelné. Je ještě otázka, proč to nazývat staročeštinou? Venkovská čeština 18. století by se pak nazýval jak?--Juandev (diskuse) 9. 3. 2015, 10:52 (UTC)

Staročeština má odbornou definici a tu je potřeba přejmout, pak bude vše v pořádku. Zatím to vypadá na češtinu od nejstarštích dob do 15. století. --Palu (diskuse) 9. 3. 2015, 10:57 (UTC)

Souhlasím, ale jen pod podmínkou, že někde pojem "staročeština" bude přesně definován, a pokud možno i vysvětlen, ať nedochází ke sporům a nejasnostem. --AuvajsAuvajs (diskuse) 10. 3. 2015, 00:16 (UTC)

Zařazení slovinčtiny

Slovinčtina je vymřelý jazyk, který se v tuto chvíli vyskytuje na 3 Wikislovnících (en, lt, pl). Nemá ale přidělen samostatný ISO kód, na en má kód zlw-slv (zlw-západoslovanština + slv, které je ale samostatně úplně jiná slovinština, což je trochu zavádějící), na lt má zase kód csb-slv, protože je brána jako dialekt kašubštiny ([1]). Někdy je ale považována za dialekt pomořančtiny, polštiny a nebo samostatný jazyk, proto je anglická verze neutrálnější a přesnější. Souhlasí komunita s tímto kódem pro začlenění jazyka do českého Wikislovníku? --Palu (diskuse) 10. 5. 2015, 15:56 (UTC)

S jakým kódem? --Auvajs (diskuse) 13. 5. 2015, 00:01 (UTC)

S kódem z anglické verze, který je podle mě neutrálnější z výše uvedených důvodů. Takže "zlw-slv." --Palu (diskuse) 13. 5. 2015, 06:53 (UTC)

Není ISO kód - není samostatný jazyk - nezařazovat vůbec. (Mj. k tomu nikdy nevznikne samostatný Wikislovník ani jiný projekt Wikimedia.)
A nelíbí se mi manipulativní způsob dotazu - jedná se vůbec o to, zda takový jazyk přijmout, a nikoliv o to, pod jakým kódem - to je až sekundární záležitost a vzhledem k výše uvedenému podružná.
— Danny B. ( diskuse • mail • přehled příspěvků ) 28. 5. 2015, 21:21 (UTC)

Hovorová čeština

Dovoluji si všechny upozornit, že hovorová čeština není nespisovná, ale je mluvenou formou spisovné češtiny. Proto slova jako hajzl, fotrovatět atd. rozhodně nejsou hovorová slova. Slova, která patří do hovorové češtiny, by měla být kodifikována některým ze slovníků spisovné češtiny nebo podobnými zdroji. Dávejte si na to prosím pozor. --Okino (diskuse) 18. 5. 2015, 16:59 (UTC)

hovorová čeština je na rozmezí ... a má různou míru "nespisovnosti" (citace snč).. a ano... tento příznak by měl být podložen akademickým zdrojem... --Dubicko (diskuse) 18. 5. 2015, 17:04 (UTC)

Podrobněji zde. Též "Následující přehled snad může ilustrovat pojmy hovorová čeština a obecná čeština, mezi nimiž vede hranice spisovného a nespisovného jazyka." nebo "Hovorové výrazy, na rozdíl od spisovných v užším smyslu, mají různou míru „nespisovnosti“." Tedy i podle toho je hovorový jazyk skutečně spisovný a opravdu se nemůže plést s obecným jazykem, jak se tu děje.

Mimochodem, všiml jsem si také, že hovorovost je vedena také u některých dalších jazyků, kde to ale vůbec nechápu. Osobně se domnívám, že nejméně u několika z těch jazyků, jde o ryzí vlastní výzkum, jelikož mám pocit, že třeba u angličtiny něco jako "hovorová angličtina" jako zavedený lingvistický termín vlastně neexistuje (stejně jako neexistuje "spisovná angličtina"); a tam, kde ho někdo zavádí (např. zde), má to velmi odlišný význam ve srovnání s hovorovou češtinou. Mám pocit, že tady by to chtělo nějakou odbornou radu... --Okino (diskuse) 24. 5. 2015, 19:31 (UTC)

Colloquial English je zavedený lingvistický termín a slovníky ho někdy užívají (obvykle hovorové výrazy označují zkratkou colloq., mám doma slovník, který to vyznačuje výrazem spoken). Jan.Kamenicek (diskuse) 24. 5. 2015, 20:51 (UTC)

Tento příznak užívá i en.wiktionary. Jiná věc ale je, jestli to lidé vkládají "pocitově" (vlastní výzkum) nebo podloženě. Domnívám se, že zejména u cizích jazyků by se tento příznak měl rozhodně zdrojovat. Jan.Kamenicek (diskuse) 24. 5. 2015, 21:23 (UTC)