Diskuse k šabloně:Wikidata

Poslední komentář: před 1 rokem od uživatele Dan Polansky v tématu „Jak se dozvědět o českých lemmatech

Smysl

editovat

Dovolil jsem si zpochybnit smysl této šablony na Wikilovníku, nebo alespoň aktuální provedení a použití, viz zrušení pilotního ukázkového nasazení. —Mykhal (diskuse) 26. 4. 2023, 14:00 (CEST)Odpovědět

Hlavní hodnotu vidím v tom, že Wikidata obsahuje překlady do mnoha jazyků, čili je to vlastně doplňkový překladový slovník, byť wiki-slovník a tím pádem nespolehlivý a zdroj hypotéz, jež si uživatel teprve na vlastní náklad ověří; tak např. pro heslo Sokrates. Přitom však není možné použít jinou propojovací techniku než právě odkaz, protože obecně co jedno heslo ve Wikislovníku, to několik položek ve Wikidata. Hodnota je možná ještě vyšší než u odkazu na Wikipedie, právě kvůli těm překladům. --Dan Polansky (diskuse) 26. 4. 2023, 14:03 (CEST)Odpovědět
No ale to přece píšu přímo v šabloně:
"Odkaz na Wikidata, projekt, jenž obsahuje:
* Překlady do řady jazyků přímo v projektu
*Odkazy do autoritativních zdrojů (např. knihovních tezaurů), jež pečlivě řídí název, pod kterým položky vedou
Tak nevím. Jak jsem to měl lépe říct? --Dan Polansky (diskuse) 26. 4. 2023, 14:04 (CEST)Odpovědět
Nezpochybňuji užitečnost šablony jako takové, ale opravdu spíš to první/ukázkové použití, kdy se do hesla obsahujícího více významů, dolů, odkázalo pouze na jeden z významů. —Mykhal (diskuse) 26. 4. 2023, 14:14 (CEST)Odpovědět
Mě však nešlo tolik o ukázkové použití, jakoby vzorové; cítil jsem jen potřebu odkázat na Wikidata a cítil jsem, že by bylo lepší to dělat šablonou spíš než ručně. Zamyslel jsem se, jak má šablona fungovat a jaké má mít parametry. Lze to možná udělat i lépe; třeba by šablona mohla mít více parametrů a umožnit nějaké disambiguátory v závorkách, aby čtenář věděl, na jaký cílový odkaz vlastně kliká, tedy zda na Sokrates (jméno) nebo Sokrates (filozof). Jedno vyvolání šablony by mohlo vytvořit všechny odkazy pro různé Q-entity najednou. Co já vím: Wikidata|Q1|Q2|d1=jméno|d2=filozof. Nebo r1 a r2, jako rozlišovač. Když něco hezkého navrhnete, můžeme to uskutečnit. Může to udělat třeba někdo, kdo rád dělá šablony. --Dan Polansky (diskuse) 26. 4. 2023, 14:19 (CEST)Odpovědět
Aha. Tak pokud to nebylo myšleno jako jediný postačující odkaz, obdoba jiných slovníkovitých externích odkazů, tak v pořádku.
Teď jsem si uvědomil, že Wikidata provozují nejen Q*, ale i L* – lexémy. —Mykhal (diskuse) 26. 4. 2023, 14:30 (CEST)Odpovědět
Odkázat na lexémy je též téma, ale to mě příliš nezajímá: Q* jsou sémantika a L* jsou pišišvořiny jako skloňování aj. Pokud si někdo chce nechat napadnout, jak odkazovat i na lexémy, lze. Možná šablony Wikidata-Q a Wikidata-L? Nevím. --Dan Polansky (diskuse) 26. 4. 2023, 14:33 (CEST)Odpovědět
Lexémy nejsou pišišvořiny, ale ekvivalent hesel Wikislovníku (resp. tedy jeho elementárních prvků: lemma slova jedné gramatické kategorie v jednom jazyce). Teoreticky by tedy určitě šlo provázat hesla Wikislovníku s příslušnými lexémy (asi i víceméně automaticky), i když je přínos diskutabilní: lexémy na Wikidatech nejsou příliš komplementem hesel na Wikislovníku, spíše by to měl být budoucí lepší substitut. (Ale bohužel z licenčního hlediska nejde Wikislovník prostě do Wikidat zmigrovat.)
A jestli odkazovat na tematické položky na Wikidatech…? No, v principu asi může být, byť je otázkou, pro které okruhy hesel to dává jak dobrý smysl. Ale nijak extra to nevybočuje z dávno existujících šablon typu {{Wikipedie}} či třeba konkrétně {{Wikidruhy}}, což je víceméně totéž, řekl bych: u hesel popisujících taxony zcela smysluplný odkaz. Ale v zásadě bych si myslel, že pro takové to základní odkazování je lepší odkázat na Wikipedii; z ní se na Wikidata lze dostat také a pro čtenáře je to rozhodně přívětivější a očekávatelnější.
--Mormegil (diskuse) 2. 5. 2023, 11:18 (CEST)Odpovědět
To byla trochu nadsázka, nicméně konzistentní s mým dlouhodobým postojem, že skloňování, výslovnost a dělení jsou informace druhé kategorie, zatímco etymologie, definice, synonyma, a příklady použití jsou informace první kategorie. Přitom už je skloňování beztak pokryto v IJP, takže lexémy alespoň pro češtinu nic moc nepřidají. A lexémy samy o sobě neobsahují sémantiku, jen linkují na Q-entity, ale není jasné, jak třeba řeší přídavná jména a slovesa.
Souhlasím, že odkaz do Wikipedie v principu pokrývá i Wikidata. Ale je to na více kliknutí, a uživatel tím odkazem není posílán přímo na Wikidata, takže si v článku Wikipedie ani nemusí uvědomit, že by bylo dobré se do Wikidata podívat. Když projekt odkazuje přímo na Wikidata, říká čtenáři: koukni tak, je tam něco dobrého slovníkového. A je to přesně tak. Dokonce jsou tam někdy i pokusy o definici skrze statementy, např. v entitě pro pojem/concept (Wikidata:Q151885), a to je naprosto fascinující, jakje možné skrze více statementů přiřadit pojmu více genera/rodů a pak uvést, kteří filozofové s kterým genusem/rodem souhlasí. --Dan Polansky (diskuse) 2. 5. 2023, 11:24 (CEST)Odpovědět
Asi jsem se nevyjádřil srozumitelně. Nejde mi o to, jak podivné výrazy používáte. Jde mi o to, že lexémy neobsahují pouze „skloňování, výslovnost a dělení“, ale že ve skutečnosti obsahují všechny zmíněné informace obou kategorií, tzn. včetně etymologie, definic (samozřejmě!!), příkladů použití, překladů atd. Nevím, co by na přídavných jménech či slovesech mělo být tak speciálního, co nevíte, jak řešit, ale reálně se řeší úplně stejně jako cokoli jiného. --Mormegil (diskuse) 2. 5. 2023, 14:10 (CEST)Odpovědět
To je moje chyba; máte pravdu. Snad dříve definice neobsahovaly. Zde např. pro české "kočka": Wikidata:Lexeme:L1778; odtud první definice: "domácí zvíře z rodu Felis". Proto se zdá odkazování na lexémy navýsost relevantní. --Dan Polansky (diskuse) 2. 5. 2023, 14:18 (CEST)Odpovědět
Ohledně přídavných jmen, např. "bílý" v Wikidata:Lexeme:L252501, není jasné, jak je propojit s Q-entitami, protože ty jsou obvykle tvaru podstatných jmen, tedy "bílost", ne "bílý". Zatímco lexém pro kočku je propojen via "item for this sense" s Q146 čili kočka domácí, lexém pro "bílý" v tuto chvíli nemá ani textovou definici, natož propojení na Q-entitu.
Za mě zůstává, že ve mě zatím lexémy nebudí velké nadšení, a nevím ani kolik jich tam pro češtinu je; Q-entity na mě vcelku působí mnohem zajímavěji. --Dan Polansky (diskuse) 2. 5. 2023, 14:25 (CEST)Odpovědět
Ještě subjektivně: coby uživatel slovníku bych Wikidatí rozhraní lexémů užívat nechtěl. Je velmi nekompaktní. Definice obsahuje ve více jazycích pod sebou, čili při řekněme 20 definicích zhoršuje soustředění. Hledat tam informaci, která mě zajímá, bude hodně obtížné; ohýbané tvary, místo aby byly prezentovány kompaktně v tabulce jako ve Wikislovníku, jsou velmi svisle roztahané. --Dan Polansky (diskuse) 2. 5. 2023, 14:34 (CEST)Odpovědět
Ano, také nikde netvrdím, že mají slovníkoví uživatelé využívat rozhraní Wikidat; to je podkladová databáze, kterou lze využívat a zpřístupňovat různými způsoby a formami. (Zcela namátkou příklad strojově vygenerovaného formátu „wikislovníkového hesla“ podle dat v lexému.) (Naopak odkazovat na samotné syrové rozhraní Wikidat místo uživatelsky vstřícnější Wikipedie navrhujete vy.) --Mormegil (diskuse) 2. 5. 2023, 16:24 (CEST)Odpovědět
Ano, navrhuji odkazovat do rozhraní Wikidat pro Q-entity, neboť jenom tam jsou k mání definice skrze statementy, byť jen částečné, viz onen výše zmíněný pojem/concept, a tam jsou v tabulce pod sebou vypsány překlady do různých jazyků, což má Wikipedie pouze skrze interwiki, a v tom Wikidata mi to přijde lepší, ale třeba se to někomu líbí více přes interwiki. A Wikidata má v té tabulce překladů nejen překladová slova a výrazy ve sloupci label ale i definice v různých jazycích ve sloupci description; pak tam má alternativní labely, což je také docela zajímavé, často synonyma; a to Wikipedie nemá. --Dan Polansky (diskuse) 2. 5. 2023, 16:39 (CEST)Odpovědět
A nemají-li čtenáři a uživatelé užívat rozhraní Wikidat pro lexémy, pak také nemá tak velký smysl na lexémy odkazovat, nebo? Nebo by šlo o to, že by chtěli třeba lexémy sami upravovat? To by chtělo asi se zamyslet více do šířky. --Dan Polansky (diskuse) 2. 5. 2023, 16:29 (CEST)Odpovědět
Pro záznam, linkování na lexémy se vůbec nebráním, jenom to v tuto chvíli není moje iniciativa. Možná bych se měl zamyslet, jak linkovat i na lexémy, zvlášť, pokud pro linkování na ně projeví někdo nadšení, neboli pokud do někoho vstoupí jistý duch, figurativně řečeno. --Dan Polansky (diskuse) 2. 5. 2023, 11:32 (CEST)Odpovědět
Děkuji tak či tak za váš zájem. Třeba se s vaší pomocí podaří návrh šablony výrazně zlepšit; teď je to opravdu jen iniciální zárodečná verze. --Dan Polansky (diskuse) 26. 4. 2023, 14:34 (CEST)Odpovědět

(zpět) Je připustit, že například u slova "Sokrates" je relevantní entit velká řada a je dobré se omezit na ty entity, které nás nejvíce zajímají, což bude jméno a filozof; podobně pojmenované jsou však také film, kapela, časopis, aj. Kdo chce se může zamyslet nad příklady a principy zahrnutí, které entity ještě ano a které už ne. Jako první kritérium by mohlo být, že nás zajímají hlavně entity, pro které máme definiční řádky, a těch bude pomálu. --Dan Polansky (diskuse) 26. 4. 2023, 14:55 (CEST)Odpovědět

Sokrates

editovat

Palu mezitím šablonu z hesla Sokrates bez diskuze smazat. Asi nesplňovala WS:FH? Ale v čem? Chce někdo Palua revertovat? --Dan Polansky (diskuse) 26. 4. 2023, 15:09 (CEST)Odpovědět

Naléhavost odstranění

editovat

Nevidím naléhavost odstranění šablony z hlavního jmenného prostoru. Když se to nebude líbit, odstraní se to botem nebo via AWB; šablona je užitá vždy na řádku začínajícím na "* " a na tom řádku už je jenom tato šablona a nic jiného. A na první pohled to přece zcela scestné není: něco jako slovníková data v Q-položkách ve Wikidata jsou a je to sesterský projekt. --Dan Polansky (diskuse) 2. 5. 2023, 16:31 (CEST)Odpovědět

Lepší syntaxe pomocí modulu

editovat

V hesle kočka nyní syntaxe vypadá takto:

* {{Wikidata|l=1|L1778}}, {{Wikidata|Q146|kočka domácí}}, {{Wikidata|Q25265|kočkovitá šelma}}, {{Wikidata|Q159565|vrba jíva}}, {{Wikidata|Q207334|kocovina}}, {{Wikidata|Q11658|transformátor}}

Viděl bych to radši takto:

* {{Wikidata|L1778|Q146|š1=kočka domácí|Q25265|š2=kočkovitá šelma|Q159565|š3=vrba jíva|Q207334|š4=kocovina|Q11658|š5=transformátor}}

Kde lexém coby první položka by byl volitelný. Tedy i toto by šlo:

* {{Wikidata|Q146}}
* {{Wikidata|Q146|š1=kočka domácí|Q25265|š2=kočkovitá šelma|Q159565|š3=vrba jíva|Q207334|š4=kocovina|Q11658|š5=transformátor}} 

To by šlo udělat pomocí modulu, ideálně, kdyby se někomu chtělo; šablona nepozná, že řetězec začíná na "L", pokud vím. Šablonou by to šlo, kdyby se řeklo l=L1778, včetně "l=". "š" znamená "štítek"/label. --Dan Polansky (diskuse) 22. 5. 2023, 07:52 (CEST)Odpovědět

Výstup by mohl být kompaktnější. Zřetězením třech volání šablony je nyní např. takový:

  • Wikidata lexém: pes, Wikidata: pes, Wikidata: samec psa

S využitím navržené nové syntaxe by mohl být:

  • Wikidata: lexém pes, pes, samec psa

--Dan Polansky (diskuse) 22. 5. 2023, 08:06 (CEST)Odpovědět

Proč odkazovat na Q-entity ve Wikidata

editovat

K rozpravě výše ještě znovu ale strukturovaně a trochu jinak:

  • Kvůli překladům do mnoha jazyků, byť nespolehlivým.
  • Kvůli definici skrze statementy/strukturované výroky, jež je někdy pěkně explicitní, např. v "liška/fox", kde se strukturně jasně řekne, že to není žádný pořádný taxon.
  • Kvůli odkazům do tezaurů, jež někdy poskytují definice ve formě "scope note" či podobné; pro češtinu např. TDKIV nebo NK ČR AUT. Kdo umí např. česky, anglicky a německy si může prohlédnout všechny tezaury v těchto jazycích, tj. pro angličtinu AAT s velmi mnoho položkami a se "scope notes". Tím si ušetříme odkazovat na tyto zajímavé zdroje přímo z Wikislovníku, ale i to bychom mohli činit.
  • Kvůli odkazu do Omegawiki, byť ten by mohl být i odkázán přímo. To je strukturovaný vícejazyčný slovník, který byť proti Wikislovníkům spíše neobstál, přesto někdy stojí za shlédnutí.
  • Kvůli odkazu do WordNetu, byť ten by mohl být i odkázán přímo. WordNet má definice stejně jako sémantické vztahy hypernymie, hyponymie, holonymie a meronymie.
  • Kvůli odkazu do Britannicy.

K alternativě odkazování na Wikipedii:

  • Ne každou Q-entitu má Wikipedie jako separátní článek, např. "soubor autorit/authority file"; v obecnosti tedy use case Wikidata není plně pokryt nepřímo skrze Wikipedí článek.
  • Položka ve Wikidata je sama o sobě z pohledu slovníkových potřeba často hodnotnější než Wikipedie, a tedy odkázat přímo tam, kde je hodnota, je lepší, než odkazovat pouze nepřímo. Protože je to Wikidata, která má překlady, strukturované definice, odkazy na tezaury, Omegawiki, WordNet, Britannicu, aj., nikoli nutně samotná Wikipedie.

Na okraj či coby slabší:

  • Wikidatí lexémy mají své vlastní definice ale také odkazují na Q-položky. Tedy v tom propojení vidí hodnotu, byť z pohledu definic je propojení zbytné. Proč nevidět podobně hodnotu v propojení Wikislovníku přímo do Q-položek Wikidata?

Toto strojí v kontrastu k L-entitám neboli lemmatům, o kterých tento oddíl není. --Dan Polansky (diskuse) 22. 5. 2023, 09:45 (CEST)Odpovědět

Jak se dozvědět o českých lemmatech

editovat

Lze spouštěním dotazů zadaných do formuláře v této stránce:

Vybrat všechna česká lemmata:

SELECT ?lexemeId ?lemma
WHERE {
  ?lexemeId dct:language wd:Q9056;
            wikibase:lemma ?lemma.
}

Vybrat všechna česká vlastní jména:

 
SELECT ?lexemeId ?lemma
WHERE {
  ?lexemeId dct:language wd:Q9056;
            wikibase:lemma ?lemma;
            wikibase:lexicalCategory wd:Q147276.
}

Českých lemmat je přes 25 000. --Dan Polansky (diskuse) 1. 6. 2023, 18:32 (CEST)Odpovědět

Zpět na stránku „Wikidata“.