Amsavatar
Připojil(a) se dne 23. 4. 2021
Poslední komentář: před 1 rokem od uživatele Amsavatar v tématu „Skloňování“
Příklady z jazykových modelů
editovatV obecné rovině platí, že je nelze vkládat, protože není jasný jejich autorskoprávní status. --Tchoř (diskuse) 4. 5. 2023, 00:15 (CEST)
- @Tchoř: Kdo tvrdí, že jejich autorskoprávní status není jasný? Mně se na tom nejasného nezdá nic. Autorské právo může náležet pouze člověku, jen a pouze člověku. AI model žádné autorské právo nemá a ani nikdy mít nebude, protože prostě není člověkem. Stejně jako např. fotoaparát nemá autorské právo k fotografiím, které se jeho prostřednictvím vytvoří. --Amsavatar (diskuse) 15. 5. 2023, 23:58 (CEST)
- Ovšem nafotím-li tím fotoaparátem nějaký autorskoprávně chráněný obraz, je už situace složitější. A s těmi jazykovými modely je to právě tenhle problém: Nebývá úplně jasné, nakolik je jejich výstup prací jiného člověka.--Tchoř (diskuse) 16. 5. 2023, 08:30 (CEST)
- Založil jsem Wikislovník:Pod lípou#Příklady z pseudo-AI jako je ChatGPT; příklady začalo vkládat více účtú, tak ať máme centrální místo rozpravy. --Dan Polansky (diskuse) 16. 5. 2023, 10:52 (CEST)
- Ovšem nafotím-li tím fotoaparátem nějaký autorskoprávně chráněný obraz, je už situace složitější. A s těmi jazykovými modely je to právě tenhle problém: Nebývá úplně jasné, nakolik je jejich výstup prací jiného člověka.--Tchoř (diskuse) 16. 5. 2023, 08:30 (CEST)
- @Tchoř: Pokud vím, tak ten chatbot nemá uloženou databázi nějakých literárních děl, z nichž by čerpal, ale má obrovskou zásobu tzv. transformačních matric, což chápu tak, že má (dynamicky se vyvíjející) soustavu pravděpodobností toho, jak se v jazyce slova kombinují. Když mu dáte příkaz třeba "napiš mi větu, v nichž jsou použita slova traktor a mňoukat", tak nezačne prohledávat tisíce naskenovaných knih, jestli tam někde náhodou něco nenajde, ale zapojí ty svoje soustavy pravděpodobností a začne provádět určité výpočty. Ani to nutně nemusí být složité kalkulace, je to spíše velmi mnoho relativně jednoduchých kalkulací. Z nich vyleze věta např. "Traktor na poli hlučně funí, ale rozhodně neumí mňoukat jako kočka.", ovšem pro ten model to je prostě jen výsledek kalkulací, nemá sebemenší tušení, co ty slova znamenají, "pouze" zná pravděpodobnosti toho, jak se spolu kombinují. Pokud to mám shrnout, tak pravděpodobnost toho, že chatbot napíše autorskoprávně chráněnou větu je v podstatě stejně velká jako že ji nevědomky napíše člověk. Tedy zanedbatelně malá.--Amsavatar (diskuse) 16. 5. 2023, 15:50 (CEST)
- Ta pravděpodobnost může pravděpodobně poměrně dramaticky růst u vzácných slov, respektive jejich vhodných kombinací. Jak už jsem vysvětloval pod Lípou, reálně pro používání jazykových modelů nemáme důvod.
- A budeme-li mluvit o češtině, pak je použití veřejně dostupných velkých jazykových modelů nevhodné i proto , že ty modely jsou v jádru založené na angličtině a ten překlad do češtiny je u nich druhořadý. Z hlediska českého jazyka poskytují velmi špatné výsledky. Osobně jsem to nezkoušel, ale kamarádi mi ukazovali, jaké nesmysly jim jeden z oslavovaných jazykových modelů dal, když požádali o slovní hříčku nebo o rým. Daná slovní hříčka si hrála s dvojsmyslností anglických ekvivalentů a v češtině zkrátka vůbec slovní hříčkou nebyla. A rým se nerýmoval.--Tchoř (diskuse) 16. 5. 2023, 20:02 (CEST)
- @Tchoř: Pokud vím, tak ten chatbot nemá uloženou databázi nějakých literárních děl, z nichž by čerpal, ale má obrovskou zásobu tzv. transformačních matric, což chápu tak, že má (dynamicky se vyvíjející) soustavu pravděpodobností toho, jak se v jazyce slova kombinují. Když mu dáte příkaz třeba "napiš mi větu, v nichž jsou použita slova traktor a mňoukat", tak nezačne prohledávat tisíce naskenovaných knih, jestli tam někde náhodou něco nenajde, ale zapojí ty svoje soustavy pravděpodobností a začne provádět určité výpočty. Ani to nutně nemusí být složité kalkulace, je to spíše velmi mnoho relativně jednoduchých kalkulací. Z nich vyleze věta např. "Traktor na poli hlučně funí, ale rozhodně neumí mňoukat jako kočka.", ovšem pro ten model to je prostě jen výsledek kalkulací, nemá sebemenší tušení, co ty slova znamenají, "pouze" zná pravděpodobnosti toho, jak se spolu kombinují. Pokud to mám shrnout, tak pravděpodobnost toho, že chatbot napíše autorskoprávně chráněnou větu je v podstatě stejně velká jako že ji nevědomky napíše člověk. Tedy zanedbatelně malá.--Amsavatar (diskuse) 16. 5. 2023, 15:50 (CEST)
- "Ta pravděpodobnost může pravděpodobně poměrně dramaticky růst u vzácných slov, respektive jejich vhodných kombinací." - Toto tvrzení je pravděpodobně vaše čistá spekulace, že? Moje zkušenosti to totiž nic takového neukazují. Co se týče vhodnosti/nevhodnosti použití, to je úplně na jinou debatu, podle mě je ChatGPT docela dobrý nástroj pro určité činnosti, ale ten nástroj musí člověk umět používat, znát jeho limity a být schopný opravovat chyby, nelze se spoléhat na to, že veškerou činnost udělá za vás, v ideálním případě může udělat třeba 80%. Ale těch 80% může dost ušetřit práci. --Amsavatar (diskuse) 16. 5. 2023, 22:32 (CEST)
- @Dan Polansky: Proč to zbytečně devalvujete tím spojením pseudo-AI? To nepovažuji za korektní přístup, připadá mi to jako určitá manipulace s tou diskuzí hned od začátku, že AI je něco nepatřičného, nežádaného nebo nedokonalého.--Amsavatar (diskuse) 16. 5. 2023, 15:50 (CEST)a
- Pokud znáte definici AI od Turinga, pak vidíte, že k pravé AI to má bezpečně daleko. Nebo to passuje Turingův test? To bych se divil. Ale pokud někomu ono pseudo- přijde příliš silné, pak lze použít kvazi- nebo semi- nebo tak; ale nějaké alienans je na místě. --Dan Polansky (diskuse) 16. 5. 2023, 15:52 (CEST)
- @Dan Polansky: Proč to zbytečně devalvujete tím spojením pseudo-AI? To nepovažuji za korektní přístup, připadá mi to jako určitá manipulace s tou diskuzí hned od začátku, že AI je něco nepatřičného, nežádaného nebo nedokonalého.--Amsavatar (diskuse) 16. 5. 2023, 15:50 (CEST)a
- Tu definici neznám a ani mě nezajímá (proč by měla?) Nejsem teoretik, ale praktik. Asi rok si hraju s ML/DL modely a nikde jsem nikoho neviděl použít "pseudo-AI", "kvazi-AI" nebo "semi-AI", prostě to je AI.--Amsavatar (diskuse) 16. 5. 2023, 16:09 (CEST)
- Pokud nemáte žádnou definici AI, pak nedokážete říct, zda je to AI. Jinak jsem více napsal Pod lípu; např. slavný Chomsky se vyjádřil shodně. Já mám smysl pro přesnost, narozdíl od mnohých jiných, proto vymýšlím výrazy, které věrněji zachycují skutečnost. --Dan Polansky (diskuse) 16. 5. 2023, 16:19 (CEST)
- AI je právě díky ChatGPT dnes v podstatě mainstream, hraje si s ní třeba i můj 93letý dědeček, a tak asi došlo k určité vulgarizaci toho pojmu, ale na tom není nic špatného, prostě takový je vývoj. Tedy pokud trváte na tom, že AI je to, co za ni považuje Turing, obecně takové pojetí nebude srozumitelné a tak je otázka, k čemu taková komunikace je...--Amsavatar (diskuse) 16. 5. 2023, 16:39 (CEST)
- Turingův test je splněn, pokud testující člověk při interakci se systémem přes textovou linku kde zároveň interaguje s člověkem přes druhou textovou linku nedokáže poznat, díky té interakci, zda je onen systém člověk; tak je to dle mé paměti a nechce se mi to prověřovat, ale tak nějak to bude. A to dává smysl; neboť umělá inteligence je inteligence taková, že je umělá. A ChatGPT inteligencí příliš neoplývá. Vulgarizace snižuje naši schopnost komunikovat; např. vulgarizací slova "pojem" se z něho stalo slovo snížené užitelnosti, a nutí se sem nové slovo koncept, což by jinak nebylo potřeba. --Dan Polansky (diskuse) 16. 5. 2023, 16:55 (CEST)
- Já jsem se zatím všude setkával s pojetím, že AI je nadřazený pojem pro ML (machine learning) a DL (deep learning), bez ohledu na to, jak je to silné v porovnání s lidskou inteligencí. Takže i velmi jednoduchý ML model provádějící regresi na základě datasetu o 2 parametrech a 10 položkách je typově vzato AI model, byť v podstatě se jedná o jednu triviální matematickou funkci. Samozřejmě netvrdím, že toto je jediné pojetí AI co existuje, ale podle mého zdání je nejrozšířenější. --Amsavatar (diskuse) 16. 5. 2023, 22:32 (CEST)
- To jako má být lineární regrese AI? To už je více hraní šachů AI. Přitom se AI obecně rozumí spíše AGI, čili obecná, nikoli jednodoménová, inteligence. Ani nelineární regresi či curve fitting na množině bodů, které jsou podmnožinou E2, nepovažuji za AI a to ani za semi-AI. Nevidím to tak, že by jakákoli ML již byla AI. Ale možná máte odkazy, které svědčí o opaku, což bych se u novinářů nedivil; kdyby novináři psali jenom o tom, čemu rozumí, to by bylo ticho. --Dan Polansky (diskuse) 16. 5. 2023, 22:36 (CEST)
- To je spíš pojetí těch, kdo tu "AI" vytváří, textů jako toto (
While all ML models are AI models, not every AI model is an ML model.
by se určitě dalo najít mnoho. --Amsavatar (diskuse) 16. 5. 2023, 22:44 (CEST)- Nu ano, tato stránka, jakási wiki s nejasnou autoritou a seriózností, opravdu prohlašuje lineární regresi za "AI model". Což mi hlava nebere, neboť je to něco tak jednoduchoučkého a ostatně na slovech a modelech částí světa nezávislého, jako jenom málo co. To opravu zaslouží zvát vulgarizací, a to masivní. --Dan Polansky (diskuse) 16. 5. 2023, 22:49 (CEST)
- To je spíš pojetí těch, kdo tu "AI" vytváří, textů jako toto (
- To jako má být lineární regrese AI? To už je více hraní šachů AI. Přitom se AI obecně rozumí spíše AGI, čili obecná, nikoli jednodoménová, inteligence. Ani nelineární regresi či curve fitting na množině bodů, které jsou podmnožinou E2, nepovažuji za AI a to ani za semi-AI. Nevidím to tak, že by jakákoli ML již byla AI. Ale možná máte odkazy, které svědčí o opaku, což bych se u novinářů nedivil; kdyby novináři psali jenom o tom, čemu rozumí, to by bylo ticho. --Dan Polansky (diskuse) 16. 5. 2023, 22:36 (CEST)
- Já jsem se zatím všude setkával s pojetím, že AI je nadřazený pojem pro ML (machine learning) a DL (deep learning), bez ohledu na to, jak je to silné v porovnání s lidskou inteligencí. Takže i velmi jednoduchý ML model provádějící regresi na základě datasetu o 2 parametrech a 10 položkách je typově vzato AI model, byť v podstatě se jedná o jednu triviální matematickou funkci. Samozřejmě netvrdím, že toto je jediné pojetí AI co existuje, ale podle mého zdání je nejrozšířenější. --Amsavatar (diskuse) 16. 5. 2023, 22:32 (CEST)
- Turingův test je splněn, pokud testující člověk při interakci se systémem přes textovou linku kde zároveň interaguje s člověkem přes druhou textovou linku nedokáže poznat, díky té interakci, zda je onen systém člověk; tak je to dle mé paměti a nechce se mi to prověřovat, ale tak nějak to bude. A to dává smysl; neboť umělá inteligence je inteligence taková, že je umělá. A ChatGPT inteligencí příliš neoplývá. Vulgarizace snižuje naši schopnost komunikovat; např. vulgarizací slova "pojem" se z něho stalo slovo snížené užitelnosti, a nutí se sem nové slovo koncept, což by jinak nebylo potřeba. --Dan Polansky (diskuse) 16. 5. 2023, 16:55 (CEST)
- AI je právě díky ChatGPT dnes v podstatě mainstream, hraje si s ní třeba i můj 93letý dědeček, a tak asi došlo k určité vulgarizaci toho pojmu, ale na tom není nic špatného, prostě takový je vývoj. Tedy pokud trváte na tom, že AI je to, co za ni považuje Turing, obecně takové pojetí nebude srozumitelné a tak je otázka, k čemu taková komunikace je...--Amsavatar (diskuse) 16. 5. 2023, 16:39 (CEST)
- Pokud nemáte žádnou definici AI, pak nedokážete říct, zda je to AI. Jinak jsem více napsal Pod lípu; např. slavný Chomsky se vyjádřil shodně. Já mám smysl pro přesnost, narozdíl od mnohých jiných, proto vymýšlím výrazy, které věrněji zachycují skutečnost. --Dan Polansky (diskuse) 16. 5. 2023, 16:19 (CEST)
- Tu definici neznám a ani mě nezajímá (proč by měla?) Nejsem teoretik, ale praktik. Asi rok si hraju s ML/DL modely a nikde jsem nikoho neviděl použít "pseudo-AI", "kvazi-AI" nebo "semi-AI", prostě to je AI.--Amsavatar (diskuse) 16. 5. 2023, 16:09 (CEST)
- (zpět) Např. "While artificial intelligence encompasses the idea of a machine that can mimic human intelligence, machine learning does not. Machine learning aims to teach a machine how to perform a specific task and provide accurate results by identifying patterns." https://cloud.google.com/learn/artificial-intelligence-vs-machine-learning
- Ale když jeden čte ten článek, tak může stejně z jiných míst nabýt dojmu, že ML je jakoby podtřída AI a tedy že stejně jako kočka je savec, tak ML je AI. Ale to by spíš bylo jako si myslet, že detekce hran za retinou/sítnicí v člověku je lidské vidění; detekce hran je jenom malinká a dost přímočará část vidění a k vidění má astronomicky daleko, neboť vidění zahrnuje nejen konstrukci 3D model viděného světa ale i obohacení tohoto modelu o fyzikální a jiné vlastnosti, čili je např. nůž viděn coby kovový, byť čistě nefyzikální model by pouze určil geometrii nože a obarvení jeho povrchu. --Dan Polansky (diskuse) 16. 5. 2023, 22:46 (CEST)
Skloňování
editovatKdybyste toho Mauglího a hlavně Balúa uměl naskloňovat, tak to by bylo super. Třeba vám dobře poradí četbot :). --Dan Polansky (diskuse) 22. 5. 2023, 14:57 (CEST)
- Zkopíroval jsem mu skloňovací tabulku se slovem Petr a napsal, ať totéž vytvoří pro Mauglí a Balú. Vygeneroval toto:
{{Substantivum (cs) | snom = Mauglí | sgen = [[Mauglího]] | sdat = [[Mauglímu]] / [[Mauglíovi]] | sacc = [[Mauglího]] | svoc = [[Mauglí]] | sloc = [[Mauglím]] / [[Mauglíovi]] | sins = [[Mauglím]] | pnom = [[Mauglíové]] | pgen = [[Mauglích]] | pdat = [[Mauglím]] | pacc = [[Mauglí]] | pvoc = [[Mauglíové]] | ploc = [[Mauglích]] | pins = [[Mauglími]] }} {{Substantivum (cs) | snom = Balú | sgen = [[Balúa]] | sdat = [[Balúovi]] | sacc = [[Balúa]] | svoc = [[Balú]] | sloc = [[Balúovi]] | sins = [[Balúem]] | pnom = [[Balúové]] | pgen = [[Balúů]] | pdat = [[Balúům]] | pacc = [[Balúy]] | pvoc = [[Balúové]] | ploc = [[Balúích]] | pins = [[Balúy]] }}
--Amsavatar (diskuse) 22. 5. 2023, 15:06 (CEST)
Super, děkuji. Nejsem si však 100% jistý, že je to dobře, i když to vypadá docela plauzibilně. Ideální by bylo najít nějaký vzor v IJP, který končí na í a ú či ů, čili je velmi těsně podobný. Kdybych si byl jistý, tak to vložím, ale takhle váhám. --Dan Polansky (diskuse) 22. 5. 2023, 15:14 (CEST)
- Dal jsem mu jako vzor jméno s plurálem, lepší bylo nějaké bez plurálu. Tvar Mauglíovi je asi navíc, jinak je to asi dobré, když se odstraní ten plurál. Na -í končí celkem běžné jméno Jiří. --Amsavatar (diskuse) 22. 5. 2023, 15:17 (CEST)
- Prima, Mauglí bude podle Jiří. Mě vlastně zajímal hlavně Balú, protože Palu bude po vzoru Balú. (Už mě nebaví zpaměti hádat, jak se "Palu" vlastně skloňuje. Pořád v tom dělám nejspíš chyby.) --Dan Polansky (diskuse) 22. 5. 2023, 15:25 (CEST)
- Tohle jsem teď našel: [1]. --Amsavatar (diskuse) 22. 5. 2023, 15:28 (CEST)
- To vypadá jako trefa do černého. Bylo by to tedy dle Nehrú a ten je v IJP přímo[2]. Klasse. --Dan Polansky (diskuse) 22. 5. 2023, 15:31 (CEST)
- Takže Balúa má chatbot dobře :)) --Amsavatar (diskuse) 22. 5. 2023, 17:05 (CEST)
- To vypadá jako trefa do černého. Bylo by to tedy dle Nehrú a ten je v IJP přímo[2]. Klasse. --Dan Polansky (diskuse) 22. 5. 2023, 15:31 (CEST)
- Tohle jsem teď našel: [1]. --Amsavatar (diskuse) 22. 5. 2023, 15:28 (CEST)
- Prima, Mauglí bude podle Jiří. Mě vlastně zajímal hlavně Balú, protože Palu bude po vzoru Balú. (Už mě nebaví zpaměti hádat, jak se "Palu" vlastně skloňuje. Pořád v tom dělám nejspíš chyby.) --Dan Polansky (diskuse) 22. 5. 2023, 15:25 (CEST)