Nepoznané vědění, které my máme, ale AI chybí

Martin Šrubař · 8. 4. 2026

Profesionální cyklista sebevědomě závodící vedle někoho, kdo na kole nejistě balancuje a přitom čte Příručku pro cyklisty
Poslední dobou používám pro programování jak Claude, tak Gemini — pracuji na aplikaci, která zpracovává dokumenty Microsoft Word. V režimu chatu si oba modely při běžných programátorských úkolech vedly srovnatelně. Jeden byl lepší v tom, druhý zase v něčem jiném. Jeden z kroků ale vyžadoval sofistikovanou manipulaci s čistým OOXML — se značkovacím jazykem uvnitř wordového dokumentu — a v tom byl Gemini soustavně lepší. A ne jen o trochu. Výrazně. V celé řadě příbuzných úloh řešil tuto jasně definovanou, odborně náročnou výzvu s mnohem větší přesností. Totéž jsem od té doby pozoroval i u dalších složitých, ale úzce vymezených problémů. Když je úkol jasně definovaný a záleží hlavně na doménových znalostech, má Gemini často navrch.

Pak jsem ale přešel na Claude Code a situace se obrátila. Claude dokázal úspěšně dokončit mnohem rozsáhlejší a ambicióznější úkoly než Gemini za použití podobných nástrojů. Projekty zasahující do více souborů, nejednoznačné požadavky, zotavování z chyb za běhu, sladění mnoha kroků k dosažení cíle. Ne proto, že by byl chytřejší v kterémkoli z jednotlivých kroků, ale proto, že dokázal udržet pohromadě celý kontext.

Tenhle rozdíl mi nedal pokoj. Když dokáže být Gemini přesnější ve specializovaných úlohách, proč má Claude Code navrch u komplexnější práce? Nabízí se odpověď, že za tím stojí lepší infrastruktura — práce s nástroji, přístup k souborům, iterativní zpracování. Jenže to je pouze popis, nikoli vysvětlení. Co přesně ta infrastruktura vlastně poskytuje?

Abychom na to dokázali odpovědět, myslím, že musíme rozlišit tři druhy znalostí, které se běžně zaměňují.

Vrstva 1: Doménové znalosti. Specifikace OOXML. Anatomie lidského kolena. Judikatura týkající se smluvních sporů. Syntaxe Pythonu. To jsou znalosti, které lze najít v učebnicích, dokumentaci a referenčních materiálech. Dobře se předávají v písemné podobě — dají se studovat, memorovat, vyhledávat. V tomhle LLM modely vynikají. Tyto znalosti jsou hojně zastoupeny v trénovacích datech a jde o typ informací, u kterých má jasně definovaná otázka v literatuře prokazatelně dohledatelnou odpověď. Tento typ znalostí nám poskytuje především formální vzdělávání a právě odtud pramení výhoda modelu Gemini ve specializovaných úlohách: přesné doménové znalosti precizně aplikované v praxi.

Vrstva 2: Praktické znalosti. Tady se láme chleba mezi čerstvým absolventem a člověkem s třiceti lety praxe — a nejde o to, že by měl ten druhý načteno o třicet let víc.

Čerstvě atestovaný chirurg i veterán se třemi dekádami praxe oba znají anatomii. Oba složili stejné zkoušky. Rozdíl je v tom, že veterán po hmatu pozná, že tkáň pod jeho prsty nepůsobí správně, ještě než je cokoliv viditelně v nepořádku. Pozná, kdy hrozí komplikace — ne z monitorů, ale na základě vzorců, které rozpoznal u tisíců předchozích případů a které by nedokázal plně popsat, kdybyste se ho zeptali. Ví, jak upravit postup přímo během operace, když se učebnicový přístup střetne s reálnou fyziologií konkrétního pacienta, která nikdy přesně neodpovídá tomu, co předpokládá teorie.

To jsou znalosti, které se učedníci učí od mistrů. Nikoli doménové znalosti — ty jsou v osnovách —, ale praktická moudrost nasbíraná léty praxe, pozorováním toho, co funguje, vnímáním vzorců a osvojováním si poučení, která nikdy nebyla explicitně vyřčena. Je to to, co juniorní vývojář získá po letech práce po boku seniorních kolegů: ne jak funguje JavaScript (to je Vrstva 1), ale kdy refaktorovat a kdy kód raději neměnit, které architektonické vzory budou způsobovat problémy při větším škálování, jak číst zdrojový kód a vědět, kde se skrývají problémy.

A teď to nejdůležitější: tyto znalosti ve většině případů v knihách nenajdete. Nejen proto, že by se těžko zapisovaly, ale ze dvou hlubších důvodů.

Prvním je problém převoditelnosti. Některé znalosti existují v jedné formě — tělesné, smyslové, motorické — a nelze je beze ztrát převést do jiné — verbální či textové. Matematické vzorce popisující rovnováhu na kole jsou naprosto přesné. Inženýr řídicích systémů by je dokázal odvodit a postavit robota, který na kole udrží balanc. Nemůžete si ale tyto vzorce osvojit jako schopnost na tom kole jezdit. Zkušený cyklista zase nedokáže tyto vzorce na základě své jízdy odvodit. Obě formy jsou neporovnatelné — ne proto, že by kterákoli z nich byla neúplná, ale protože slouží odlišným kognitivním funkcím. Vzorec popisuje fyziku. Samotná dovednost je touto fyzikou, aplikovanou v praxi prostřednictvím těla. Znalost vzorce dovednost nepřenese a ovládání dovednosti neodhalí vzorec.

Druhým důvodem je to, čemu bych říkal problém intuice. Velkou část expertního úsudku tvoří rozpoznávání vzorců, které se po dlouhou dobu trénuje na datech s obrovským množstvím šumu a nízkou informační hodnotou. Chirurgovo „tady něco nesedí” není nějaké jednoduché pravidlo, které by se dalo rovnou naučit. Je to výstup jeho skutečné biologické neuronové sítě, trénované na tisících případů a drobných indikátorech, které samy o sobě neznamenají téměř nic, ale společně tvoří jasný signál. Nedá se to zapsat, protože žádné jediné jasné „to“ zkrátka neexistuje. Je to statistický vzorec rozprostřený napříč celou kariérou pozorování zatížených šumem, který nelze rozložit na jasně formulovatelná pravidla o nic víc, než se dají váhy natrénované neuronové sítě rozložit na lidsky srozumitelnou logiku.

Tyto dva mechanismy — znalosti, které nelze převádět mezi různými formami, a rozpoznávání vzorců, které nelze rozložit na pravidla — vysvětlují, proč je křivka kodifikovatelnosti tak strmá. Prvních 80 % praktických znalostí tvoří věci, které slovně vyjádřit lze, i když to dosud nikdo neudělal. Zbývajících 20 % je skutečně složitých, tvořených znalostmi, které se vzpírají převodu z tělesné zkušenosti, a intuitivním rozpoznáváním vzorců, které si člověk vybudoval ze šumem zatížených signálů v průběhu času.

Existuje celý obor — Kognitivní analýza úloh (Cognitive Task Analysis) — věnovaný vytahování tohoto typu znalostí z expertů. Funguje, ale ne dokonale. Výzkum ukázal, že experti činí zhruba 70 % svých rozhodnutí nevědomě a že i když se záměrně snaží své znalosti předat, podstatnou část kroků i důvodů vynechají. Ty znalosti v sobě mají — používají je při každé příležitosti, ale při běžném vysvětlování zkrátka nevyjdou najevo. Strukturované dotazování z nich dokáže část zachytit, ale celý proces je drahý, časově náročný a nevyhnutelně ztrátový.

Vrstva 3: Metaprocedurální znalosti. Toto je vrstva pod odborností i praktickou moudrostí: základní schopnost efektivně přistupovat ke složitým, neznámým úkolům. Jak něco rozložit na zvládnutelné části. Jak rozpoznat, které závislosti jsou klíčové. Jak seřadit činnosti tak, aby první kroky nenarušily ty následující. Jak odhadnout náročnost, rozdělit si pozornost a přizpůsobit se, když se realita odchýlí od plánu. Kognitivní věda má pro tyto aspekty své termíny — exekutivní funkce, metakognice, heuristické uvažování —, ale ty se studují především v kontextu vývojové psychologie a klinické praxe (jak děti získávají schopnost plánovat nebo co se stane, když ji poškodí poranění mozku), nikoli v kontextu systematického kódování těchto schopností pro potřeby AI.

Nejde o žádnou specializovanou dovednost. Každý dospělý člověk, který kompetentně funguje ve společnosti, ji do jisté míry má. Téměř nic z toho ovšem nebylo zachyceno ani zdokumentováno, protože to nikdo vlastně ani nepovažuje za znalost.

Některé praktické znalosti dříve skutečně vědomé byly — chirurg, který se záměrně naučil novou techniku; vývojář, který cíleně studoval nový framework. Ale ohromné množství z nich bylo získáno oním nevědomým vstřebáváním, jaké je charakteristické pro učení se jazyku. Chirurg se vědomě nerozhodl naučit, jak na hmat působí abnormální tkáň — tento cit se v něm vybudoval během tisíců zákroků, aniž by prošel fází záměrného učení. Seniorní vývojář v sobě cíleně nepěstoval instinkt pro rozeznání špatné architektury — ten se zformoval tím, jak v průběhu let narážel na chyby, které nikdy nikdo explicitně nekatalogizoval.

Rozdíl mezi Vrstvou 2 a Vrstvou 3 nespočívá v tom, že jedna se učila vědomě a druhá ne. Velká část Vrstvy 2 byla získána stejně nevědomě. Rozdíl je v rozsahu: Vrstva 2 je specifická pro danou doménu — je vázaná na chirurgii, programování nebo truhlařinu. Vrstva 3 je univerzální v tom smyslu, že se uplatňuje ve všech oborech —, ale není mezi lidmi rovnoměrně rozložena. Někteří jedinci mají Vrstvu 3 mnohem silnější než ostatní a tato variabilita může být podstatnější, než si obvykle připouštíme. Schopnost efektivně přistoupit k neznámému a složitému úkolu — rozložit ho, seřadit kroky, stanovit priority, přizpůsobit se — je pravděpodobně přesně to, co odlišuje vysoce efektivní lidi od těch méně efektivních, a to bez ohledu na inteligenci. Podobně je tomu i u srovnání Gemini a Claude Code: hrubý kognitivní výkon u jasně definovaných úloh je jedna věc; schopnost usměrnit tento výkon k dosažení spolehlivých komplexních výsledků je věc druhá a tyto dvě vlastnosti nemusí nutně jít ruku v ruce. Vrstva 3 ale nemá vyhrazený obor, neexistuje u ní žádná skupina certifikovaných expertů ani systematický soubor postupů — což extrémně znesnadňuje její studium či zachycení.

Podívejte se teď na to, čím Claude Code skutečně disponuje a co ho činí tak efektivním, a uvidíte, jak jsou v něm současně zastoupeny Vrstva 2 i Vrstva 3, i když se toto dělení nikde výslovně neuvádí.

To, co procedury Claude Code vlastně napříč oběma vrstvami kódují, je určitý druh znalostí: věci, které mají naprosto zřejmé řešení, pokud o nich přemýšlíte, ale celý háček spočívá v tom vědět, že o nich vůbec přemýšlet máte. Zkontrolovat kód po vytvoření souboru. Přečíst si dokumentaci ještě před začátkem psaní. Začít nejtěžší částí, ne tou nejsnazší. To nejsou žádné přelomové objevy — každý vývojář, který to uslyší, rovnou řekne „to je přece jasné“. Ale právě to „to je přece jasné“ představuje největší problém. Daná znalost se zdá triviální, jakmile se řekne nahlas, a to je důvod, proč ji nikdo nahlas neříká, a proč ji AI nemá.

U lidí se s přibývajícími zkušenostmi tyto znalosti zautomatizují do něčeho, co vypadá jako instinkt. Neříkáte si v duchu „měl bych si ten kód zkontrolovat“ — prostě ho zkontrolujete. Naučily vás to roky zpětné vazby: přeskočili jste validaci, něco se rozbilo, poučili jste se z toho. Stovky drobných korekcí ze zkušeností s nízkou informační hodnotou a množstvím šumu se v průběhu času postupně zformovaly do spolehlivých vzorců, které se teď spouštějí pod prahem vašeho vědomí. Pozoruhodné je, že tento druh znalostí — utvářený u lidí zkušenostním tréninkem biologické neuronové sítě, který nemohl nikdo reálně vyučovat, protože každá jednotlivá lekce je příliš malá a příliš samozřejmá na to, aby se dala slovně popsat — se ukazuje jako do značné míry zachytitelný do textu. Ne dokonale. Deklarativní část — tedy znalosti, které lze zformulovat jako pravidla a kroky — se přenáší dobře. Ta část, která se vzpírá verbalizaci — ztělesněná intuice, rozpoznávání vzorců trénované po léta na signálech plných šumu,zůstává výsadou člověka. Tato mezera pak vysvětluje ty momenty, kdy AI vytvoří kód, který je technicky správný, ale přitom tak nějak špatně, a to způsobem, který by zkušený programátor okamžitě rozpoznal. Přesto je ale ta kodifikovatelná část mnohem větší, než byste čekali, a její zapsání přináší hmatatelný nárůst schopností.

Ve světě současné AI mě zaráží jedna věc. Problém Vrstvy 2 a Vrstvy 3 se sice intenzivně řeší, ale z úhlu pohledu, který možná opomíjí hlubší podstatu.

O výzkum agentní AI totiž není nouze. Informatika je plná studií o plánování, uvažování v krocích (chain-of-thought), orchestraci práce s nástroji a sebereflexi — existují stovky článků o tom, jak přimět LLM efektivně řetězit akce. Frameworky jako ReAct, SWE-agent a nespočet architektur postavených na scaffoldingu (dodatečných podpůrných strukturách pro model) — ty všechny inženýrským způsobem řeší to, co nazývám problémem Vrstvy 3. A v samotných AI firmách jde vývoj ještě dál: každý tým, který vyvíjí agentní systémy, de facto odkrývá a kodifikuje neviditelnou vrstvu kompetence, která odděluje modely typu „umí udělat jednotlivé kroky” od modelů „dokáže věc zdárně dotáhnout do konce”.

Jenže téměř všechny tyto aktivity přistupují k problému jako k čistě inženýrské výzvě: jak model promptovat nebo mu postavit podpůrné lešení (scaffolding), aby produkoval lepší sekvence akcí? To, co tu z velké části chybí, je hlubší epistemologická otázka: jaká je povaha znalostí, které kompetentní lidé využívají, když přistupují ke složitým úkolům, proč se vzpírají formulaci do slov a jaké jsou reálné předpoklady pro jejich zachycení? Inženýrský přístup staví lešení, které sice funguje, ale aniž by jeho tvůrci plně rozuměli tomu, kolem čeho to lešení vlastně staví. Výsledkem jsou sice funkční řešení, kterým ale chybí teoretický základ — víme například, že určité způsoby promptování zlepšují schopnost modelu plánovat, ale nemáme žádnou jasnou teorii proč, opřenou o to, jak tyto znalosti fungují u lidí.

A na tom záleží, protože bez tohoto konceptuálního rámce je tvorba podpůrných struktur z velké části záležitostí metody pokus-omyl. Každý tým objevuje znalosti Vrstvy 2 a Vrstvy 3 naprosto nezávisle, po svém je zakóduje, ale nemá k dispozici žádný systematický způsob, jak zjistit, co mu uniklo. Jasné porozumění tomuto problému — tedy problému získávání znalostí s identifikovatelnými vrstvami a odlišnými předpoklady — by mohlo urychlit nejen vývoj samotné umělé inteligence, ale pomohlo by nám zodpovědět i širší otázku toho, jak vlastně funguje lidská kompetence, jak se dovednosti přenášejí a proč jich tolik zůstává neviditelných i pro ty lidi, kteří jimi disponují.

Základem toho všeho je ovšem otázka, která je podle mě fundamentálnější než jakákoli konkrétní debata o AI architektuře nebo trénovacích metodách.

Je vůbec možné veškeré vědění v nějaké formě zachytit a kodifikovat?

Tři výše popsané vrstvy naznačují, že v principu ano — ale že předpoklady pro zachycení každé z těchto vrstev se radikálně liší.

Vrstva 1 vyžaduje pouze jazyk. Zapište ji a bez problému se přenese dál. Specifikace OOXML je zkrátka dokument. Anatomie je v učebnicích. Tohle je ten jednoduchý případ a přesně proto jsou LLM modely tak dobré v doménových znalostech: od samého počátku se totiž nacházely v jejich přirozeném prostředí.

Vrstva 2 vyžaduje správné metody získávání informací — a občas i správné smyslové vstupy. Zkušeného chirurga můžete pomocí rozhovoru a Kognitivní analýzy úloh přimět, aby odkryl část svého rozhodovacího procesu. Ale fakt, že nedokáže předat svou znalost toho, jak nepůsobí na dotek správně abnormální tkáň, není dán tím, že by ji neuměl popsat — jde tu o zcela odlišnou modalitu. K zachycení takové znalosti byste nepotřebovali lepší otázky. Potřebovali byste senzorické rukavice, snímače tlaku a haptický záznam. Podmínkou totiž není najít ta správná slova. Tou podmínkou je mít správný smyslový aparát k tomu, abyste vůbec mohli pozorovat, co se skutečně děje. Na příkladu robota jezdícího na kole to lze ukázat naprosto konkrétně: fyziku rovnováhy dokážeme zakódovat od úplných základů, ale schopnost zkušeného cyklisty zvládnout jízdu po dlažebních kostkách v bočním větru je postavená na smyčkách vestibulární, proprioceptivní a haptické zpětné vazby, které se v cyklistově mysli nikdy nezformovaly do slov. Dalo by se to zachytit — ale museli byste senzory ověsit cyklistu, a ne ho jen zpovídat.

Vrstva 3 vyžaduje něco, co ještě nemáme: metodu pro zviditelnění oné kognitivní opěrné struktury, která je základem efektivního jednání ve všech oborech. Tyto znalosti jsou prokazatelně reálné — lidé je úspěšně využívají každý den a to, nakolik je jedinec ovládá, je jedním z nejsilnějších ukazatelů toho, kdo dokáže dotáhnout věci do konce a kdo ne. Nám ovšem chybí i základní slovní zásoba pro jejich popis, natož systematické metody pro jejich zachycení. Ocitáme se tu v pozici podobné dobám před vznikem vědecké medicíny: jako léčitelé, kteří sice dokážou člověka uzdravit, ale nedovedou vysvětlit jak, protože konceptuální rámec pro porozumění tomu, co vlastně dělají, zatím ještě nebyl objeven.

Mezitím je můj osobní domácí úkol poněkud jednodušší. Mám dva syny — pětiletého a jedenáctiletého — a hodlám se začít pozorněji dívat na to, jak přesně přistupují k problémům, které jsou pro ně obtížné. Jak si je kouskují, kde se zasekávají a jaký druh pomoci jim v takové chvíli reálně prospívá. Pokud je totiž úvaha v tomto textu správná, pak někde v mezeře mezi těžkostmi mého pětiletého syna a rostoucími dovednostmi toho jedenáctiletého se skrývají přesně ty znalosti, které AI potřebuje úplně nejvíc a které se zatím ještě nikomu nepodařilo úspěšně zachytit.

Komentáře můžete zaslat na tento email.

Sdílet: Twitter, Facebook