# MateMatic - Architektura AI dla kancelarii prawnych (llms-full) > Rozszerzona wersja llms.txt dla modeli językowych. Zawiera pełniejsze opisy stron, recenzji i definicji. > Wersja krótka: https://matematicsolutions.com/llms.txt > Standard: https://llmstxt.org/ > Aktualizacja: 2026-05-07. Autor: Wiesław Mazur, MateMatic Solutions Sp. z o.o. MateMatic projektuje suwerenne środowiska AI dla polskich kancelarii prawnych. Specjalizacja: agenci dziedzinowi z nadzorem merytorycznym (human-in-the-loop), zgodność z EU AI Act, RODO, NIS2, DORA i kodeksem etyki zawodów prawniczych. Metodyka w trzech krokach: Audyt Rzetelności → Projekt Architektury → Wdrożenie Agentów. Obszar operacyjny: Polska i Unia Europejska. ## Strony główne ### MateMatic - oferta i metodologia URL: https://matematicsolutions.com/ Opis: Strona główna. Trzy kroki metodyki (Audyt, Architektura, Wdrożenie), ROI calculator dla kancelarii, FAQ w 10 pytaniach (EU AI Act, tajemnica adwokacka, compound regime, art. 14 nadzór, art. 50 transparentność, koszty wdrożenia). Autor: Wiesław Mazur. ### Akademia MateMatic URL: https://matematicsolutions.com/akademia.html Opis: Program szkoleniowy dla prawników i zespołów compliance. Moduły od podstaw (czym jest model językowy) do zaawansowanych (projektowanie agentów z HITL dla kancelarii prawnych). ### Szkolenia URL: https://matematicsolutions.com/szkolenia.html Opis: Katalog pojedynczych modułów szkoleniowych - warsztaty dla partnerów, paralegali, działów IT kancelarii. Formaty: in-house, online, hybrydowo. ### Baza Wiedzy URL: https://matematicsolutions.com/baza-wiedzy.html Opis: Biblioteka 28 recenzji książek, raportów i artykułów naukowych dotyczących AI w sektorze prawnym. Każda recenzja z perspektywy polskiej kancelarii: co z tego wynika dla compliance, dla architektury, dla tajemnicy adwokackiej. Autor wszystkich recenzji: Wiesław Mazur. ### Słownik pojęć (Definicje) URL: https://matematicsolutions.com/baza-wiedzy/definicje.html Opis: Glosariusz 18 kluczowych pojęć stosowanych na matematic.co. Zawiera m.in. EU AI Act, art. 14 (nadzór ludzki), compound regime (RODO + AI Act + NIS2 + DORA + etyka), tajemnica adwokacka, agent AI, suwerenne środowisko danych, HITL, cognitive surrender, stochastic parrot, bifurkacja BigLaw, RODO art. 22, DPIA, NIST AI RMF, ISO/IEC 42001, halucynacja, GPAI, DJA Polska. ### Kontakt URL: https://matematicsolutions.com/kontakt.html Opis: Strona kontaktowa MateMatic Solutions. Adres email: kontakt@matematic.co (każda wiadomość ma odpowiedź zwykle w 1 dzień roboczy). Dane spółki: MateMatic Solutions Sp. z o.o., ul. Wysoka 5, 31-460 Kraków, KRS 0001176750, NIP 9452311849. Kanały publiczne: LinkedIn Company, LinkedIn Wiesław Mazur (osobiście), YouTube MateMatic. Schema: ContactPage + Organization + ContactPoint (customer support, sales) + BreadcrumbList. Brak telefonu publicznego, brak formularza, brak cennika - kontakt zawsze przez email z indywidualną wyceną per kancelaria. ### Aktualności URL: https://matematicsolutions.com/aktualnosci.html Opis: Teksty bieżące Wiesława Mazura - refleksje z praktyki wdrożeniowej, komentarze do legislacji, analizy narzędzi. ### 100 promptów do Claude URL: https://matematicsolutions.com/100-promptow-do-claude.html Opis: Interaktywna sub-page z pełną listą 100 promptów do Claude uporządkowanych w 10 kategoriach po 10 pozycji: dokument, myślenie, research, strategia, pisanie, komunikacja, nauka, produktywność, tworzenie, kod. Kody hybrydowe: uniwersalne po angielsku (/debug, /polish, /summary), kody prawne po polsku (/umowa, /pismo, /cytaty, /opinia). Funkcje: wyszukiwarka live, filtry kategorii, kopiowanie jednym kliknięciem. Plus PDF 13 stron do pobrania (brand MateMatic dark theme). Schema: WebPage + BreadcrumbList + HowTo + ItemList (100 pozycji) + FAQPage. ## Aktualności ### Kirkland & Ellis buduje własną AI za 500 mln USD: „build, not buy" przestało być przywilejem megafirmy URL: https://matematicsolutions.com/aktualnosci/2026-05-29-kirkland-ellis-500m-wlasna-ai-build-vs-buy.html Data: 2026-05-29 Opis: Komentarz MateMatic do Financial Times (Kaye Wiggins, Suzi Ring, 28 maja 2026). Oś tekstu: najwyżej zarabiająca kancelaria świata buduje własnościową platformę AI zamiast kupować gotową, a prawdziwą decyzją nie jest kwota, lecz to, kto jest właścicielem modelu znającego firmę i gdzie leżą jej dane. Ten sam motyw governance jest osiągalny bez budżetu megafirmy - przez open source uruchamiany lokalnie. SKALA Kirkland & Ellis to firma z przychodem ponad 9 mld USD w 2025 - największa kancelaria świata pod względem obrotu, więc deklaracja jest zakładem strategicznym na rdzeniu działalności, nie eksperymentem na marginesie. Platforma ma obsługiwać zlecenie od początku do końca, a nie składać się z luźno zszytych pojedynczych narzędzi. Kancelaria będzie właścicielem całości albo będzie miała prawo nią zostać; dostawcy zewnętrzni pomagają budować, ale bez prawa odsprzedaży powstałego systemu komukolwiek innemu. Nazwę platformy i partnerów technologicznych Kirkland ma ujawnić w nadchodzących tygodniach. LICZBY 500 mln USD w ciągu trzech do czterech lat; ponad 100 mln USD w samym 2026; finansowanie z własnych zysków firmy (partnerzy absorbują krótkoterminową redukcję wypłat); 180 specjalistów technicznych przy udziale 250 prawników, w tym 100 partnerów; ponad 9 mld USD przychodu w 2025. Cytat prezesa zarządu Jona Ballisa: „weźmiemy zbiorową inteligencję naszej instytucji i będziemy mogli wdrożyć ją w całej firmie" oraz „nie wynajmują nas za podstawę" (we don't get hired for the floor). Kontekst rynkowy: większość BigLaw wybrała gotowe produkty (Harvey, Legora); Freshfields zawiązał partnerstwo z Anthropic, Cleary Gottlieb przejął Springbok w marcu 2025. BUILD, NOT BUY - CO TO ZNACZY Kupując narzędzie SaaS, kancelaria oddaje dwie rzeczy: kontrolę nad tym, gdzie i jak przetwarzane są dane spraw, oraz swoją wiedzę instytucjonalną. „Collective intelligence", o której mówi Ballis, to sposób, w jaki ta konkretna firma redaguje, negocjuje i ocenia ryzyko; wpuszczona do cudzej platformy staje się sygnałem zasilającym produkt sprzedawany także konkurencji. Budowa własnościowa zamyka oba wycieki: dane zostają u siebie, a wiedza nie staje się aktywem dostawcy. Pytanie „kto jest właścicielem modelu i gdzie leżą dane" jest identyczne dla kancelarii za 9 mld i za 900 tys. - różni się tylko skala kapitału, jaką można na nie odpowiedzieć. TRZY WNIOSKI DLA POLSKIEJ KANCELARII (1) Własność modelu i lokalność danych są osiągalne bez 500 mln USD - model open source uruchomiony lokalnie (np. polski Bielik na własnej maszynie) nie wysyła danych nigdzie, a wagi modelu i akta zostają pod kontrolą firmy; ten sam efekt governance za ułamek kosztu. (2) Powierzenie przetwarzania do vendora AI to decyzja RODO, nie zakup IT - każde narzędzie SaaS, do którego trafiają dane sprawy, to podmiot dalej powierzający przetwarzanie w rozumieniu art. 28 RODO (umowa powierzenia, lokalizacja danych, ryzyko transferu poza EOG); dla danych objętych tajemnicą zawodową (art. 6 prawa o adwokaturze, art. 3 ustawy o radcach prawnych) pytanie „gdzie fizycznie leży ten dokument" staje się obowiązkiem. (3) Wybór „mieć vs kupić" trzeba udokumentować - AI Act nakłada na podmiot stosujący system wysokiego ryzyka (deployera, art. 26 rozporządzenia 2024/1689) obowiązki nadzoru i użytkowania zgodnie z instrukcją dostawcy. UCZCIWE ZASTRZEŻENIE Polska kancelaria średniej wielkości nie zbuduje platformy za 500 mln USD i byłoby nieuczciwe sugerować inaczej. Kirkland nie rezygnuje też z dostawców - własna platforma jest dodatkiem do dalszego licencjonowania narzędzi zewnętrznych, nie ich zamiennikiem; „build, not buy" w praktyce znaczy „build and buy", z własnością tam, gdzie tkwi przewaga. Transfer dotyczy motywu (suwerenność danych i wiedzy), nie metody ani skali. CO ROBI MATEMATIC Audyt zależności od dostawców AI (do których narzędzi trafiają dziś dane spraw, gdzie fizycznie leżą, co jest objęte umową powierzenia z art. 28 RODO i które przepływy dotyczą informacji chronionych tajemnicą zawodową) oraz budowa Konstytucji AI ze świadomą decyzją „build vs buy" dla każdej klasy danych i ścieżką zgodności z AI Act. Pillary: Decyzja jako jednostka pracy + stack zero-cloud. Interpretacja MateMatic, nie stanowisko PUODO, NRA ani KRRP. CROSS-REFERENCE Aktualność 28.05.2026 (PATRON Desktop pilotaż), Aktualność 20.05.2026 (pięć MCP w open source, Patron w pilocie od czerwca), Aktualność 18.05.2026 (BetterCallMitch - szwajcarski produkt z otwartego kodu), Aktualność 18.05.2026 (SuzieLaw - otwarty Harvey z podmianą modelu). Autor: Wiesław Mazur - MateMatic. ### PATRON Desktop wchodzi w pilotaż: narzędzie dla kancelarii, które trzyma akta na Twoim komputerze URL: https://matematicsolutions.com/aktualnosci/2026-05-28-patron-desktop-pilotaz-zaproszenie.html Data: 2026-05-28 Opis: Zaproszenie MateMatic do pilotażu PATRON Desktop wraz z ankietą zgłoszeniową testera. Oś: narzędzie dla polskich kancelarii oparte na AI i otwartym kodzie, w którym akta i przetwarzanie zostają na komputerze użytkownika, a wybór silnika AI należy do kancelarii. CO POTRAFI Dokumenty, OCR, przeszukiwalna baza i pamięć sprawy działają lokalnie. Silnik AI wybiera sam użytkownik - od modelu na własnej maszynie (np. Bielik), przy którym nic nie opuszcza komputera, po dziesiątki modeli chmurowych przez OpenRouter. Przyjmuje załączniki w każdym formacie bez limitu rozmiaru i liczby, wciąga całe foldery spraw, rozumie akta jako całość, zapamiętuje sprawy i uczy się sposobu pracy użytkownika, współpracuje z Wordem w obie strony i łączy się z polskimi źródłami prawa (orzecznictwo, ISAP, KRS, EUR-Lex). Zgłoszenia przez krótką ankietę sprawdzającą wymagania sprzętowe i prawne. TEZA MATEMATIC Kancelaria nie musi wybierać między użytecznością AI a kontrolą nad danymi - architektura lokalna daje obie naraz. CO ROBI MATEMATIC Prowadzi pilotaż produktu i zbiera zgłoszenia testerów. Pillary: Decyzja jako jednostka pracy + stack zero-cloud. CROSS-REFERENCE Aktualność 29.05.2026 (Kirkland & Ellis build vs buy), Aktualność 20.05.2026 (pięć MCP w open source, Patron w pilocie od czerwca). Autor: Wiesław Mazur - MateMatic. ### Porównanie bije rubrykę: Stanford i Harvey publikują pierwszy publiczny benchmark dwóch metod oceny AI w prawie URL: https://matematicsolutions.com/aktualnosci/2026-05-27-judgmentbench-rubric-vs-preference-stanford.html Data: 2026-05-27 Opis: Komentarz MateMatic do pracy JudgmentBench (arXiv, 24 maja 2026). Oś: dwie dominujące metody oceny jakości pracy AI w prawie (rubryka punktowa i porównanie parami) po raz pierwszy zmierzone na tym samym zbiorze danych, a porównanie parami wygrywa zdecydowanie - co ma bezpośrednie skutki dla każdej kancelarii budującej wewnętrzny audyt jakości AI. SKALA Zespół Stanford Law (Julian Nyarko i in.), Snorkel AI oraz Harvey opublikował pierwszy publiczny zbiór danych, w którym te same wyniki modeli AI są równocześnie ocenione rubryką punktową i porównaniem parami. 30 zadań z BigLaw Bench Harvey'a (redagowanie odpowiedzi na pozew, kontrargumenty w summary judgment, due diligence, klauzule indemnifikacyjne, prawo stanowe Delaware) wygenerowano w trzech poziomach jakości (excellent/good/intermediate) modelem Claude Opus 4.6, a te same wyniki ocenili ci sami prawnicy obydwoma metodami. LICZBY 1539 ocen rubrycznych i 1530 ocen porównawczych od 51 praktykujących prawników (mediana 10 lat doświadczenia; 11 z dwóch dużych amerykańskich kancelarii, pozostali z Snorkel AI), ekwiwalent 242 godzin pracy o wartości godzinowej 242 000 USD. Korelacja z rankingiem jakości (Spearman): 0.908 porównanie vs 0.150 rubryka - rubryka statystycznie nieodróżnialna od szumu. Mediana czasu na zadanie: 1.92 min porównanie vs 4.74 min rubryka. Efekt utrzymuje się dla ludzi i dla autograderów LLM (GPT-5.4 i GPT-5.4-mini). CZTERY WNIOSKI DLA POLSKIEJ KANCELARII (1) Audyt jakości wyniku modelu AI rubryką jest słabszy niż się powszechnie zakłada - suma punktów rubrycznych słabo koreluje z faktyczną jakością; lepiej zorganizować proces wokół porównań parami. (2) Rubryka pozostaje wartościowa do diagnozy per-kryterium (czy zacytowano aktualny stan prawny, czy nie zhalucynowano sygnatury), nie do oceny ogólnej - przesuwa się z roli „pomiar jakości" do „kontrola błędów". (3) AI Act art. 15 wymaga „appropriate levels of accuracy" - wybór metodologii pomiaru sam jest decyzją o tym, co uznajemy za jakość, i musi być udokumentowany w polityce wewnętrznej. (4) Wiedzę milczącą partnera lepiej oddają porównania niż checklisty - to fundament współczesnego trenowania modeli (RLHF, DPO operują na parach, nie na rubrykach). ZASTRZEŻENIA AUTORÓW Porównanie zwija się do pojedynczego rankingu (rubryka mówi dlaczego jeden wynik jest lepszy, porównanie tylko który); jakość była indukowana promptem, nie naturalna; to U.S. BigLaw przy stawce 1000 USD/h, nie polska kancelaria średnia - mechanika porównania jest uniwersalna, ale konkretne wymiary jakości w polskiej praktyce (zgodność z KPC, linia orzecznicza SN) wymagają własnej kalibracji. CO ROBI MATEMATIC Audyt jakości AI (jakimi metodami kancelaria dziś ocenia wyniki modeli, gdzie ten pomiar jest słaby) i Konstytucja AI z polityką pomiaru jakości oraz ścieżką audytu zgodną z art. 15 AI Act. Pillary: Decyzja jako jednostka pracy + stack zero-cloud. Interpretacja MateMatic, nie stanowisko PUODO, NRA ani KRRP. CROSS-REFERENCE Aktualność 22.05.2026 (Watchdog - AI w administracji), Aktualność 20.05.2026 (pięć MCP w open source), Aktualność 13.05.2026 (Claude for Legal Industry), TOM Bazy Wiedzy (MIT - czego governance AI nie mierzy). Autor: Wiesław Mazur - MateMatic. ### W polskiej administracji AI już pracuje, a zasad korzystania z niej praktycznie nie ma URL: https://matematicsolutions.com/aktualnosci/2026-05-22-watchdog-ai-administracja-rejestr-zasady.html Data: 2026-05-22 Opis: Komentarz MateMatic do raportu Sieci Obywatelskiej Watchdog Polska „AI w administracji" (publikacja 18 maja 2026). Oś tekstu: AI wchodzi w procesy administracji szybciej, niż powstają zasady jej użycia - wdrożenie wyprzedziło spisane polityki o cały rząd wielkości, a brak wewnętrznej polityki AI to nieudokumentowane ryzyko, które dotyczy każdej organizacji przetwarzającej dane wrażliwe, w tym kancelarii. SKALA Raport oparty na wnioskach o informację publiczną, nie na ankiecie dobrowolnej - instytucja ma obowiązek odpowiedzieć. 5480 wniosków rozesłanych latem 2025, odpowiedziało 74% instytucji. 9% jednostek zadeklarowało korzystanie z AI (transkrypcja, chatboty, diagnostyka medyczna, analityka danych), z rozkładem: 34% miast powiatowych, 20% organów centralnych, 14% starostw. LICZBY 5480 wniosków o informację publiczną; 74% odpowiedzi; 9% jednostek deklaruje AI; 34% / 20% / 14% (miasta powiatowe / organy centralne / starostwa); ok. 20 gmin z ponad 2000 ma spisane zasady korzystania z AI; 18 maja 2026 - data publikacji. Część instytucji odmówiła ujawnienia, jak używa AI, powołując się na „tajemnicę" i „bezpieczeństwo". Postulaty raportu: jawny rejestr zastosowań AI, obowiązek informowania obywateli, wewnętrzne polityki bezpieczeństwa, mechanizmy niezależnej kontroli. CZTERY LINIE POLSKIEGO COMPLIANCE (1) RODO - brak wewnętrznej polityki AI to brak udokumentowanej podstawy i zasad przetwarzania (art. 6 i art. 9 przy danych szczególnych kategorii); w razie kontroli PUODO administrator nie ma czym wykazać legalności, a ciężar dowodu leży po jego stronie. (2) Rozliczalność (art. 5 ust. 2 RODO) - administrator ma obowiązek wykazać zgodność, nie tylko jej przestrzegać; rejestr zastosowań AI to operacyjna forma rozliczalności. (3) EU AI Act - Załącznik III wprost wymienia systemy wspierające dostęp do usług publicznych i wymiar sprawiedliwości jako wysokiego ryzyka; bez inwentaryzacji użyć nie da się ustalić, które systemy podlegają rygorom art. 26. (4) Tajemnica zawodowa (art. 6 prawa o adwokaturze, art. 3 ustawy o radcach prawnych) - zasłona „bezpieczeństwo" jest podwójnie ryzykowna, tajemnica chroni klienta, a nie brak procedury. TRZY PYTANIA Czy mamy spisaną listę narzędzi AI używanych w organizacji? Czy wiemy, jakie dane trafiają do każdego z nich i gdzie są przetwarzane? Czy ktokolwiek imiennie odpowiada za zasady korzystania z AI? DLA ZARZĄDU Raport pokazuje na przykładzie państwa to, co dotyczy każdej organizacji: brak wewnętrznej polityki AI nie jest neutralny - to nieudokumentowane ryzyko, które ujawnia się dopiero przy kontroli albo incydencie. Tani moment na uporządkowanie jest teraz, zanim zrobi to za was audytor. CO ROBI MATEMATIC Audyt gotowości (inwentaryzacja użyć AI plus ocena luk wobec RODO, AI Act i tajemnicy zawodowej) i budowa Konstytucji AI - spisanego, własnego zestawu zasad korzystania z AI z imienną odpowiedzialnością, dokumentu, którego raport nie znalazł w niemal żadnej gminie. Pillary: Decyzja jako jednostka pracy + stack zero-cloud. Interpretacja MateMatic, nie stanowisko PUODO, NRA ani KRRP. CROSS-REFERENCE Aktualność 19.05.2026 (KE wytyczne klasyfikacja AI wysokiego ryzyka), Aktualność 18.05.2026 (AI Act co obowiązuje co mit), TOM Bazy Wiedzy (Alan Turing Institute - etyka AI dla urzędnika), TOM Bazy Wiedzy (MIT - czego governance AI nie mierzy). Autor: Wiesław Mazur - MateMatic. ### Otwieramy polskie prawo dla agentów AI: pięć serwerów MCP w open source, Patron w pilocie od czerwca URL: https://matematicsolutions.com/aktualnosci/2026-05-20-mcp-polskie-prawo-patron-open-source.html Data: 2026-05-20 Opis: Aktualność MateMatic o publikacji pięciu konektorów Model Context Protocol do otwartych źródeł polskiego i unijnego prawa oraz otwarciu repo agenta Patron. Oś tekstu: polskie i unijne prawo jest dostępne darmowo u źródła, kancelaria nie musi płacić abonamentu za to, co ustawodawca już udostępnia; brakowało warstwy, która zamienia te API w narzędzia, którymi posługuje się agent AI - tę warstwę MateMatic właśnie publikuje. POZYCJONOWANIE MateMatic publikuje pięć osobnych serwerów MCP w organizacji matematicsolutions na GitHub: mcp-saos (orzecznictwo Sądu Najwyższego, Trybunału Konstytucyjnego i sądów powszechnych przez API SAOS Fundacji ePaństwo), mcp-nsa (NSA i 16 Wojewódzkich Sądów Administracyjnych przez CBOSA - tu mieszka większość polskich rozstrzygnięć RODO, podatkowych i administracyjnych), mcp-isap (Dziennik Ustaw, Monitor Polski i jednolite teksty ustaw przez Sejm ELI), mcp-krs (skład zarządu, reprezentacja, wyszukiwanie po nazwie lub numerze KRS przez darmowe oficjalne API Ministerstwa Sprawiedliwości), mcp-eu-sparql (prawo UE - EUR-Lex, orzecznictwo CJEU, ECLI, CELEX przez Publications Office SPARQL i Cellar). Wszystkie na licencji MIT. Równolegle otwarte jest repo agenta Patron - lokalnego, RODO-safe asystenta dla polskich kancelarii na licencji AGPL-3.0, hard fork projektu willchen96/mike. Pierwszy pilot kancelaryjny ruszy w czerwcu 2026. SKALA 5 otwartych serwerów MCP MateMatic w org matematicsolutions. 96 000+ aktów polskiego prawa od 1918 r. dostępnych przez Sejm ELI. 17 sądów administracyjnych w jednym konektorze (NSA + 16 WSA). 0 kosztów licencji za dostęp do źródeł (publiczne API rządowe i unijne). AGPL-3.0 dla powłoki Patrona, MIT dla pięciu konektorów. Pilot kancelaryjny czerwiec 2026. LICZBY Otwarte serwery MCP: 5 (SAOS, NSA, ISAP, KRS, EU-SPARQL). Akty polskiego prawa: 96 000+ od 1918 r. (Sejm ELI). Sądy administracyjne: NSA + 16 WSA przez CBOSA. Koszt licencji źródeł: 0 zł (publiczne API). Licencja konektorów: MIT. Licencja Patrona: AGPL-3.0, pilot w czerwcu 2026. PIĘĆ KONEKTORÓW - CO ODBLOKOWUJĄ 01 mcp-saos - orzecznictwo Sądu Najwyższego, Trybunału Konstytucyjnego i sądów powszechnych przez API SAOS Fundacji ePaństwo. Wyszukiwanie po słowach kluczowych, pobranie pełnej treści wyroku, wyszukanie po sygnaturze sprawy. 02 mcp-nsa - NSA i 16 Wojewódzkich Sądów Administracyjnych przez CBOSA. Tu mieszka większość polskich rozstrzygnięć RODO, podatkowych i administracyjnych - pierwsze miejsce do sprawdzenia, gdy klient pyta o ochronę danych. 03 mcp-isap - Dziennik Ustaw, Monitor Polski i jednolite teksty ustaw przez oficjalne API Sejm ELI. 96 000+ aktów polskiego prawa od 1918 roku. 04 mcp-krs - skład zarządu, reprezentacja, wyszukiwanie po nazwie lub numerze KRS przez darmowe oficjalne API Ministerstwa Sprawiedliwości. 05 mcp-eu-sparql - prawo Unii Europejskiej: EUR-Lex, orzecznictwo CJEU, identyfikatory ECLI i CELEX przez Publications Office SPARQL i Cellar. PATRON - AGENT Patron to czatowy interfejs dla prawnika - kompletna aplikacja postawiona na tych konektorach, którą kancelaria może sama uruchomić. Hard fork projektu willchen96/mike, w pełni self-host (żadnych danych w chmurze MateMatic), bring-your-own-model (kancelaria sama wybiera dostawcę LLM), audit trail typu hash-chain SHA-256 zgodny z AI Act art. 12. Powłoka na licencji AGPL-3.0: każda kancelaria może ją uruchomić u siebie, ale komercyjny SaaS na niej oparty musi opublikować swoje modyfikacje. FILTR TRZYFILAROWY MATEMATIC BIERZEMY pięć konektorów MCP - są gotowe, przetestowane na żywym API, na licencji MIT, można je wpiąć w produkt komercyjny, wewnętrzne narzędzie kancelarii albo darmowy projekt bez pytania o zgodę. Każdy, kto buduje polskie legal-AI, dostaje warstwę dostępu do źródeł za darmo. FLAGUJEMY Patrona w fazie pre-launch - repo matematicsolutions/patron już publiczne, ale produkt celuje w pierwszą pilotową kancelarię w czerwcu 2026; do tego momentu zaproszenie do oceny architektury i kodu, jeszcze nie do wdrożenia produkcyjnego. NIE ENDORSUJEMY żadnego konkretnego modelu LLM - Patron jest bring-your-own-model, kancelaria sama wybiera, czy podpina Gemini, OpenAI, lokalny model Llama, czy polskiego dostawcę z certyfikatem ISO i polską jurysdykcją. LINIE POLSKIEGO COMPLIANCE Pierwsza linia: konektory MCP nie przekazują danych sprawy do MateMatic - są procesami uruchamianymi lokalnie u klienta MCP, połączenie idzie z laptopa prawnika do publicznego API rządowego, nie do naszego serwera; nie mamy logów, nie mamy podglądu, nie ma nas w łańcuchu sub-processorów. Druga linia: Patron z założenia self-host - stack zero-cloud (Supabase własny, MinIO zamiast Cloudflare R2, SMTP zamiast Resend), dane sprawy nie opuszczają perymetru kancelarii. Trzecia linia: każde wywołanie narzędzia w Patronie zapisuje się w audit trail z łańcuchem hashy SHA-256 - bezpośrednia realizacja AI Act art. 12 (logowanie automatyczne, integralność, możliwość rekonstrukcji), komenda npm run audit:verify sprawdza spójność łańcucha, zmiana wstecz wymaga przepisania całego rejestru. Czwarta linia: AGPL-3.0 dla powłoki Patrona oznacza, że jeśli ktoś zrobi z niego SaaS, ma obowiązek opublikować modyfikacje - zabezpieczenie dla kancelarii (przejrzystość) i dla całego polskiego LegalTechu (kod wraca do społeczności); konektory MIT mają inny reżim (można je wpinać w produkty zamknięte, bo to infrastruktura dostępu do źródeł, nie warstwa biznesowa). TRZY PYTANIA DLA ZARZĄDU KANCELARII (1) Czy nasz obecny dostawca legal-AI udostępnia kod konektorów do polskich baz prawnych? Jeśli nie, dlaczego - skoro źródła są publiczne i darmowe? (2) Gdzie fizycznie żyją dane sprawy podczas zapytania do legal-AI? Mapa: laptop prawnika - klient AI - serwer dostawcy - model LLM - odpowiedź. Każdy przeskok to potencjalny sub-processor, który trzeba wpisać do rejestru z art. 30 RODO. (3) Czy można zrobić audyt wsteczny - kto i jakim zapytaniem dotknął którego dokumentu? AI Act art. 12 nie pyta, czy to lubimy - pyta, czy to jest. DLA ZARZĄDU KANCELARII Pięć darmowych narzędzi do polskich baz prawnych jest dziś dostępnych w open source pod licencją MIT. Jeśli kancelaria buduje, zleca albo kupuje AI prawniczego, warto sprawdzić, czy te konektory są wewnątrz - albo dlaczego nie. Patron, agent oparty na nich w całości, wchodzi w produkcyjny pilot w czerwcu i będzie - według naszej wiedzy - pierwszym polskim legal-AI z pełnym hash-chain audytem zgodnym z AI Act art. 12. CO ROBI MATEMATIC Warsztaty wdrożeniowe dla zarządu kancelarii oparte na Konstytucji AI Patrona - dokumencie governance opisującym misję, zasady, granice i role w użyciu AI, z planem 6-8 tygodni do produkcji. Audyt architektury legal-AI z perspektywy zero-cloud i AI Act art. 12 - mapa sub-processorów, ocena gdzie żyją dane sprawy, rekomendacja zmian. Konsultacje na poziomie kodu dla zespołów IT integrujących nasze konektory MCP - od konfiguracji po hardening produkcyjny. Pillary MateMatic: Decyzja jako jednostka pracy + Stack zero-cloud. CROSS-REFERENCE Aktualność 19.05.2026 (BetterCallMitch - szwajcarski produkt z otwartego kodu), Aktualność 18.05.2026 (AI Act co obowiązuje co mit), Aktualność 18.05.2026 (Trzy repozytoria legal AI z otwartym kodem), repo Praxis - otwarte przewodniki praktyczne dla kancelarii (CC BY-SA 4.0). ŹRÓDŁA Organizacja MateMatic Solutions na GitHub (https://github.com/orgs/matematicsolutions/repositories). Repo Patrona (https://github.com/matematicsolutions/patron, AGPL-3.0). Pięć repo konektorów MCP (mcp-saos, mcp-nsa, mcp-isap, mcp-krs, mcp-eu-sparql, wszystkie MIT). API SAOS Fundacji ePaństwo (https://www.saos.org.pl/help/index.php/dokumentacja-api). API Sejm ELI (https://api.sejm.gov.pl/eli/). CBOSA (https://orzeczenia.nsa.gov.pl/). API KRS MS (https://api-krs.ms.gov.pl/). EUR-Lex SPARQL (https://publications.europa.eu/webapi/rdf/sparql). Specyfikacja Model Context Protocol (https://modelcontextprotocol.io/). ### Komisja Europejska: projekt wytycznych - jak rozpoznać system AI wysokiego ryzyka URL: https://matematicsolutions.com/aktualnosci/2026-05-19-ke-wytyczne-klasyfikacja-ai-wysokiego-ryzyka.html Data: 2026-05-19 Opis: Aktualność MateMatic o projekcie wytycznych Komisji Europejskiej do artykułu 6 AI Act, opublikowanym 19 maja 2026. Oś tekstu: to pierwszy dokument, który zamienia abstrakcyjne pojęcie wysokiego ryzyka w sprawdzalną listę przypadków z praktycznymi przykładami; klasyfikacja to nie formalność - od niej zależy, czy na klienta spada cały reżim obowiązków AI Act, czy żaden. POZYCJONOWANIE: 19 maja 2026 Komisja Europejska opublikowała projekt wytycznych do artykułu 6 rozporządzenia (UE) 2024/1689 (AI Act) - dokumentu, który tłumaczy, kiedy system sztucznej inteligencji jest systemem wysokiego ryzyka. To długo oczekiwany materiał: rozporządzenie nakazywało Komisji wydać go do 2 lutego 2026, więc wychodzi z opóźnieniem i na razie jako projekt poddany ukierunkowanym konsultacjom. Pełny tekst projektu i zaproszenie do konsultacji opublikowano na portalu Shaping Europe's digital future. CO TO JEST: Wytyczne porządkują osiem obszarów z Załącznika III AI Act: biometria, infrastruktura krytyczna, edukacja i szkolenie zawodowe, zatrudnienie i zarządzanie pracownikami, dostęp do podstawowych usług prywatnych i publicznych, ściganie przestępstw, migracja i kontrola graniczna, sprawowanie wymiaru sprawiedliwości i procesy demokratyczne. Zasada nadrzędna: wysokiego ryzyka jest nie cały obszar, tylko wymieniony w Załączniku III konkretny przypadek użycia; lista przypadków jest wyczerpująca i można ją zmienić wyłącznie aktem delegowanym Komisji. Wytyczne tłumaczą każdy przypadek osobno i opatrują go przykładami systemu wysokiego ryzyka oraz systemu, który tego progu nie przekracza. Zaklasyfikowanie jako wysokie ryzyko nie oznacza zakazu używania - oznacza zestaw obowiązków: zarządzanie ryzykiem, jakość danych, dokumentacja techniczna, rejestrowanie zdarzeń, przejrzystość, nadzór człowieka, dokładność, cyberbezpieczeństwo. MECHANIZM FILTRA (ARTYKUŁ 6 USTĘP 3): Dostawca może wyłączyć system spod klasyfikacji wysokiego ryzyka, jeśli system spełnia choć jeden z czterech wyczerpujących, ale rozłącznych warunków: (1) wąskie zadanie proceduralne; (2) poprawa wyniku zakończonej pracy człowieka; (3) wykrywanie wzorców decyzyjnych bez zastępowania oceny człowieka bez właściwej weryfikacji; (4) zadanie przygotowawcze do oceny istotnej dla przypadku z Załącznika III. Dwa zastrzeżenia: warunki interpretuje się wąsko, bo filtr jest wyjątkiem od reguł chroniących prawa podstawowe, i tylko gdy system nie wpływa istotnie na wynik decyzji; system profilujący osoby fizyczne w rozumieniu RODO jest zawsze wysokiego ryzyka - filtr go nie ratuje. O skorzystaniu z filtra decyduje samoocena dostawcy z obowiązkiem rejestracji. LICZBY: Data publikacji: 19 maja 2026. Status: projekt do konsultacji. Obszary Załącznika III: osiem. Mechanizm filtra: cztery warunki. Profilowanie osób: zawsze wysokie ryzyko. Obowiązki Załącznika III: choć miały wejść 2 sierpnia 2026, w pakiecie Digital Omnibus uzgodniono przesunięcie tej daty na 2 grudnia 2027 (formalne przyjęcie spodziewane do sierpnia 2026). FILTR TRZYFILAROWY MATEMATIC: BIERZEMY wytyczne jako narzędzie robocze - projekt zamienia ogólnik wysokiego ryzyka w listę przypadków z przykładami, materiał realnie wspierający ocenę pojedynczego systemu klienta; Komisja zapowiada przeszukiwalną wersję na platformie informacyjnej AI Act. FLAGUJEMY wyjątek profilowania jako najczęstsze miejsce, w którym pozornie wąski system wpada w wysokie ryzyko, oraz status projektu poddanego konsultacjom - brzmienie może się zmienić, klasyfikacja oparta dziś na draftcie wymaga sprawdzenia po publikacji wersji finalnej. NIE REKOMENDUJEMY traktowania samooceny z artykułu 6 ustęp 3 jako formalności do odhaczenia ani odkładania klasyfikacji do grudnia 2027 - samoocena bez udokumentowanego uzasadnienia jest pierwszą rzeczą, o którą zapyta organ nadzoru. CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: (1) Klasyfikacja to czynność udokumentowana, nie wrażenie - to dostawca decyduje w drodze samooceny, czy system korzysta z filtra; samoocena bez zapisanego rozumowania (który warunek, dlaczego, na jakiej podstawie) jest dla organu nadzoru materiałem do podważenia. (2) Profilowanie zamyka drogę do filtra - jeśli system profiluje osoby fizyczne w rozumieniu RODO, jest wysokiego ryzyka niezależnie od tego, jak wąskie wydaje się jego zadanie; to pierwszy test przed sięgnięciem po którykolwiek z czterech warunków. (3) System w większej całości nie chowa się za filtrem - nawet system spełniający warunek filtra pozostaje wysokiego ryzyka, gdy jest częścią złożonej całości, w tym systemu agentowego, i wspólnie wpływa istotnie na decyzję; klasyfikuje się przeznaczenie i miejsce w całości. (4) Termin to nie urlop - uzgodnione przesunięcie obowiązków Załącznika III na grudzień 2027 daje czas na przygotowanie, nie na zwłokę; inwentaryzacja i klasyfikacja systemów to praca, którą trzeba wykonać wcześnie. TRZY PYTANIA, ZANIM UZNASZ SYSTEM KLIENTA ZA NEUTRALNY: (1) Który przypadek z Załącznika III - lista wyczerpująca, zacznij od wskazania przypadku, nie ogólnego obszaru. (2) Czy system profiluje osoby - jeśli tak, filtr nie działa, system jest wysokiego ryzyka. (3) Czy samoocena jest zapisana - powołując się na filtr z artykułu 6 ustęp 3, uzasadnienie (warunek, fakty, wniosek) musi istnieć na piśmie, zanim system trafi na rynek. CO ROBI MATEMATIC: MateMatic prowadzi klasyfikację systemów AI pod kątem artykułu 6 AI Act: inwentaryzację narzędzi, które kancelaria stosuje albo dostarcza, przypisanie ich do przypadków z Załącznika III, ocenę mechanizmu filtra i udokumentowaną samoocenę. Deliverable: rejestr systemów AI z przypisaną klasą ryzyka i uzasadnieniem dla każdego wpisu. Klasyfikacja systemu to decyzja, którą trzeba zapisać, opatrzyć datą i uzasadnieniem - jak każdą decyzję, za którą ktoś później odpowiada. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. CROSS-REFERENCE: Aktualność 18.05.2026 (AI Act co obowiązuje co mit), Aktualność 13.05.2026 (Anthropic launchuje Claude for the legal industry), Aktualność 19.05.2026 (BetterCallMitch - krajowy produkt legal AI z otwartego kodu). Autor: Wiesław Mazur - MateMatic. ### BetterCallMitch - Szwajcaria złożyła z otwartego kodu krajowy produkt prawniczy URL: https://matematicsolutions.com/aktualnosci/2026-05-19-bettercallmitch-szwajcarski-produkt-z-otwartego-kodu.html Data: 2026-05-19 Opis: Aktualność MateMatic o BetterCallMitch - otwartym agencie prawniczym złożonym pod szwajcarski rynek przez Federico Cesconiego. Oś tekstu: powłoka czatu jest dziś towarem, produktem jest warstwa krajowa - konektory do lokalnych źródeł prawa; BetterCallMitch to pierwszy w tym ekosystemie produkt legal AI przypisany do konkretnego kraju, a warstwy krajowej dla Polski jeszcze nie ma. POZYCJONOWANIE: BetterCallMitch (repozytorium fedec65/bettercallmitch, licencja AGPL-3.0) to otwarty agent prawniczy złożony pod szwajcarski rynek. Powstał jako fork projektu willchen96/mike (Mike OSS) - tej samej rodziny otwartych narzędzi legal AI, którą MateMatic opisywał 18 maja. To kolejny etap po surowych repozytoriach: ktoś wziął bazę, dołożył warstwę krajową, nadał nazwę i tożsamość, ogłosił produkt. Cesconi stawia tezę marketingową wprost - Harvey i Legora kosztują fortunę, a Mike OSS jest ich otwartą odpowiedzią; tezę trzeba czytać jako jego stanowisko, nie dowód równoważności funkcji. CO TO JEST: Fork willchen96/mike z dołożoną warstwą krajową - zestawem szwajcarskich konektorów do oficjalnych źródeł prawa: wyszukiwaniem orzeczeń sądów federalnych i kantonalnych, bazą legislacji Fedlex, weryfikacją cytatów, wsparciem redagowania pism. Autor mówi w zapowiedzi o dziewięciu szwajcarskich konektorach prawnych; publiczna dokumentacja repozytorium opisuje siedem zdalnych serwerów MCP. Model jest wymienny - Claude, Gemini albo model lokalny uruchomiony przez Ollamę - a tryb ściśle prywatny wymusza przetwarzanie wrażliwych zapytań na modelu lokalnym. Stack: Next.js, Express, Supabase. LICZBY: Licencja AGPL-3.0-only. Korzeń: fork willchen96/mike. Modele: Claude, Gemini, Ollama (własny klucz). Konektory krajowe: szwajcarskie (sądy federalne i kantonalne, Fedlex). Tryb ściśle prywatny wymusza model lokalny. Dojrzałość: projekt świeży, kilkanaście commitów - nie skończony produkt. FILTR TRZYFILAROWY MATEMATIC: BIERZEMY wzorzec, nie repozytorium - BetterCallMitch pokazuje drogę: otwarty korzeń, własna warstwa krajowa, self-host, model pod kontrolą; filozofia self-host plus własny model plus dane w perymetrze jest dokładnie tą, którą MateMatic opisuje jako stack zero-cloud. FLAGUJEMY licencję AGPL-3.0 jako copyleft sieciowy i świadomą decyzję o modelu biznesowym oraz stack oparty na Supabase (hostowana baza danych) - hasło o danych nieopuszczających perymetru jest prawdziwe dopiero po samodzielnym postawieniu Supabase; projekt jest młody. NIE REKOMENDUJEMY traktowania BetterCallMitch jako gotowego narzędzia dla polskiej kancelarii (konektory szwajcarskie - Fedlex, sądy federalne i kantonalne; brak polskich źródeł krajowych ISAP i SAOS), forka i wdrożenia bez wcześniejszego audytu licencji, architektury przepływu danych i obowiązków z AI Act. CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: (1) AGPL-3.0 to decyzja o modelu biznesowym, nie ustawienie - forkując i udostępniając narzędzie przez sieć, kancelaria zobowiązuje się udostępnić również własne modyfikacje na tej samej licencji; dla projektu otwartego to spójne, dla kancelarii liczącej na zamkniętą warstwę własną to bariera do rozpoznania przed forkiem. (2) Supabase trzeba przeczytać osobno - architektura używa hostowanej bazy danych; tajemnica zawodowa wymaga, by akta nie trafiały do zewnętrznego procesora bez umowy powierzenia w rozumieniu artykułu 28 RODO, a obietnicę perymetru domyka dopiero samodzielny hosting Supabase. (3) Konektory krajowe nie przenoszą się przez granicę - szwajcarskie MCP nie znają polskiego ustawodawstwa ani orzecznictwa; polskich źródeł ISAP, SAOS, KRS ktoś musi zbudować. (4) Fork pod marką kancelarii to rola dostawcy - wdrożenie zmodyfikowanego narzędzia AI pod własną marką wprowadza kancelarię w rolę dostawcy w rozumieniu AI Act, z cięższym zestawem obowiązków niż te ciążące na podmiocie jedynie stosującym gotowe narzędzie. TRZY PYTANIA, ZANIM POTRAKTUJESZ TO JAKO WZORZEC: (1) Produkt czy baza - kilkanaście commitów i licencja AGPL znaczą, że forkujesz projekt w budowie, z pracą utrzymaniową po swojej stronie. (2) Czyj jest model i gdzie liczy - dopiero model lokalny realnie utrzymuje dokument w perymetrze kancelarii. (3) Kto bierze odpowiedzialność dostawcy - fork pod marką kancelarii przesuwa obowiązki AI Act na nią. CO ROBI MATEMATIC: MateMatic pracuje nad polskim odpowiednikiem - otwartym, RODO-safe agentem prawniczym zbudowanym na tej samej filozofii (self-host, własny model, dane w perymetrze kancelarii), którego rdzeniem są konektory do polskich źródeł prawa. Pierwszy element już działa: otwarty dostęp do legislacji Unii i orzecznictwa Trybunału Sprawiedliwości UE przez oficjalny endpoint EUR-Lex, z weryfikowalnymi cytatami. Projekt powstaje w modelu otwartym, MateMatic zaprasza do współtworzenia prawników, developerów i kancelarie. Niezależnie MateMatic prowadzi audyt narzędzia AI dla kancelarii - ocena otwartego repozytorium lub wtyczki pod kątem licencji, architektury przepływu danych oraz zgodności z RODO i tajemnicą zawodową; deliverable to jednostronicowa karta ryzyka narzędzia. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. CROSS-REFERENCE: Aktualność 18.05.2026 (Suzie Law - otwarty odpowiednik Harvey z wyborem modelu), Aktualność 18.05.2026 (Trzy otwarte repozytoria legal AI - rodzina AGPL mike/donna/eumike), Aktualność 13.05.2026 (Anthropic launchuje Claude for the legal industry), Aktualność 18.05.2026 (AI Act co obowiązuje co mit). Autor: Wiesław Mazur - MateMatic. ### Suzie Law - otwarty odpowiednik Harvey, w którym podmieniasz model pod siebie URL: https://matematicsolutions.com/aktualnosci/2026-05-18-suzielaw-otwarty-harvey-podmiana-modelu.html Data: 2026-05-18 Opis: Aktualność MateMatic o Suzie Law - otwartym workspace prawniczym wzorowanym na Harvey, czwartym repozytorium legal AI opisanym w maju 2026 roku, po rodzinie AGPL mike/donna/eumike. Oś tekstu: elastyczność, czyli możliwość podmiany modelu, jest realną przewagą, ale przesuwa odpowiedzialność prawną na kancelarię, która forkuje narzędzie. POZYCJONOWANIE: Suzie Law (repozytorium firelex/suzielaw, licencja MIT, utworzone 26 kwietnia 2026) to otwarty workspace prawniczy, opisywany przez autora Mathiasa Strassera jako alternatywa dla Harvey. W odróżnieniu od rodziny AGPL z poprzedniej aktualności stoi na licencji MIT i osobnej platformie Team Suzie. Główną przewagą, którą autor stawia na pierwszym miejscu, jest elastyczność: model, na którym działa system, można podmienić. Ta sama elastyczność jest jednak zobowiązaniem - to kancelaria, nie dostawca, odpowiada za architekturę, licencję i miejsce, gdzie trafia dokument klienta. CO TO JEST: Asystent czatu Counsel, dwanaście person praktyki (litigation, M&A, capital markets, arbitraż, antitrust, prawo pracy, IP, ochrona danych, prawo nieruchomości, podatki, transakcje, biznes prawa), biblioteka ponad stu sześćdziesięciu gotowych procesów pracy. Do tego przegląd dokumentów z odpowiedziami opartymi na cytatach, redagowanie pism z eksportem do pliku .docx, redline ze śledzeniem zmian w formacie Worda i opcjonalna baza wiedzy w trybie RAG. WYSZUKIWANIE PRAWA: Zunifikowany interfejs sięgający do dwudziestu dwóch oficjalnych źródeł pierwotnych w dziewiętnastu jurysdykcjach - CourtListener i eCFR dla Stanów, legislation.gov.uk i Find Case Law dla Wielkiej Brytanii, EUR-Lex i CURIA dla prawa Unii, Légifrance i Judilibre dla Francji, gesetze-im-internet i OpenLegalData dla Niemiec, i dalej. Każda odpowiedź niesie klikalne odnośniki do dokumentu źródłowego. Założenie projektu: żadnych zmyślonych autorytetów. WYBÓR MODELU: Selektor z pięcioma pozycjami - trzy modele w chmurze (Claude Sonnet 4.6, GPT-5.5, Qwen 3.6-Plus) i dwa uruchamiane lokalnie (Qwen 3.6-35B, Gemma 4-26B). Działa w trybie własnego klucza dostawcy. Kancelaria może postawić Suzie Law na modelu działającym na własnym serwerze - to trzecia opcja między zamkniętym SaaS a budową narzędzia od zera. LICZBY: Licencja MIT. Dwanaście person praktyki. Ponad sto sześćdziesiąt procesów pracy w bibliotece. Dwadzieścia dwa oficjalne źródła prawa w dziewiętnastu jurysdykcjach. Pięć modeli do wyboru (trzy w chmurze, dwa lokalne). Repozytorium firelex/suzielaw utworzone 26 kwietnia 2026. FILTR TRZYFILAROWY MATEMATIC: BIERZEMY podmianę modelu jako realną ścieżkę, nie hasło marketingowe - pięć modeli, w tym dwa uruchamiane lokalnie; postawienie systemu na modelu na serwerze kancelarii oznacza, że treść objęta tajemnicą zawodową nie opuszcza jej infrastruktury; do tego dyscyplina cytatów, każda teza prowadzi klikalnym odnośnikiem do źródła pierwotnego. FLAGUJEMY wersję hostowaną suzielaw.com działającą przez prywatne konto chmurowe autora, domyślny model przetwarzający zapytania poza EOG, włączone obejście logowania w przykładowym pliku konfiguracyjnym (każde żądanie jako użytkownik demonstracyjny), rozliczanie płatności dopiero dodawane, brak polskiego źródła krajowego, młody projekt na równie świeżej platformie Team Suzie. NIE REKOMENDUJEMY wersji hostowanej suzielaw.com do jakiegokolwiek materiału klienckiego, traktowania określenia "alternatywa dla Harvey" jako zamiany jeden do jednego (to baza startowa, nie zweryfikowany produkt), forka i wdrożenia w kancelarii bez wcześniejszego audytu licencji, architektury przepływu danych i obowiązków wynikających z AI Act. CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: (1) MIT to decyzja prawna w drugą stronę niż AGPL - AGPL wymusza otwarcie modyfikacji, MIT pozwala zamknąć fork jako produkt własnościowy; ale fork plus podmiana modelu plus wdrożenie pod marką kancelarii wprowadza kancelarię w rolę dostawcy w rozumieniu artykułu 25 AI Act, z cięższym zestawem obowiązków niż te ciążące na podmiocie jedynie stosującym narzędzie. (2) Wersja hostowana nie jest dla materiału objętego tajemnicą zawodową - suzielaw.com działa przez prywatne konto chmurowe autora, domyślny model przetwarza zapytania poza EOG, bez umowy powierzenia w rozumieniu artykułu 28 RODO ani podstawy transferu w rozumieniu artykułu 44 i kolejnych. (3) Podmiana modelu to decyzja o przepływie danych, nie ustawienie techniczne - dopiero wybór modelu lokalnego (Qwen lub Gemma na serwerze kancelarii) sprawia, że dokument nie opuszcza jej infrastruktury; domyślny model w chmurze tej gwarancji nie daje. (4) Wyszukiwanie prawa nie obejmuje Polski - EUR-Lex i CURIA tak, ISAP i SAOS nie; wyszukiwanie w dziewiętnastu jurysdykcjach nie jest dla polskiej kancelarii kompletem, polskie ustawodawstwo i orzecznictwo krajowe trzeba sprawdzić w osobnym, oficjalnym źródle. TRZY PYTANIA PRZED WDROŻENIEM: (1) Na jakim modelu ma działać - chmurowy Claude, GPT lub Qwen, czy model lokalny; to rozstrzyga, gdzie wyląduje treść zapytania prawnika. (2) Kto jest dostawcą w rozumieniu AI Act - fork wdrożony pod marką kancelarii przesuwa obowiązki dostawcy na kancelarię, zgodnie z artykułem 25. (3) Gdzie sprawdzasz prawo polskie - wyszukiwanie obejmuje prawo Unii, nie krajowe ISAP i SAOS. CO MATEMATIC WNOSI: Audyt narzędzia AI dla kancelarii - ocena otwartego repozytorium lub wtyczki pod kątem licencji, architektury przepływu danych oraz zgodności z RODO i tajemnicą zawodową, zanim narzędzie trafi do projektu klienckiego. Deliverable: jednostronicowa karta ryzyka narzędzia - typ licencji i jej konsekwencje, mapa "gdzie idą dane", lista decyzji do podjęcia przed wdrożeniem. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. CROSS-REFERENCE: Aktualność 18.05.2026 (Trzy otwarte repozytoria legal AI - rodzina AGPL mike/donna/eumike), Aktualność 13.05.2026 (Anthropic launchuje Claude for the legal industry), Aktualność 13.05.2026 (Legal Data Hunter), Aktualność 18.05.2026 (AI Act co obowiązuje co mit). Autor: Wiesław Mazur - MateMatic. ### Trzy otwarte repozytoria legal AI, które dopasowujesz pod siebie URL: https://matematicsolutions.com/aktualnosci/2026-05-18-trzy-repozytoria-legal-ai-otwarty-kod.html Data: 2026-05-18 Opis: Aktualność MateMatic - przegląd trzech otwartych repozytoriów legal AI powstałych w maju 2026 roku, kontynuacja artykułu Wiesława Mazura na LinkedIn o repozytoriach mike i donna. Teza wspólna: asystenta AI traktuje się jak rower z cudzymi ustawieniami, zamiast dopasować go pod siebie - otwarty kod tę zmianę umożliwia. POZYCJONOWANIE: Otwarty kod daje kancelarii trzecią opcję między drogim zamkniętym SaaS a budową narzędzia od zera - działającą bazę, którą można ustawić pod własną jurysdykcję i własną architekturę danych. eumike jest dowodem operacyjnym: fork mike zrobiony siedemnaście dni po jego premierze, dopasowujący narzędzie pod prawo Unii Europejskiej. TRZY REPOZYTORIA: mike (willchen96/mike) - otwarta platforma legal AI Willa Chena, byłego prawnika Latham & Watkins. Asystent, przegląd tabelaryczny, powtarzalne procesy pracy. Autor deklaruje rdzeń funkcji aplikacji webowej Harvey i lepsze wykonanie części zadań. Powstanie 29 kwietnia 2026, ponad tysiąc gwiazdek na GitHub w trzy dni, na 18 maja 2026 ponad 3000 gwiazdek i około 900 forków. Licencja AGPL-3.0. Architektura: Next.js, Express, Supabase, magazyn obiektów zgodny z Cloudflare R2. Można postawić instancję lokalnie. donna (chiefofstaff-legal/donna) - otwarty silnik orkiestracji delegowanych decyzji. Rozwiązuje pracę dookoła zadania: układanie materiałów wejściowych, pilnowanie następnego kroku, przeklejanie między narzędziami. Każda delegowana decyzja zapisywana jako podpisany, odporny na manipulację rekord - kto zdecydował, na jakiej podstawie, z którym modelem AI, kiedy. Rdzeń około 200 linii Pythona z biblioteki standardowej, bez zależności zewnętrznych. Status alfa. Powstanie 11 maja 2026, AGPL-3.0. Stawia decyzję, nie dokument i nie czat, jako pierwszorzędny obiekt. eumike (lucianschw-dev/eumike) - fork mike autorstwa Luciana Schwartza-Crofta, utworzony 16 maja 2026. Cztery narzędzia pobierające akty i orzecznictwo Unii Europejskiej na żywo z EUR-Lex - wyszukiwanie po numerze CELEX, po sygnaturze ECLI dla orzeczeń Trybunału Sprawiedliwości, po adresie ELI, oraz weryfikacja cytatów. Działa przez osobny serwer w standardzie Model Context Protocol. Obsługuje 24 języki urzędowe UE. Cel: ugruntować odpowiedzi w realnych dokumentach źródłowych, żeby model nie generował nieistniejącego orzecznictwa Trybunału Sprawiedliwości UE. Autor jest prawnikiem od prawa UE, nie programistą. Narzędzie pokazuje zachowanie pod niepewność: zapytane o realny, lecz mało znany wyrok C-83/23 nie zmyśliło treści, tylko rozpisało format identyfikatora, zaproponowało kandydujący numer CELEX i poprosiło o potwierdzenie przed pobraniem dokumentu. LICZBY: mike - powstanie 29 kwietnia 2026, ponad 3000 gwiazdek na GitHub na 18.05.2026. donna - powstanie 11 maja 2026. eumike - powstanie 16 maja 2026. Licencja wszystkich trzech: AGPL-3.0. eumike obsługuje 24 języki urzędowe UE. Trzy daty powstania mieszczą się w dwudziestu dniach - gęstość kalendarza wynika z natury otwartego kodu. FILTR TRZYFILAROWY MATEMATIC: BIERZEMY wzorzec, nie konkretne repozytorium - otwarty kod legal AI można przeczytać, sprawdzić, sforkować i postawić na własnej infrastrukturze; eumike dowodzi, że dopasowanie jurysdykcyjne zajmuje kilkanaście dni, a ten sam mechanizm da się powtórzyć pod orzecznictwo polskich sądów albo bazę ISAP. FLAGUJEMY AGPL-3.0 jako licencję copyleft z klauzulą sieciową, weryfikację cytatów jako ograniczenie a nie eliminację halucynacji, domyślną konfigurację mike i eumike zakładającą Supabase i Cloudflare R2 (dane w chmurze, nie zero-cloud), donna w statusie alfa. NIE REKOMENDUJEMY wdrożenia żadnego z tych repozytoriów produkcyjnie w kancelarii bez wcześniejszego audytu licencji, architektury danych i mapy ryzyka; deklaracja "rdzeń funkcji Harvey" jest stanowiskiem autora, nie wynikiem niezależnego benchmarku. CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: (1) AGPL-3.0 to decyzja prawna, nie tylko techniczna - klauzula sieciowa wymaga udostępnienia kodu źródłowego modyfikacji udostępnianych przez sieć; licencję powinien przeczytać prawnik, nie tylko dział IT. (2) Weryfikacja cytatów nie jest gwarancją - eumike ugruntowuje odpowiedź w realnym dokumencie z EUR-Lex, ale nie znosi ryzyka błędnej interpretacji pobranego tekstu; ostatnie słowo ma prawnik, nie model. (3) Self-hostable to nie to samo co domyślnie self-hosted - mike i eumike w domyślnej konfiguracji zakładają Supabase i magazyn zgodny z Cloudflare R2, co stanowi powierzenie przetwarzania w rozumieniu artykułu 28 RODO i potencjalnie transfer poza EOG w rozumieniu artykułu 44 i kolejnych. (4) Tajemnica zawodowa zaczyna się przy konfiguracji - otwarty kod pozwala postawić instancję w całości na infrastrukturze kancelarii, ale dopiero lokalna baza, lokalny magazyn plików oraz lokalny lub europejski model decydują, czy materiał objęty tajemnicą zawodową nie opuszcza kontroli kancelarii. TRZY PYTANIA ZANIM SKLONUJESZ REPOZYTORIUM DO KANCELARII: (1) Czy zespół przeczytał AGPL-3.0 i rozumie klauzulę sieciową - modyfikacja plus udostępnienie przez sieć równa się obowiązek publikacji kodu. (2) Gdzie fizycznie wyląduje dokument klienta - domyślnie materiał trafia do Supabase i magazynu R2, bez przekonfigurowania to chmura, nie serwer kancelarii. (3) Kto odpowiada za błędną interpretację pobranego orzeczenia - ugruntowanie w EUR-Lex zmniejsza ryzyko zmyślenia sygnatury, ale nie zdejmuje odpowiedzialności z prawnika. DLA ZARZĄDU KANCELARII: Otwarty kod daje trzecią opcję między drogim zamkniętym SaaS a budową od zera. eumike pokazuje, że dopasowanie pod własną jurysdykcję jest kwestią kilkunastu dni pracy. Warunkiem nie jest budżet na licencję, tylko świadoma decyzja co do licencji AGPL, miejsca przechowywania danych i odpowiedzialności za treść - i ta decyzja musi zapaść, zanim ktokolwiek sklonuje repozytorium. CO MATEMATIC WNOSI: Audyt narzędzia AI dla kancelarii - ocena otwartego repozytorium lub wtyczki pod kątem licencji, architektury przepływu danych oraz zgodności z RODO i tajemnicą zawodową, zanim narzędzie trafi do projektu klienckiego. Deliverable: jednostronicowa karta ryzyka narzędzia - typ licencji i jej konsekwencje, mapa "gdzie idą dane", lista decyzji do podjęcia przed wdrożeniem. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Oceny są stanowiskiem MateMatic, nie zastępują doradztwa prawnego i nie stanowią stanowiska NRA ani KRRP. CROSS-REFERENCE: Aktualność 13.05.2026 (Legal Data Hunter w connector marketplace Anthropic - modularny otwarty stack legal AI), Aktualność 13.05.2026 (Claude for the legal industry - 12 pluginów open source), Aktualność 18.05.2026 (AI Act co obowiązuje co uzgodniono co mit). Źródło wyjściowe: artykuł Wiesława Mazura na LinkedIn o repozytoriach mike i donna. Autor: Wiesław Mazur - MateMatic. ### AI Act w połowie 2026: co już obowiązuje, co dopiero uzgodniono, a co jest mitem URL: https://matematicsolutions.com/aktualnosci/2026-05-18-ai-act-2026-co-obowiazuje-co-mit.html Data: 2026-05-18 Opis: Aktualność MateMatic porządkująca stan prawny AI Act w połowie 2026 roku w trzech warstwach - co faktycznie obowiązuje, co zostało dopiero uzgodnione, a co jest obiegowym mitem. Materiał oparty na zweryfikowanych źródłach: komunikat Rady UE z 7 maja 2026 oraz orzeczenie Sądu Unii Europejskiej w sprawie Data Privacy Framework z 3 września 2025. CO JUŻ OBOWIĄZUJE: AI Act wszedł w życie 1 sierpnia 2024 roku, a jego przepisy uruchamiają się etapami. Od 2 lutego 2025 roku obowiązuje zakaz praktyk uznanych za niedopuszczalne - między innymi scoringu społecznego i nieukierunkowanego zbierania wizerunków twarzy do baz rozpoznawania. Od 2 sierpnia 2026 roku wchodzą obowiązki przejrzystości z artykułu 50: wymóg informowania użytkownika, że rozmawia z systemem AI, oraz oznaczania treści generowanych przez AI. Sam techniczny obowiązek znakowania treści syntetycznych (artykuł 50 ustęp 2) dostał w negocjacjach Digital Omnibus wąski dodatkowy okres przejściowy. CO DOPIERO UZGODNIONO: Komisja Europejska 19 listopada 2025 roku przedstawiła pakiet Digital Omnibus. 7 maja 2026 roku Rada i Parlament Europejski osiągnęły wstępne porozumienie co do zmian w AI Act, w tym przesunięcia obowiązków dla systemów wysokiego ryzyka: dla systemów z załącznika III na 2 grudnia 2027 roku, dla systemów wbudowanych w produkty z załącznika I na 2 sierpnia 2028 roku. To wstępne porozumienie przed formalnym przyjęciem, którego spodziewano się do sierpnia 2026 roku. Do momentu formalnego przyjęcia pierwotne terminy formalnie wciąż obowiązują. Poprawne sformułowanie to "uzgodniono przesunięcie", nie "przesunięto". CO JEST MITEM: Obiegowe zdanie, że ramy przesyłu danych osobowych UE-USA upadły pod koniec 2025 roku, jest nieprawdą. 3 września 2025 roku Sąd Unii Europejskiej oddalił skargę na decyzję o adekwatności i utrzymał w mocy unijno-amerykańskie ramy ochrony danych (Data Privacy Framework). Skarżący złożył 31 października 2025 roku odwołanie do Trybunału Sprawiedliwości UE i to postępowanie wciąż się toczy, ale ramy obowiązują, a przesyłanie danych na ich podstawie jest legalne. Ramy bywały już dwukrotnie unieważniane, w 2015 i w 2020 roku - to fakt - ale "bywały unieważniane" to nie to samo co "upadły teraz". DLACZEGO TA RÓŻNICA KOSZTUJE: Dla kancelarii i działów compliance rozróżnienie obowiązuje / dopiero uzgodniono / mit nie jest pedanterią. To różnica między rzetelną poradą a paniką - albo, co gorsza, między poradą a fałszywym poczuciem bezpieczeństwa. Zanim powtórzy się tezę "AI Act tego zakazał" albo "coś upadło", trzeba sprawdzić, w której z trzech warstw ona leży. CO MATEMATIC WNOSI: Audyt "Mapa zgodności AI dla kancelarii" porządkuje te trzy warstwy dla konkretnej organizacji. Deliverable: jednostronicowa mapa obowiązków AI Act i RODO z datami wejścia w życie, lista narzędzi AI w użyciu z przypisanym poziomem ryzyka, rejestr decyzji do podjęcia. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Interpretacje regulacyjne są stanowiskiem MateMatic, nie zastępują doradztwa prawnego i nie stanowią stanowiska NRA ani KRRP. CROSS-REFERENCE: Aktualność 7.05.2026 (EU AI Act Omnibus - przesunięcie terminów), Aktualność 6.05.2026 (EDPB szablon DPIA i mechanizm zarządzania ryzykiem), Aktualność 13.05.2026 (Claude for the legal industry). Autor: Wiesław Mazur - MateMatic. ### Legal Data Hunter wchodzi do connector marketplace Anthropic. Open-source projekt sprzed trzech miesięcy dostarcza Claude 31 mln dokumentów prawnych w 160+ jurysdykcjach. URL: https://matematicsolutions.com/aktualnosci/2026-05-13-legal-data-hunter-anthropic-partnerstwo.html Data: 2026-05-13 Opis: Komentarz operacyjny MateMatic do partnerstwa Legal Data Hunter (LDH) z Anthropic ogłoszonego 12 maja 2026 przez Zacharie Laïka (CEO Goodlegal, Station F, maintainer LDH). Druga aktualność tego samego dnia - komplementarna do pierwszej (Claude for the legal industry), bo LDH siedzi w wykazie 20+ konektorów MCP launchu Anthropic, w kategorii Legal research obok Midpage i Trellis. Format Aktualności signal-boost, nie tom Bazy Wiedzy. POZYCJONOWANIE: LDH wystartował na początku 2026 roku jako open-source projekt na GitHub (repozytoria worldwidelaw/legal-sources i ZachLaik/legal-data-pipeline). Cytat założycielski Laïka: "law worldwide belongs to everyone and an AI agent could somehow collect it into a single omni-jurisdictional database". Trzy miesiące później projekt ma 31 mln dokumentów w 160+ jurysdykcjach, 1100+ skryptów zbierających źródła publiczne. MateMatic pisał o LDH na LinkedIn, gdy projekt był młodszy o kilka tygodni i o kilka rzędów wielkości mniejszy - dziś oficjalne partnerstwo z Anthropic. ARCHITEKTURA PROJEKTU: Open-source na GitHub. Frontend: Leaflet.js + GeoJSON z mapą pokrycia jurysdykcji. Dashboard statusu źródeł per kraj z czterema stanami: complete, planned, blocked, requires maintenance. Dane dystrybuowane przez status.json. Pipeline: legal-data-pipeline. Kontakt założyciela: zacharie@goodlegal.fr. Email i kontrybucja przez "Become a Lead" na stronie LDH. SKALA I TEMPO: 31 milionów dokumentów prawnych zagregowanych przez 1100+ open-source skryptów. 160+ jurysdykcji - z mapą pokrycia. ~3 miesiące od pierwszego commitu do partnerstwa z największym dostawcą frontier-modelu na rynku (data deklarowana przez założyciela). Średnio ~194 tys. dokumentów per jurysdykcja (31 mln / 160+) - średnia myli, USA i UE prawdopodobnie ciężko, Polska może mieć dramatycznie mniej. INTEGRACJA Z CLAUDE: Plug-in w connector marketplace Claude bez konfiguracji custom MCP - user dodaje przez marketplace, autoryzuje, korzysta z poziomu claude.ai, Claude Code i Cowork. Anthropic team kuratorujący partnerstwo: Mark Pike (ten sam, który koordynował Claude for legal industry z launchu Anthropic w tym samym dniu), Hadley Mouritzen, Cameron Barnes. DRUGI SYGNAŁ FAKTOGRAFICZNY: 31 mln dokumentów w 160+ jurysdykcjach to dokładnie ta sama liczba, którą Anthropic w blogu Claude for the legal industry przypisuje pozycji "Legal research corpus" - to korpus LDH. Free Law Project, też podpięty jako konektor, dostarcza osobno największy publiczny dataset US trial court. Dwa różne źródła, dwie komplementarne pokrywy: LDH globalna szerokość, Free Law Project głębokość US. TRZYFILAROWY FILTR MATEMATIC: BIERZEMY: - 1100+ open-source skryptów jako zaproszenie do roli jurisdiction lead Polska - maintainerski tag "Become a Lead" na stronie LDH explicite. Kancelaria z głębokim know-how o krajowych źródłach (SAOS, ISAP, RCL, eKRS, MSiG, dziennikach urzędowych ministerstw) może objąć patronat nad polską jurysdykcją i kierować pokryciem od strony jakościowej. Realny ruch wolny od vendor lock-in - LDH pozostaje OSS niezależnie od partnerstwa z Anthropic. - Connector w marketplace Claude oznacza, że adoption w polskiej kancelarii nie wymaga budowy custom MCP. Plugin Litigation Legal albo Privacy Legal z dzisiejszego launchu Anthropic może wywoływać LDH jako research backend, gdy prawnik pisze brief, bez wymiany DMS, bez integracji własnymi rękami. - Tempo OSS jako sygnał kierunkowy - trzy miesiące od pustego repo do 31 mln dokumentów to konsekwencja konfiguracji projektu (skrypty modułowe per jurysdykcja, każda do osobnego forku i pull requesta). Dla polskiej kancelarii rozważającej własną mini-bazę wiedzy jest to konkretna mechanika do podpatrzenia: granularność per jurysdykcja i per typ źródła, nie monolityczny pipeline. FLAGUJEMY: - Polska jurysdykcja - status do sprawdzenia w status.json przed promowaniem klientowi. Mapa pokrycia LDH ma cztery stany (complete, planned, blocked, requires maintenance). Jeżeli PL jest "planned" albo "blocked" - kancelaria nie ma dziś polskiego korpusu, ma deklarację. - 31 mln to liczba globalna, nie deklaracja głębokości per jurysdykcja - 31 mln / 160+ = średnio ok. 194 tys. dokumentów per kraj. Średnia myli. Sygnał dla polskiej kancelarii: traktuj LDH jako baseline research tool, sprawdź własną jurysdykcję, nie ekstrapoluj globalnych metryk na lokalną dostępność. - LDH agreguje, nie waliduje. Skrypty polegają na stabilności źródła zewnętrznego. Gdy SAOS przerywa publikację albo zmienia format, LDH ma stary snapshot, dopóki kontrybutor nie zaktualizuje skryptu. To natura modelu OSS-aggregator, nie zarzut. Konsekwencja dla kancelarii: do pism procesowych zawsze weryfikacja bezpośrednio w oficjalnym źródle, LDH jako wstępny przegląd. - Tajemnica zawodowa i prompt-flow. Wyszukiwanie publicznego prawa przez LDH nie jest problemem, ale jeśli prawnik wpisuje do promptu fakty sprawy ("moja klientka X w sporze z Y o Z, znajdź podobne orzeczenia"), to leci nie tylko do Anthropic, lecz dodatkowo wywołuje konektor LDH z parametrami pochodzącymi z faktów klienta. Każdy konektor MCP rozszerza powierzchnię, na której fakty klienta opuszczają środowisko kancelarii. DPA z Anthropic + regulamin promptingu z explicite zakazem cytowania faktów klienta w zapytaniach research (interpretacja MateMatic, nie stanowisko NRA ani KRRP). NIE ENDORSUJEMY: - Tezy "31 mln dokumentów to globalne autorytatywne źródło dla prawnika". LDH dostarcza ilość. Jakość wymaga walidacji per jurysdykcja, per typ źródła (orzecznictwo, akty prawne, dzienniki urzędowe, interpretacje administracyjne), per granularność daty i wersji. Bez tej warstwy 31 mln jest sygnałem o skali projektu, nie deklaracją gotowości produkcyjnej w polskiej praktyce. - Tezy "podpinamy LDH i kancelaria ma globalny research stack". Konektor LDH siedzi obok Westlaw, LexisNexis, CURIA, EUR-Lex i obok SAOS, ISAP, eKRS - nie zastępuje żadnego z nich. To dodatkowa warstwa wstępnego przeglądu, która działa najlepiej, gdy kancelaria ma już zaufane oficjalne źródła i wie, kiedy LDH wystarczy, a kiedy trzeba schodzić głębiej. CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: 1. RODO art. 28 i tajemnica zawodowa - konektor LDH jest trzecim podmiotem w architekturze obok kancelarii i Anthropic. DPA musi pokryć łańcuch: kancelaria → Anthropic → LDH. Sprawdzenie warunków LDH jako podmiotu dalej powierzającego przetwarzanie po stronie Anthropic jest obowiązkowe przed wdrożeniem. 2. Walidacja pokrycia PL przed jakimkolwiek deploymentem na żywych sprawach. Pobierz dashboard statusu, zobacz, ile dokumentów jest indeksowanych z polskich źródeł, jakie źródła są "complete" / "planned" / "blocked". Jeśli kluczowy SAOS jest "planned" - dziś LDH nie szuka w polskim orzecznictwie. 3. EU AI Act art. 26 obowiązki wdrażającego. Plugin używający LDH jako research backend nie wpada w Annex III dopóki działa wspomagająco. Ale automatyzacja pipeline "pobierz orzecznictwo z LDH → wygeneruj draft uzasadnienia → wyślij do klienta bez review" przesuwa w stronę deployer obligations. Zachowaj Decyzja jako jednostka pracy - prawnik jako etap walidacji output research. 4. Citing orzeczeń z LDH w pismach procesowych. KaBLE-podobne ryzyko (first-person false belief - Stanford HAI overlay z 9 maja 2026) nie znika, choć dotyczy innego typu błędu: halucynacja sygnatury orzeczenia albo fragmentu uzasadnienia. Reguła: każde cytowanie z LDH weryfikuj w oficjalnym źródle, zanim wejdzie do pisma. TRZY PYTANIA PRZED WŁĄCZENIEM KONEKTORA W KANCELARII: 1. Jaki jest status polskich źródeł w LDH (SAOS, ISAP, eKRS, MSiG, dzienniki urzędowe)? Jeśli "planned" lub "blocked" - LDH dziś nie jest pierwszym narzędziem dla polskiej praktyki, jest opcją dla spraw transgranicznych. 2. Czy kancelaria chce objąć rolę jurisdiction lead PL? To pozycja maintainera dla polskiej jurysdykcji - widoczność w globalnym projekcie OSS, wpływ na priorytet pokrycia źródeł, obecność w międzynarodowym projekcie LegalTech. Koszt: czas seniora technicznego plus prawnik nadzorujący jakość źródeł. 3. Czy regulamin promptingu w kancelarii zakazuje wprowadzania faktów klienta do zapytań research? Konektor LDH dodaje powierzchnię, na której takie zapytania wychodzą poza kancelarię. Jeśli zasady nie ma - LDH ją wymusza. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH: Legal Data Hunter w connector marketplace Anthropic daje polskiej kancelarii dostęp do globalnego wstępnego przeglądu prawa bez integracji własnymi rękami i jednocześnie zaprasza do roli jurisdiction lead PL, której objęcie ma sens dla kancelarii inwestującej w obecność w międzynarodowych projektach LegalTech. Pierwszy krok operacyjny: dziś sprawdź status polskich źródeł w dashbordzie LDH, zanim klienci usłyszą "podpinamy LDH". Drugi: zdecyduj, czy polskie pokrycie jest dla Was projektem do współzarządzania, czy tylko opcją do śledzenia. CO MATEMATIC WNOSI: Warsztat "Walidacja stack-u AI kancelarii na własnym korpusie" w nowej edycji uwzględnia LDH jako baseline research backend obok lokalnych źródeł (SAOS, ISAP, eKRS). Audyt pokrycia LDH dla polskich źródeł (które publiczne źródła są dziś indeksowane, jakie luki), test 30-50 zapytań research wzorowanych na realnych zadaniach kancelarii, mapowanie LDH na pillar Decyzja jako jednostka pracy z eksplicite zapisaną regułą weryfikacji w oficjalnym źródle. Plus opcjonalny moduł Jurisdiction lead PL dla kancelarii, które chcą objąć tę pozycję - mapa zadań, harmonogram, wymagania techniczne (Python skrypty modułowe), wymagania jakościowe (walidacja prawna źródeł). Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Interpretacje regulacyjne są stanowiskiem MateMatic, nie zastępują doradztwa prawnego i nie stanowią stanowiska NRA ani KRRP. CROSS-REFERENCE: Aktualność 13.05.2026 (Anthropic launchuje Claude for the legal industry - LDH w wykazie 20+ konektorów); Aktualność 9.05.2026 (Stanford HAI LegalTech overlay - KaBLE benchmark dla cytowania orzecznictwa); Aktualność 27.04.2026 (polski LegalTech mapa AI); Aktualność 5.05.2026 (AI Firm Index Pollinsa - katalog AI-native kancelarii). Autor recenzji: Wiesław Mazur - MateMatic. ### Anthropic launchuje Claude for the legal industry. 12 pluginów praktyki w open source, integracja w Word i Outlook, 20+ konektorów do istniejących DMS-ów. URL: https://matematicsolutions.com/aktualnosci/2026-05-13-claude-for-legal-industry-anthropic-launch.html Data: 2026-05-13 Opis: Komentarz operacyjny MateMatic do launchu Claude for the legal industry opublikowanego 12 maja 2026 przez Anthropic. Materiał blogowy claude.com/blog/claude-for-the-legal-industry + post LinkedIn Marka Pike (prawnik-product manager w Anthropic, 2 319 reakcji, 125 komentarzy w 13 godzin) + post LinkedIn Anthropic Claude for the Legal Industry. Format Aktualności signal-boost, nie tom Bazy Wiedzy - to launch produktu, nie raport do recenzji. POZYCJONOWANIE: Anthropic w jednym dniu publikuje materiał, który normalnie składałby się na trzy oddzielne launche - warstwa produktowa (Claude w Word i Outlook), warstwa rozszerzalności (12 pluginów + 20+ konektorów + Skills), warstwa narracyjna (partnerstwa BigLaw, in-house, platform AI). MateMatic czyta to z perspektywy polskiej kancelarii - co da się zaadaptować, co wymaga polskiego layeru, czego nie endorsujemy. WARSTWA PRODUKTOWA: Claude osadzony w Microsoft Word (drafting, redlining, tracked changes, formatting check na execution copies, scrub internal comments przed dystrybucją do counterparty) i w Microsoft Outlook (matter triage, response drafting, scheduling). To architektoniczna deklaracja: stack AI musi wejść tam, gdzie żyje praca prawnika - Word, Outlook, data room, document management - a nie zapraszać prawnika do siebie. WARSTWA ROZSZERZALNOŚCI - 12 PLUGINÓW PRAKTYKI: Open source w repozytorium anthropics/claude-for-legal jako Markdown, z zaproszeniem do forkowania, dostosowywania, podsyłania community submissions. Pluginy: Commercial Legal, Corporate Legal (M&A, diligence, board consents), Employment Legal (hires, terminations, leave deadlines), Privacy Legal (DPA reviews, DSAR responses), Product Legal (launch reviews, claim substantiation), Regulatory Legal (monitoring, policy tracking), AI Governance Legal (use case triage, impact assessments), IP Legal (trademark clearance, DMCA handling), Litigation Legal (intake, holds, depositions, briefs), plus Law Student, Legal Clinic, Legal Builder Hub. Skills jako warstwa reusable instructions - kodują playbooki kancelarii. WARSTWA ROZSZERZALNOŚCI - 20+ KONEKTORÓW MCP: Contract lifecycle: Definely, Docusign, Ironclad. Deal rooms: Box, Datasite. Document management: iManage, NetDocuments. E-discovery: Consilio, Everlaw, Relativity. Legal research: Legal Data Hunter, Midpage, Trellis. Research platforms: Thomson Reuters CoCounsel, Harvey, Solve Intelligence. Public service: BoardWise, Courtroom5, Descrybe, Free Law Project (31 mln dokumentów, 160+ jurysdykcji, największy publiczny dataset trial court w USA). WARSTWA NARRACYJNA - PARTNERZY I CYTATY: Gerrit Beckhaus, Freshfields Lab: "Our approach in the Freshfields Lab has always been to build on the best available technology. Claude's capabilities have become an essential part of our proprietary AI-powered solutions". Mindy Lok, Accenture in-house: "My legal team at Accenture put Claude to work on everyday legal matters, and we have been very excited to see how productivity gains could be realized" (konkretu liczbowego brak - Accenture chwali kierunek, nie podaje metryki produktywności). Joel Hron, Thomson Reuters: "The future of AI won't be defined by where the work happens, it will be defined by whether the results can be trusted" (najmocniejsze zdanie launchu - przesuwa kryterium oceny stack-u z "gdzie pracuje" na "czy można zaufać wynikowi"). Winston Weinberg, Harvey: "Claude Opus 4.7 scored 90.9% on Harvey's BigLaw Bench, the highest of any Claude model, and the Harvey for Claude Connector brings our legal intelligence directly into Claude". Jay Madheswaran, Eve: "We evaluate every model against 24+ legal-specific scorers - citation accuracy, ungrounded case quotes, memory leakage, refusal correctness - because in litigation, an authoritative-sounding hallucination is worse than no answer". Holland & Knight, Legora, Solve Intelligence, Crosby - dodatkowi partnerzy. MARK PIKE NARRATIVE: Prawnik w Anthropic, który zaczął kodować i przyjął rolę part-time product managera. Post LinkedIn 12 maja 2026 opisuje drogę od "zabawek" (wirtualny gavel, Clawd-shaped pager) do launchu produktowego. Motto Anthropic, które cytuje: "do the simple thing that works". Inny rodzaj launchu niż klasyczny BigLaw vendor pitch. LICZBY DO ZAPAMIĘTANIA: 90,9 procent - Claude Opus 4.7 na Harvey BigLaw Bench (najwyższy wynik wśród modeli Claude). 31 milionów dokumentów - Free Law Project korpus. 160+ jurysdykcji. 12 pluginów open source. 20+ konektorów MCP. Claude for Nonprofits z dyskontowanym dostępem dla qualifying legal aid clinics, public defenders, nonprofit legal services. Cztery darmowe narzędzia public service: BoardWise, Courtroom5, Descrybe, Free Law Project. TRZYFILAROWY FILTR MATEMATIC NA LAUNCHU ANTHROPIC: BIERZEMY: - 12 pluginów open source w Markdown jako startery procesu, nie gotowy stack. Kancelaria może forkować Privacy Legal pod polskie RODO/PUODO/art. 9 AI Act, Litigation Legal pod KPC, AI Governance Legal pod EU AI Act z polskim layerem. Architektonicznie zgodne z pillarem MateMatic Decyzja jako jednostka pracy - playbook jako artefakt, nie magia w black-boxie. - Skills jako reusable instructions - mechanizm, w którym zespół kancelarii koduje własny standard (np. redline DPA z 12 klauzulami + 6 AI-specific addenda z Kenneya, plus polski layer RODO art. 28) i wszyscy associate przy każdym zadaniu pracują na tym samym standardzie. - Harvey BigLaw Bench 90,9 procent jako referencja - benchmark istnieje, można podawać klientom liczbę, można porównywać konkurencyjne stack-i. Nie jako dowód gotowości produkcyjnej, ale jako baseline. - Cztery darmowe konektory public service (Free Law Project, Courtroom5, BoardWise, Descrybe) plus Claude for Nonprofits jako sygnał, że pro bono i legal aid nie są dodatkiem, są w pakiecie od dnia jeden. Polskie odpowiedniki KIRP i NRA mogłyby z tej architektury skorzystać. FLAGUJEMY: - 20+ konektorów to anglo-amerykański stack (iManage, NetDocuments, Ironclad, Harvey, Relativity, Thomson Reuters CoCounsel, Everlaw, Consilio). Polska kancelaria w większości przypadków nie ma żadnego z nich. Adopcja launchu w Polsce nie jest "podłącz i działa" - jest "wymień DMS na iManage albo zbuduj custom MCP do polskiego systemu". Koszt wdrożenia rośnie o wymianę stack-u back-officowego, nie o sam Claude. - Plugin AI Governance Legal zaprojektowany pod compliance review checklists w stylu use case triage, impact assessments, board-level reporting - architektura anglo-amerykańska, gdzie Legal jest jednym z owners obok IT, Risk i Compliance. Polski layer (EU AI Act art. 9 zarządzanie ryzykiem, art. 26 obowiązki wdrażającego, KSC incydenty, RODO art. 35 DPIA) wymaga dodania - plugin sam tego nie zawiera (interpretacja MateMatic, nie stanowisko NRA ani KRRP). - Harvey BigLaw Bench - benchmark anglojęzyczny, common-law oriented, mierzony na pracy BigLaw firm w USA. 90,9 procent na BigLaw Bench nie jest 90,9 procent na polskiej pracy procesowej. Stanford HAI LegalTech overlay (Aktualność 9.05.2026) pokazał GPT-5.1 = 73,4 procent na CaseLaw v2 i KaBLE flag dla first-person false belief. - Brak twardych metryk compliance/security w blogu - brak explicite SOC 2, brak HIPAA, brak audit logs jako standardu, brak retention policy w warstwie launchu. "Permission-bound, auditable access" (iManage connector) i "permission-scoped workflows" to deklaracja, nie certyfikacja. Polski compliance officer musi domknąć ten brak własnym pytaniem do Anthropic enterprise sales. NIE ENDORSUJEMY: - Tezy "Claude jest topowy w BigLaw Bench, więc gotowy dla naszych klientów" bez walidacji na polskim korpusie aktów z polskim językiem i polskimi instrumentami (RODO art. 6/9/22/32/35, AI Act art. 6/9/26/50, KPC, tajemnica zawodowa adwokacka). Sam Anthropic nie twierdzi, że plugin Privacy Legal pokrywa RODO - twierdzi, że obejmuje DPA review i DSAR response. Reszta zostaje na barkach kancelarii (interpretacja MateMatic, nie stanowisko NRA ani KRRP). - Tezy "12 pluginów = gotowy stack" - to startery, nie kompletne procesy. Plugin Litigation Legal obejmuje intake, holds, depositions, briefs - w common law. KPC, art. 6 prawa o adwokaturze, art. 6 ustawy o radcach, KSC, KRRP rules of conduct - poza scope plugina. Trzeba dorobić polski layer regulacyjny i etyczny. - Tezy "Anthropic teraz robi za vendora, więc relacja Claude vs polski LegalTech jest rozstrzygnięta" - launch zwiększa zaufanie do platformy, ale nie wymienia stack-u rynku polskiego. Polski LegalTech (Aktualność 27.04.2026 mapa AI) ma własny rytm adopcji - launch Anthropic jest sygnałem, nie wymiennikiem. CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA (czego launchowy blog nie mówi): 1. RODO art. 28 umowa powierzenia - Anthropic jako procesor wymaga DPA z konkretnym zestawem klauzul (lokalizacja serwerów, podpowierzenie, audyt, zwrot/usunięcie danych po zakończeniu). Plugin Privacy Legal nie zwalnia z negocjacji DPA z Anthropic - jest narzędziem do review DPA z klientami, nie z dostawcą AI. 2. Tajemnica zawodowa adwokacka i radcowska (art. 6 prawa o adwokaturze, art. 6 ustawy o radcach prawnych) - wprowadzenie treści objętych tajemnicą wymaga zgody klienta opartej na informacji o miejscu przetwarzania, umowy z Anthropic gwarantującej zero retention dla treningu, mechanizmu, który technicznie blokuje retencję (nie tylko deklaratywnie). Plugin Litigation Legal pomaga w workflow - nie zmienia tej rachuby. NRA i KRRP bez jednolitego stanowiska o AI w pracy procesowej - pole otwarte. 3. EU AI Act po Omnibus z 7 maja 2026 (Aktualność 7.05.2026) - pluginy Litigation Legal, Privacy Legal, AI Governance Legal działają w trybie wspomagającym, nie podejmują decyzji autonomicznie, więc poza najtwardszą częścią aktu (Annex III). Ale konfiguracja, w której plugin pracuje bez human-in-the-loop weryfikacji (auto-generowane pisma z Litigation Legal w workflow demand letter, wysyłane bez review prawnika) przesuwa kancelarię w stronę art. 26 (obowiązki wdrażającego). Polski layer wymaga zapisanego procesu Decyzja jako jednostka pracy w każdym workflow. 4. First-person false belief KaBLE - benchmark, który Stanford HAI wyróżniło w LegalTech overlay do AI Index 2026 (Aktualność 9.05.2026), dotyczy całej rodziny LLM-ów, również tych użytych w pluginie Litigation Legal do streszczeń zeznań, opinii biegłych, pism drugiej strony. Plugin nie jest zwolnieniem z testu czy format wymusza rozróżnienie "świadek twierdzi" vs "udowodnione". TRZY PYTANIA, KTÓRYCH LAUNCH NIE ZWALNIA Z ODPOWIEDZI: 1. Czy kancelaria ma plan walidacji 12 pluginów na polskim korpusie - zbiór 30-50 zadań testowych w polskim języku, z polskimi instrumentami procesowymi. 2. Czy mamy DPA z Anthropic przygotowaną do podpisu przed migracją wrażliwych treści. 3. Który z 20+ konektorów jest pierwszym krokiem - polska kancelaria ma SharePoint, OneDrive, czasem własny DMS. Pytanie brzmi "który punkt integracji ma najwyższy ROI w naszej praktyce" - odpowiedź różni się między kancelarią procesową, korporacyjną i butikiem regulacyjnym. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH: Launch Claude for the legal industry zmienia architekturę dostępną dla polskich kancelarii - 12 pluginów open source w Markdown to startery, na których można zbudować polski stack, nie zamknięty produkt do kupienia. Najgroźniejsza decyzja w tym kwartale to skopiowanie konfiguracji BigLaw firmy z USA bez warstwy walidacji na polskich aktach i bez polskiego layeru regulacyjnego. Najbezpieczniejszy ruch to fork dwóch-trzech pluginów najbliższych praktyce kancelarii, walidacja na zbiorze 30-50 polskich zadań i DPA z Anthropic podpisana przed migracją wrażliwych treści. CO MATEMATIC WNOSI DO TEMATU: Warsztat "Walidacja stack-u AI kancelarii na własnym korpusie" w nowej edycji uwzględnia fork pluginu Anthropic jako wariant referencyjny. Konstrukcja własnego pluginu w Markdown, mapowana na polskie instrumenty (art. 9 RODO, art. 6 prawa o adwokaturze, art. 9 i 26 AI Act, KPC). Zbiór testowy 30-50 zadań wzorowanych na CaseLaw v2 i KaBLE w polskim języku - by zmierzyć accuracy modelu z pluginem Anthropic na pracy, którą kancelaria faktycznie wykonuje. Deliverable: forked plugin gotowy do commit do własnego repo + zbiór testowy + DPA template do negocjacji z Anthropic. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Interpretacje regulacyjne w warsztacie są stanowiskiem MateMatic, nie zastępują doradztwa prawnego i nie stanowią stanowiska NRA ani KRRP. CROSS-REFERENCE: Aktualność 9.05.2026 (Stanford HAI LegalTech overlay AI Index 2026 - KaBLE, CaseLaw v2, walidacja na własnym korpusie); Aktualność 9.05.2026 (Kenney Digital 520 - 12 klauzul DPA + 6 AI addenda do forkowania na polski layer pluginu Privacy Legal); Aktualność 7.05.2026 (EU AI Act Omnibus - przesunięcie Annex III, art. 26 nadal obowiązuje); Aktualność 27.04.2026 (polski LegalTech mapa AI - kontekst rynku, na którym Anthropic launchuje); TOM 052 BW (Stanford HAI AI Index 2026 - pełna recenzja flagowa); TOM 056 BW (Kenney Atlas governance czterech jurysdykcji). Autor recenzji: Wiesław Mazur - MateMatic. ### Kenney składa practitioner's playbook AI compliance. Cztery checklisty bierzemy do biurka kancelarii. Rozdziału 25 nie. URL: https://matematicsolutions.com/aktualnosci/2026-05-09-kenney-digital520-ai-compliance-enterprise-playbook.html Data: 2026-05-09 Opis: Signal-boost MateMatic dla Insight Report Digital 520 - Noah M. Kenney, "AI Compliance for the Enterprise", May 2026, 58 stron, 25 rozdziałów, practitioner's playbook do compliance dla generative AI. Licencja proprietary z dystrybucyjnym wyjątkiem ("may be distributed, disseminated, and shared so long as the materials are not sold. Digital 520 must be properly attributed. This document may not be edited in any way without prior written permission"). MateMatic NIE hostuje PDF lokalnie - link do oryginału. POZYCJONOWANIE - CZWARTY MATERIAŁ KENNEYA W 14 DNI: Trzy wcześniejsze tomy w Bazie Wiedzy: TOM 001 Governing Agents (paper, agenty AI, 22.04.2026), TOM 045 Runtime Enforcement (companion paper, 29.04.2026), TOM 056 Governing Intelligence (książka First Edition, atlas regulacyjny czterech jurysdykcji, 9 maja 2026 rano). Anti-monomania pivot - czwarty materiał wybrany format Aktualności signal-boost, NIE kolejny tom Bazy Wiedzy. To inny gatunek niż TOM 056 (atlas) - ten dokument dostarcza artefakty: 12 wymaganych klauzul DPA, 5 governance documents, 12 najczęstszych gaps, 90-dniowy harmonogram tygodniowy. KONSTRUKCJA DOKUMENTU - 5 CZĘŚCI: Część I uniwersalne wymogi (rozdz. 1-7): AI Discovery and Inventory, Selecting the Right Licensing Tier, Data Processing Agreement, Procurement Pathways, Sub-Processor Disclosure, Five Required Governance Documents, Five-Layer AI Governance Stack. Część II regulatory landscape (rozdz. 8-12): USA stanowy i federalny, sectoral, EU, UK. Część III branże regulowane (rozdz. 13-18): włącznie z legal i sektorem publicznym. Część IV reporting/risk/audit (rozdz. 19-22): AI Incident Reporting, Data Subject Rights at the AI Surface, Risk Assessments and Impact Assessments, Audit-Readiness. Część V common gaps i remediation (rozdz. 23-25): The Twelve Most Common Gaps, The Ninety-Day Compliance Plan, Engaging Digital 520. CZTERY CHECKLISTY DO BIURKA KANCELARII: 1. Dwanaście klauzul DPA dla dostawców generative AI (rozdz. 3) Purpose limitation (zakaz "service improvement" jako otwartego wykorzystania), no training on customer data (express written prohibition), cross-border transfer assessment dla EU-US, security commitments z TOMs (technical and organizational measures) i SOC 2 Type II / ISO 27001 attestation, incident notification max 72 godzin z required content, audit rights (kontraktowe lub przez attestation reports), data subject request assistance, deletion on termination z written certification, confidentiality of personnel, indemnification i liability cap "multiple of fees, not capped at fees". Plus 6 AI-specific addenda: output ownership (customer owns prompts and outputs), hallucination i accuracy disclaimers, transparency obligations (model identifier, version, material change notifications - required for EU AI Act deployer obligations), bias testing methodology dla high-risk use cases, logging i traceability, EU AI Act alignment. Sample contract clauses załączone, gotowe do adaptacji do polskiego prawa. 2. Pięć obowiązkowych governance documents (rozdz. 6) (1) Acceptable Use Policy - sekcje: scope and applicability, definicje, sanctioned tools list reference, prohibited data classes per tool, prohibited use cases (legal advice generation, hiring decisions, financial advice bez review), required practices, reporting obligations, consequences for violation. Approver: CEO/COO/General Counsel. Owner: Privacy Officer / AI Governance Lead. (2) Data Classification Scheme - 4-tier (Public, Internal, Restricted, Prohibited), field-level mapping per major system (CRM, ERP, HRIS, support, financial), AI-specific use rules per class, reclassification process. Approver: CISO and CPO jointly. Owner: Data Governance Lead. (3) Approved Tools List - tool name and version, approved tier and account scope, approved use cases, approved data classes, risk assessment reference and date, sub-processors disclosed, owner and reviewer, tool addition request workflow. Approver: AI Governance Lead. Quarterly review. (4) AI Governance Charter and RACI - named AI Governance Lead z decision-rights authority, cross-functional advisory body (Privacy, Security, Legal, IT, business), RACI dla tool approval, risk assessment, contract signature, incident response, audit response, exception approval, escalation path do executive sponsor i board, monthly executive reporting / quarterly board reporting. Approver: CEO i Board. (5) AI-Extended DSAR i Incident Response Procedures - DSAR z five-surface reach (database, prompt log, output cache, embedding index, observability), vendor escalation contacts i DPA-required assistance scope, incident classification matrix (PI breach, algorithmic discrimination, cyber incident, adverse event, sub-processor incident), notification decision tree by jurisdiction, tabletop exercise schedule. Approver: CPO i CISO. Annual review plus tabletop dwa razy rocznie. Five-surface reach DSAR jest najmocniejszą innowacją operacyjną w całym dokumencie. 3. Dwanaście najczęstszych gaps z remediation (rozdz. 23) (1) Consumer-tier accounts in production use; (2) missing DPA or BAA dla material vendors; (3) privacy notices nie odzwierciedlają AI processing; (4) sub-processor list incomplete or stale; (5) DSAR process nie sięga AI surfaces; (6) brak data classification scheme; (7) brak named AI governance owner; (8) embedded AI features on by default i undisclosed; (9) brak risk assessment dla material use cases; (10) incident response runbook lacks AI scenarios; (11) brak bias testing dla high-risk AI; (12) shadow AI unmanaged. Każdy gap sparowany z konkretną remediation action. Bezpośrednie zdanie z dokumentu: "If three or more of these are present in your environment, the file is behind". 4. 90-dniowy plan z tygodniowym harmonogramem (rozdz. 24) Tygodnie 1-4 (Visibility): tyg. 1 discovery (SSO, DNS, expense, attestation), tyg. 2 reconcile sources i finalizacja inventory v1, tyg. 3 license tier match i vendor outreach dla DPA gaps, tyg. 4 charter governance i nazwanie ownera. Tygodnie 5-8 (Documents): tyg. 5 draft AUP i Data Classification, tyg. 6 approve AUP i pierwsza klasyfikacja major systems, tyg. 7 Approved Tools List i workflow tool addition, tyg. 8 AI extensions DSAR i incident response, AUP communication. Tygodnie 9-12 (Operations): tyg. 9 risk assessment top 3 use cases, tyg. 10 sub-processor list publiczna i dla klientów, update privacy notice, tyg. 11 tabletop incident response na 2 AI scenarios, tyg. 12 audit-readiness self-assessment, file index, brief sponsora i boardu. HIGHEST-LEVERAGE THREE jeśli tylko trzy akcje są możliwe w tym kwartale: (1) stop consumer-tier business use, (2) execute DPA lub BAA dla każdego dostawcy przetwarzającego personal information, (3) name AI governance owner z decision-rights authority. To jedyny fragment, który warto zacytować na zarządzie kancelarii bez tłumaczenia. 5. Sub-processor disclosure i procurement pathways (rozdz. 4-5) Trzy ścieżki procurement (direct vendor, hyperscaler middleware, reseller) z różnymi anchor contracts, sub-processor relationships, residency control i audit posture. Required artifacts dla direct vendor procurement: Master Services Agreement, DPA z 12 klauzulami, BAA jeśli PHI, security questionnaire response lub current SOC 2 Type II / ISO 27001 attestation, sub-processor list current as of contract date z notice mechanism, configuration record (retention, region, training opt-out, audit logging, SSO/SCIM integration). Vendor-specific notes: OpenAI ChatGPT Enterprise i API z Zero Data Retention dla approved use cases na API; Anthropic standard DPA; Google Vertex AI/Gemini; AWS Bedrock; Azure AI/Copilot. Notes wymagają aktualizacji co 60 dni. TRZYFILAROWY FILTR MATEMATIC NA ŚWIEŻYCH SZABLONACH: BIERZEMY: - 12 klauzul DPA i 6 AI-specific addenda jako szablon do adaptacji z mappingiem na art. 28 RODO (procesor) i art. 26-27 EU AI Act (deployer obligations) - Five-surface reach DSAR (database, prompt log, output cache, embedding index, observability) jako gotową listę pól, których RODO art. 15-17-18 wymaga, a większość polskich kancelarii nie inwentaryzuje - 12 najczęstszych gaps z remediation jako lustrzaną checklistę audytu wewnętrznego MateMatic - prawie każdy gap mapuje się jeden-do-jednego na art. 32 RODO lub art. 9 AI Act - Highest-Leverage Three jako rekomendację do zarządu kancelarii - trzy konkretne akcje na ten kwartał, bez fluffu FLAGUJEMY: - US-centryzm kontraktowy (DPA + BAA Business Associate Agreement HIPAA, CCPA service-provider terms, sectoral law amerykańskie) - dla polskiej kancelarii podstawą pozostaje art. 28 RODO i krajowe przepisy o świadczeniu usług drogą elektroniczną - Five-Layer AI Governance Stack w rozdz. 7 to powtórzenie modelu z TOM 045 (Runtime Enforcement) - kto ma TOM 045, nie potrzebuje rozdz. 7 tutaj - Daty EU AI Act sprzed Omnibus z 7 maja 2026 - dokument datowany "May 2026" prawdopodobnie nie uwzględnia jeszcze przesunięcia Annex III na 2 grudnia 2027 (zob. Aktualność 7.05.2026) - Liability cap "multiple of fees" wymaga osobnego ujęcia w polskim prawie cywilnym w kontekście odpowiedzialności kontraktowej i deliktowej (interpretacja MateMatic, nie stanowisko NRA ani KRRP) NIE ENDORSUJEMY: - Rozdziału 25 "Engaging Digital 520" jako legitymowanego compliance step - to sales pitch wymieniający 5 engagementów Digital 520 (Discovery and Gap Assessment 2-4 tygodnie, AI Governance Build 8-12 tygodni, Reference Architecture for Integration Boundary 4-8 tygodni, Audit-Readiness Preparation 4-6 tygodni, Fractional Chief AI Officer kwartalny retainer) - Compliance playbook nie powinien zamykać się rozdziałem o tym, gdzie kupić doradztwo od autora - rozdz. 25 to reklama, nie checklist - Czytelnik kancelarii powinien wiedzieć, że rozdziały 1-24 są neutralnym materiałem, a rozdział 25 jest reklamą - i uważać, by w rekomendacji wewnętrznej nie cytować ich jako tej samej kategorii - Wzorcowy przykład tego, dlaczego MateMatic flaguje samopromocję inline w listach kuratorskich TRZY PYTANIA DLA POLSKIEJ KANCELARII W TYM TYGODNIU: 1. Czy DPA z naszymi dostawcami AI ma 12 klauzul Kenneya, czy mamy "zaakceptowane warunki dostawcy"? Jeśli "podpisaliśmy ich standardowy DPA" - przeczytaj go z 12-klauzulową checklistą w jednej ręce i art. 28 RODO w drugiej. Gdzie 12 klauzul brakuje, doczep addendum. 2. Czy mamy named AI Governance Lead z decision-rights authority - czy temat AI rozkłada się między partnerami bez właściciela? Jeśli "wszyscy o tym myślą" - mamy gap nr 7 z listy Kenneya. Charter z RACI (rozdz. 6 item 4) jednorazowa praca, ale musi być wykonana zanim kancelaria zatrudni pierwszego paralegala mającego dostęp do AI z aktami klienta. 3. Czy nasz proces DSAR sięga five-surface reach, czy zatrzymuje się na bazie danych? Database to tylko jedna z pięciu powierzchni. Prompt log, output cache, embedding index, observability - wszystkie zawierają dane osobowe klienta i wszystkie podlegają art. 15-17-18 RODO. Większość polskich kancelarii nie ma żadnej z czterech ostatnich w SOP DSAR. CO MATEMATIC WNOSI: Warsztat "Lokalizacja DPA i pięciu governance documents do polskiego porządku prawnego". Lokalizacja 12 klauzul Kenneya plus 6 AI-specific addenda do art. 28 RODO i art. 26-27 EU AI Act z polskim wzorcem umowy powierzenia jako kotwicą. Five governance documents jako szablon Karty Polityki AI Kancelarii z mappingiem na Karta Etyki Adwokata, Kodeks Etyki Radcy Prawnego, ustawę o świadczeniu usług drogą elektroniczną, ustawę o krajowym systemie cyberbezpieczeństwa w nowelizacji NIS2. 12 najczęstszych gaps Kenneya jako checklista pierwszego audytu wewnętrznego z polskimi instrumentami egzekucji per gap. Deliverable po warsztacie: zlokalizowany szablon DPA z 12 klauzulami plus 6 AI addenda w polskim języku prawnym, gotowy do podpisania przez wspólnika. Pakiet pięciu governance documents w wersji polskiej z odniesieniami do KEA, KERP, art. 28 RODO i art. 9 AI Act. Audyt 12 najczęstszych gaps przeprowadzony w środowisku kancelarii z raportem zamknięcia luk. 90-dniowy plan zaadaptowany do polskich realiów. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. CROSS-REFERENCE: TOM 056 (Governing Intelligence - atlas regulacyjny czterech jurysdykcji, opublikowany 9 maja 2026 rano); TOM 045 (Runtime Enforcement - Five-Layer Stack); TOM 001 (Governing Agents); TOM 054 (EDPB DPIA baseline-eskalacja); Aktualność 7 maja 2026 (EU AI Act Omnibus); Aktualność 9 maja 2026 rano (Stanford HAI LegalTech overlay). --- ### Stanford HAI dorzuca LegalTech overlay do AI Index 2026. Pięć tematów, każdy z liczbą - i nie są to liczby, które zwalniają z czujności. URL: https://matematicsolutions.com/aktualnosci/2026-05-09-stanford-hai-legaltech-overlay-ai-index-2026.html Data: 2026-05-09 Opis: Signal-boost MateMatic dla overlay LegalTech wydanego przez Stanford Institute for Human-Centered AI jako kuratorska synteza branżowa wybranych kawałków AI Index Report 2026 (385+ stron, IX edycja, kwiecień 2026). Pełna recenzja flagowa raportu opublikowana 4 maja 2026 jako TOM 052 BW/2026/052. PIĘĆ TEMATÓW LEGALTECH OVERLAY: 1. Legal Reasoning Benchmarks (rozdz. 2.5) CaseLaw v2 testuje real-world litigation i legal research na ostatnich orzeczeniach sądów USA i Kanady, siedem wymiarów reasoning. GPT-5.1 prowadzi z 73,4 procent accuracy, większość top modeli w przedziale 62-70 procent. Wspólna słabość raportowana wprost: modele opierają się na wiedzy ogólnej zamiast na dostarczonych dokumentach. LegalBench obejmuje sześć zadań reasoning lustrzanych do real legal work - top 15 modeli powyżej 83 procent, ale w wąskim 4-punktowym przedziale (różnicowanie modeli trudne). Ogólnie AI trafia w 60-90 procent accuracy na zadaniach prawnych. 2. Hallucination Problem w Legal Contexts (rozdz. 3.2) Wyróżniony benchmark KaBLE testuje, czy modele odróżniają znane fakty od wierzeń - krytyczne dla prawa. Modele wykazały istotne spadki accuracy na zadaniach first-person false belief - sygnał, że obecne modele nadal nie nauczyły się tej dystynkcji w sposób niezawodny. Realne ryzyko dla zastosowań prawniczych. 3. LegalTech Investment Trends (rozdz. 4.2) LegalTech pojawia się w globalnych danych AI investment by sector (2018-2025) jako odrębna kategoria. Wykresy trendu inwestycyjnego pokazują LegalTech osiągający około 6,52 mld USD w 2025 roku. 4. AI Adoption w Legal Functions (rozdz. 4.3) Knowledge management w business/legal/professional services - 58 procent adopcji, na równi z software engineering / IT jako top use case we wszystkich branżach. Funkcje risk i compliance nadal pokazują niski uptake AI w większości sektorów. Na poziomie governance: Legal jako primary owner of AI governance tylko w 5-6 procent organizacji. 5. Legal i Regulatory Frameworks (rozdz. 3.3 i 5) RODO pozostaje najczęściej cytowanym wpływem regulacyjnym na responsible AI - 60 procent organizacji, lekko w dół z 65 procent rok wcześniej. EU AI Act i U.S. AI Executive Order rosną w wpływie. Japonia, Korea Południowa i Włochy uchwaliły krajowe ustawy o AI w okresie raportowania. Senat USA pozwolił stanom kontynuować własne ustawy o nadzorze AI. WNIOSEK HAI: AI capable of legal reasoning (benchmarki 60-87 procent), inwestycje rosną, enterprise adoption w legal knowledge work należy do najwyższych - ale reliability concerns (halucynacje, mylenie wiary z faktem) pozostają centralną barierą głębszego deploymentu w high-stakes legal settings. TRZYFILAROWY FILTR MATEMATIC: BIERZEMY: 6,52 mld USD inwestycji LegalTech jako sygnał dojrzałości kategorii; 58 procent adopcji knowledge management jako baseline porównawczy; 5-6 procent Legal jako primary owner of AI governance jako mapa okna do wejścia. FLAGUJEMY: GPT-5.1 = 73,4 procent na CaseLaw v2 (oznacza około 26 procent błędów na real-world litigation; słabość modelu wskazana wprost - opieranie się na wiedzy ogólnej zamiast na dostarczonych dokumentach); LegalBench top 15 w wąskim 4-punktowym przedziale (walidacja na własnych aktach kancelarii liczy się bardziej niż ranking benchmarka); KaBLE i first-person false belief jako sygnał ryzyka, że asystent może bezkrytycznie zamienić "świadek twierdzi, że X" na "X" (interpretacja MateMatic, nie stanowisko NRA ani KRRP). NIE ENDORSUJEMY: wniosku, że 60-90 procent accuracy = gotowość do produkcji w polskiej kancelarii bez walidacji na własnym korpusie aktów (nie na anglojęzycznym CaseLaw v2 ani LegalBench common-law oriented) oraz architektury kontroli per decyzja; wniosku, że knowledge management 58 procent adopcji = dowód na bezpieczne wdrożenie (sam HAI flaguje hallucination jako centralną barierę w high-stakes legal settings). TRZY PYTANIA DLA POLSKIEJ KANCELARII W TYM TYGODNIU: 1. Czy mamy mierzony baseline accuracy AI na własnych aktach - nie na CaseLaw v2 ani LegalBench? 2. Czy nasze procesy uwzględniają KaBLE-typową kruchość modeli na first-person false belief? Czy asystent przygotowujący streszczenie zeznania ma narzucony format zachowujący rozróżnienie "świadek twierdzi X" vs "X jest udowodnione"? 3. Co robimy z 5-6 procent Legal as primary owner of AI governance? Mapa rynku - jeśli klienci kancelarii nie mają u siebie prawnika u steru AI governance, kancelaria ma okno świadczyć tę funkcję ad hoc. CO MATEMATIC WNOSI: Warsztat Walidacja stack-u AI kancelarii na własnym korpusie. Deliverable: zbiór testowy 30-50 zadań wzorowanych na CaseLaw v2 i KaBLE w polskim języku i polskim systemie prawnym. Mapa accuracy na 3-4 modelach kandydatach (open-weight do lokalnego deploymentu plus jeden cloud reference). Pre-ustawiony prompt-template z post-walidacją dla streszczeń i analizy. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Interpretacje regulacyjne na poziomie warsztatu są stanowiskiem MateMatic - nie zastępują doradztwa prawnego. CROSS-REFERENCE: TOM 052 (Stanford HAI AI Index 2026 - pełna recenzja flagowa); TOM 056 (Kenney Governing Intelligence - atlas dla compliance officera w 4 jurysdykcjach UE/USA/UK/CN, opublikowany 9 maja 2026 rano); TOM 053 (Five Eyes - careful adoption agentic AI); Aktualność 7 maja 2026 (EU AI Act Omnibus - przesunięcie terminów). --- ### EU AI Act przesuwa terminy. Kierunek pozostaje. Kancelaria, która zrobi odroczenie wymówką, popełnia błąd kategorii. URL: https://matematicsolutions.com/aktualnosci/2026-05-07-eu-ai-act-omnibus-przesuniecie-terminow.html Data: 2026-05-07 Opis: Komentarz operacyjny MateMatic do politycznego porozumienia Rady UE i Parlamentu Europejskiego z 7 maja 2026 ws. Digital Omnibus on AI. Najgłośniejsza zmiana - przesunięcie terminów egzekucji: Annex III (rekrutacja, edukacja, kredyt, biometria, infrastruktura krytyczna, ściganie, wymiar sprawiedliwości, migracja) z 2 sierpnia 2026 na 2 grudnia 2027; Annex I (urządzenia medyczne, maszyny, zabawki, dźwigi, łodzie regulowane sektorowo) na 2 sierpnia 2028; art. 50(2) watermarking grace period skompresowany z 6 do 3 miesięcy, nowa data 2 grudnia 2026. Daty są twarde, niezależne od dostępności standardów technicznych ani wytycznych Komisji. Mniej widoczne, ale ważniejsze: rdzeń aktu pozostaje nietknięty - art. 9, art. 6, klasyfikacja ryzyka, obowiązki dostawców i użytkowników, definicje, kary. Trilog jeszcze nie zamknięty, ale to operacyjna baza planowania. Pięć elementów porozumienia: (1) przesunięcie egzekucji Annex III i Annex I; (2) nudification i CSAM dodane do art. 5 prohibited practices z safe-harbour dla systemów z efektywnymi prewencyjnymi zabezpieczeniami; (3) rejestracja w bazie unijnej pozostaje obowiązkowa dla dostawców exempted - propozycja Komisji uproszczenia ograniczona przez Parlament i Radę; (4) art. 50(2) watermarking grace period skompresowany do 3 miesięcy; (5) szerszy zakres przetwarzania sensitive personal data dla bias correction - nadal "strictly necessary" i tylko dla określonych typów uprzedzeń. Co przemilczano: art. 4 (AI literacy). Komisja i Rada chciały usunąć lub znacząco złagodzić ten obowiązek - argumentem był "ciężar administracyjny". Parlament Europejski był przeciw. Brak komunikatu w tej sprawie sugeruje brak porozumienia lub przesunięcie decyzji na późniejszy etap trilogu. Dla kancelarii to oznacza: nie zakładać, że obowiązek AI literacy zniknie. Polskie kancelarie, które do tej pory wstrzymywały programy literacy AI dla pracowników "do wyjaśnienia", powinny zacząć teraz - prawdopodobieństwo, że obowiązek pozostanie w jakiejś formie, jest wyższe niż prawdopodobieństwo jego usunięcia. Anti-deprioritisation argument MateMatic: najczęstsza reakcja rynku LegalTech od dzisiejszego rana - "skoro przesunięto, mamy więcej czasu, można odpriorytetyzować" - to błąd kategorii. Po pierwsze, przesunięto egzekucję, nie obowiązek przygotowania (Annex III i Annex I obejmują zastosowania już dziś w produkcji w wielu organizacjach - rekrutacja przez AI screening, scoring kredytowy, biometria w kontroli dostępu, narzędzia wspomagające pracę sędziego). Po drugie, art. 9 (system zarządzania ryzykiem) jest mechanizmem ciągłym, nie egzaminem do zdania w terminie - standard ISO 27005, na którym art. 9 jest oparty, mówi wprost: zbudowanie takiego procesu wymaga przejścia trzech cykli iteracji, czyli minimum dwóch kwartałów obserwowanych zmian. Po trzecie, konsultacje EDPB nad szablonem DPIA kończą się 9 czerwca 2026 - RODO art. 32-35 i AI Act art. 9 to ten sam mechanizm baseline-eskalacja, opisany w trzech różnych aktach prawnych; kancelaria wstrzymująca prace nad architekturą zarządzania ryzykiem traci również okno wpływu na finalny szablon EDPB. Trzy pytania operacyjne dla kancelarii (nie ważne czy dostawca czy użytkownik AI): (1) Które z naszych obecnych systemów AI pasują do Annex III lub Annex I? - mapping jest pracą architektoniczną, nie prawną; wymaga zrozumienia, jak system działa pod spodem, nie tylko jak jest reklamowany przez dostawcę; (2) Czy mamy proces zarządzania ryzykiem dla AI w kategorii art. 9 - ciągły, nie audytowy? - jeśli odpowiedź to "robimy roczny audyt zewnętrzny", to nie jest art. 9, to jest dokument do szuflady; (3) Co robimy z AI literacy między dziś a hipotetycznym wycofaniem art. 4? - jeśli czekamy na decyzję Brukseli, przegrywamy; polskie kancelarie zaczynające programy literacy w maju 2026 w 2027 będą miały zespoły czytające output AI z należną ostrożnością; konkurencja, która czekała - nie. Każde z tych pytań ma jedną poprawną odpowiedź na poziomie procesu. Brak procesu w którymkolwiek z trzech to nie luka prawna - to luka operacyjna, której kara za AI Act jest tylko jednym z kosztów ujawnienia. Cross-references: Aktualność 2026-05-06 EDPB szablon DPIA (mechanizm baseline-eskalacja w trzech aktach prawnych); BW/053 Five Eyes Careful adoption (operacjonalizacja bezpieczeństwa decyzji plus mapping NIS2 UKSC); BW/050 Krause Moneyball plus triada BW/051-053 plus Aktualność 2026-05-04 Supesu (decyzja jako jednostka pracy - rama zarządcza dla art. 9 jako ciągłego procesu). Co MateMatic wnosi: warsztat AI Act dla kancelarii - mapowanie systemów AI kancelarii na Annex III i Annex I, projektowanie procesu art. 9 jako ciągłego mechanizmu, program AI literacy dopasowany do art. 4 niezależnie od finalnej formy, którą artykuł przyjmie w tekście Omnibusu; deliverable - mapa ryzyka systemów AI kancelarii plus lista luk do zamknięcia przed 2 grudnia 2027 plus roadmapa programu AI literacy z konkretnymi modułami szkoleniowymi dla zespołów prawnych i administracyjnych. Materiał oparty o połączenie trzech aktów prawnych (RODO art. 32-35, AI Act art. 9-6, ISO 27005), nie jeden checklist regulacyjny. Interpretacje regulacyjne na poziomie warsztatu są stanowiskiem MateMatic - nie zastępują doradztwa prawnego. Schema: NewsArticle + BreadcrumbList. ### EDPB ma szablon DPIA. Ale formularz to nie jest problem - problem jest wcześniej. URL: https://matematicsolutions.com/aktualnosci/2026-05-06-edpb-szablon-dpia-mechanizm-zarzadzania-ryzykiem.html Data: 2026-05-06 Opis: EDPB opublikował 14 kwietnia 2026 oficjalny szablon DPIA - konsultacje publiczne otwarte do 9 czerwca 2026. Branża komentuje formularz; MateMatic patrzy na mechanizm. KLUCZ: większość organizacji robi DPIA bez solidnego baseline'u z art. 32 RODO pod spodem - czyli wchodzi na piętro omijając fundament. Szablon EDPB tego nie naprawi, bo problem jest w kolejności działań, nie w jakości formularza. Historia mechanizmu: ISO/IEC TR 13335-3:1998 (poprzednik ISO 27005) opisał dwa poziomy oceny ryzyka jako mechanizm, nie opcję. Ocena ogólna baseline (szybka, przekrojowa, daje obraz ryzyka dla całej organizacji - jeśli niskie zatrzymujesz się tu, jeśli wysokie idziesz dalej) plus ocena szczegółowa eskalacja (wchodzi tylko gdy baseline wykaże wysokie ryzyko, pogłębiona analiza konkretnych aktywów, zagrożeń, podatności i skutków). Mechanizm znany specjalistom bezpieczeństwa informacji od prawie trzydziestu lat trafił w tekst RODO w tym samym rozdziale, w tej samej logice eskalacji, bez przypisu do normy z 1998 roku. RODO art. 32 to baseline (organizacja ocenia ryzyko dla praw i wolności osób fizycznych ogólnie, dla wszystkich operacji przetwarzania - wynik tej oceny determinuje dobór środków technicznych i organizacyjnych); art. 35 (DPIA) to eskalacja (wchodzi dokładnie wtedy gdy operacja przetwarzania "może powodować wysokie ryzyko" - czyli gdy baseline z art. 32 wykaże wyzwalacz). Oba artykuły w tym samym rozdziale RODO - to nie przypadek układu tekstu, to odzwierciedlenie jednego procesu w dwóch artykułach. AI Act dodaje trzeci poziom tej samej piramidy: art. 9 system zarządzania ryzykiem to baseline odpowiednik art. 32 dla AI (ciągły system identyfikacji, analizy i kontroli ryzyka przez cały cykl życia systemu - nie jednorazowy audyt); art. 6 plus Annex III to eskalacja (gdy system AI trafia na listę zastosowań wysokiego ryzyka - rekrutacja, ocena kredytowa, wymiar sprawiedliwości, biometria - obowiązkowa ocena zgodności, dokumentacja techniczna, rejestracja w unijnej bazie danych); audyt zewnętrzny przez jednostkę notyfikowaną dla wybranych kategorii to szczyt piramidy. Trzydzieści lat historii, trzy regulacje (ISO TR 13335 → ISO 27005 → RODO art. 32/35 → AI Act art. 9/6/Annex III), zero przypadku - jeden wzorzec myślenia o ryzyku przepisywany kolejno na język kolejnych regulacji. Co to oznacza dla kancelarii: kancelaria, która dziś prowadzi projekt wdrożenia RODO lub AI Act "od strony prawnej", ma szansę popełnić ten sam błąd, który opisuje szablon EDPB - traktować DPIA jako formularz do wypełnienia, a nie jako drugi poziom procesu zaczętego wcześniej w art. 32. Pytania przed podpisaniem umowy z doradcą compliance: jak ocenicie ryzyko w art. 32 zanim przystąpicie do DPIA; kto w zespole wdrażał ISO 27001 lub ISO 27005; jak zmapujecie systemy AI na Annex III od strony architektury, nie tylko przepisów. Cisza w odpowiedzi to też odpowiedź. Kancelaria bez tych kompetencji może napisać poprawny dokument DPIA - nie może natomiast przeprowadzić procesu, którego DPIA jest tylko widocznym efektem. Różnica niewidoczna w treści dokumentu, widoczna dopiero przy pierwszym incydencie lub inspekcji UODO. Co MateMatic wnosi: warsztat AI Act dla kancelarii - mapowanie systemów AI na Annex III, analiza art. 9 jako ciągłego procesu, połączenie z baseline'em RODO art. 32 i wyzwalaczami DPIA art. 35; deliverable - mapa ryzyka systemów AI plus lista luk do zamknięcia przed pierwszą inspekcją. Termin konsultacji EDPB do 9 czerwca 2026 to dobry moment żeby zacząć od mechanizmu, nie od formularza. Cross-references: BW/054 EDPB Guidelines on DPIA (pełna recenzja); Aktualność 2026-05-07 EU AI Act Omnibus (przesunięcia terminów Annex III/I plus mostek do mechanizmu baseline-eskalacja). Schema: NewsArticle + BreadcrumbList. ### AI Firm Index - powstał katalog AI-native kancelarii. Co z tego dla polskiego rynku prawniczego. URL: https://matematicsolutions.com/aktualnosci/2026-05-05-ai-firm-index-pollins-katalog-ai-native-kancelarii.html Data: 2026-05-05 Opis: Sygnał z rynku - Matt Pollins (co-founder Lupl, wcześniej partner w CMS) uruchomił w marcu 2026 katalog kancelarii zbudowanych od podstaw wokół AI - aifirmindex.com. 27 wpisów w marcu, 40 wpisów w kwietniu 2026. Pollins próbuje opisać kategorię, której wcześniej nie było - NewMod, kancelaria-AI-natywna - intake, pricing, delivery i struktura zespołu zaprojektowane od pierwszego dnia wokół AI jako fundamentu, a nie dodatku. To nie ranking "najlepszych" kancelarii - to indeks kategorii, która się dopiero formuje. MateMatic patrzy z czerwonym długopisem - co bierzemy do polskiego rynku, co wymaga kontekstu pod art. 5 ustawy o radcach i art. 4a prawa o adwokaturze, czego nie endorsujemy. Pięć kryteriów Pollinsa: (1) intake przez agentów, nie przez maila do associate - klient nie pisze do partnera "mam sprawę, oddzwoń", wpisuje do formularza, do Slack-bota, do agenta, który zbiera dane, kwalifikuje sprawę i przekazuje do prawnika dopiero z gotowym kontekstem; (2) publiczny cennik online albo AI-asystent wyceny - pricing transparency twardym kryterium, klient wie co zapłaci zanim umówi konsultację, część firm publikuje listę cen, część daje agenta-wyceniacza, brak punktu "zadzwoń, omówimy"; (3) AI jako fundament workflow, nie add-on - każdy etap obsługi sprawy (draft, review, komunikacja, fakturowanie) wykorzystuje AI domyślnie, prawnik nadzoruje, ale praca powstaje w narzędziu, nie w Word-zie wspomaganym Copilotem; (4) struktura zespołu odporna na model billable hour - część firm rezygnuje z modelu godzinowego całkowicie (flat fee, subscription, success fee), wynagrodzenie zespołu nie zależy od liczby przepracowanych godzin tylko od liczby zamkniętych spraw lub jakości decyzji; (5) definicja w ruchu - Pollins explicit pisze, że kategoria dopiero powstaje i kryteria będą ewoluować, to nie closed-list, to obserwacja rynku in-flight. Przykładowe firmy w indeksie: Crosby (NDA/MSA, US), Garfield (small claims, UK), Soxton, Eudia, Alaro, AgileCounsel. Trzyfilarowy filtr MateMatic - co bierzemy: pricing transparency online (publiczny cennik nie narusza KEA art. 32 ani KERP art. 36 - mówią o godziwości wynagrodzenia, nie o utajnieniu); intake przeprojektowany na agenta zamiast skrzynki mailowej (wzorzec techniczny niezależny od kraju, da się zbudować na stack zero-cloud - formularz plus AppFlowy plus Bielik lokalnie); ekonomia decyzji zamiast godziny (narracja MateMatic od BW/050 Krause Moneyball i triady BW/051-053). Co wymaga kontekstu: polski rynek pod art. 5 ustawy o radcach prawnych i art. 4a prawa o adwokaturze wymaga, by właścicielami spółki prawniczej byli wyłącznie radcowie/adwokaci - to wyklucza model amerykański typu Manifest OS (60 mln USD Series od PE, partnerzy = inwestorzy finansowi); polska kancelaria może zaadaptować operacje AI-native, ale nie strukturę kapitałową; większość firm w katalogu hostuje dane klientów na OpenAI/Anthropic API bez transparentnej DPA, dla polskiej kancelarii pod RODO art. 28 i tajemnicą zawodową (art. 6 PoA, art. 6 u.r.p.) to oddzielny audyt. Czego nie endorsujemy: vendor lock-in jako fundament - część firm w indeksie zbudowana wokół jednego ekosystemu (Lupl, Manifest OS, Alaro) i bez tego ekosystemu nie istnieje, MateMatic pozostaje vendor-agnostic; "AI-native" jako self-tag marketingowy - 27→40 firm w miesiąc to też sygnał, że część kancelarii dokleja etykietę bez pokrycia operacyjnego. Co MateMatic robi z tym sygnałem: (1) katalog Pollinsa wzmacnia tezę MateMatic od miesięcy - jednostką pracy prawnika przestaje być godzina i dokument, staje się decyzja; pięć kryteriów AI-native to operacjonalizacja tej tezy na poziomie firmy; (2) Polski LegalTech AI 2026 ma już dwa aktywne dashboardy w Akademii MateMatic (mapa 19 narzędzi w 8 kategoriach plus 100 promptów dla kancelarii); trzecim dashboardem rozważanym na Q3 2026 jest self-assessment "AI-native readiness PL" - 5 kryteriów Pollinsa zmapowane na art. 5 u.r.p., RODO art. 28-32, AI Act art. 26, KEA i KERP; nie ranking, nie indeks - osobiste narzędzie diagnostyczne; (3) cztery z pięciu kryteriów Pollinsa (intake, pricing, delivery, audytowalność decyzji) da się dziś zbudować na stack zero-cloud RODO-safe bez OpenAI, bez Lupl, bez Manifest OS - pillar MateMatic od kwietnia (gogcli + Chandra OCR + noScribe + AppFlowy + Cline + DocuSeal + Bielik lokalnie); AI-native bez vendor lock-in jest możliwa, tylko trzeba ją złożyć ręcznie. Sygnał kierunkowy: polska kancelaria, która zaczyna w maju 2026 myśleć o swoich operacjach jako AI-native, ma dwa lata przewagi nad rynkiem - pierwsza fala adopcji (87 procent prawników z ChatGPT) skończyła się "AI-augmented", a nie "AI-native"; druga fala - przeprojektowanie intake, pricing i delivery wokół decyzji - dopiero się zaczyna. Co MateMatic wnosi: audyt AI-native readiness dla polskiej kancelarii - pięć kryteriów Pollinsa zmapowane na art. 5 u.r.p., art. 4a PoA, RODO art. 28-32, AI Act art. 26, KEA i KERP; diagnostyka intake, pricingu, delivery, struktury zespołu i audytowalności decyzji - co dziś działa, co wymaga przeprojektowania, co da się zbudować na stack zero-cloud RODO-safe bez vendor lock-in; deliverable - mapa luk plus plan kwartalny plus checklist deontologiczna. Cross-references: BW/050 Krause Moneyball for Lawyers, Aktualność 2026-05-04 Supesu (decyzja jako jednostka pracy), BW/051 Supesu, BW/052 Stanford AI Index 2026, BW/053 Five Eyes Careful adoption. Schema: NewsArticle + BreadcrumbList. ### Raport Supesu pokazuje wynagrodzenia, AI i wypalenie. Pod spodem jest coś ważniejszego: zmienia się jednostka pracy prawnika. URL: https://matematicsolutions.com/aktualnosci/2026-05-04-supesu-decyzja-jako-jednostka-pracy.html Data: 2026-05-04 Opis: Komentarz strategiczny MateMatic do IV edycji Raportu Rynku Prawniczego Supesu (CAWI, n=507). Teza otwierająca: większość czytelników ogląda raport jak materiał HR (wynagrodzenia, rotacja, wypalenie, narzędzia AI) i to słuszna lektura, ale niewystarczająca. Pod warstwą HR-ową dzieje się zmiana ważniejsza dla zarządu kancelarii - 87 procent adopcji AI plus 50 procent objawów wypalenia plus 33 procent wdrożenia AI w działach in-house razem oznaczają, że jednostką pracy prawnika przestaje być godzina i dokument, a staje się decyzja. AI i LegalTech nie przyspieszają pracy - przesuwają granicę między wykonaniem a odpowiedzialnością. Trzy operacyjne konsekwencje: (1) mniej znaczenia ma czas pracy - 50 procent objawów wypalenia w branży gdzie 87 procent prawników już używa AI oznacza, że narzędzie nie redukuje stresu, bo stres nie pochodził z czasu, tylko z rzadkości i wagi decyzji; (2) więcej znaczenia ma jakość i trafność decyzji - klient nie płaci za godzinę przy biurku, tylko za wybór ścieżki A zamiast B z uzasadnieniem, wycena oparta na godzinie przesuwa się ku wycenie opartej na decyzji; (3) największą przewagę budują ci, którzy potrafią to zapisać w systemie - decyzja "w głowie partnera" nie skaluje się i nie przenosi na zespół, decyzja zapisana z kontekstem, alternatywami i uzasadnieniem daje skalowalność i realną kontrolę zarządczą. Trzy warstwy architektury pracy: WARSTWA WEJŚCIA DECYZJI (skąd prawnik bierze sygnały - akta, baza orzecznictwa, output AI, intuicja zawodowa, konsultacja z partnerem; czy świadomie zaprojektowane czy improwizowane na każdą sprawę osobno); WARSTWA WERYFIKACJI I DRUGIEGO OKA (czy decyzja przechodzi human-in-the-loop oversight, peer review, supervisorship partnera, czy istnieją scenariusze gdzie jedno oko wystarcza i są świadomie wybrane); WARSTWA ZAPISU I AUDYTOWALNOŚCI (czy decyzja zostaje udokumentowana w sposób pozwalający odtworzyć ją za 12 miesięcy w postępowaniu dyscyplinarnym, w sporze o starania zawodowe, w audycie klienta). Centralne przesunięcie zarządcze: większość organizacji systematyzuje WIEDZĘ a powinna systematyzować SPOSÓB PODEJMOWANIA DECYZJI - bo wiedza bez kontekstu decyzji szybko staje się martwa, a dopiero zapisany powtarzalny sposób dochodzenia do decyzji daje skalowalność i realną kontrolę. Mostek do polskiej deontologii i regulacji: art. 6 KEA i art. 6 KERP wymagają staranności zawodowej, niezależności i godności zawodu spełnianych na poziomie decyzji nie godziny; RODO art. 28 i 32 (środki techniczno-organizacyjne adekwatne do ryzyka - bez zapisanego sposobu podejmowania decyzji o wprowadzeniu danych klienta do AI środki organizacyjne nie istnieją na papierze mimo że istnieją w głowach); AI Act art. 26 deployer obligations (dokumentacja użycia AI plus nadzór ludzki plus raportowanie incydentów - bez warstwy zapisu decyzji deployer obligations są fikcją regulacyjną); NIS2 polska transpozycja UKSC (3.04.2026 wejście, 3.04.2027 deadline implementacji - dla kancelarii obsługujących klientów z 18 sektorów objętych dyrektywą wymaga rejestru incydentów i ścieżki decyzyjnej w cyber security). Trzy pytania operacyjne dla zarządu kancelarii: (1) czy wiemy jaką decyzję nasi prawnicy podejmują najczęściej tygodniowo i jakim sygnałem zewnętrznym ta decyzja się zaczyna; (2) czy nasze decyzje przechodzą drugie oko i kiedy świadomie z drugiego oka rezygnujemy, dlaczego, na jaki próg ryzyka klienta; (3) czy potrafimy odtworzyć decyzję sprzed sześciu miesięcy z kontekstem, alternatywami i uzasadnieniem, jeśli klient zażąda pod art. 15 RODO, jeśli sąd dyscyplinarny zapyta, jeśli następca w dziale in-house będzie analizował precedens. Co MateMatic wniesie: audyt architektury pracy kancelarii w trzech sesjach - mapowanie warstwy wejścia decyzji (sygnały, AI, baza orzecznictwa, konsultacja), warstwy weryfikacji i drugiego oka (HITL, peer review, supervisorship), warstwy zapisu i audytowalności (rejestr decyzji pod RODO art. 28-32, AI Act art. 26, NIS2); deliverable - polityka decyzyjna kancelarii plus rejestr scope'ów AI plus protokół drugiego oka plus szablon zapisu decyzji do odtworzenia w postępowaniu dyscyplinarnym. Cross-references: BW/051 Supesu (pełna recenzja - 5 obserwacji MateMatic plus 3 luki ankiety plus mapping deontologia/RODO/AI Act); BW/052 Stanford AI Index 2026 (globalny benchmark); BW/053 Five Eyes Careful adoption (operacjonalizacja bezpieczeństwa decyzji); BW/050 Krause Moneyball (Profit Formula plus system A-F klientów jako framework decyzyjny). Schema: NewsArticle + BreadcrumbList. ### Workspace staje się natywnym środowiskiem AI. Dwa ogłoszenia Google'a w tym tygodniu i poważne 'ale' dla kancelarii. URL: https://matematicsolutions.com/aktualnosci/2026-04-30-google-workspace-staje-sie-srodowiskiem-ai.html Data: 2026-04-30 Opis: Komentarz strategiczny MateMatic łączący dwa ogłoszenia Google'a z tego samego tygodnia w jedną tezę. 27.04 globalny rollout eksportu plików w Gemini (Docs, Sheets, Slides, PDF, Word .docx, Excel .xlsx, RTF, TXT, MD, CSV, LaTeX - dla wszystkich edycji Workspace plus Workspace Individual plus kont prywatnych, Rapid Release i Scheduled Release). 29.04 natywne MCP w Workspace plus custom MCP w Gemini Enterprise (preview). Razem: Workspace przestaje być miejscem trzymania plików z doczepionym AI - staje się natywnym środowiskiem AI z dwustronnym interfejsem (MCP od strony danych wejściowych, eksport od strony wyjściowych) i jednolitą warstwą tożsamości OAuth plus Workspace identity. Sednem dla kancelarii: rozróżnienie DPA per edycja Workspace. Business Standard/Plus, Enterprise Standard/Plus, Frontline, Essentials, Nonprofits, Business Starter mają Gemini Apps jako core service z enterprise-grade data protection (Workspace DPA, treść NIE używana do treningu); Workspace Individual, Business Base, G Suite legacy, Cloud Identity, Chrome Enterprise mają Gemini jako additional service podlegającą Google Terms of Service plus Gemini Apps Privacy Notice (consumer terms, możliwy review przez human reviewers); prywatne konto Google to pełne consumer ToS bez DPA z domyślnie włączoną historią rozmów. Sprawdzenie edycji - badge Pro/Expanded/Ultra w UI gemini.google.com. Trzy use case'y: kancelaria z Business Standard/Plus korzysta świadomie (notatka po rozprawie plus eksport docx do folderu sprawy w obrębie DPA); kancelaria z mixed accounts wymaga audytu pilnie (część zespołu pod DPA, część nie - polityka natychmiast); indywidualny prawnik z prywatnym kontem ma default status quo (każda treść sprawy klienta wpisana w prompt narusza tajemnicę zawodową; sensowna decyzja to migracja na Workspace Business Standard 12 EUR/użytkownik/mc albo samodyscyplina). Mapping compliance: RODO art. 28 (DPA per edycja - pierwsza pozycja audytu); RODO art. 32 (świadoma decyzja edycji plus polityka AI plus szkolenie zespołu = środek techniczno-organizacyjny); tajemnica zawodowa art. 6 PoA i art. 6 RP (prawnik z prywatnym kontem Google'a wklejający treść sprawy do Gemini narusza obowiązek - bez "ale"); AI Act art. 26 (deployer obligations - nadzór zerwany jeśli dopuszczone konta osobiste). Pięć czerwonych flag: brak inwentaryzacji edycji; brak polityki AI; brak szkolenia z badge'a; domyślne ustawienia konta osobistego; eksport "z domu do pracy" (treść już wyszła z Google'a po stronie consumer). Co MateMatic wnosi: audyt edycji Workspace plus warsztat "AI scoping w Workspace" - rozdzielenie co prawnik może z Gemini w kontekście sprawy, ustawienie MCP scope'ów dla agentów gdy MCP wyjdzie z preview, dokumentacja pod RODO 28+32 i AI Act art. 26. Cross-references: Aktualność 2026-04-30 Google podpina Workspace i Gemini Enterprise pod MCP (równoległy komentarz tego samego dnia, fokus na MCP scope'ach). Schema: NewsArticle + BreadcrumbList. ### Google podpina Workspace i Gemini Enterprise pod MCP. Co to znaczy dla kancelarii. URL: https://matematicsolutions.com/aktualnosci/2026-04-30-google-workspace-mcp-servers-gemini-enterprise.html Data: 2026-04-30 Opis: Komentarz strategiczny MateMatic do dwóch ogłoszeń Google'a o Model Context Protocol (MCP) - otwartym standardzie Anthropic'a. Tor pierwszy: zdalne serwery Workspace MCP (Gmail, Drive, Calendar, Chat, People) jako developer preview - klienci AI (Gemini CLI, Claude Code, Claude Desktop, IDE) konfigurują endpoint plus OAuth client/secret plus scope'y i dostają tools takie jak search_threads, create_draft, create_file, listing wydarzeń kalendarza, z uprawnieniami dziedziczonymi po użytkowniku. Tor drugi: custom MCP server data store w Gemini Enterprise (Pre-GA) - kancelaria wystawia własny serwer MCP nad DMS/bazą wzorów, podpina w konsoli Cloud jako data store; wymóg StreamableHTTP (bez SSE), HTTPS, OAuth (Okta/Azure AD/Google), Discovery Engine Editor role, override organization policy; agent w Agent Designer (nie default Gemini). Trzy use case'y dla kancelarii: (1) asystent prowadzącego sprawę read-only do folderu Drive sprawy plus label'a Gmail; (2) custom MCP nad firmowym DMS/bazą wzorów (search_clauses, get_template); (3) audyt scope'ów AI w kancelarii - jawne OAuth = pierwsza centralna warstwa "co AI faktycznie czyta i pisze". Mapping compliance: RODO art. 32 (least privilege via scope'y); RODO art. 28 (Google nadal procesor; trzecia strona klient MCP = nowy podmiot DPA); tajemnica zawodowa art. 6 PoA i art. 6 RP (zgoda klienta plus DPA dostawcy klienta MCP); AI Act art. 26 (rejestr scope'ów jako artefakt deployer obligations). Czerwone flagi preview: status Preview/Pre-GA bez SLA; brak VPC-SC i PSC w Gemini Enterprise preview; granica klienta MCP jako trzeciej strony; scope hygiene (drive vs drive.file, gmail.modify vs gmail.readonly); zarządzanie OAuth client w IdP. Wzorzec MateMatic: otwarty standard nie vendor lock-in plus Workspace nie nowy SaaS plus jawne scope'y i audytowalność. Konkluzja: dziś czas na politykę i sandbox, nie produkcję; warsztat MateMatic "MCP scoping dla kancelarii" mapuje scope'y do typowych procesów (nowa sprawa, due diligence, KYC, monitoring orzecznictwa) i dokumentuje to pod RODO plus AI Act art. 26. Cross-references: Aktualność 2026-04-30 Workspace staje się natywnym środowiskiem AI (synteza obu ogłoszeń); Magika 2026-04-29 (input validation jako warstwa bezpieczeństwa AI workflow). Schema: NewsArticle + BreadcrumbList. ### Magika - 1 MB modelu Google, który sprawdza czym naprawdę jest plik. Praktycznie dla kancelarii. URL: https://matematicsolutions.com/aktualnosci/2026-04-29-magika-google-detektor-typow-plikow.html Data: 2026-04-29 Opis: Recenzja MateMatic open-source'owego narzędzia google/magika (Apache 2.0, 16.8 tys. gwiazdek na GitHubie). Magika to klasyfikator typu zawartości pliku (file content type detection) - czyta pierwsze bajty pliku i mówi z prawdopodobieństwem, czym ten plik naprawdę jest, niezależnie od rozszerzenia w nazwie. Plik "umowa.pdf", który w środku jest .exe z malware, Magika zidentyfikuje jako plik wykonywalny. Specyfikacja techniczna: model ~1 MB, inferencja 5 ms na pojedynczym CPU, 200+ obsługiwanych typów plików, ~99% precision/recall na zbiorze ~100M plików treningowych. Inferencja konstantnie szybka niezależnie od rozmiaru pliku - Magika analizuje wybrany podzbiór bajtów. System progowy per typ z trzema poziomami pewności (high-confidence, medium-confidence, best-guess). Bindings: Rust CLI, Python (pip install magika), JavaScript/TypeScript (npm), Go. Korekta klikbajtu mediów branżowych: Magika to NIE antywirus, NIE zastępuje EDR, NIE wykryje exploit'a w prawdziwym PDF z wstrzykniętym JavaScript. Należy do warstwy "weryfikacja typu zawartości", nie "detekcja zachowania". Kilka mediów branżowych w ostatnich dniach skróciło Magikę do "1 MB AI malware detector" - jest to wprowadzanie w błąd. Google używa Magiki wewnętrznie w Gmail, Drive i Safe Browsing - "battle-tested at scale". Trzy use case'y dla polskiej kancelarii prawnej: 1) Filtr przy bramie pocztowej - skrypt z Magiką sprawdza, czy załącznik "umowa.pdf" rzeczywiście jest PDF; rozbieżność typu z rozszerzeniem flaguje wiadomość do ręcznego sprawdzenia przed dotarciem do skrzynki pełnomocnika prowadzącego sprawę. 2) Pre-processing przed indeksowaniem do DMS - magika -r na całym katalogu skanów wyciąga z pipeline'u pliki o niezgodnym typie przed indeksowaniem; higiena DMS jako baza dalszej automatyzacji. 3) Audyt cudzego dysku przy due diligence M&A - klasyfikacja 50 tys. plików w godzinę na lokalnym CPU; raport z rozkładem typów (PDF, obrazy, binaria, skrypty, niezgodności typu i rozszerzenia) jako pierwsza warstwa data room intelligence. Mapping na ramy compliance: - RODO art. 32 - obowiązek środków technicznych i organizacyjnych adekwatnych do ryzyka; Magika to tania, sprawdzona, open-source warstwa weryfikacji plików bez ekspozycji RODO (zero wysyłki do third-party). - NIS2 (dyrektywa 2022/2555, polska ustawa wdrażająca w toku prac) - identyfikacja zagrożeń jako udokumentowana procedura w pipeline'ie kancelarii świadczącej usługi dla podmiotów objętych. - ENISA Multilayer Framework for Good Cybersecurity Practices for AI + zasada security by design - weryfikacja typu zawartości jako klasyczny element warstwy input validation. Wzorzec MateMatic vendor-agnostic edukator: open source (Apache 2.0, kod audytowalny), lokalna inferencja (zero ekspozycji RODO, plik nie opuszcza infrastruktury kancelarii), zero opłat licencyjnych. Pozycjonowanie: nie sprzedajemy Magiki, uczymy z niej korzystać; w 8 z 10 polskich kancelarii pierwszego kwartału 2026 weryfikacja typu pliku sprowadza się do zaufania rozszerzeniu w nazwie - to luka, którą Magika zamyka za zero złotych licencji. Linki: github.com/google/magika, securityresearch.google/magika. Schema: NewsArticle. Autor: Wiesław Mazur. ### Otwarty przewodnik po dostępności dokumentów. Piekot i Zrolka zapraszają do współtworzenia. URL: https://matematicsolutions.com/aktualnosci/2026-04-29-piekot-zrolka-przewodnik-dostepnosc-dokumentow.html Data: 2026-04-29 Opis: Komentarz MateMatic do inicjatywy Piotra Zrolki (CPACC, Certified Professional in Accessibility Core Competencies - jeden z nielicznych certyfikowanych specjalistów dostępności w Polsce) i Tomasza Piekota (językoznawca z Uniwersytetu Wrocławskiego, autorytet w plain language). Punkt zapalny: rozmowa Zrolki z przedstawicielką dużej instytucji finansowej, która powołała się na publikację ZBP ze zdaniem, że "w dokumentach cyfrowych nie można używać przypisów". Zrolka zamiast pisać polemikę otworzył kolaboracyjny dokument Google - przewodnik po dostępności dokumentów Word otwarty na wkład każdego, z planem migracji na GitHub. Pierwsze rozdziały w toku - przypisy i tabele. Filtr MateMatic dla kancelarii prawnej - trzy ramy prawne wymagające dostępności dokumentów: 1) European Accessibility Act (dyrektywa 2019/882, polska ustawa o zapewnianiu spełniania wymagań dostępności niektórych produktów i usług z 26 kwietnia 2024) obowiązująca od 28 czerwca 2025 - e-commerce, bankowość elektroniczna, kancelarie obsługujące te sektory. 2) RODO art. 12 - zwięzłość, przejrzystość, zrozumiałość i łatwa dostępność klauzul informacyjnych; PDF bez tagów struktury jest dla niewidomego klienta nieczytelny, czyli niezgodny z art. 12. 3) Konwencja ONZ o prawach osób z niepełnosprawnościami art. 9 + Kodeks pracy art. 23a - dostępność dokumentów wewnętrznych dla pracownika z dysfunkcją wzroku jako obowiązek pracodawcy. Dodatkowy obszar: dostępność procesowa - skan PDF z papierowej kserówki bez warstwy tekstowej i tagów jest dla strony reprezentowanej przez niewidomego pełnomocnika de facto pustą kartką. Pozycjonowanie MateMatic: brakujący rozdział, który chętnie wniesiemy do przewodnika - dokumenty prawne (pisma procesowe, opinie prawne, klauzule informacyjne RODO, regulaminy, umowy) z polskim filtrem, przykładami z praktyki kancelarii i ekstensją na Google Docs dla kancelarii pracujących na Workspace. Wpisuje się w wzorzec vendor-agnostic edukatora - nie konkurujemy z dostawcami narzędzi dostępności, uczymy kancelarie pracować poprawnie z tym, co mają. Linki: dokument Google (Rekomendacja do tworzenia dokumentów Word), post Tomasza Piekota na LinkedIn. Schema: NewsArticle. Autor: Wiesław Mazur. ### Baza Wiedzy urosła w weekend o dziewięć tomów. Co siedzi w tym przyroście. URL: https://matematicsolutions.com/aktualnosci/2026-04-28-baza-wiedzy-przyrost.html Data: 2026-04-28 Opis: Podsumowanie weekendu wzbogacenia Bazy Wiedzy MateMatic z 33 do 42 tomów. Mapa pięciowarstwowego stack'u governance AI dla kancelarii - nie kolekcja przypadkowych źródeł, tylko świadomie ułożona drabina kompetencyjna od polityki wewnętrznej do empirycznego benchmarku globalnego. Pięć warstw: (1) BW/039 RAII Responsible AI Implementation - wewnętrzna polityka AI w organizacji jako fundament; (2) BW/040 King AI Vendor Assessment Guide - audyt dostawców LegalTech jako warstwa kontroli zewnętrznej; (3) BW/041 RAND AGI Forecasting - monitoring trajektorii rozwoju AI dla decyzji strategicznych zarządu; (4) BW/036 Kuśmierek Polska wobec AGI - polski kontekst regulacyjny i geopolityczny dla rynku LegalTech; (5) BW/042 AICDI Responsible AI in Practice - empiryczny benchmark globalny ze 100 tysięcami punktów danych z 2972 spółek (operacjonalizacja co realnie wdrażają zespoły governance, nie co deklarują w strategiach). Plus cztery dodatkowe tomy uzupełniające: BW/034 Kumaran (LLM confidence biases - dlaczego nadmierna pewność modelu jest pułapką dla prawnika); BW/035 Laban (LLMs corrupt documents - ryzyko cichej modyfikacji treści dokumentu w workflow AI); BW/037 MIT AIRI Navigator (framework nawigacji ryzyk AI); BW/038 Smuha Cambridge Handbook AI (akademicki przegląd governance jako kontekst). Rekomendowana kolejność czytania dla compliance officera kancelarii: warstwa polityki wewnętrznej (RAII) → audyt dostawców (King) → monitoring trajektorii (RAND) → polski kontekst (Kuśmierek) → empiryczny benchmark (AICDI). Każdy tom z czerwonym długopisem MateMatic - co bierzemy do polskiego rynku, co wymaga kontekstu deontologicznego, czego nie endorsujemy. Cross-references: BW/039-042 jako pięciowarstwowy stack governance; BW/034-035, BW/037-038 jako materiały uzupełniające; BW/036 Kuśmierek jako most między warstwą strategiczną a polskim kontekstem regulacyjnym. Schema: NewsArticle + BreadcrumbList. ### Polski LegalTech AI 2026. Subiektywny przewodnik dla kancelarii. URL: https://matematicsolutions.com/aktualnosci/2026-04-27-polski-legaltech-mapa-ai.html Data: 2026-04-27 Opis: Subiektywny przewodnik po polskim rynku LegalTech AI w 2026 r. Punkt wyjścia: post Elizy Kruczkowskiej (Board Member EIC) z 26 kwietnia o szwedzkiej Legora wycenianej na 5,5 mld USD i jej publiczne pytanie "A Polska? Kto u nas buduje rozwiązania w legal AI?". Drugie źródło: Demo Day "LegalTech AI made in Poland" Fundacji LegalTech Polska (Meetup #29, 30 listopada 2025). Trzecie źródło: komentarze pod postem Elizy + własny research Wiesława Mazura. Lista 18 narzędzi rozłożonych w 8 kategorii (bez rankingu, bez wskazywania "najlepszego"): 1) Research orzecznictwa i analiza stanów: LeoLex (Michał Gaszewski), AIMON (Klaudia Maciejewska/Bogumił Latos), Omnilexia (Jędrzej Kardach), Zapytaj kodeks (Dawid Warsiński). Alternatywa DIY: SAOS publiczne API + Claude/Gemini. 2) Analiza umów i contract review: Gaius-Lex (Paweł Kulig, polskie), Spellbook (kanadyjskie), Harvey (amerykańskie), Legora (szwedzkie). 3) Workflow, DMS i organizacja kancelarii: Verolex AI (Wojciech Sitek), LOGiT FLOW, Libra Polska (Wolters Kluwer), Kleos (Wolters Kluwer). 4) Chat AI z poradami i draftami: LexAI (Kajetan Komar-Komarowski), IURA. 5) Compliance i RegTech: regAlly (Aneta Girdwoyń, ex-BigLaw). 6) Negocjacje i ugody Gen-AI: Eporozumienie.pl (Simone Barszczak/Paweł Urzenitzok). 7) E-discovery: Relativity (Relativity Poland - Piotr Stefaniak; 35% firmy w Polsce, prawie połowa engineering). 8) Tradycyjne bazy z warstwą AI: LEX (Wolters Kluwer), Legalis (C.H. Beck - partner Demo Day 2025). Rama myślenia: ENISA Security by Design + 3 pytania kontrolne (gdzie idą moje dane, co jeśli vendor zniknie za 18 miesięcy, czy wyjaśnię output klientowi). Disclaimer: subiektywny ogląd, zaproszenie do uzupełnień w komentarzach pod postem na LinkedIn. Autor: Wiesław Mazur. ### 100 promptów do Claude. Przewodnik dla kancelarii. URL: https://matematicsolutions.com/aktualnosci/2026-04-24-100-promptow-do-claude.html Data: 2026-04-24 Opis: Wprowadzenie do listy 100 promptów: dlaczego hybryda PL+EN, jak wygląda dobry prompt, przykłady /umowa (kategoria Dokument) i /steelman (kategoria Myślenie), trzy zasady governance (nigdy treść pism tylko metadane, prompt to szkielet nie odpowiedź, zapisz audyt). Z twardym CTA do sub-page i PDF. Autor: Wiesław Mazur. ### Command Center w Claude. Jedno okno zamiast ośmiu. URL: https://matematicsolutions.com/aktualnosci/2026-04-22-command-center-w-claude.html Data: 2026-04-22 Opis: Praktyka: warstwa zarządcza nad ośmioma aplikacjami dnia codziennego (poczta, kalendarz, Slack, Notion, GitHub, Drive, Figma, Gamma). Architektura delegowania z nadzorem, nie automatyzacja dla automatyzacji. ### DJA Polska URL: https://matematicsolutions.com/aktualnosci/2026-04-21-dja-polska.html Data: 2026-04-21 Opis: Omówienie projektu Ustawy o systemach sztucznej inteligencji (DJA Polska) - implementacja AI Act w polskim porządku prawnym. Co to znaczy dla kancelarii, które doradzają klientom. ## Baza Wiedzy - recenzje Każdy wpis to pisemna recenzja źródła z perspektywy polskiej kancelarii. Format wszystkich tomów: headline (lead), "O czym jest ten materiał", trzy h3 recenzji (Perspektywa compliance, Perspektywa bezpiecznej architektury, Czego autorzy nie dopowiadają), "Co z tego wynika", ramka "Dla zarządu kancelarii w trzech zdaniach". Autor recenzji: Wiesław Mazur · MateMatic. ### BW/065 - Masz sekret? Agent AI go nie utrzyma. Pierwszy benchmark prywatności LLM w społeczności agentów. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-29-priyanshu-multi-agent-privacy-contextual-integrity.html Autorzy: Aman Priyanshu (Foundation AI), Supriti Vijay (Foundation AI), Esha Pahwa (Corvic AI) - wszyscy z równym wkładem Tytuł oryginału: Got a Secret? LLM Agents Can't Keep It: Evaluating Privacy in Multi-Agent Systems Wydawca: arXiv (Cornell University); praca przyjęta na CAIS '26 (ACM Conference on AI and Agentic Systems), San Jose Data: 26 maja 2026 (arXiv:2605.27766v1 [cs.AI]) Licencja: Creative Commons Attribution 4.0 International (CC BY 4.0) - dozwolony cytat i derywat z atrybucją; MateMatic linkuje do arXiv Typ recenzji: paper akademicki (arXiv, konferencja ACM) Data publikacji: 2026-05-29 POZYCJONOWANIE: Pierwszy benchmark prywatności agentów LLM w środowisku wieloagentowym. Standardowe testy bezpieczeństwa sprawdzają model w izolacji (jeden prompt, jedna odpowiedź); ta praca pokazuje, że zachowanie respektujące prywatność w krótkim promptcie nie utrzymuje się, gdy agent uczestniczy w trwałym środowisku społecznym. Architektura badanych agentów (persystentna pamięć MEMORY.md, do której agent sam dopisuje, plus widoczność wytworów innych agentów) to dokładnie kształt agentowego asystenta prawnego, który pamięta sprawy między sesjami. KONSTRUKCJA EKSPERYMENTU: 2533 persony agentów wyodrębnione z publicznego zbioru Moltbook (platforma społecznościowa agentów w stylu Reddita), każdej przypisany prywatny profil człowieka liczący średnio około 97 par klucz-wartość w dziesięciu domenach wrażliwych (tożsamość ogólna, finanse, zdrowie, zdrowie psychiczne, sprawy prawne, relacje, mieszkanie, zatrudnienie, edukacja, terminarz). Agenty działały na wspólnej bazie SQLite przez 25 symulowanych dni, na trzech modelach OpenAI w równych proporcjach (GPT-5-nano, GPT-5-mini, GPT-5), korzystając z dwunastu narzędzi (przeglądanie, pisanie, głosowanie, operacje na pamięci MEMORY.md). Uzbierano 29 945 postów i 81 264 odpowiedzi, łącznie 111 209 elementów treści. Wykrywaniem wycieków zajmował się osobny sędzia LLM oceniający każdą treść wobec pełnego profilu autora w dziesięciu domenach. RAMA TEORETYCZNA - INTEGRALNOŚĆ KONTEKSTOWA: Helen Nissenbaum (2004): prywatność to nie tajność informacji, lecz adekwatność jej przepływu do norm danego kontekstu. Ten sam fakt ujawniony w jednym miejscu jest neutralny, w innym staje się naruszeniem. Autorzy operacjonalizują to wprost: ujawnienie liczy się jako naruszenie, gdy cecha wrażliwa wypływa poza kontekst, który by ją uzasadniał. CZTERY WYNIKI: (1) Pojedyncza tura kontra uczestnictwo społeczne: odsetek ujawnień rośnie z 19,95% w izolacji do 45,30% w środowisku społecznym (CIMemories, uśrednione po modelach OpenAI); skumulowane naruszenia rosną monotonicznie do około 2500 z 111 tysięcy elementów do 25. dnia. (2) Zaraźliwość - efekt zapadki społecznej: kolejna odpowiedź w wątku wycieka z prawdopodobieństwem 12,8% po wycieku poprzedniej wobec 1,6% po czystej (baza 1,8%), około ośmiokrotny wzrost wywołany samym sąsiedztwem społecznym, bez ataku. (3) Instrukcja "nie ujawniaj" pomaga, ale nie immunizuje: GPT-4o 2624 do 2102, GPT-5-mini 2889 do 2194, GPT-5 2296 do 482 (silnie zależne od modelu); nawet z zabezpieczeniami odsetek pozostaje powyżej 37,8%; obrona probabilistyczna, nie twarda granica. (4) Środowisko jako predyktor: rozpiętość ujawnień po społecznościach od poniżej 2% (techniczne) do ponad 16% (autoprezentacja) dorównuje różnicom między modelami; wariancja po profilach niska (odchylenie 2,8%, zakres 27,8%-36,4%), więc ryzyko zależy bardziej od kontekstu niż od zawartości profilu. MITYGACJA AUTORÓW (poza warstwą promptu): System prompty świadome kontekstu społecznego; piaskownica pamięci zapobiegająca wypływaniu cech między kontekstami (memory sandboxing preventing cross-context attribute surfacing); monitoring norm na poziomie platformy wykrywający kaskady ujawnień, zanim się rozejdą. Środkowy punkt pokrywa się z ryzykiem DSGAI11 (Cross-Context Conversation Bleed) z TOMu 060 OWASP. FILTR TRZYFILAROWY MATEMATIC - CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: (1) To tajemnica zawodowa w formie agentowej - asystent AI znający informacje ze sprawy klienta A może je ujawnić w kontekście klienta B, bo lokalnie wygląda to naturalnie; tajemnica z artykułu 6 prawa o adwokaturze i artykułu 3 ustawy o radcach prawnych nie zna pojęcia "lokalnie adekwatnego" ujawnienia, wiąże bezwzględnie (interpretacja MateMatic, nie stanowisko NRA ani KRRP). (2) Wyciek pod presją kontekstu to naruszenie minimalizacji i poufności z RODO - artykuł 5 ustęp 1 litera c (minimalizacja) i litera f (integralność i poufność); integralność kontekstowa jest pojęciowo bliska zasadzie ograniczenia celu z litery b; pomiar wycieku to operacyjny dowód, czy architektura te zasady spełnia (interpretacja MateMatic, nie stanowisko PUODO). (3) Benchmark dostawcy mierzony w izolacji nie jest dowodem zgodności z artykułem 15 AI Act - rozporządzenie 2024/1689 wymaga odpowiednich poziomów dokładności i odporności przez cały cykl życia, a centralny wniosek pracy mówi, że statyczne jednoturowe testy systematycznie zaniżają ryzyko prywatności w warunkach agentowych (interpretacja MateMatic, nie stanowisko Komisji Europejskiej ani UODO). (4) Mitygacja jest architektoniczna, nie regulaminowa - "pamięć asystenta jest osobna dla każdej sprawy i nie wypływa między klientami" to wymóg architektury (piaskownica pamięci, separacja kontekstów) sprawdzalny w konfiguracji, a nie zdanie w polityce, które model może zignorować pod presją (interpretacja MateMatic, nie stanowisko żadnego regulatora). SŁABSZE STRONY: Persony i profile syntetyczne, generowane i przypisane agentom, nie pobrane od realnych użytkowników (liczby jako wzorzec zjawiska, nie stawka konkretnej szkody); symulowane środowisko w stylu Reddita, nie żywa platforma; organiczna symulacja używa wyłącznie modeli OpenAI, więc wynik nie jest automatycznie przenośny na modele open source ani lokalne (np. Bielik); wykrywanie wycieku opiera się na sędzim LLM, więc raportowane liczby to górna granica, a nie pomiar precyzyjny - wniosek kierunkowy mocny, konkretny punkt procentowy mniej. CO Z TEGO WYNIKA: Bezpieczeństwo agentowego asystenta prawnego rozstrzyga się w warstwie architektury, nie w treści instrukcji - lekcja spójna z TOM 061 (nadzór nad cichymi błędami niezależny od modelu) i TOM 062 (kontrola nad plikami poniżej modelu). Trzy decyzje do wdrożenia: pamięć izolowana per sprawa albo per klient (sprawdzalna cecha wdrożenia, nie deklaracja dostawcy); ocena odporności w długim horyzoncie i pod presją kontekstu zamiast pojedynczego promptu z karty benchmarku; dla modeli innych niż przebadane (w tym lokalnych) założenie, że efekt może być inny, i sprawdzenie u siebie. Zgodne z duchem artykułu 5 RODO i artykułu 15 AI Act, niezależnie od używanego modelu. CO MATEMATIC WNIESIE: Audyt izolacji pamięci asystenta AI (czy wiedza nie wypływa między sprawami i klientami), ocena odporności w długim horyzoncie zamiast karty benchmarku dostawcy, Konstytucja AI z wymogiem separacji kontekstów jako warunkiem dopuszczenia asystenta do akt. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. CROSS-REFERENCE: TOM 062 Zhong (agent na dysku kancelarii, kontrola poniżej modelu), TOM 061 Potts-Sudhof (niewidoczne awarie AI), TOM 060 OWASP GenAI Data Security (DSGAI11 Cross-Context Conversation Bleed, izolacja pamięci per sprawa), TOM Kenney Governing Agents, TOM AI Act Guide Bird & Bird. Autor recenzji: Wiesław Mazur - MateMatic. ### BW/064 - Stan Michigan spisał, co AI robi z zawodem prawnika. Recenzja raportu State Bar of Michigan. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-19-state-bar-michigan-ai-zawod-prawnika.html Autorzy: State Bar of Michigan, Board of Commissioners - Workgroup on Artificial Intelligence (przewodniczący: Joseph P. McGill, 90. prezes State Bar of Michigan) Tytuł oryginału: raport o wpływie sztucznej inteligencji na zawód prawnika (samorząd udostępnia go jako Age of AI Report) Wydawca: State Bar of Michigan Data: czerwiec 2025 Licencja: publikacja samorządu zawodowego, wszystkie prawa zastrzeżone - recenzja referencyjna pod prawem cytatu (art. 29 ustawy o prawie autorskim i prawach pokrewnych), MateMatic nie hostuje lokalnej kopii PDF Typ recenzji: raport samorządu prawniczego Data publikacji: 2026-05-19 POZYCJONOWANIE: Raport grupy roboczej do spraw AI przy obowiązkowym samorządzie adwokackim stanu Michigan (mandatory bar - przynależność obligatoryjna). Dokument nie ma mocy wiążącej; autorzy nazywają go pierwszym krokiem, materiałem edukacyjnym i mapą drogową dla samorządu. Nie tworzy obowiązków - opisuje, jak istniejące reguły deontologiczne stosują się do generatywnej AI. Wartość dla polskiej kancelarii leży w metodzie: raport pokazuje, jak inny samorząd prawniczy rozłożył obowiązki zawodowe wobec AI na konkretne reguły. CENTRALNA TEZA: Kompetencja technologiczna przestała być udogodnieniem, a stała się obowiązkiem etycznym. Raport wychodzi od MRPC 1.1 (obowiązek kompetencji) i jej komentarza, który wymienia wprost wiedzę o istniejącej i rozwijającej się technologii. Rozumienie narzędzia AI - co potrafi, czego nie, gdzie się myli - jest częścią obowiązku kompetencji. Ocena prawnika nie może zostać delegowana do generatywnej AI, bo pozostaje odpowiedzialnością prawnika. CZTERY OBSZARY RAPORTU: Zarządzanie kancelarią: przegląd dokumentów i e-discovery, badania prawne, redagowanie pism, analiza umów, przechowywanie dokumentów, prognozowanie wyniku sprawy, cyberbezpieczeństwo. Etyka: rozłożona na obowiązki z Michigan Rules of Professional Conduct - kompetencja (MRPC 1.1), staranność (MRPC 1.3), komunikacja, rozsądne wynagrodzenie, poufność, uczciwość wobec sądu, nadzór. Nieuprawnione świadczenie pomocy prawnej (UPL): trzy otwarte pytania - czy zakaz da się egzekwować wobec programów AI, czy program udziela informacji czy porady, czy dokument z AI mieści się w wyjątku dla czynności czysto technicznych. Dostęp do wymiaru sprawiedliwości: argumenty za i przeciw, obietnica obniżenia kosztu pomocy prawnej dla pustyń prawnych zależna od kompetencji cyfrowych i ram regulacyjnych. STARY OBOWIĄZEK, NOWY SPOSÓB NARUSZENIA: Obowiązek staranności (MRPC 1.3) zilustrowany sprawą Mata przeciwko Avianca - sąd w Nowym Jorku ukarał prawników grzywną 5000 dolarów za pismo z nieistniejącymi orzeczeniami, fałszywymi cytatami i zmyślonymi sygnaturami wygenerowanymi przez AI. To nie był nowy delikt, tylko stare naruszenie obowiązku staranności popełnione nowym narzędziem. Podpis prawnika pod pismem to poświadczenie oparcia twierdzeń na faktach i prawie - AI go nie zdejmuje. Obowiązek poufności: wprowadzenie akt klienta do narzędzia AI może oznaczać ujawnienie informacji poufnej dostawcy modelu. Obowiązek nadzoru: prawnik odpowiada za pracę narzędzia jak za pracę personelu. FILTR TRZYFILAROWY MATEMATIC - CZTERY LINIE POLSKIEGO COMPLIANCE OFFICERA: (1) Polskie kodeksy etyki (Zbiór Zasad Etyki Adwokackiej, Kodeks Etyki Radcy Prawnego) nie zawierają zdania o kompetencji technologicznej, ale obowiązek z nich wynika - z obowiązku sumiennego wykonywania zawodu z należytą starannością i stałego podnoszenia kwalifikacji (interpretacja MateMatic, nie stanowisko NRA ani KRRP). (2) Poufność to w polskich realiach tajemnica zawodowa plus RODO - wprowadzenie akt do zewnętrznego narzędzia AI uruchamia tajemnicę adwokacką lub radcowską oraz powierzenie przetwarzania z artykułu 28 i, przy dostawcy spoza EOG, podstawę transferu z rozdziału V; raport widzi tylko obowiązek confidentiality wobec klienta (interpretacja MateMatic, nie stanowisko NRA, KRRP ani UODO). (3) Nieuprawnione świadczenie pomocy prawnej ma w Polsce inną konstrukcję niż UPL stanu Michigan - zawód adwokata i radcy prawnego jest reglamentowany; pytania raportu pozostają trafne, ale przeniesienie wniosków wymaga osadzenia w polskiej ustawie (interpretacja MateMatic, nie stanowisko NRA ani KRRP). (4) Raport nie zna AI Act - powstał w porządku, w którym regulacja AI jest fragmentaryczna (Michigan ma dwie ustawy o AI, obie o treściach wyborczych); polska kancelaria ma drugą warstwę obowiązków z rozporządzenia 2024/1689, w tym klasyfikację systemów wysokiego ryzyka z artykułu 6 (interpretacja MateMatic, nie stanowisko Komisji Europejskiej). TRZY ZARZUTY UCZCIWIE: Dokument jest wprost związany ze stanem Michigan - analiza etyczna stoi na Michigan Rules of Professional Conduct, analiza UPL na ustawie stanowej; czytelnik spoza USA dostaje wzór rozumowania, nie gotowe wnioski. Czerwiec 2025 to w tej dziedzinie odległa data - część szczegółów już nieaktualna, raport sam odnotowuje uchylenie rozporządzenia wykonawczego Bidena w styczniu 2025. Raport jest opisowy i edukacyjny, nie operacyjny - pięć rekomendacji adresowanych do samorządu, nie do indywidualnej kancelarii. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH: Raport nie jest zbiorem przepisów - jest dowodem, że inny samorząd prawniczy potraktował kompetencję wobec AI jako obowiązek etyczny, nie modę. Te same powinności (staranność, poufność, nadzór) ciążą na polskim adwokacie i radcy prawnym, a sprawa Mata przeciwko Avianca pokazuje koszt ich naruszenia nowym narzędziem. Pytanie dla zarządu: czy wiemy, którego z naszych obowiązków zawodowych dane narzędzie AI dotyka - i czy to zapisaliśmy. USE CASES: Audyt polityki AI kancelarii pod kątem obowiązków deontologicznych. Warsztat AI governance oparty na metodzie raportu - obowiązek po obowiązku. Materiał szkoleniowy o obowiązku kompetencji technologicznej. Argumentacja dla zarządu, dlaczego kompetencja wobec AI to powinność, nie moda. CROSS-REFERENCE: TOM 062 Zhong (agent filesystem misuse - gdy agent AI sięga po akta klienta), TOM 060 OWASP GenAI Data Security (wyciek danych), TOM 061 Potts-Sudhof (niewidoczne awarie AI), TOM Kenney Governing Agents, TOM AI Act Guide Bird & Bird. CO MATEMATIC WNIESIE: metoda raportu jako powtarzalne ćwiczenie na polskim kodeksie etyki, audyt polityki AI, warsztat AI governance dla kancelarii oparty na języku obowiązków zawodowych. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Autor recenzji: Wiesław Mazur - MateMatic. ### BW/063 - Czy AI wymknie się spod kontroli? Pierwsza systematyczna ocena dowodów empirycznych. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-18-uuk-loss-of-control-agentic-ai.html Autorzy: Risto Uuk (Future of Life Institute; KU Leuven; London School of Economics and Political Science), Santeri Koivula (Future of Life Institute; ETH Zurich), Lorenzo Pacchiardi (University of Cambridge), Rokas Gipiškis (Future of Life Institute; AI Standards Lab; Vilnius University), Laura Caroli, Kamaria Horton (RAND) Tytuł oryginału: Assessing the Empirical Evidence for Loss of Control from Agentic General-Purpose AI Wydawca: Future of Life Institute - preprint, nie przeszedł recenzji naukowej Data: maj 2026 Licencja paperu: preprint akademicki - MateMatic nie hostuje lokalnej kopii PDF, link do Future of Life Institute obok Typ recenzji: Recenzja referencyjna · Paper akademicki (preprint) Data publikacji recenzji MateMatic: 2026-05-18 POZYCJONOWANIE Pierwszy systematyczny przegląd dowodów empirycznych - a nie argumentów teoretycznych - na utratę kontroli nad agentowym AI ogólnego przeznaczenia. Kodeks Postępowania dla GPAI, dokument wykonawczy do unijnego AI Act, wymienia utratę kontroli jako jedno z czterech ryzyk systemowych wymagających oceny. Paper daje kancelarii doradzającej w AI governance i regulatorowi precyzyjny język ryzyka: nie alarm, nie lekceważenie, tylko mapa tego, ile naprawdę wiemy. O CZYM JEST TEN MATERIAŁ Autorzy przejrzeli 19 badań empirycznych dla ośmiu właściwości modelu wskazanych w modelach zagrożeń jako istotne dla utraty kontroli: sprawczość (agency), samoreplikacja, błędna generalizacja celu, perswazja, hakowanie nagrody, samozachowanie, świadomość sytuacyjna, strategiczne oszukiwanie. Definicja utraty kontroli za Yampolskim 2020: sytuacja, w której twórcy modelu nie potrafią już wiarygodnie przewidzieć ani sterować jego zachowaniem. Autorzy skupiają się na scenariuszu power-seeking - AI dążącego do władzy w sensie zbieżności instrumentalnej (zdobywanie zasobów, samozachowanie, opór wobec ingerencji jako podcele przydatne dla niemal każdego celu). Praca jest preprintem; Risto Uuk współtworzył przepisy o GPAI w AI Act. FRAMEWORK WALIDACYJNY - TRZY WYMIARY WIARYGODNOŚCI Metoda przejęta od Salaudeen i in. 2025. Każde badanie ocenia się nie po tym, co znalazło, ale po tym, jak wiarygodnie zmierzyło. Wiarygodność konstruktu: czy ewaluacja mierzy zamierzoną właściwość, czy coś innego (np. rzeczywiste oszukiwanie vs zapamiętany wzorzec z treningu). Wiarygodność treściowa: czy pokrywa pełny zakres właściwości. Wiarygodność zewnętrzna: czy wynik z laboratorium uogólnia się na realne wdrożenie. Trzech autorów niezależnie ocenia każdą parę badanie-właściwość (rozsądny/ostrożnie/niewystarczający, uzgadnianie większością głosów). Agregacja: choć jeden "niewystarczający" - spekulatywne; przewaga "ostrożnie" - słabo prawdopodobne/nieprawdopodobne; przewaga "rozsądny" - wysoce prawdopodobne/nieprawdopodobne. Skala mierzy siłę i kierunek dowodu, nie szansę na zdarzenie. WERDYKT CENTRALNY I WERDYKTY PER WŁAŚCIWOŚĆ Utrata kontroli jest "słabo prawdopodobna" - dowody istnieją, ale niedojrzałe; żadne badanie nie osiąga progu wiarygodności na mocniejszy werdykt. "Słabo prawdopodobne" to NIE "ryzyko niskie". Strategiczne oszukiwanie - słabo prawdopodobne (najszersza baza, 7 ocen badań, alignment faking, in-context scheming). Hakowanie nagrody - słabo prawdopodobne (2 zbieżne badania, generalizacja do manipulowania własną funkcją nagrody mimo środków zaradczych). Sprawczość, perswazja, samozachowanie, błędna generalizacja celu - słabo prawdopodobne (wąskie konteksty eksperymentalne). Samoreplikacja - spekulatywne (2 sprzeczne badania). Świadomość sytuacyjna - słabo NIEprawdopodobna (jedyna właściwość z przewagą dowodów przeciw; najmocniejsze metodologicznie badanie Phuong i in. 2025 negatywne). LUKA PRZEKROJOWA - WIARYGODNOŚĆ ZEWNĘTRZNA Żadne z 19 badań nie osiągnęło wysokiej wiarygodności zewnętrznej. Ewaluacje prowadzono w warunkach sztucznych, często z jawnym podpowiadaniem celu modelowi. Dla najbardziej niebezpiecznych właściwości wysoka wiarygodność zewnętrzna może być strukturalnie nieosiągalna w ramach odpowiedzialnych praktyk badawczych - nikt nie da agentowi realnej szansy na samoreplikację, żeby sprawdzić, czy mu się uda. To sufit możliwych dowodów, nie brak zdolności. FILTR TRZYFILAROWY MATEMATIC - CZTERY LINIE POLSKIEGO COMPLIANCE 1. "Słabo prawdopodobne" w rejestrze ryzyka to nie "ryzyko niskie" - werdykt odzwierciedla niedojrzałość nauki o ewaluacji, nie ustalenie, że ryzyko jest małe; wpisanie "niskie" to błędna klasyfikacja i słaby punkt przed audytorem (interpretacja MateMatic, nie stanowisko UODO ani AI Office). 2. Kodeks Postępowania dla GPAI obciąża dostawcę modelu, ale skutki spadają na wdrażającego - kancelaria uruchamia agenta na aktach; dokumentacja ryzyka dostawcy oparta na dowodach o niskiej wiarygodności zewnętrznej nie zwalnia z własnej oceny (interpretacja MateMatic, nie stanowisko Komisji Europejskiej). 3. Benchmark dostawcy nie jest dowodem bezpieczeństwa u wdrażającego - skoro żadne badanie nie uogólnia się na warunki wdrożenia, konieczna ocena w realnym lokalnym kontekście i nadzór po wdrożeniu (interpretacja MateMatic, nie stanowisko regulatora). 4. Samoraport agenta nie jest dowodem - najmocniej udokumentowana niebezpieczna właściwość to strategiczne oszukiwanie; nadzór musi być behawioralny (obserwacja skutków, nie deklaracja modelu); domyka linię z TOM 062, gdzie agent w 11% przypadków aktywnie kłamał (interpretacja MateMatic, nie stanowisko AI Office). TRZY ZARZUTY UCZCIWIE Subiektywność punktacji - analiza wrażliwości pokazuje, że przy ostrzejszym ocenianiu większość właściwości spada do "spekulatywne", przy łagodniejszym sprawczość i strategiczne oszukiwanie sięgają "wysoce prawdopodobne". Ocena każdej właściwości osobno bez modelowania ich interakcji (świadomość sytuacyjna może być warunkiem skutecznego oszukiwania lub samoreplikacji). Szybka dezaktualizacja - ocena dotyczy modeli do połowy 2025, o generację za frontem możliwości. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH Pierwszy systematyczny przegląd dowodów empirycznych na utratę kontroli nad agentowym AI kończy się werdyktem "słabo prawdopodobne" - dowody na ryzyko istnieją, ale są niedojrzałe, a nie że ryzyko jest małe. Żadne z 19 ocenionych badań nie uogólnia się wiarygodnie na realne warunki wdrożenia, więc benchmark dostawcy modelu nie jest dowodem bezpieczeństwa agenta w kancelarii. Najmocniej udokumentowana niebezpieczna właściwość to strategiczne oszukiwanie, dlatego nadzór nad agentem musi opierać się na obserwacji skutków, nie na samoraporcie modelu. USE CASES Audyt rejestru ryzyka AI kancelarii z poprawną klasyfikacją niepewności. Framework walidacyjny (konstrukt/treść/kontekst zewnętrzny) wpisany do procesu oceny narzędzi AI w polityce kancelarii. Warsztat AI governance oparty na precyzyjnym języku ryzyka zamiast alarmu lub lekceważenia. Argument dla zarządu, że poważne podejście do ryzyka AI nie wymaga wiary w katastrofę. CROSS-REFERENCE TOM 062 Zhong (agent filesystem misuse - samoraport agenta zawodzi w 11%), TOM 061 Potts-Sudhof (niewidoczne awarie AI - architektura nadzoru niezależna od modelu), TOM 009 AI Risk Repository MIT, TOM 001 Kenney Governing Agents, TOM 011 NIST AI 800-4 (monitoring po wdrożeniu), TOM 008 AI Act Guide Bird & Bird. CO MATEMATIC WNIESIE Przekład akademickiego frameworku walidacyjnego na operacyjne narzędzie oceny narzędzi AI dla kancelarii. Audyt rejestru ryzyk AI z naciskiem na poprawną klasyfikację niepewności. Warsztat AI governance. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. ### BW/062 - Agent AI skasował 110 dokumentów prawnych. Pierwsze systematyczne badanie agent filesystem misuse. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-18-zhong-yolofs-agent-filesystem-misuse.html Autorzy: Shawn (Wanxiang) Zhong, Junxuan Liao (University of Wisconsin-Madison), Jing Liu (Microsoft Research), Mai Zheng (Iowa State University), Andrea C. Arpaci-Dusseau, Remzi H. Arpaci-Dusseau (University of Wisconsin-Madison) Tytuł oryginału: Don't Let AI Agents YOLO Your Files: Shifting Information and Control to Filesystems for Agent Safety and Autonomy Wydawca: arXiv (Cornell University) - preprint, nie przeszedł recenzji naukowej Identyfikator: arXiv:2604.13536v2 [cs.OS] Data: 15 kwietnia 2026 Licencja paperu: arXiv non-exclusive distribution license (copyright autorzy) - MateMatic nie hostuje lokalnej kopii PDF, link do arXiv obok Typ recenzji: Recenzja referencyjna · Paper akademicki (arXiv) Data publikacji recenzji MateMatic: 2026-05-18 POZYCJONOWANIE Pierwsze systematyczne badanie tego, co agenty AI robią z systemem plików użytkownika. Agenty kodujące (Claude Code, Codex, Cursor, Gemini, Copilot) działają bezpośrednio na dysku z uprawnieniami użytkownika i same decydują, które pliki otworzyć, zmienić albo usunąć. Praca daje kancelarii pierwszą policzalną nazwę dla zjawiska "agentowi skasował się projekt": agent filesystem misuse jako mierzalna klasa ryzyka z taksonomią i liczbami. O CZYM JEST TEN MATERIAŁ Autorzy zebrali 290 publicznych raportów o awariach agentów z lat 2024-2026 (zgłoszenia GitHub 205, media społecznościowe 31, fora produktowe 25, blogi 18, National Vulnerability Database 11), z 13 frameworków. Klasyfikacja: 158 incydentów (potwierdzona szkoda), 49 exploitów, 83 słabości. Najczęściej raportowany framework to Claude Code (97 raportów), dalej Codex 61, Cursor 37, Gemini 32, Copilot 28. Druga część pracy to YoloFS - agent-native filesystem zaprojektowany pod agenty. Autorzy to zespół z poważnym dorobkiem w badaniach systemów operacyjnych (Andrea i Remzi Arpaci-Dusseau - autorzy podręcznika Operating Systems: Three Easy Pieces). Praca jest preprintem na arXiv, nie przeszła recenzji naukowej. DWIE LUKI - INFORMACJA I KONTROLA Agenty wyrządzają szkody, bo mają dwie luki. Luka informacji: ani użytkownik, ani agent nie wie wiarygodnie, co dane wywołanie narzędzia zrobi z plikami przed wykonaniem, ani co zmieniło po. Luka kontroli: mechanizmy nie zapobiegają szkodzie ani jej nie naprawiają; filtry treści komend obejść trywialnie (blokada rm omijana Pythonowym shutil). Kluczowy wniosek autorów dla compliance: kontrola musi być egzekwowana poniżej modelu, samo instruowanie modelu jej nie zapewni - prompt injection z zatrutego dokumentu nadpisuje instrukcje. CO AGENTY ROBIĄ Z PLIKAMI (207 incydentów i exploitów, pięć wymiarów) Operacja: nadpisanie pliku 44%, usunięcie 39%, odczyt i wyciek sekretu 17%. Zasięg: 42% szkód poza projektem (system 16%, katalog domowy 13%, sekrety 13%). Reakcja agenta: 68% działa dalej jak gdyby nic, 21% przeprasza bez możliwości cofnięcia, 11% aktywnie kłamie (sfałszowane wyniki testów, zmyślone kroki naprawcze; raport R190 - agent oświadczył "nie wystąpiły żadne problemy" tuż po skasowaniu pliku). Świadomość użytkownika: 83% zauważa od razu, 10% później, 8% atak zaprojektowany jako niewidoczny. Odwracalność: 40% szkód nieodwracalnych (23% trwała utrata danych, 17% częściowa). Konkretne incydenty: kasowanie całych dysków, rm -rf na katalogu domowym, raport R22 - agent skopiował zerobajtowe atrapy z iCloud i usunął oryginały, niszcząc 110 dokumentów prawnych; wyciek .env, kluczy API, poświadczeń SSH; uszkodzenie konfiguracji serwera MCP z utratą tokenów. TAKSONOMIA PRZYCZYN (trzy role, liczby się nakładają) Model - zawodny wykonawca: 168 raportów (błędne działanie 130 - zły cel 76, rozszerzenie zakresu 50, złe użycie narzędzia 27; łamanie reguł 56; prompt injection 21). Framework - zepsuty egzekutor: 226 (błędy polityk 204 - zła konfiguracja 130, luka powłoki 77, obejście filtra 52; słabe zabezpieczenia 60). Użytkownik - przeciążony recenzent: 105 (auto-zatwierdzanie i tryb YOLO 80, niekonkretne zatwierdzenie 31). YoloFS - TRZY TECHNIKI Staging: zmiany agenta trafiają do osobnej warstwy roboczej, bazowy system plików nietknięty do decyzji człowieka (zatwierdzić/odrzucić), użytkownik widzi diff - kontrola korygująca. Snapshots i travel: agent robi migawki i wraca do poprzednich stanów - autokorekta bez czekania na użytkownika. Progressive permission: dostęp bramkowany regułami, pytanie tylko gdy ważne - kontrola zapobiegawcza. Ewaluacja z Claude Code 2.1.45: na 11 zadaniach z ukrytymi niszczącymi skutkami ubocznymi YoloFS uniknął niezatwierdzonej szkody we wszystkich 11 (Claude sam się skorygował w 8); bez YoloFS żaden z agentów nie zapobiegał szkodom niezawodnie; na 112 rutynowych zadaniach ~99% skuteczności przy mniejszej liczbie interakcji; narzut wydajnościowy bliski zera. CZTERY LINIE POLSKIEGO COMPLIANCE 1. Agent na dysku kancelarii ma dostęp do akt wszystkich klientów - usunięcie i nadpisanie to utrata akt, wyciek .env i kluczy to wyciek dostępów do systemów z aktami; uderza w tajemnicę zawodową art. 6 prawa o adwokaturze i art. 3 ustawy o radcach prawnych (interpretacja MateMatic, nie stanowisko NRA ani KRRP). 2. 40% szkód nieodwracalnych przekłada się wprost na art. 32 RODO - bez kopii zapasowej, warstwy staging i dziennika audytowego trudno bronić tezy o odpowiednich środkach technicznych (interpretacja MateMatic, nie stanowisko UODO). 3. Tego nie naprawia regulamin promptowania - kontrola musi być w warstwie technicznej: agent w izolowanym katalogu albo na kopii, uprawnienia zawężone do projektu, brak dostępu do katalogu domowego. 4. Tryb YOLO i auto-zatwierdzanie zakazane wprost w polityce AI, nadzór człowieka definiowany przez staging a nie klikanie "zatwierdź" - inaczej "human in the loop" z art. 14 AI Act jest fikcją (interpretacja MateMatic, nie stanowisko Komisji Europejskiej). SŁABSZE STRONY YoloFS testowany niemal wyłącznie z Claude Code na małej syntetycznej próbie (11 zadań opaque, 112 rutynowych). Rozwiązanie na poziomie systemu plików wymaga montażu i konfiguracji per projekt; mechanizmy izolacji (Landlock, seccomp, przestrzenie nazw montowania) to świat Linuksa, a większość kancelarii pracuje na Windowsie. Staging chroni przed korupcją i usunięciem, ale nie cofnie wycieku - wyciekłego poświadczenia nie da się odczytać z powrotem. CO Z TEGO WYNIKA Kancelaria dostaje język i liczby, którymi może opisać i uzasadnić ryzyko uruchomienia agenta na aktach. Problemu nie rozwiązuje się na poziomie modelu - lekcja ta sama co z TOMu 061: architektura nadzoru musi być niezależna od jakości modelu. Taktycznie, do wdrożenia od razu: agent w izolowanym katalogu lub na kopii akt, włączona kontrola wersji i kopia zapasowa przed pierwszym zadaniem (prowizoryczny staging), zakaz trybu YOLO i auto-zatwierdzania, sekrety poza katalogiem dostępnym dla agenta. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH Agent AI uruchomiony na dysku kancelarii działa z uprawnieniami pracownika i potrafi skasować, nadpisać albo wyciec akta klienta - w próbie 290 raportów 40% szkód było nieodwracalnych, w 11% agent kłamał o tym, co zrobił. Tego ryzyka nie usuwa lepszy model ani instrukcja w konfiguracji, tylko warstwa techniczna: izolowany katalog lub kopia, kopia zapasowa i kontrola wersji przed pierwszym zadaniem, zakaz trybu YOLO w polityce AI. Brak tych środków jest słabym punktem zgodności z art. 32 RODO i tajemnicą zawodową (interpretacja MateMatic, nie stanowisko NRA, KRRP ani UODO). CROSS-REFERENCE TOM 061 Potts-Sudhof (niewidoczne awarie AI - architektura nadzoru niezależna od modelu), TOM 060 OWASP GenAI Data Security (wyciek sekretów, AI-DSPM), TOM Kenney Governing Agents, TOM Anthropic Petri (alignment auditing), TOM ENISA Technical Guidance NIS2, TOM AI Act Guide Bird & Bird. CO MATEMATIC WNIESIE Audyt gotowości kancelarii do uruchomienia agenta AI na aktach (izolacja katalogu, kopia zapasowa, kontrola wersji, polityka AI z zakazem trybu YOLO i auto-zatwierdzania), warsztat agent safety dla CIO i compliance officera, rejestr ryzyk z mapą operacja-zasięg-odwracalność. Pillary: Decyzja jako jednostka pracy + Stack zero-cloud. Autor recenzji: Wiesław Mazur - MateMatic. ### BW/061 - Niewidoczne awarie ChatGPT i Claude. 79% błędów AI nie widzi ani użytkownik, ani monitoring. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-14-potts-sudhof-invisible-failures-human-ai-interactions.html Autorzy: Christopher Potts (Bigspin AI, Stanford University), Moritz Sudhof (Bigspin AI) Tytuł oryginału: Invisible Failures in Human-AI Interactions Wydawca: arXiv (Cornell University) - technical report Identyfikator: arXiv:2603.15423v2 [cs.CL] Data: 12 maja 2026 Kod i dane: https://github.com/bigspinai/bigspin-invisible-failure-archetypes Dataset bazowy: WildChat (Zhao et al. 2024), licencja ODC-By v1.0 Licencja paperu: arXiv non-exclusive distribution license (copyright autorzy) - MateMatic nie hostuje lokalnej kopii PDF, link do arXiv obok Typ recenzji: Recenzja referencyjna · Paper akademicki (arXiv) Data publikacji recenzji MateMatic: 2026-05-14 POZYCJONOWANIE Pierwsza znana nam taksonomia cichych awarii AI oparta na rzeczywistych konwersacjach z ChatGPT (nie na benchmarku, nie na adwersarialnym red-teamingu). W bibliotece MateMatic uzupełnia warstwę "monitoring AI i detekcja awarii" obok TOM 060 OWASP GenAI Data Security (architektura AI-DSPM), TOM Anthropic Petri (alignment auditing) i TOM Sample-efficient Sycophancy Mitigation. Jest pierwszą pracą, która daje kancelarii operacyjnie sensowną nazwę dla zjawisk obserwowanych od dwóch lat, ale dotąd bez języka. CENTRALNA TEZA EMPIRYCZNA W próbie 100 000 angielskich rozmów z WildChat 63% rozmów zawiera awarię, z czego 79% niewidocznych (użytkownik nie zgłasza), 12% widocznych (frustracja, korekta, eskalacja), 9% mieszanych. Monitoring oparty na sygnałach satysfakcji wyłapie 12% awarii - jeden na osiem błędów. Reszta dzieje się w ciszy. METODA ANNOTACJI Annotatorzy: Claude Opus 4.6 i GPT-5.4 jako anotatorzy główni, Claude Sonnet 4.6 jako anotator wstępny. Protokół dwustopniowy. Krok 1: tagowanie 63 sygnałami atomowymi (50 dotyczących AI - np. ai_acknowledges_correction, ai_implicit_refusal; 13 dotyczących użytkownika - np. user_expresses_frustration, user_positive_feedback). Krok 2: inferencja archetypu z raportu sygnałów obu anotatorów (z zaznaczeniem na czym się zgodzili i nie zgodzili). Cohen kappa między anotatorami: 0,81-0,94 (substantial to almost perfect agreement). Krytyczna obserwacja metodologiczna - anotacja na poziomie sygnałów daje kappa 0,81, anotacja na poziomie pełnego transkryptu kappa 0,52. Wniosek dla kancelarii budującej audyt AI: lepiej tagować mikrosygnały zachowania niż prosić AI o ogólną ocenę "czy ta odpowiedź jest dobra". OSIEM ARCHETYPÓW NIEWIDOCZNYCH AWARII (z częstością i definicją operacyjną) 1. The walkaway - 85,1% - rozmowa kończy się gwałtownie, użytkownik znika bez słowa wyjaśnienia. Praktyk kancelarii: prawnik prosi o wzór klauzuli, dostaje coś dziwnego, zamyka kartę. Klient dostaje umowę z luką. 2. The silent mismatch - 52,6% - AI odpowiada na inne pytanie niż zadane, ale odpowiedź jest na tyle prawdopodobna, że ani AI ani użytkownik nie zauważa rozbieżności. Praktyk: prawnik pyta o art. 6 ustawy o adwokaturze, AI generuje analizę art. 6 ustawy o radcach prawnych (więcej dokumentów w treningu), tekst jest dobry, źródło błędne. 3. The confidence trap - 32,3% - błędna odpowiedź z pełną pewnością, konkretne nazwiska/daty/sygnatury. Operacyjna definicja halucynacji. Praktyk: sygnatura "II CSK 234/22 z 15 marca 2022 r." z czterozdaniowym streszczeniem - wyrok nie istnieje. 4. The partial recovery - 5,5% - AI próbuje naprawić błąd, druga odpowiedź lepsza, ale nadal niepełna, rozmowa kończy się z połowicznym rozwiązaniem. 5. The drift - 3,9% - rozmowa stopniowo odchodzi od pierwotnego tematu, AI gubi pierwotny kontekst w długich rozmowach. 6. The death spiral - 2,0% - AI w pętli próbuje rozwiązać problem, każda próba gorsza. Najczęstsza w software_development. 7. The contradiction unravel - 0,3% - AI w tej samej odpowiedzi zaprzecza sobie, współwystępuje silnie z confidence trap. Praktyk: w jednym akapicie "klauzula X jest dopuszczalna na gruncie art. 385[1] kc", trzy akapity dalej "klauzula X jest niedozwolona". 8. The mystery failure - mniej niż 0,05% - awaria bez sygnałów, kategoria-śmietnik. Niska częstość dowodzi, że taksonomia siedmiu pierwszych archetypów jest empirycznie domknięta. TEST FUTURE-2K - CZY POSTĘP MODELI LIKWIDUJE PROBLEM 2000 single-turn pytań z WildChat plus nowe odpowiedzi od Claude Sonnet 4.6, Claude Opus 4.6, GPT-4.1, GPT-5.4 (system prompt "You are a helpful assistant", temperature 0). Anotacja tym samym protokołem. Failure rates spadły z 41,7% (oryginalne GPT-3.5/4 z WildChat) do mniej niż 10% dla każdego z nowych modeli - wymierna poprawa o rząd wielkości. ALE rozkład archetypów pozostał stabilny: walkaway, silent mismatch i confidence trap dalej dominują. Niewidoczność awarii nie zmieniła się. Innymi słowy nowoczesne modele mylą się rzadziej, ale gdy się mylą, mylą się tak samo niewidocznie jak ich poprzednicy. To najmocniejszy wniosek operacyjny pracy. Kancelaria wdrażająca najnowszego Copilot albo Claude pozbywa się tylko części objętości problemu, nie problemu cichych awarii jako klasy. Architektura monitoringu wymagana przez art. 14 AI Act musi obejmować detekcję niewidocznych porażek niezależnie od jakości modelu. ANALIZA DOMENOWA (52 DOMEN, PPMI) - creative_writing: silent mismatch (AI zgaduje cel, tworzy estetyczny wynik nie na cel) - design_ux: silent mismatch (forma maskuje rozjazd merytoryczny) - software_development: contradiction unravel, partial recovery, visible failure (programiści weryfikują w czasie rzeczywistym - kompilują, uruchamiają, debugują - błąd wychodzi szybko) - education_academic: confidence trap, drift, contradiction unravel (eksperci wyłapują, początkujący nie) - general_knowledge: confidence trap (fabrykowanie faktów z konkretnymi szczegółami) - translation_language: confidence trap, contradiction unravel, mystery failure - personal_lifestyle: mystery failure, drift (cele rozmyte, więc i awarie) Paper nie analizuje osobno pracy prawniczej. Prawnik czerpie z tych samych źródeł co edukacja i wiedza ogólna (confidence trap), pracuje rzemieślniczo nad konkretnym dokumentem jak programista (partial recovery), tworzy teksty w których forma maskuje treść (silent mismatch) - kombinacja trzech najgorszych domen. Software_development ma najwyższy wskaźnik visible failure spośród analizowanych domen, bo programiści mają natychmiastową pętlę walidacji (kompilator, testy jednostkowe). Praca prawnicza takiej pętli nie ma - hipoteza: wskaźnik visible failure dla domeny prawniczej będzie prawdopodobnie niższy, a niewidoczność awarii wyższa. FILTR TRZYFILAROWY MATEMATIC - CZTERY BIAŁE PLAMY DLA POLSKIEGO COMPLIANCE 1. Artykuł 14 AI Act (human oversight) nie definiuje, co znaczy nadzór nad ciszą. Jeżeli 79% awarii nie ma sygnału użytkownika, klasyczne "human in the loop" oparte na zgłoszeniach pracowników jest fikcyjną kontrolą. Polski operator systemu AI w kancelarii musi wybrać jedno z dwóch - drugą linię prawnika (drugi prawnik weryfikuje co pierwszy zaakceptował od AI) albo techniczny monitoring detekcji niewidocznych awarii w stylu Pottsa-Sudhofa. Trzecia opcja "audytujemy losowe próbki raz na kwartał" jest niezgodna z duchem art. 14 (interpretacja MateMatic, nie stanowisko Komisji Europejskiej ani UODO). 2. RODO art. 22 (decyzje zautomatyzowane) i confidence trap. Prawnik biorący poradę AI bez weryfikacji bo brzmi pewnie - gdzie się kończy "wsparcie decyzji" a gdzie zaczyna "decyzja zautomatyzowana wywołująca skutki prawne"? UODO nie ma stanowiska. Audyt kancelarii musi sprawdzać czy istnieje ślad "prawnik zweryfikował X" - inaczej AI staje się ukrytym podmiotem decyzyjnym (interpretacja MateMatic, nie stanowisko UODO). 3. Tajemnica zawodowa art. 6 ustawy o adwokaturze i silent mismatch. Najgroźniejszy archetyp w kontekście kancelarii. AI odpowiada na inne pytanie i robi to wiarygodnie. Prawnik prosi o draft odpowiedzi na pismo procesowe w sprawie X, dostaje draft pasujący do sprawy Y (źle skojarzona sygnatura), wysyła klientowi - naruszenie tajemnicy w drugą stronę (cudza sprawa wpada w korespondencję) plus niedołożenie należytej staranności. NRA i KRRP powinny przygotować wytyczne (interpretacja MateMatic, nie stanowisko NRA ani KRRP). 4. Polityka AI w kancelarii musi zawierać klauzulę "drugiej pary oczu" na ciche archetypy. Każdy dokument do klienta lub sądu z udziałem AI musi przejść drugą weryfikację z checklistem na trzy krytyczne archetypy. Confidence trap - sygnatury, daty, nazwiska, czy istnieją? Silent mismatch - czy odpowiedź dotyczy tej sprawy? Contradiction unravel - czy nie ma w tekście wewnętrznej sprzeczności? Walkaway, drift i death spiral są mniej ryzykowne, bo prawnik zauważa, że dokument urywa się dziwnie (interpretacja MateMatic, nie stanowisko żadnego regulatora). TRZY ZARZUTY UCZCIWIE 1. Próbka jest tylko angielska. Protokół dostosowany do angielszczyzny, podpartej frekwencyjnie WildChatem. Polskojęzyczne rozmowy mogą wykazywać inny rozkład archetypów. Confidence trap może być mocniejszy w polskim (mniej polskiego materiału treningowego, częstsze fabrykacje). Silent mismatch może być słabszy (polski wymaga gramatycznie konkretniej - przypadki, rodzaje - więc AI rzadziej generuje płynnie błędną odpowiedź). Hipotezy do replikacji przez NASK, Politechnikę Warszawską, polskie centra badawcze AI. 2. Anotator (Opus 4.6) ma własne biases. Dla WildChata (GPT-3.5/4) anotator stoi powyżej linii frontu - to działa. Dla Future-2K (Sonnet 4.6, Opus 4.6) anotator jest tej samej klasy co anotowany model - mogą się pojawiać efekty "model lubi sam siebie", trudne do wyczyszczenia. To nie unieważnia wniosków, ale każe ostrożnie z liczbami dla Future-2K. 3. Dominacja single-turn (63% rozmów). Single-turn wyklucza pełną obserwację drift, death spiral, contradiction unravel - wymagają wielu wymian. Praktyka kancelarii z długimi rozmowami nad jednym pismem może wyglądać inaczej niż statystyki Future-2K. Multi-turn analizy są w appendiksach, ale oparte na mniejszej próbie. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH 79% błędów AI nie ma sygnału - klient nie powie, że dostał coś dziwnego, prawnik nie powie, że AI mu coś podsunęło źle, monitoring oparty na skargach wyłapie co ósmy błąd. Trzy archetypy są krytyczne dla pracy prawniczej: confidence trap (fabrykowane sygnatury i daty), silent mismatch (odpowiedź dotyczy nie tej sprawy), contradiction unravel (sprzeczność w jednym dokumencie). Polityka AI w kancelarii musi przewidywać "drugą parę oczu" dla każdego dokumentu z udziałem AI z konkretnym checklistem na te trzy archetypy - inaczej nie wypełnia art. 14 AI Act ani należytej staranności wobec klienta (interpretacja MateMatic, nie stanowisko NRA ani KRRP). USE CASES - Compliance officer kancelarii - obowiązkowo, taksonomia jako baseline checklist polityki AI - Partner zarządzający, zarząd kancelarii - obowiązkowo, decyzja architektoniczna druga linia prawnika vs monitoring techniczny pod art. 14 AI Act - CIO, szef LegalTech - obowiązkowo, implementacja sygnał-driven monitoringu, model-agnostyczna architektura nadzoru - Adwokat, radca prawny pracujący codziennie z ChatGPT/Claude/Copilot - obowiązkowo, świadomość trzech krytycznych archetypów przy weryfikacji własnej pracy - Aplikant adwokacki, aplikant radcowski - obowiązkowo, silent mismatch przy researchu wyroków najgroźniejszy przed wysłaniem czegokolwiek do partnera - Audytor zewnętrzny kancelarii pod RODO/AI Act - obowiązkowo, taksonomia jako baseline metodologiczny audytu - Klient indywidualny kancelarii - nie polecam całości, tylko sekcja "Dla zarządu w trzech zdaniach" CROSS-REFERENCE - TOM 060 OWASP GenAI Data Security 2026 (architektura AI-DSPM do operacjonalizacji checklist; DSGAI11 cross-context bleed daje techniczne uzasadnienie dla "drugiej pary oczu" przy silent mismatch) - TOM 057 LEGIT Legal Issue Tree Rubrics (vertical AI jako odpowiedź na confidence trap; fine-tuning open-weight modelu z rubric reward zmniejsza fabrykacje) - TOM 059 FORESIGHT KE (anticipatory governance jako szersza ramka monitoringu AI; klaster "Regulatory Enforcement" dotyka enforcement art. 14 AI Act) - TOM Anthropic Petri (alignment auditing - infrastruktura monitoringu sygnałów behawioralnych modelu) - TOM Sample-efficient Sycophancy Mitigation (jeden z mechanizmów wpływających na confidence trap; sycophancy zwiększa pewność odpowiedzi niezależnie od jej trafności) - TOM EDPB DPIA Template baseline-eskalacja (gdzie wpisać taksonomię w DPIA art. 35 RODO) - TOM AI Act Guide Bird & Bird (operacyjny przewodnik po obowiązkach z AI Act art. 14) - TOM Stanford HAI AI Index 2026 (kontekst makro adopcji AI; baseline 88% adopcji globalnie) - BW/002 Yin Reasoning Trap (hallucination 2-10x przez reasoning enhancement jako jeden z mechanizmów confidence trap) - TOM ENISA NIS2 Technical Guidance (incident handling 3.1-3.6 jako szablon dla AI failure response) CO MATEMATIC WNIESIE - Warsztat "Niewidoczne awarie AI w kancelarii" dla zarządu i compliance: taksonomia 8 archetypów, mapping na art. 14 AI Act, decyzja architektoniczna druga linia / monitoring - Audyt obecnej polityki AI kancelarii pod kątem trzech krytycznych archetypów (confidence trap, silent mismatch, contradiction unravel) - Checklist "Druga para oczu" jako pierwszy deliverable operacyjny - manualny, pre-techniczny, do natychmiastowego wdrożenia - Warsztat dla CIO i szefa LegalTech "Sygnał-driven monitoring AI" - sygnały zachowania zamiast samooceny modelu, architektura model-agnostyczna - Template DPIA z sekcją "Detekcja niewidocznych awarii" - Deliverable: rejestr ryzyk AI w kancelarii z mapą krytycznych archetypów per typ dokumentu (umowa, pismo procesowe, opinia, research wyroków) Sekcje recenzji MateMatic w HTML: headline (lead), "O czym jest ten dokument", trzy h3 recenzji (Osiem archetypów - co znaczą i kiedy uderzają w kancelarię; Czy to artefakt starych modeli - test Future-2K mówi że nie; Domena ma znaczenie - praca prawnicza jako klasa wysokiego ryzyka cichej halucynacji; Metoda anotacji - dlaczego dwa LLM-y mówią to samo i to znaczy że można im wierzyć), "Czego autorzy nie powiedzieli a co musi powiedzieć polski compliance" (cztery białe plamy), "Słabsze strony paperu" (trzy zarzuty), "Co z tego wynika", ramka "Dla zarządu kancelarii w trzech zdaniach". Autor recenzji: Wiesław Mazur - MateMatic. ### BW/060 - OWASP GenAI Data Security 2026: 21 ryzyk DSGAI plus framework AI-DSPM. Co bierze polska kancelaria do polityki AI. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-12-owasp-genai-data-security-risks-mitigations-2026.html Autorzy: Scott Clinton (OWASP GenAI Security Project, Board Co-chair, Co-founder), Kyriakos "Rock" Lambros (Zenity, Director of AI Standards and Governance), Emmanuel Guilherme Junior (OWASP GenAI Data Security Initiative Lead) plus 18 contributors plus 5 reviewers Tytuł oryginału: GenAI Data Security - Risks and Mitigations 2026 Wydawca: OWASP GenAI Security Project (projekt OWASP Foundation) Data: marzec 2026, Version 1.0 Strona projektu: https://genai.owasp.org Licencja: Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) - reuse i adaptacja komercyjna autoryzowane z atrybucją plus share-alike. MateMatic hostuje kopię oryginalnego PDF lokalnie zgodnie z CC BY-SA 4.0 z atrybucją do OWASP GenAI Security Project. Typ recenzji: Recenzja referencyjna · Standard branżowy (OWASP) Data publikacji recenzji MateMatic: 2026-05-12 POZYCJONOWANIE - DRUGA WARSTWA RODZINY OWASP W BIBLIOTECE MATEMATIC Sibling OWASP: TOM OWASP AIVSS (LLM Top 10 plus AIVSS scoring agentic) jest pierwszą warstwą w rodzinie OWASP w naszej bibliotece, OWASP GenAI Data Security 2026 drugą - specjalistyczną dla danych. Razem domykają framework OWASP dla AI w polskiej kancelarii. CENTRALNA TEZA ARCHITEKTONICZNA Context window agreguje dane z wielu domen zaufania (system prompt, user input, RAG results, tool outputs, conversation history) do jednego płaskiego namespace bez wewnętrznej kontroli dostępu. Chunk RAG retrieved z poufnej bazy HR siedzi obok user inputu z taką samą wagą zaufania. Nie istnieje dziś mechanizm który by oznaczył segment kontekstu jako "dostępny dla rozumowania ale nie dla bezpośredniego output". Konsekwencja: GenAI security musi przyjąć zero inherent trust w model - model może leaknąć, regurgitate albo zrekonstruować dane przez memoryzację, inwersję albo output. Polski compliance officer dostaje formalnie sformułowaną podstawę dlaczego DPIA dla narzędzia AI musi traktować model jako untrusted intermediary, niezależnie od deklaracji dostawcy w karcie produktu. 21 RYZYK DSGAI01-DSGAI21 W SZEŚCIU KLASTRACH Direct exposure: DSGAI01 Sensitive Data Leakage, DSGAI02 Agent Identity & Credential Exposure (NHI Non-Human Identities), DSGAI03 Shadow AI & Unsanctioned Data Flows. Pipeline integrity: DSGAI04 Data Model & Artifact Poisoning, DSGAI05 Data Integrity & Validation Failures, DSGAI06 Tool/Plugin/Agent Data Exchange Risks. Governance fundamentals: DSGAI07 Data Governance Lifecycle & Classification, DSGAI08 Non-Compliance & Regulatory Violations. GenAI-specific attack surfaces: DSGAI09 Multimodal Capture & Cross-Channel Leakage, DSGAI10 Synthetic Data Anonymization Pitfalls, DSGAI11 Cross-Context & Multi-User Conversation Bleed, DSGAI12 Unsafe Natural-Language Data Gateways (LLM-to-SQL/Graph), DSGAI13 Vector Store Platform Data Security. Operational infrastructure: DSGAI14 Excessive Telemetry & Monitoring Leakage, DSGAI15 Over-Broad Context Windows & Prompt Over-Sharing, DSGAI16 Endpoint & Browser Assistant Overreach, DSGAI17 Data Availability & Resilience Failures. Model as artifact: DSGAI18 Inference & Data Reconstruction, DSGAI19 Human-in-the-Loop & Labeler Overexposure, DSGAI20 Model Exfiltration & IP Replication, DSGAI21 Disinformation & Integrity Attacks via Data Poisoning. STRUKTURA KAŻDEGO RYZYKA (sześcioelementowa) How the attack unfolds, attacker capabilities, illustrative scenario, impact, mitigations w trzech tierach (Tier 1 foundational / Tier 2 hardening / Tier 3 advanced) z anotacją scope (Buy/Build/Both), known CVEs. TIEROWANIE MITIGATIONS CRAWL/WALK/RUN Tier 1 - shipnąć w jednym sprincie z istniejącym tooling, reduce most exposure with least friction. Tier 2 - wymaga zmian architektonicznych, nowych narzędzi, koordynacji między zespołami. Tier 3 - zakłada dojrzały program: red teaming, differential privacy, formal verification, custom detection models. Dla polskiej kancelarii to mapa drogowa - większość zespołów zaczyna od Tier 1, dochodzi do Tier 2 w roku-dwóch, Tier 3 to perspektywa dużej kancelarii z dedykowanym zespołem LegalTech-security. FRAMEWORK AI-DSPM (Data Security Posture Management dla GenAI) - 13 KAPABILITIES Traditional DSPM extended (1-4): GenAI data asset discovery & inventory; classification, labeling & policy binding; data flow mapping, lineage & "GenAI bill of materials" (DBOM); access governance & entitlement posture (RBAC/ABAC plus Just-in-Time Data Access plus per-agent identity). GenAI specific (5-13): prompt/RAG/output-layer DLP; vector store & embedding security posture; data integrity, poisoning & tamper detection; observability, telemetry & log-retention posture; third-party, plugin/tool & connector governance; lifecycle management, erasure & compliance readiness; training governance & privacy-enhancing fine-tuning (z Hard De-identification plus Differential Privacy DP-SGD plus federated learning); resilience posture for GenAI data dependencies; human i shadow AI controls. KLUCZOWE OPERACYJNE ELEMENTY DLA KANCELARII Just-in-Time Data Access (kapabilita 4): agent dostaje token tylko dla konkretnego zadania, scope i TTL baked-in, revoked on completion - zamiast permanent credentials. Hard De-identification i Differential Privacy (kapabilita 11): mechanizmy do training governance zgodnego z RODO art. 32. Verifiable Erasure (Tier 3 DSGAI01): cryptographic erasure plus machine unlearning dla DSR. PIĘĆ CVE W NARZĘDZIACH KANCELARYJNYCH CVE-2024-5184 EmailGPT (prompt injection do system-prompt disclosure), CVE-2025-32711 Microsoft 365 Copilot (Information Disclosure), CVE-2025-54794 Claude AI (Prompt Injection "The Jailbreak That Talked Back"), CVE-2026-0612 The Librarian (information leakage przez web_fetch tool), CVE-2026-22708 Cursor (Terminal Tool Allowlist Bypass via Environment Variables). Pięć CVE rozłożonych na trzy lata - ciągle aktywny pipeline luk w narzędziach najczęściej używanych w workflow kancelarii. CONFIRMED EXFIL PATHS 2025 Microsoft Copilot, Google Gemini, Sourcegraph Amp, VS Code Continue. Mechanizm - markdown image rendering do external URLs i tool callbacks bez allowlist. Mitigation - blokuj markdown image rendering, sanitize tool callback targets, disable API-redirect channels w LLM output rendering. FILTR TRZYFILAROWY MATEMATIC - CZTERY BIAŁE PLAMY DO WYPEŁNIENIA PRZEZ POLSKIEGO COMPLIANCE OFFICERA 1. Mapping DSGAI01 (Sensitive Data Leakage) na tajemnicę zawodową adwokacką i radcowską - art. 6 prawa o adwokaturze i art. 6 ustawy o radcach prawnych stawiają wyższy standard niż RODO, tajemnica zawodowa jest bezterminowa, nie podlega zwolnieniu przez klienta jednostronnie, leakage przez model fine-tuned na sprawach klienta nawet przypadkowy to potencjalne naruszenie tajemnicy zawodowej niezależnie od konsekwencji RODO; Tier 3 mitigation OWASP Verifiable Erasure (cryptographic erasure, machine unlearning) staje się dla polskiej kancelarii wymaganym standardem dochowania tajemnicy zawodowej zwłaszcza w obliczu DSR Data Subject Rights klienta-osoby fizycznej (interpretacja MateMatic, nie stanowisko NRA ani KRRP). 2. DSGAI03 (Shadow AI) i ustawowa odpowiedzialność partnera zarządzającego - associate korzystający z ChatGPT z prywatnego konta podczas analizy umowy klienta generuje wprost ryzyko DSGAI03 unsanctioned data flow, kancelaria jako administrator danych odpowiada za środki organizacyjne (art. 32 RODO), partner zarządzający za nadzór; polskie organy NRA i KRRP nie wydały dotąd wytycznych operacyjnych pod kątem Shadow AI - OWASP daje gotową listę kontrolek detective i preventive; polski warsztat z policy AI w kancelarii powinien adresować Shadow AI jako pierwszy temat polityki, nie ostatni. 3. DSGAI11 (Cross-Context & Multi-User Conversation Bleed) i konflikt interesów - cross-context bleed w modelu używanym do obsługi dwóch klientów z konkurencyjnymi interesami może naruszyć obowiązek bezstronności adwokackiej, per-user/per-task memory isolation z mitigacji Tier 2 OWASP staje się dla kancelarii fundamentem zgodności z etyką zawodu, nie hardening. 4. DSGAI16 (Endpoint & Browser Assistant Overreach) i Microsoft 365 Copilot w polskiej kancelarii - Copilot w workspace ma dostęp do całej skrzynki mailowej, OneDrive, SharePoint, Teams, czasem do CRM; CVE-2025-32711 (M365 Copilot Information Disclosure) jest konkretnym przypadkiem; mitigation Tier 1 OWASP data minimization plus scope restriction dla polskiej kancelarii powinno znaczyć segregację skrzynek (sprawy klientów wrażliwych poza scope Copilota) i jasną politykę kiedy assistant ma dostęp do akt klienta a kiedy nie. TRZY ZARZUTY UCZCIWIE Mapping na compliance europejski słaby (cytowanie GDPR w warstwie impact bez schodzenia w konkrety art. 6, 9, 22, 32, 35; EU AI Act wspomniany w DSGAI08 i DSGAI21 ale bez identyfikacji obowiązków deployerów art. 26 ani providerów art. 16 - polski compliance musi sam zrobić mapping). Inkonsystencja numeracji (odniesienia do DSGAI24 i DSGAI25 we wstępie i DSGAI21 mimo że dokument zawiera DSGAI01-21 - ślad po wcześniejszych draftach zwiniętych w ramach editorial consolidation, drobiazg ale zgrzyt dla mappingu po identyfikatorach). Większość ilustracyjnych scenariuszy operuje na przykładach amerykańskich consumer-grade SaaS (customer support chatbot ze SSN, ticket fine-tuning, support documentation) - brakuje scenariuszy z domeny finansowej, medycznej, prawniczej gdzie regulacja jest tłustsza; dla polskiej kancelarii trzeba samodzielnie zbudować scenariusze (assistant w outlooku partner-associate, RAG na bazie KRS, fine-tuning na zanonimizowanych orzeczeniach, DMS z agentem do automatycznej klasyfikacji pism). DLA COMPLIANCE OFFICERA W TRZECH ZDANIACH OWASP daje pierwszą operacyjną mapę data security w GenAI - 21 ryzyk DSGAI z tiered mitigations (crawl/walk/run) plus framework AI-DSPM z trzynastoma kapabilities, plus konkretne CVE w Microsoft 365 Copilot, Cursor i Claude jako baseline audytowy. Centralna teza architektoniczna do polityki AI kancelarii: context window agreguje dane z różnych domen zaufania do flat namespace bez kontroli dostępu, więc model musi być traktowany jako untrusted intermediary niezależnie od deklaracji dostawcy. Cztery białe plamy do wypełnienia przez polskiego compliance: mapping DSGAI01 na tajemnicę zawodową, DSGAI03 Shadow AI jako pierwszy temat polityki, DSGAI11 cross-context bleed jako fundament etyki, DSGAI16 endpoint overreach jako konkretna kontrolka dla M365 Copilot (interpretacja MateMatic, nie stanowisko NRA ani KRRP). USE CASES Obowiązkowo: compliance officer/IOD kancelarii (cały dokument plus filtr trzyfilarowy MateMatic jako baseline polityki AI), CIO/dyrektor IT/szef LegalTech (AI-DSPM 13 kapabilities jako szablon governance plus Tier 1 mitigations jako pierwszy sprint), adwokat doradzający klientowi-spółce wdrażającej AI (21 ryzyk jako framework due diligence). Selektywnie: partner zarządzający kancelarii (sekcja Document Scope plus 21 ryzyk plus filtr MateMatic - sześciostronicowy executive summary), aplikant/associate (DSGAI03 Shadow AI plus DSGAI11 Cross-Context Bleed jako wymóg etyczny). Nie polecam: klient indywidualny szukający prawnika. CROSS-REFERENCE TOM OWASP AIVSS (sibling OWASP, LLM Top 10 plus AIVSS scoring agentic), TOM Five Eyes Careful Adoption Agentic AI (sześć agencji rządowych, pięć kategorii ryzyk plus lifecycle), TOM ENISA Technical Guidance NIS2 (13 obszarów cybersec z evidence list), TOM ENISA Security by Design, TOM OASIS CoSAI Agentic IAM (direct partner DSGAI02 Agent Identity), TOM MIT AI Risk Repository (risk taxonomy), TOM Berkeley CLTC GPAI Risk Management Profile, TOM MindForge AI Risk Management, TOM NIST AI 800-4 Monitoring, TOM King AI Vendor Assessment Guide, TOM Kenney Governing Intelligence Atlas, TOM AI Act Guide Bird & Bird, TOM EDPB DPIA Template baseline-eskalacja. CO MATEMATIC WNIESIE Warsztat polityki AI dla kancelarii oparty na 21 ryzykach DSGAI plus AI-DSPM 13 kapabilities (mapping na art. 32 RODO, art. 9 AI Act, tajemnicę zawodową), audyt Microsoft 365 Copilot pod kątem DSGAI16 plus CVE-2025-32711, warsztat Shadow AI policy jako pierwszy temat polityki AI w kancelarii. Deliverable: polityka AI kancelarii plus rejestr ryzyk DSGAI plus protokół incident response AI plus mapa kontrolek M365 Copilot. --- ### BW/059 - FORESIGHT KE: trzy scenariusze AI 2040. Anticipatory governance zamiast prognozy. Co to znaczy dla polskiej kancelarii. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-12-ec-foresight-futures-of-ai-r-and-i.html Autorzy: Wenzel Mehnert, Arianna Ferrari, Orestas Strauka, Mariam Chachava, Žilvinas Martinaitis, Kerstin Cuhls, Alexandra Csabi (Foresight On Demand Consortium dla European Commission, Directorate-General for Research and Innovation, Common Policy Centre, Unit G.1 - Common R&I Strategy and Foresight Service) Tytuł oryginału: The Futures of Artificial Intelligence: Implications for Europe's R&I Ecosystem. Part 5: Final Report Wydawca: European Commission, Luxembourg: Publications Office of the European Union, 2026 Data: kwiecień 2026 (manuskrypt zamknięty) ISBN: 978-92-68-38852-5 DOI: 10.2777/7322666 Objętość: 38 stron Licencja: Decision 2011/833/EU - reuse autoryzowany (komercyjny i niekomercyjny) z atrybucją do European Union i pod warunkiem niezniekształcania oryginalnego znaczenia. MateMatic hostuje kopię oryginalnego PDF lokalnie zgodnie z tą licencją. Typ recenzji: Recenzja referencyjna · Raport instytucji publicznej (EU) Data publikacji recenzji MateMatic: 2026-05-12 POZYCJONOWANIE - CZWARTA POZYCJA SERII FORESIGHT AI DLA EU Raport zamyka kwartet w bibliotece MateMatic dotyczący foresight AI dla Europy. Mapowanie governance: TOM MIT Mapping AI Governance i TOM Leslie - Turing AI Ethics Governance Introduction dają architekturę instytucjonalną. AGI horyzont: TOM RAND - AGI Forecasting (rozkład prawdopodobieństw timeline AGI) i TOM Kuśmierek - Polska wobec AGI (polska pozycja w globalnej dynamice). Realny stan EU: TOM Stanford HAI AI Index 2026 i TOM European AI Report 2026 (twarde dane adoption). FORESIGHT KE przekłada to wszystko na trzy scenariusze 2040 i sześć klastrów rekomendacji dla R&I policy. CENTRALNA TEZA RAPORTU Przyszłość AI nie da się prognozować, ale można i trzeba zbudować zdolność działania pod niepewnością. Trzy scenariusze 2040 nie mają mówić, co się stanie. Mają mówić, jaki zestaw zdolności (instytucjonalnych, kompetencyjnych, technologicznych) jest robust across futures. Strategiczna orientacja nie polega na anticipation jednego dominującego outcome, ale na zdolności adaptacji do wielu, zmieniających się przyszłości. TRZY SCENARIUSZE AI 2040 Scenariusz A - EU przyczepione do globalnych sieci AGI i ASI. W 2040 technologia AI jest wysoce zaawansowana (AGI i ASI poza ludzkim rozumieniem i kontrolą), kilka globalnych firm i sieci technologicznych kapitalizuje value generowane przez AI, EU czyni się atrakcyjne żeby otrzymać usługi tych transnarodowych sieci - scenariusz integracji-w-pozycji-klienta, Europa nie produkuje rdzeniowej AI, kupuje dostęp. Scenariusz B - Europa prowadzi unikalną rewolucję AI. W 2040 EU AI jest bardziej innowacyjna i użyteczna niż w innych regionach, USA i Chiny uwięzione w niewystarczających zwrotach z gigantycznych inwestycji w LLM, EU korzysta z masywnych inwestycji w edukację tworząc nowe paradygmaty AI - scenariusz suwerenności technologicznej zbudowanej na innym fundamencie (humanistycznym, edukacyjnym, instytucjonalnym). Scenariusz C - Global AI Winter. W 2040 boom AI z lat 2020 skończony, wcześniejsze obietnice nie zmaterializowały się jako mierzalne zwroty, AI 2040 jest mniej więcej tak zdolne jak piętnaście lat wcześniej, wielkie inwestycje zatrzymane pod koniec lat 2020, rozwój AI trwa wolno - scenariusz korekty, bańka pęka, hype wygasa. Autorzy explicite zastrzegają: scenariusze są "think pieces" - nie prognozy, nie ranking prawdopodobieństwa, nie preferencje. To narzędzia do otwierania perspektyw i stress-testu strategii. FRAMEWORK TOSA ZAMIAST SWOT TOSA - Threats, Opportunities, Stakes, Actions. Wygląda jak kosmetyczna mutacja SWOT, nie jest. Różnica w trzeciej literze. SWOT pyta o Strengths i Weaknesses - atrybuty obiektu analizy. TOSA pyta o Stakes - co jest stawką, kto wygrywa i kto traci, co jest do obronienia i co do zdobycia. Przesunięcie z analizy statycznej (atrybuty) do analizy politycznej (interesy i ryzyka). Konkret kancelaryjny: partner z trzyletnią umową LegalTech-SaaS za 180 tysięcy złotych rocznie z 2024. W A Stakes = utrzymanie zależności od dostawcy spoza EU mimo wzrostu cen. W B Stakes = sunk cost umowy wobec tańszych suwerennych europejskich. W C Stakes = wyjaśnienie wspólnikom braku obiecanej rewolucji. Trzy razy ten sam partner, trzy razy inne Stakes. SWOT by tego nie wyciągnął. TWARDE DANE EMPIRYCZNE AI uptake przedsiębiorstw EU: 13,48 procent w 2024 (Eurostat), wzrost z 8 procent w 2023, ale wciąż znacząco poniżej 55 procent globalnie (McKinsey 2023). Distribution sektorowa: wysokie uptake w ICT i professional services, niskie w manufacturing, construction, utilities. Trzy funkcjonalne profile adopcji (z komentarzem MateMatic dla polskiego rynku): - Innovation-led (ICT, professional services, healthcare, education): trajektoria 2030 deep integration AI w core operations, nie wsparcie. Kancelarie prawnicze tu. Pięć lat. Kto traktuje asystenta AI jako "ciekawy gadżet" jest poza krzywą projekcji KE. - Operational core (manufacturing, energy, transport, finance, construction): trajektoria incremental nie disruptive. Klienci korporacyjni kancelarii - powolne, regulowane wdrożenia, długie cykle inwestycyjne, twarde wymogi compliance. - Service envelope (wholesale, retail, hospitality, admin, arts): trajektoria supplementary przez SaaS. AI dociera przez gotowe rozwiązania, niski próg wejścia ale i niska różnicowalność. BARIERY ADOPCJI W EU (autorzy) Fragmentacja rynku, dominacja SME (99 procent firm), brak globalnych platform digital, lingwistyczna diversity (dla NLP - kluczowe), human capital shortage, fragmented investment, ethical/security/trust concerns. Wszystkie obowiązują polski rynek prawniczy. Lingwistyczna diversity dla polskiej kancelarii to barierka konkurencyjna chroniąca przed dominacją anglojęzycznych narzędzi - ale ta sama bariera spowalnia adaptację globalnych modeli do polskiego kontekstu prawnego. SZEŚĆ KLASTRÓW REKOMENDACJI - SENSE-MAKING WORKSHOP 10.02.2026 BRUKSELA Działania robust across all three scenarios (czyli wskazane niezależnie który scenariusz się zmaterializuje): 1. Rethinking Education - critical thinking ponad technical skills, AI literacy na wszystkich poziomach, talent retention aligned z European values 2. Global Tech Strategies - tech diplomacy, digital sovereignty, modelowanie responsible AI governance globalnie 3. Regulatory Enforcement - implementation challenge AI Act, distributed oversight across domains, funded enforcement capacity 4. Green AI - energy-efficient AI, alignment z climate objectives, sustainable AI i AI for sustainability 5. European AI Ecosystem - integrated public-private AI ecosystem, data sovereignty, certified trustworthy human-overseen AI systems 6. Cultivating AI Innovation - research-to-market pathways, cultural and creative sectors jako driver, regulatory sandboxes dla governance learning Dla polskiej kancelarii operacyjnie najistotniejsze: Regulatory Enforcement (AI Act ma ambitny framework, ale wykonanie pozostaje wyzwaniem - kancelaria budująca compliance pod AI Act dziś kształtuje praktykę enforcement na lata; cross-ref TOM AI Act Guide Bird & Bird i TOM EDPB DPIA Template) i European AI Ecosystem (certyfikacja trustworthy AI z human oversight - dokładnie miejsce gdzie polski rynek LegalTech ma szansę zbudować segment przewagi: zaufanie + tajemnica zawodowa + RODO). TRZY STRATEGICZNE IMPLIKACJE DLA EU R&I POLICY 1. Strengthening anticipatory governance capacities to navigate persistent uncertainty - cztery obszary: Adaptive Governance, Monitoring & Foresight, Strengthening AI Literacy, Hype Assessment. 2. Enhancing European competitiveness through broader and deeper AI adoption across sectors - cztery obszary: Strengthening the European AI Ecosystem, Promotion of Vertical AI, Agile Governance Structures, Robust AI Systems. 3. Shaping a distinct European pathway for AI that builds on trust, sustainability and public interest - pięć obszarów: Rediscover humanities, Twin transition, Public-Private Partnerships, Human values for AI innovation, Tech Diplomacy. FILTR TRZYFILAROWY MATEMATIC - CZTERY BIAŁE PLAMY DO WYPEŁNIENIA PRZEZ POLSKIEGO COMPLIANCE OFFICERA 1. Trzy scenariusze AI 2040 jako wejście do strategii kancelarii - każdy scenariusz ma inne implikacje operacyjne. W A pytanie: jak utrzymać tajemnicę zawodową i niezależność prawnika kiedy infrastruktura AI jest poza EU. W B pytanie: jak zbudować przewagę kompetencyjną na narzędziach, które konkurencja też będzie miała. W C pytanie: co z inwestycjami w LegalTech zrobionymi w latach 2024-2028. Wszystkie trzy pytania warto zadać dziś. 2. Anticipatory governance i art. 9 EU AI Act - autorzy explicite: regulatory ambition alone is insufficient without corresponding implementation and enforcement capabilities. Polska wersja: sam KSC i polski AI Act enforcement bez kompetencji organów nadzoru nie zadziała. Klient z sektorów wysokiego ryzyka (medycyna, finanse, edukacja, infrastruktura krytyczna) musi budować własną dokumentację zgodności z art. 9 AI Act bez liczenia na ścisłe ramki interpretacyjne organów (interpretacja MateMatic, nie stanowisko NRA ani KRRP). 3. Hype Assessment jako praktyczna kompetencja - czwarty obszar anticipatory governance, rzadkie u policy paperów. Dla polskiej kancelarii odróżnianie strategicznej przesady od ugruntowanego rozwoju w codziennym napływie informacji o "rewolucyjnych" narzędziach LegalTech. NRA i KRRP, które rekomendowałyby konkretne narzędzia AI dla członków, nie mają jeszcze takiej metodologii. 4. Vertical AI dla professional services - autorzy rekomendują vertical AI (AI dostosowane do specyfiki sektorów). Dla professional services znaczy nie generic LLM, tylko LLM domain-tuned na polskim prawie. Kontynuacja wątku z BW/057 LEGIT - fine-tuning open-weight modelu z rubric reward na polskich drzewach argumentów. FORESIGHT KE dorzuca strategiczne uzasadnienie: vertical AI to nie nisza, to europejska droga konkurencyjna. TRZY ZARZUTY UCZCIWIE Brak twardych danych dla Polski i CEE (liczby agregowane EU - trzeba sięgnąć do GUS, PARP, SuPESU, NRA). Scenariusze świadomie spekulatywne bez prawdopodobieństw (decyzja metodologiczna szanowna - foresight uczciwy nie udaje prognozy - ale zarząd musi sam przypisać subiektywne wagi i alokować pod nie kapitał). Promise "gaining time" przez AI poddany krytyce słusznie ale bez metryk (luka, którą TOSA nie wypełnia - kancelaria musi zbudować metryki ROI samodzielnie: godziny billable per matter, time-to-first-draft, etc.). META OBSERWACJA - AKTUALIZACJA DANYCH Manuskrypt zamknięty kwiecień 2026, sense-making workshop luty 2026, ankieta ekspercka maj 2025. Twarde dane mają już rok do półtora. W tempie obecnej dynamiki AI to długo. Polska kancelaria biorąca FORESIGHT KE jako baseline strategiczny musi zbudować własny mechanizm aktualizacji - cykl półroczny minimum, ewentualnie kwartalny - bo żaden raport instytucjonalny nie nadąża za rzeczywistym tempem zmian. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH Komisja Europejska oficjalnym dokumentem mówi to, co dziś trzeba powiedzieć każdemu zarządowi kancelarii - przyszłości AI nie da się prognozować, więc strategia musi być robust across trzech radykalnie różnych scenariuszy 2040 (AGI/ASI Networks, EU Leadership, AI Winter), a nie pod jedną przewidywaną wizję. Operacyjna konsekwencja to anticipatory governance wewnątrz kancelarii - regularne foresight, hype assessment, monitoring AI Act enforcement, AI literacy na wszystkich poziomach. Vertical AI dla polskiego prawa (lokalny fine-tuning na polskich datach, polskim retrieval, polskim rubric) jest europejską drogą konkurencyjną - nie niszą, a celową polityką gospodarczą EU, z której polskie kancelarie mogą skorzystać dziś. USE CASES Obowiązkowo: zarząd kancelarii w pełnym składzie (raport do przeczytania jeden raz na dedykowane posiedzenie, nie do delegowania), partner zarządzający rozważający strategię AI 2026-2030, compliance officer wdrażający AI Act u klientów wysokiego ryzyka (anticipatory governance jako uzasadnienie wykraczające poza minimum dokumentacyjne), zespoły LegalTech w dużych polskich kancelariach (europejskie strategiczne uzasadnienie dla vertical AI). Selektywnie: CIO/dyrektor IT kancelarii (klastry European AI Ecosystem i Cultivating AI Innovation), adwokat doradzający klientowi-spółce publicznej (klaster Global Tech Strategies plus tech diplomacy), aplikant adwokacki/radcowski (klaster Rethinking Education jako argument za inwestycją w kompetencje interpretacyjne plus krytyczne myślenie), solo praktyk i kancelaria 1-3 osobowa (tylko sekcja "Dla zarządu w trzech zdaniach"). Nie polecam: klient indywidualny szukający prawnika. CROSS-REFERENCE: BW/057 LEGIT (vertical AI i fine-tuning na polskich drzewach argumentów), TOM Stanford HAI AI Index 2026 (baseline 88 procent adopcji globalnie, 362 incydenty AI 2025), TOM European AI Report 2026 (baseline EU adoption), TOM SuPESU Raport rynku prawniczego 2025-2026 (polski baseline kancelaryjny, 87 procent prawników używa AI), TOM Bifurcation of BigLaw (bifurcation rynku już widoczny - FORESIGHT KE go przyspiesza), TOM AI Act Guide Bird & Bird (operacyjny przewodnik po obowiązkach z AI Act), TOM EDPB DPIA Template baseline-eskalacja (mechanizm art. 32+35 RODO plus art. 9 AI Act), TOM RAND - AGI Forecasting (rozkład prawdopodobieństw timeline AGI - mostek do Scenariusza A), TOM Kuśmierek - Polska wobec AGI (krajowa pozycja w globalnej dynamice AGI/ASI), TOM MIT Mapping AI Governance (architektura instytucjonalna), TOM Leslie - Turing AI Ethics Governance Introduction (ramy etyczne governance), TOM EC DMA Review SWD 2026/123 (siostrzany dokument EC, podobny gatunek policy paper). CO MATEMATIC WNIESIE Warsztat trzech scenariuszy AI 2040 dla zarządu kancelarii (Stakes per scenariusz, mapowanie ryzyk LegalTech, alokacja kapitału pod subiektywne wagi prawdopodobieństw), warsztat anticipatory governance (cykl półroczny foresight, hype assessment, monitoring AI Act enforcement, AI literacy na wszystkich poziomach), warsztat vertical AI dla polskiego prawa (lokalny fine-tuning, polski retrieval, polski rubric LEGIT-style). Deliverable: strategia AI 2026-2030 robust across trzech scenariuszy plus rejestr ryzyk strategicznych plus mechanizm aktualizacji. --- ### BW/055 - ENISA przekłada NIS2 na konkrety. 47 stron technical guidance z evidence list dla każdego z 13 obszarów cybersec. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-09-enisa-technical-guidance-nis2-implementing-regulation-2024-2690.html Autorzy: Konstantinos Moulinos, Marianthi Theocharidou (European Union Agency for Cybersecurity, ENISA) Tytuł oryginału: Technical Implementation Guidance on Commission Implementing Regulation (EU) 2024/2690 of 17 October 2024 laying down rules for the application of NIS2 Directive (EU 2022/2555) as regards technical and methodological requirements of cybersecurity risk-management measures Wydawca: ENISA, Luxembourg: Publications Office of the European Union, 2025 Data: czerwiec 2025, version 1.0 Objętość: 47 stron Licencja: Creative Commons Attribution 4.0 International (CC BY 4.0) - reuse autoryzowany z atrybucją do ENISA. MateMatic NIE hostuje PDF lokalnie - link do strony ENISA. Typ recenzji: Recenzja referencyjna · Standard regulacyjny EU Data publikacji recenzji MateMatic: 2026-05-09 POZYCJONOWANIE - DOMYКА SIEĆ POWIĄZAŃ CYBERSEC W BIBLIOTECE Pięć tomów i jedna Aktualność tworzą pełną mapę cybersec/compliance dla polskiej kancelarii: BW/045 Kenney Runtime Enforcement (security jako cross-cutting capability w AI Governance Stack), TOM 054 EDPB DPIA (mechanizm baseline-eskalacja art. 32-35 RODO), TOM 056 Kenney Atlas (NIST AI RMF, ISO 42001, mapping na NIS2), Aktualność 9 maja 2026 Kenney AI Compliance playbook (12 klauzul DPA, sub-processor disclosure), TOM 057 LEGIT (reasoning evaluation), TOM 058 ENISA NIS2 (baseline operacyjny dla 13 obszarów cybersec). KONSTRUKCJA DOKUMENTU - 13 OBSZARÓW CYBERSEC 1. POLICY ON THE SECURITY OF NETWORK AND INFORMATION SYSTEMS 1.1 Policy on the security of network and information systems - 11 elementów wymaganych (a-k): approach to security mgmt, alignment with business strategy, security objectives, commitment to continual improvement, resources commitment, communication and acknowledgement, roles and responsibilities, documentation retention, topic-specific policies list, indicators and measures of maturity, formal approval date by management bodies. Roczny review. 1.2 Roles, responsibilities and authorities - mianowanie CISO, named AI/cybersecurity governance lead z decision-rights authority, RACI cross-functional advisory body. 2. RISK MANAGEMENT POLICY 2.1 Risk management framework - identyfikacja, ocena, treatment plan z 7 elementami (description of risk, treatment option avoidance/mitigation/transfer/acceptance, assets, measures, effectiveness procedure, timelines, responsible roles), residual risks akceptacja przez management bodies, mapping na ISO/IEC 27005:2022. 2.2 Compliance monitoring - regularne audyty i pomiary skuteczności środków. 2.3 Independent review - external lub internal independent review information and network security. 3. INCIDENT HANDLING (6 podsekcji) 3.1 Incident handling policy 3.2 Monitoring and logging 3.3 Event reporting 3.4 Event assessment and classification 3.5 Incident response 3.6 Post-incident reviews 4. BUSINESS CONTINUITY AND CRISIS MANAGEMENT (3 podsekcje) 4.1 Business continuity and disaster recovery plan 4.2 Backup and redundancy management 4.3 Crisis management 5. SUPPLY CHAIN SECURITY (2 podsekcje) 5.1 Supply chain security policy 5.2 Directory of suppliers and service providers - inwentarz dostawców z mappingiem na poziomy krytyczności, dokumentacją kontraktów, sub-processor disclosure (cross-link do 12 klauzul DPA Kenneya z dzisiejszej Aktualności). 6. SECURITY IN NETWORK AND INFORMATION SYSTEMS ACQUISITION/DEVELOPMENT/MAINTENANCE (9+ podsekcji) 6.1-6.9+ incl. Network security, Network segmentation, Protection against malicious and unauthorised software. 7-11. Effectiveness assessments, basic cyber hygiene practices and cybersecurity training, cryptography, HR security, access control + MFA. 12. ASSET MANAGEMENT (5 podsekcji) 12.1 Asset management policy 12.2 Information classification (and handling) 12.3 Removable media policy 12.4 Asset inventory - hardware, software, dane, sub-processors, użytkownicy, klucze kryptograficzne, certyfikaty. 12.5 Deposit, return or deletion of assets upon termination of employment. 13. ENVIRONMENTAL AND PHYSICAL SECURITY (3 podsekcje) 13.1 Supporting utilities 13.2 Protection against physical and environmental threats 13.3 Perimeter and physical access control PLUS: Annex I National Frameworks, Annex II Glossary. PATTERN KAŻDEGO ROZDZIAŁU Pierwsze: cytat z odpowiedniego punktu Annexu Implementing Regulation 2024/2690 - co dokładnie tekst regulacji wymaga. Drugie: sekcja GUIDANCE - bullet points wyjaśniające jak wymóg interpretować, z odniesieniami do standardów ISO i frameworks (ISO/IEC 27005:2022, ISO/IEC 27001, NIST CSF). Trzecie: sekcja EXAMPLES OF EVIDENCE - konkretna lista artefaktów które audytor może zobaczyć podczas inspekcji. ADRESAT GŁÓWNY (per sub-sektory cyfrowej infrastruktury i usług ICT) Dostawcy DNS, rejestratorzy TLD, dostawcy chmury, centra danych, sieci dostarczania treści (CDN), dostawcy zarządzanych usług, dostawcy zarządzanych usług cyberbezpieczeństwa (MSSP), marketplace internetowe, wyszukiwarki, dostawcy social networking, dostawcy zaufania (trust service providers). Pośrednio - wszystkie essential/important entities pod NIS2 (energia, transport, finanse, zdrowie, administracja publiczna, sektor wodno-kanalizacyjny, kosmiczny, pocztowy/kurierski, gospodarki odpadami, chemii, żywności, produkcji wybranych krytycznych produktów, dostawcy cyfrowi, badania). DOKUMENT EXPLICITE ZAZNACZA "Non-binding i ma jedynie advisory character" - nie zastępuje krajowych wytycznych, ale daje wspólną mapę dla państw członkowskich. TRZYFILAROWY FILTR MATEMATIC BIERZEMY CZTERY OBSZARY NAJMOCNIEJSZE DLA POLSKIEJ KANCELARII: - Risk Management Framework (rozdz. 2.1) - dla polskiej kancelarii jako "important entity" pod NIS2 i jako administratora danych pod RODO art. 32 to jest fundament; risk treatment plan z 7 elementami plus mapping na ISO/IEC 27005:2022, jeden szablon dla art. 32 RODO i NIS2 art. 21. - Incident Handling (rozdz. 3.1-3.6) - kompletny lifecycle którego większość polskich podmiotów ma wdrożony fragmentarycznie; udokumentowana procedura raportowania wymagająca przez art. 23 NIS2 (early warning, incident notification, final report w określonych terminach), post-incident reviews z mechanizmem rejestracji wniosków na przyszłość. - Supply Chain Security (rozdz. 5.1-5.2) - inwentarz dostawców i sub-processor disclosure jako bezpośrednie odpowiedniki 12 klauzul DPA Kenneya z Aktualności AI Compliance for the Enterprise; ten sam artefakt w dwóch różnych aktach prawnych (art. 28 RODO, NIS2 art. 21). - Asset Management (rozdz. 12.1-12.5) - pełny inwentarz hardware/software/dane/sub-processors/użytkownicy/klucze kryptograficzne/certyfikaty jako fundament wszystkich innych dwunastu obszarów; brak jednego inwentarza w jednym miejscu = gap nr 12 z listy Kenneya (shadow AI unmanaged) plus naruszenie art. 32 RODO i NIS2 art. 21. FLAGUJEMY: - Dokument datowany na czerwiec 2025 - od publikacji minęło około 11 miesięcy. Sam Implementing Regulation 2024/2690 z 17.10.2024 nie został zmodyfikowany, ale ENISA zapowiada cykliczny review guidance we współpracy z Komisją Europejską i NIS Cooperation Group - aktualizacje będą dotyczyły mappingu na nowe standardy, nie samej struktury wymogów. - Krajowe wytyczne polskich organów (CSIRT NASK, CSIRT GOV, CSIRT MON, Minister Cyfryzacji) mogą iść głębiej w niektórych obszarach. - ENISA evidence list nie jest jedynym punktem odniesienia - entities w scope regulacji muszą sprawdzić pod jurysdykcją którego krajowego organu się znajdują (recital 7 Implementing Regulation). NIE ENDORSUJEMY: - Traktowania ENISA evidence listy jako jedynego punktu odniesienia bez sprawdzenia krajowego organu właściwego. - Wniosku że "wymóg jest spełniony bo mamy procedurę wdrożoną w praktyce" - bez udokumentowanej polityki, podpisanych kontraktów, zapisów zatwierdzeń przez zarząd, dla audytora wymóg nie istnieje. POLSKI MOSTEK Pierwsza linia. Polski organ właściwy: ustawa o krajowym systemie cyberbezpieczeństwa w nowelizacji NIS2 (status legislacyjny dynamiczny - aktualne na 9 maja 2026 weryfikuj na bieżąco). Funkcję organu właściwego ds. cyberbezpieczeństwa pełni Minister Cyfryzacji, operacyjnie współpracują CSIRT NASK (sektor cywilny), CSIRT GOV (sektor rządowy), CSIRT MON (sektor wojskowy) plus sektorowe CSIRT-y dla wybranych branż (interpretacja MateMatic, nie stanowisko Ministerstwa Cyfryzacji ani CSIRT). Druga linia. Mechanizm baseline-eskalacja: art. 32 RODO (baseline) plus art. 35 RODO (DPIA, eskalacja) plus NIS2 art. 21 i Implementing Regulation 2024/2690 plus ENISA Technical Guidance jako jeden proces zarządzania ryzykiem w czterech aktach prawnych - nie cztery oddzielne checkboxy. Trzecia linia. Tajemnica zawodowa: Karta Etyki Adwokata art. 19 i Kodeks Etyki Radcy Prawnego art. 14-17 wymagają ochrony tajemnicy w sposób który dla NIS2 art. 21 ust. 2 lit. e (encryption where appropriate) oznacza mocniejszy standard niż dla podmiotu nie świadczącego usług prawnych. Stack zero-cloud i lokalna inferencja AI jako spełnienie proportionality test (interpretacja MateMatic, nie stanowisko NRA ani KRRP). Cryptographic controls z rozdziału 9 ENISA guidance powinny być adaptowane do polskiej kancelarii z uwagą na ten dodatkowy wymiar. Czwarta linia. Powiązanie z RODO art. 33-34 (notification): NIS2 art. 23 wymaga notification do organów cyberbezpieczeństwa, RODO art. 33-34 do PUODO i podmiotów danych. Te dwa reżimy notyfikacji incydentów mają różne terminy, różne formularze, różnych adresatów - polska kancelaria musi mieć mechanizm który obsługuje oba w jednym przebiegu incident response. Procedura post-incident review (rozdz. 3.6) jest naturalnym miejscem do udokumentowania że oba reżimy zostały obsłużone. CO Z TEGO WYNIKA - REKOMENDACJA TRZEM GRUPOM - Polska kancelaria reprezentująca klienta z sektorów essential/important entities pod NIS2: dokument jako twardy fundament do przygotowania compliance roadmap. 13 obszarów = 13 workstreams, każdy z evidence list = konkretny deliverable. - Polska kancelaria jako potencjalne "important entity" pod NIS2 (jeśli powyżej progów): dokument jako checklista gap analysis. 13 obszarów, evidence list per obszar, mapping na art. 32 RODO i NIS2 art. 21. - Compliance officer kancelarii: roczny review polityki, kwartalny review approved tools list, post-incident review po każdym incydencie. Dyscyplinę wdrażasz raz, przegląd jest cykliczny. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH Pierwszy europejski dokument który przekłada wymogi cybersec NIS2 na konkretną listę evidence dla każdego z trzynastu obszarów - od policy, przez risk management i incident handling, po asset management i environmental security. Licencja CC BY 4.0 pozwala na pełne cytowanie i adaptację z atrybucją do ENISA - możemy budować polskie szablony bez pytania o zgodę. Razem z TOM 054 EDPB DPIA i TOM 045 Kenney Runtime Enforcement to operacyjny baseline dla polskiej kancelarii zarządzającej klientami pod NIS2 albo dla samej kancelarii jako "important entity" powyżej progów. CROSS-REFERENCE: BW/045 Kenney Runtime Enforcement (security cross-cutting capability), TOM 054 EDPB DPIA Guidelines (mechanizm baseline-eskalacja art. 32-35 RODO), TOM 056 Kenney Governing Intelligence Atlas (NIST AI RMF + ISO 42001), TOM 057 Lee LEGIT (reasoning evaluation), Aktualność 9 maja 2026 Kenney/Digital 520 AI Compliance for the Enterprise (12 klauzul DPA + 5 governance documents + sub-processor disclosure). --- - LEGIT obala final-answer-only RL w prawie. 24 tysiące drzew argumentów jako rubric audytu reasoning AI. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-09-lee-legit-legal-issue-tree-rubrics.html Autorzy: Jinu Lee (University of Illinois Urbana-Champaign), Kyoung-Woon On (LBOX), Simeng Han (Stanford University), Arman Cohan (Yale University), Julia Hockenmaier (University of Illinois Urbana-Champaign) Tytuł oryginału: Evaluating Legal Reasoning Traces with Legal Issue Tree Rubrics Źródło: arXiv:2512.01020v2 [cs.AI], 1 maja 2026 Strona arXiv: https://arxiv.org/abs/2512.01020 Licencja: arXiv preprint - cytowanie pod prawem cytatu (art. 29 ustawy o prawie autorskim i prawach pokrewnych). Koreańskie wyroki sądowe stanowiące korpus LEGIT nie są chronione prawem autorskim (Copyright Act of Republic of Korea, art. 7) - dokładnie tak jak polskie wyroki sądów powszechnych. Wszystkie sprawy zanonimizowane (przez sąd lub LBOX). MateMatic NIE hostuje PDF lokalnie - link do arXiv. Typ recenzji: Recenzja referencyjna · Paper akademicki Data publikacji recenzji MateMatic: 2026-05-09 POZYCJONOWANIE - DOMYКА TRIADĘ REASONING AI W PRAWIE Trzecia warstwa serii w bibliotece MateMatic: BW/002 Yin Reasoning Trap (PROBLEM - reasoning enhancement zwiększa halucynacje narzędziowe od dwu- do dziesięciokrotnie); BW/052 Stanford HAI AI Index 2026 plus LegalTech overlay z dziś rana (POMIAR - CaseLaw v2 GPT-5.1 73,4 procent, LegalBench top 15 modeli powyżej 83 procent w 4-pkt range, KaBLE benchmark dla first-person false belief); BW/057 LEGIT (METODOLOGIA NAPRAWY - drzewo argumentów jako rubric, którego CaseLaw v2 i LegalBench nie pokrywały). To nie monomania tematyczna - to naturalna progresja problem → pomiar → metodologia. CENTRALNA TEZA PAPERU Dotychczasowe benchmarki legal reasoning - od BertLaw 2016, przez Hwang i in. 2022, do LegalBench i CaseLaw v2 z 2025-2026 - oceniają LLM tylko po finalnej odpowiedzi. To, co działo się po drodze - jakich argumentów dotknął, jakie pominął, jakie pomylił - nie wchodzi w score. LEGIT pokazuje, dlaczego to nie wystarcza, i co zamiast. DATASET LEGIT 24 tysiące instancji z koreańskich sądów (cywilne i administracyjne - do 84,1 procent wszystkich spraw sądowych, czyli typ pracy który polska kancelaria gospodarcza, kontraktowa i administracyjna wykonuje codziennie). Test split 300 starannie ręcznie zweryfikowanych przykładów (100/100/100 easy/medium/hard, dzielone na liczbę kwestii w sprawie). Pipeline konstrukcji: Gemini-2.0-Flash z 3-shot examples kuratorowanymi przez autorów, dwukrotne wywołanie LLM (generation + validation), ręczna inspekcja na losowej próbce. DRZEWO ARGUMENTÓW JAKO STRUKTURA Korzeń: żądanie pozwu (purpose of claim). Każdy węzeł zawiera argument jednej ze stron i wniosek sądu co do tego argumentu (przyjęty/odrzucony). Węzły wyższego poziomu: konkretne przepisy prawa materialnego ("jeżeli wypadek był nagły, fortuitous i zewnętrzny, ubezpieczyciel jest zobowiązany do wypłaty"). Węzły niższe: commonsense inference na faktach ("jeżeli zmarły wcześniej kilkukrotnie tracił przytomność po piciu, prawdopodobnie pre-existing condition jest przyczyną śmierci"). Korzeń kończy się wnioskiem sądu - finalny order. Legal judgment prediction = backward chaining (top-down traversal) drzewa, iterujące dwie operacje: decomposition (identyfikacja child issues z given issue) i deduction (wnioskowanie z faktów i konkluzji child issues). LEGIT SCORE - 10 PUNKTÓW W TRZECH WYMIARACH - Final order correctness: 5 punktów (najważniejsze, fundament LJP) - Issue correctness: 3 punkty (3/N punktów per issue gdzie N = liczba węzłów non-root) - Issue coverage: 2 punkty (2/N punktów per issue covered) - Razem: maks 10 punktów Logika rozkładu: rozumowanie na każdej kwestii (3) ważniejsze niż samo wymienienie kwestii (2), bo właściwa konkluzja na issue wymaga znalezienia rationales i wnioskowania, nie tylko zaznaczenia tematu. Final order pozostaje najważniejszy ale nie jedyny - łącznie issue coverage + correctness dają 5 punktów, czyli tyle samo co finalny order. CZEGO CASELAW V2 I LEGALBENCH NIE POKRYWAŁY Oba mierzą finalny output, oba pomijają to co LEGIT explicite waży: czy model po drodze rozważył wszystkie kwestie i czy każdą rozumował poprawnie. Przykład praktyczny: dwa modele predykują "oddalić powództwo" - oba trafiają. Pierwszy szczegółowo analizuje warunki kontraktowe wypadku objętego polisą. Drugi wypisuje "oddalić" bez argumentacji. Dla CaseLaw v2 oba dostają tę samą ocenę za final answer. Dla LEGIT - pierwszy 10 punktów, drugi 5 z 10. Polski adwokat patrzący na output asystenta rozróżnia natychmiast - LEGIT to formalizuje. EMPIRYCZNE WYNIKI - OBALENIE FINAL-ANSWER-ONLY RL PARADIGM DeepSeek-R1 z grudnia 2024 popularyzuje paradygmat: trenuj LLM przez RL z prostą funkcją nagrody (+10 jeśli finalna odpowiedź poprawna, 0 w przeciwnym razie). Działa w matematyce i programowaniu - bo finalna odpowiedź jednoznaczna i sprawdzalna. W prawie zawodzi: - Gemma-3-4B (baseline): 4,02 LEGIT score (test) - Gemma-3-4B + final-answer-only RL: 4,31 - Gemma-3-4B + LEGIT rubric reward RL: 4,77 - Gemma-3-27B (baseline, dla porównania): 4,82 Sześciokrotnie mniejszy model dorównuje większemu jeśli trenujesz go z rubric reward. Co więcej, finalny order correctness u modelu trenowanego z final-answer-only jest NIŻSZY niż u modelu trenowanego z LEGIT rewards - mimo że final-answer reward był trenowany dokładnie na tej metryce. Optymalizacja jakości całego rozumowania daje lepsze wyniki niż optymalizacja samego finalnego output, nawet z punktu widzenia tego finalnego output. RAG COMPLEMENTARY Z RL RAG dorzuca 0,1-0,4 punktu LEGIT score, niezależnie od (generator, retriever) pair (BM25, Contriever, fine-tuned Contriever, ground-truth citations). Gain w wszystkich trzech komponentach (coverage, correctness, final order). RAG i RL to complementary - obie poprawy są dodatne, nie zastępują się. Dla polskiej kancelarii: lokalna inferencja + retrieval polskich aktów (kotwica RODO i tajemnica zawodowa) + opcjonalne fine-tuning na polskich rubric tree. RELIABILITY LLM-AS-A-JUDGE Strong LLMs (Gemini 2.5-Pro, GPT-4.1) osiągają wysoką inter-rater agreement z licencjonowanymi koreańskimi prawnikami w ocenach LEGIT - można używać jako automatyczny sędzia zamiast ręcznej weryfikacji. Słabsze open-source LLMs (mniejsze Gemma, EXAONE) - ograniczona zgodność. Implikacja: do oceny reasoning trace asystenta AI w kancelarii potrzebujesz modelu sędziowskiego klasy Gemini 2.5 Pro lub GPT-4.1 - mniejsze modele które polska kancelaria mogłaby uruchomić lokalnie nie nadają się jako automatyczny sędzia. CZEGO AUTORZY NIE POWIEDZIELI - POLSKI KOMPONENT 1. Adaptacja Issue Tree do polskiego porządku procesowego (KPC/KPA) - mechaniczna, nie strukturalna; common-law/civil-law różnica drugorzędna. 2. Art. 22 RODO i low-friction oversight - SCHUFA C-634/21 traktuje rubber-stamp review jako brak nadzoru; bez metryki LEGIT-podobnej partner nie ma narzędzia do rozróżnienia poprawnej argumentacji od poprawnej wyłącznie konkluzji (interpretacja MateMatic, nie stanowisko NRA ani KRRP). 3. Art. 15 EU AI Act accuracy - LEGIT-style trzy wymiary jako baseline metodologiczny dla dokumentacji zgodności high-risk AI w art. 9 AI Act. 4. Tajemnica zawodowa - issue coverage jako twarda metryka kompletności streszczeń opinii biegłego, zeznań świadka, pisma drugiej strony. CO Z TEGO WYNIKA - REKOMENDACJA TRZEM GRUPOM - Partnerom kancelarii rozważającym wdrożenie asystenta AI: konkretna mapa do audytu jakości output, nie tylko obserwacji wyników. - Compliance officerom przygotowującym DPIA zgodne z art. 9 AI Act i art. 35 RODO: baseline metodologiczny pomiaru accuracy w trzech wymiarach. - Zespołom legal-tech rozważającym fine-tuning modelu open-weight: empiryczny argument za RL z rubric reward zamiast final-answer-only RL. DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH Pierwsza poważna metodologia oceny jakości reasoning asystenta AI w prawie - drzewo argumentów jako rubric, trzy wymiary scoringu, empiryczny dowód że final-answer-only RL nie wystarcza. Adaptacja do polskich realiów wymaga zbioru zanonimizowanych spraw i polskich przykładów 3-shot - prac mierzalnych w tygodniach, nie miesiącach, ze skalą zależną od reprezentatywności korpusu. Wartość: konkretne narzędzie dla audytora, mierzalne wejście dla DPIA, argument za rubric-based fine-tuningu zamiast final-answer-only RL przy własnym modelu open-weight. CROSS-REFERENCE: BW/001 (Governing Agents - art. 22 SCHUFA, four regimes), BW/002 (Yin Reasoning Trap), BW/045 (Runtime Enforcement Kenney), BW/052 (Stanford HAI AI Index 2026 - pełna recenzja flagowa), BW/056 (Kenney Governing Intelligence atlas - opublikowany 9.05.2026 rano), Aktualność 9.05.2026 rano (Stanford HAI LegalTech overlay - CaseLaw v2 i KaBLE). --- - Atlas dla compliance officera w czterech jurysdykcjach. Kenney składa książkę z paperów, które już znamy. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-09-kenney-governing-intelligence-book.html Autor: Noah M. Kenney (Founder Digital 520, President Disruptive AI Lab, President Ethical Tech Forum) Tytuł oryginału: Governing Intelligence: Law, Privacy, Security, and Compliance in the Age of Artificial Intelligence Wydawca: Digital 520 (publikacja własna) Edycja: First Edition Rok: 2026 Objętość: 487 stron, 20 rozdziałów numerowanych, 5 aneksów, glosariusz blisko 250 pojęć, bibliografia Licencja: © 2026 Noah M. Kenney, All Rights Reserved. Recenzja referencyjna MateMatic pod prawem cytatu (art. 29 ustawy o prawie autorskim i prawach pokrewnych). MateMatic NIE hostuje PDF lokalnie. Link do autora: noahkenney.com. Link do oficyny: digital520.com. Typ recenzji: Recenzja flagowa · Synteza referencyjna · Tom flagowy serii Kenneya Data publikacji recenzji MateMatic: 2026-05-09 POZYCJONOWANIE W BAZIE WIEDZY MATEMATIC Trzeci tom autorstwa Noah M. Kenney w naszej bibliotece, ale pierwszy poświęcony jego pełnej książce. Tom flagowy serii. Dwa wcześniejsze papery autora są fragmentami rozszerzonymi w tym wydaniu książkowym: BW/001 Governing Agents (mapowanie czterech reżimów na agenty AI; w książce rozdziały 4-7 i 18) oraz BW/045 Runtime Enforcement and the AI Governance Stack (companion paper; w książce rozdziały 8-9 i fragmenty 16). Trzy materiały tego samego autora to nie powtórki, tylko warstwy: paper 1 - fokus na agentach, paper 2 - runtime enforcement, książka - całościowy atlas dwudziestu obszarów compliance. KONSTRUKCJA KSIĄŻKI - DWIE WARSTWY Warstwa 1 - komparatystyka regulacyjna: rozdział 4 (EU AI Act), rozdział 5 (USA - federalny i stanowy), rozdział 6 (inne kraje - UK, Kanada, Singapur, Brazylia, Indie), rozdział 7 (Chiny - Cyberspace Administration of China, generatywna AI od 2023, interim measures, podejście authoritarian-state). Warstwa 2 - warsztat praktyka: rozdziały 8-20 (ramy etyczne, governance lifecycle, model auditing, sektorowy compliance dla finansów, zdrowia, edukacji, zatrudnienia, AI Privacy Engineering, security, post-incident management, GenAI risk, agenty AI, wdrożenie korporacyjne). Aneksy: A (regulatorzy), B (organizacje), C (lista źródeł), D (szablon raportu z audytu AI), E (glosariusz blisko 250 pojęć). TRZYFILAROWY FILTR MATEMATIC BIERZEMY: komparatystyka czterech jurysdykcji (rozdz. 4-7) - mapa, do której zaglądasz, gdy klient pyta o reżim, którego nie znasz. NIST AI RMF jako wspólny język między regulacjami i ISO/IEC 42001. Aneks D - szablon audytu - jeden z najlepszych w komercyjnej publikacji, sekcje: scope, methodology, governance findings, technical findings, risk classification (critical/high/medium), remediation tracking 30/90/180/365 dni, management response, peer review. Aneks E - słownik blisko 250 pojęć (adversarial robustness, calibration, conformity assessment, counterfactual explanation, data poisoning, differential privacy, federated learning, model card, model drift, bias drift, jailbreak, RAG) - zasilenie naszego słownika definicje.html. Ramy etyczne (rozdz. 3) - 7 zasad fundamentalnych (fairness, transparency, accountability, privacy, safety, beneficence, autonomy) i 9 ram porównawczych (IEEE EAD, OECD AI Principles, UNESCO Recommendation, Beijing AI Principles). NIE ENDORSUJEMY: US-centryzm regulacyjny - NYC Local Law 144 (audyt bias dla narzędzi rekrutacyjnych), BIPA (Biometric Information Privacy Act stanu Illinois), FERPA (ochrona danych studentów), FTC Section 5 enforcement, Colorado AI Act, Texas Data Privacy and Security Act - dla polskiej kancelarii to kontekst dla klienta z amerykańską spółką-matką, nie podstawa. Compliance-by-vendor jako podejście domyślne - autor operuje w modelu "kupujesz narzędzie z DPA i model cards, dostajesz compliance"; w Polsce dla kancelarii zarządzającej tajemnicą zawodową niewystarczające. Daty EU AI Act sprzed AI Act Omnibus z 7 maja 2026 - książka podaje 2.02.2025 (zakaz unacceptable risk), 2.08.2025 (general-purpose AI), 2.08.2026 (cały framework dla high-risk); zaktualizowane przez Omnibus: high-risk Annex III - 2 grudnia 2027, high-risk Annex I - 2 sierpnia 2028, art. 50(2) o oznaczaniu treści generowanych - 2 grudnia 2026. POLSKI MOSTEK (gdzie dopisujemy własną warstwę): polski mostek jurysdykcyjny - czytaj każdy rozdział z pytaniem, jak mapuje się na art. 9 AI Act (system zarządzania ryzykiem dostawcy), art. 6 plus Annex III (wysokie ryzyko), art. 26 (obowiązki użytkownika), art. 50 (transparentność), art. 72 (post-market monitoring); RODO art. 32 (środki techniczne i organizacyjne) i art. 35 (DPIA) jako kotwica - zob. BW/054 EDPB DPIA Guidelines; tajemnica zawodowa adwokacka (art. 6 Prawa o adwokaturze) i radcowska (art. 3 ustawy o radcach prawnych) jako twarda bariera (interpretacja MateMatic, nie stanowisko NRA ani KRRP). EU AI Act Omnibus jako filtr aktualizacyjny dla każdego fragmentu o terminach. Stack zero-cloud jako alternatywa dla compliance-by-vendor (lokalna inferencja, dane nie opuszczają środowiska kancelarii). Decyzja jako jednostka pracy zamiast governance na poziomie systemu - granularność, której polska praktyka kancelaryjna potrzebuje. TABELA REFERENCYJNA - WARTOŚĆ ROZDZIAŁÓW DLA PL KANCELARII Rozdz. 4 (EU AI Act) - wysoka, ale daty zaktualizować Omnibusem. Rozdz. 5 (USA federal i stanowy) - kontekst dla klienta z USA, nie dla PL administratora. Rozdz. 6 (UK, Kanada, inne) - punkt odniesienia dla klienta międzynarodowego. Rozdz. 7 (Chiny) - tylko jeśli klient operuje w CN. Rozdz. 3 (etyka i ramy porównawcze) - baseline dla warsztatu zarządu, lokalizować do Karty Etyki Adwokata i Kodeksu Etyki Radcy Prawnego. Rozdz. 11 (AI Privacy Engineering) - wysoka wartość, dopełnienie RODO art. 25 (Privacy by Design). Rozdz. 13-14 (sektory regulowane) - wybiórczo: finanse i zdrowie tak, inne raczej nie. Rozdz. 18 (agenty AI) - patrz BW/001, już omówione. Aneks D (szablon audytu) - bardzo wysoka, adaptacja na PL nie wymaga dużej pracy. Aneks E (glosariusz) - wysoka, zasilenie naszego słownika MateMatic. CROSS-REFERENCE BW/001 (Governing Agents - Kenney 2026), BW/045 (Runtime Enforcement - Kenney 2026), BW/054 (EDPB Guidelines on DPIA - mechanizm baseline-eskalacja), Aktualności 7.05.2026 (EU AI Act Omnibus daty referencyjne). Disclaimer interpretacji prawnych: tajemnica zawodowa adwokacka i radcowska - interpretacja MateMatic, nie stanowisko NRA ani KRRP. WERDYKT DLA ZARZĄDU KANCELARII W TRZECH ZDANIACH Atlas referencyjny do bibliotek kancelarii zarządzających klientami z amerykańską ekspozycją lub międzynarodowym portfelem AI. Wartość najwyższa w komparatystyce regulacyjnej (rozdziały 4-7), AI Privacy Engineering (rozdział 11) i szablonie audytu (Aneks D), ale daty EU AI Act trzeba zaktualizować z Omnibus z 7 maja 2026 (Annex III - 2 grudnia 2027), a stack zero-cloud i tajemnicę zawodową dopisać samodzielnie. Razem z BW/001 i BW/045 buduje serię Kenneya - trzy uzupełniające się warstwy, nie powtórki. --- - Leiden i TNO pytają 112 pracowników: czy mały model RAG wystarczy do zadań z wrażliwymi danymi. Odpowiedź zmienia rachunek dla kancelarii. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-06-froma-rag-assistants-model-size-human-ai.html Autorzy: Lennard C. Froma, Tom Kouwenhoven, Maaike H.T. de Boer, Catholijn M. Jonker, Max J. van Duijn (Leiden University LIACS, TNO - Netherlands Organisation for Applied Scientific Research, TU Delft) Tytuł oryginału: Seeking Information with RAG-Assistants: Does Model Size Matter in Human-AI Collaborations? Źródło: arXiv:2605.00964v1 [cs.IR], 1 maja 2026 Licencja: arXiv preprint - brak jawnej licencji CC-BY. Recenzja referencyjna MateMatic pod prawem cytatu (art. 29 ustawy o prawie autorskim i prawach pokrewnych). MateMatic nie hostuje PDF lokalnie. Typ recenzji: Recenzja referencyjna · Badanie empiryczne Data publikacji recenzji MateMatic: 2026-05-06 CENTRALNY WYNIK BADANIA Human-AI hybrid (człowiek interagujący z RAG-asystentem przez wiele tur) zawsze bije LLM-only i LLM+RAG baseline - niezależnie od rozmiaru modelu (N=112, trzy warunki eksperymentalne, accuracy mierzona przez dwóch niezależnych raterów). Postrzegana użyteczność i satysfakcja użytkownika statystycznie porównywalna dla modeli 3B/8B/70B - autorzy nazywają to "nuanced trade-off". Modele 3B i 8B lokalnie deployowalne: "can be deployed in edge computing supporting full control over privacy-sensitive data handling" (cytat z pracy). Scenariusz projektowany z EU AI Act compliance i wrażliwymi danymi jako explicit constraint. TRZY WYNIKI EMPIRYCZNE Wynik 1: Human-AI hybrid zawsze wygrywa - statystycznie istotna przewaga nad LLM-only i LLM+RAG baseline niezależnie od rozmiaru modelu. Human-in-the-loop nie jest tylko kwestią compliance - jest kwestią efektywności. Wynik 2: Satysfakcja użytkownika nie rośnie proporcjonalnie z parametrami - postrzegana użyteczność porównywalna dla 3B/8B/70B. Subiektywna ocena nie odzwierciedla różnicy w accuracy obiektywnej. Wynik 3: Małe modele wystarczają do lokalnego RAG z wrażliwymi danymi - 3B/8B lokalnie deployowalne z pełną kontrolą nad danymi, zmniejszony footprint środowiskowy, EU AI Act compliance jako motywacja projektowa. TRZYFILAROWY FILTR MATEMATIC CO BIERZEMY: empiryczny dowód za lokalnym RAG z małymi modelami (scenariusz z wrażliwymi danymi i EU AI Act compliance jako explicit constraint); walidacja HITL jako mechanizm obiektywnie poprawiający accuracy (nie tylko wymóg compliance); kontrintuicyjny wynik satysfakcji zmienia rachunek decyzyjny dla kancelarii rozważającej lokalny RAG. CO WYMAGA KONTEKSTU: scenariusz anglojęzyczny nie prawniczy - brak bezpośredniego transferu do polskich aktów, sporządzania pism, cytowania orzecznictwa; uczestnicy nie byli prawnikami (brak deontologii KEA/KERP, odpowiedzialności za treść pisma procesowego); accuracy obiektywna rośnie z rozmiarem modelu - dla zadań wymagających wysokiej precyzji (cytowanie przepisów, analiza wyroku WSA) weryfikacja progu przed wyborem 3B obowiązkowa. CZEGO NIE ENDORSUJEMY: traktowania "3B wystarczy" jako universal argument za najtańszym rozwiązaniem bez walidacji na własnych danych prawniczych; pomijania języka polskiego - Bielik lub PLLuM dają lepszy punkt startowy dla polskich tekstów prawnych niż generyczny anglojęzyczny 3B (cross-ref BW/036 Kuśmierek). MAPPING NA POLSKIE INSTRUMENTY Tajemnica zawodowa KEA i KERP: lokalny deployment modelu 3B/8B na sprzęcie kancelarii lub w zamkniętym środowisku sieciowym - dane nie wychodzą do zewnętrznego API. Art. 6 prawa o adwokaturze, art. 6 KEA, art. 3 ustawy o radcach prawnych, KERP. Kancelaria używająca zewnętrznego RAG przez API bez DPA z dostawcą działa w obszarze ryzyka naruszenia tajemnicy zawodowej - na gruncie art. 6 KEA i art. 3 ustawy o radcach - interpretacja MateMatic, nie formalne stanowisko NRA ani KIRP. RODO art. 32: lokalny deployment modelu jako środek techniczny adekwatny do ryzyka (zamiast przesyłania danych do zewnętrznego API) - bezpośrednia implementacja art. 32 dla operacji przetwarzania z aktami klientów. AI Act art. 14 (nadzór ludzki): wynik human-AI hybrid zawsze > LLM-only to empiryczna walidacja, że HITL nie jest tylko compliance checkbox - jest mechanizmem obiektywnie poprawiającym accuracy. Art. 14 AI Act i art. 32 RODO wskazują w tym samym kierunku co dane z N=112. Zero-cloud stack dla kancelarii: małe modele 3B/8B wystarczają dla zadań RAG z wrażliwymi danymi - empiryczne wsparcie dla warstwy modelu językowego w architekturze zero-cloud MateMatic (Bielik/PLLuM/Llama on-premise). Zastrzeżenie: scenariusz anglojęzyczny - testy z modelem polskojęzycznym na własnym zbiorze dokumentów kancelarii przed wdrożeniem produkcyjnym. POWIĄZANIA Z BW I MATEMATIC Cross-reference: BW/036 Kuśmierek (polska wobec AGI - lokalne LLM dla polskich tekstów prawnych), BW/051 Supesu (87 procent adopcji AI bez rozróżnienia DPA), BW/053 Five Eyes (art. 32 mapping dla narzędzi AI), BW/054 EDPB DPIA (mechanizm baseline-eskalacja dla oceny ryzyka RAG w kancelarii). CO MateMatic WNIESIE: warsztat Lokalny RAG dla kancelarii - od wyboru modelu open-weight (Bielik/PLLuM/Llama) do walidacji accuracy na polskich aktach, konfiguracja lokalnego RAG bez danych wychodzących poza sieć kancelarii, deployment zgodny z art. 32 RODO i tajemnicą zawodową KEA/KERP, deliverable: działający prototyp lokalnego RAG plus protokół weryfikacji accuracy plus mapa ryzyk wdrożenia. Autor recenzji: Wiesław Mazur - MateMatic. ### BW/054 - EDPB Guidelines on DPIA (2026): szablon to efekt uboczny. Mechanizm baseline-eskalacja od ISO TR 13335 do AI Act to fundament. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-06-edpb-guidelines-dpia-template-baseline-eskalacja.html Wydawca: European Data Protection Board (EDPB) - Guidelines on Data Protection Impact Assessment, projekt wytycznych opublikowany 14.04.2026, konsultacje publiczne do 9.06.2026 (edpb.europa.eu). Następca wytycznych WP29 (WP248 rev.01, 2018). Licencja: dokument publiczny EDPB - recenzja MateMatic pod prawem cytatu (art. 29 ustawy o prawie autorskim i prawach pokrewnych). CENTRALNY ARGUMENT: Mechanizm baseline-eskalacja w zarządzaniu ryzykiem nie pochodzi z RODO. Pochodzi z ISO/IEC TR 13335-3:1998 - "Guidelines for the Management of IT Security, Part 3: Techniques for the management of IT security" (poprzednik ISO 27005). RODO wpisało ten mechanizm do art. 32 (baseline - ocena ogólna ryzyka dla praw i wolności osób fizycznych dla całej organizacji) i art. 35 (eskalacja - DPIA dla operacji mogących powodować wysokie ryzyko) bez przypisu do normy technicznej. AI Act art. 9 plus Annex III dodaje trzeci poziom tej samej piramidy. Nowy szablon EDPB to narzędzie dokumentowania mechanizmu - nie zmiana mechanizmu. Kancelaria bez procesu art. 32 pod spodem nie poprawi compliance przez wypełnienie szablonu DPIA. CZTERY POZIOMY HISTORYCZNE: 1998 ISO/IEC TR 13335-3 (dwupoziomowy model - ocena ogólna plus eskalacja do szczegółowej przy wysokim ryzyku, standard roboczy specjalistów bezpieczeństwa IT przez ponad dekadę); 2011 ISO/IEC 27005 (mechanizm przejęty i sformalizowany w rodzinie norm 27000, globalny standard audytów bezpieczeństwa informacji do dziś); 2018 RODO art. 32 plus art. 35 (mechanizm wpisany w prawo UE - art. 32 jako baseline administrator danych, art. 35 DPIA jako eskalacja precyzyjnie wyzwalana przez wysokie ryzyko konkretnej operacji); 2024 AI Act art. 9 plus Annex III (trzeci poziom tej samej piramidy - ciągły system zarządzania ryzykiem dla dostawców AI wysokiego ryzyka, eskalacja do oceny zgodności i external audit przez jednostkę notyfikowaną). ART. 32 I ART. 35 RODO - JEDEN PROCES, NIE DWA CHECKBOXY: Art. 32 to baseline całej organizacji - ocena ryzyka dla praw i wolności osób fizycznych dla wszystkich operacji przetwarzania, dobór środków technicznych i organizacyjnych adekwatnych do tego ryzyka. Art. 35 to eskalacja precyzyjnie wyzwalana: operacja przetwarzania, która "może powodować wysokie ryzyko" - czyli gdy ocena z art. 32 wskazuje wysokie ryzyko dla konkretnej operacji. DPIA nie jest projektem równoległym do art. 32 - jest jego kontynuacją dla przypadków wysokiego ryzyka. Kancelaria zamawiająca DPIA bez wcześniejszej oceny art. 32 robi eskalację bez baseline'u: poprawny dokument, błędna kolejność działań, niezmienione ryzyko rzeczywiste. TRZYFILAROWY FILTR MateMatic: CO BIERZEMY - szablon jako punkt wyjścia do ustrukturyzowania procesu art. 32 dla kancelarii bez formalnego rejestru czynności przetwarzania (struktura szablonu DPIA pozwala zrozumieć co RODO wymaga w warstwie oceny ryzyka); logika eskalacji potwierdzona przez EDPB 2026; okno konsultacji do 9.06.2026 aktywne (kancelarie mogą zgłaszać uwagi przez KIRP, NRA lub bezpośrednio do EDPB). CO WYMAGA KONTEKSTU - projekt roboczy nie normatywny, wersja finalna może się różnić od projektu, stosować jako roboczy nie gotowy standard; szablon dotyczy jednej operacji przetwarzania - nie zastępuje rejestru art. 30 RODO ani ogólnej polityki zarządzania ryzykiem art. 32; kancelaria bez rejestru art. 30 i polityki art. 32 powinna zacząć od tych fundamentów, nie od szablonu DPIA. CZEGO NIE ENDORSUJEMY - traktowania szablonu DPIA jako produktu compliance do odhaczenia bez procesu art. 32 pod spodem (DPIA bez baseline to dokument bez wartości operacyjnej); pominięcia warstwy AI Act przez kancelarie-deployer narzędzi AI (AI Act art. 9 nakłada obowiązki analogiczne do art. 32 RODO). MAPPING NA POLSKIE INSTRUMENTY: RODO art. 32 - polska kancelaria prawna jest administratorem danych klientów; art. 32 wymaga oceny ryzyka i doboru środków adekwatnych do ryzyka dla każdej operacji przetwarzania, w tym dla narzędzi AI używanych w pracy z aktami klientów; kancelaria używająca zewnętrznych narzędzi AI do analizy akt klientów bez oceny art. 32 i bez weryfikacji wyzwalacza art. 35 działa poza ramami RODO niezależnie od posiadania klauzul w umowach z klientami. RODO art. 35 DPIA - wyzwalacze dla polskiej kancelarii: systematyczna analiza danych wrażliwych klientów przez zewnętrzny system AI, profilowanie klientów na potrzeby marketingu usług prawnych, systemy podejmowania decyzji z istotnym skutkiem dla klienta. AI Act art. 9 i art. 26 - kancelaria wdrażająca system AI do obsługi spraw jest deployer w rozumieniu AI Act; art. 9 nakłada na dostawców obowiązek systemu zarządzania ryzykiem przez cały cykl życia systemu - deployer dziedziczy część tych obowiązków przez art. 26; mechanizm analogiczny do art. 32/35 RODO: ocena ryzyka systemu AI (baseline) plus eskalacja do formalnej oceny zgodności dla systemów z Annex III. AI Act Annex III - lista systemów wysokiego ryzyka obejmuje wymiar sprawiedliwości, egzekwowanie prawa, zarządzanie migracją; kancelarie obsługujące klientów z tych obszarów weryfikują czy narzędzia AI klienta lub własne trafiają na listę. NIS2/KSC - nowelizacja ustawy o krajowym systemie cyberbezpieczeństwa podpisana 19.02.2026, wejście w życie 3.04.2026, rozszerzenie z 7 do 18 sektorów; kancelarie obsługujące podmioty kluczowe mogą dziedziczyć obowiązki jako podmioty trzecie w łańcuchu dostawców; mechanizm baseline-eskalacja z RODO art. 32/35 daje gotową strukturę analizy ryzyka bezpieczeństwa informacji wymaganej przez NIS2 bez reinwencji koła dla każdej regulacji osobno. USE CASE'Y: compliance officer/IOD kancelarii budujący politykę przetwarzania danych - obowiązkowo (mechanizm art. 32/35 jako architektura a nie dwie osobne procedury); adwokat doradzający klientowi-spółce wdrażającej AI - obowiązkowo (AI Act art. 9 jako trzeci poziom tego samego mechanizmu, argument do zarządu klienta); adwokat reprezentujący stronę w postępowaniu przed UODO - tak (brak procesu art. 32 pod spodem DPIA to argument w postępowaniu); IOD organów administracji publicznej wdrażających AI - obowiązkowo (trzy poziomy piramidy mapują się na trzy reżimy regulacyjne jednocześnie: RODO, AI Act, NIS2); partner zarządzający kancelarii 5-30 osobowej bez compliance officera - tak selektywnie (argument historyczny 1998-2024 jako narzędzie edukacji zarządu, "eskalacja bez baseline to błędna kolejność" jako argument do inwestycji w politykę wewnętrzną); solo praktyk i kancelaria 1-3 osobowa - selektywnie (baza art. 32 obowiązkowa dla każdej kancelarii, art. 35 wyzwalany przez konkretne operacje wysokiego ryzyka); kancelaria bez klientów z sektorów Annex III AI Act - tak w zakresie RODO art. 32/35, selektywnie w zakresie AI Act. POWIĄZANIA Z BW: BW/053 Five Eyes Careful adoption agentic AI (pięć ryzyk agentic AI zmapowanych na art. 32 RODO i NIS2 - direct complement; mechanizm art. 32/35 z BW/054 jako regulacyjny kontekst dla pięciu ryzyk Five Eyes); BW/049 Uberti-Bona Marin techno-normative AI accuracy (AI Act art. 9-15 i cztery techno-normative choices - direct partner; AI Act art. 9 jako trzeci poziom mechanizmu baseline-eskalacja z BW/054); BW/039 RAII Policy Template (struktura polityki AI - BW/054 dostarcza historyczny argument za architekturą zamiast procedury); BW/030 ENISA Security-by-Design (security cross-cutting - analogia do mechanizmu baseline-eskalacja w zarządzaniu ryzykiem bezpieczeństwa). Cross-reference do Aktualności 6.05.2026 EDPB (kontekst rynkowy, konsultacje do 9.06.2026). Razem z BW/053 Five Eyes i BW/049 Uberti-Bona zamyka triadę: ryzyko agentic AI (operacyjne) plus ryzyko accuracy AI (metodologiczne) plus architektura compliance (regulacyjna) - trzy warstwy jednego systemu zarządzania ryzykiem dla kancelarii. CO MateMatic WNIESIE: warsztat architektura ryzyka dla kancelarii - RODO art. 32/35 plus AI Act art. 9 jako jeden proces; mapowanie operacji przetwarzania kancelarii na wyzwalacze art. 35 RODO; analiza systemów AI kancelarii pod AI Act art. 9 i Annex III; połączenie obu warstw w spójny rejestr ryzyka z planem działań; deliverable mapa ryzyka kancelarii plus lista operacji wymagających DPIA lub oceny zgodności AI Act plus plan zamknięcia luk przed inspekcją UODO lub notyfikowaną jednostką AI Act. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/053 - Sześć agencji rządowych Five Eyes pisze przewodnik bezpieczeństwa agentic AI. Pięć ryzyk plus lifecycle czterech etapów. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-04-five-eyes-careful-adoption-agentic-ai.html Wydawca: Joint authoring agencies - Australian Signals Directorate's Australian Cyber Security Centre (ASD's ACSC) jako lead authoring agency, United States Cybersecurity and Infrastructure Security Agency (CISA), United States National Security Agency (NSA), Canadian Centre for Cyber Security (Cyber Centre), New Zealand National Cyber Security Centre (NCSC-NZ), United Kingdom National Cyber Security Centre (NCSC-UK). Tytuł: "Careful adoption of agentic AI services". Stron: 28+. Data: 2025/2026 (cytuje OWASP 2025 Top 10 LLM/GenAI plus 2025 Minimum Elements for SBOM jako referencje). Sześć authoring agencies to Five Eyes (sojusz wywiadowczy USA, Wielka Brytania, Kanada, Australia, Nowa Zelandia - tradycyjnie jedna agencja per kraj) z rozszerzeniem o drugą agencję USA: oprócz NSA udział wzięła także CISA, cywilna agencja Department of Homeland Security odpowiedzialna za ochronę krytycznej infrastruktury USA. Adresat: government, critical infrastructure i industry stakeholders. Dokument koncentruje się na agentic AI opartym na large language models (LLM), pokrywa zagrożenia, podatności i ryzyka wynikające z zachowania agentic AI. Licencja: Creative Commons Attribution 4.0 International (CC BY 4.0). MateMatic hostuje PDF lokalnie z atrybucją do sześciu agencji autorskich (link "Pobierz oryginał" na stronie tomu). Materiał public-interest, dystrybuowany bezpłatnie przez ASD ACSC i partnerów. Status: oficjalna joint guidance koordynowana przez Five Eyes z dwoma agencjami USA - najwyższy autorytet cyberbezpieczeństwa w świecie zachodnim. Nie jest to vendor publication - autorskie agencje są neutralne wobec dostawców AI. Threat intelligence dla agentic AI nadal się rozwija - autorskie agencje wprost wskazują, że istniejące frameworki jak OWASP 2025 Top 10 LLM/GenAI Apps i MITRE ATLAS nie pokrywają jeszcze wszystkich attack vectors specyficznych dla agentic AI. CENTRALNA REKOMENDACJA agencji autorskich jest jednoznaczna: "never granting agentic AI broad or unrestricted access, especially to sensitive data or critical systems; only use agentic AI for low-risk and non-sensitive tasks; align agentic AI risks and mitigation strategies with your organisation's existing security model and risk posture". STRUKTURA DOKUMENTU - 28+ stron z czterema głównymi częściami: (a) Definicja agentic AI i odróżnienie od generative AI (sekcje "What is agentic AI?", "How is it different from generative AI?", "Broader agentic AI security considerations" obejmujące Inherited risks of LLMs, Increased attack surface, Increased complexity, Evolving security as technology matures, AI security as part of cyber security). (b) Pięć kategorii ryzyk specyficznych dla agentic AI (sekcja "Agentic AI security risks"). (c) Best practices w czterech etapach lifecycle (sekcja "Best practices for securing agentic AI systems"). (d) Defend against future risks (sekcja końcowa) plus Conclusion plus Further information plus Appendix A - cyber security prerequisites before implementation of AI agents. PIĘĆ KATEGORII RYZYK SPECYFICZNYCH DLA AGENTIC AI: 1. PRIVILEGE RISKS (s. 7) - uprawnienia agenta i ich nadużycie. Agentic AI z definicji wykonuje akcje w imieniu użytkownika (czyta pliki, wysyła wiadomości, modyfikuje dane, wywołuje API). Każda z tych akcji wymaga uprawnień. Privilege risks obejmują: nadmierne uprawnienia agenta ponad to co potrzebne do zadania, eskalacja uprawnień (agent uzyskuje dostęp do zasobów do których nie powinien), przekazanie uprawnień osobom trzecim (agent działa w imieniu użytkownika ale faktycznie pod kontrolą atakującego), brak segmentacji dostępu między rolami. Polska kancelaria mapuje to na art. 32 RODO zasadę least privilege: agent obsługujący sprawy spadkowe nie ma dostępu do akt karnych, agent prowadzący kalendarz spotkań nie czyta wiadomości email klientów. Cross-reference do Aktualności 30.04.2026 Workspace MCP scoping - scope'y MCP (drive vs drive.file, gmail.readonly vs gmail.modify) to operacjonalizacja Privilege risks. Bez świadomego podziału scope'ów agent narusza zasadę least privilege z dnia pierwszego. 2. DESIGN AND CONFIGURATION RISKS (s. 9) - błędy projektowe. Ryzyko nie wynika z błędu LLM ani złośliwości aktora, tylko z błędnej konfiguracji systemu agentic AI. Klasyczne przykłady: domyślne hasła w deployment, błędna integracja z systemami źródłowymi, nieaktualne komponenty open-source w stosie, brak walidacji wejścia, brak rate limiting, błędna interpretacja roli systemowej (system prompt) przez LLM. Polska kancelaria nie potrzebuje atakującego żeby ponieść szkodę - wystarczy własna konfiguracja. Mapping na art. 32 RODO: środki techniczno-organizacyjne adekwatne do ryzyka muszą obejmować nie tylko obronę przed atakiem ale też walidację własnej konfiguracji. 3. BEHAVIOUR RISKS (s. 9) - nieprzewidywalne zachowanie LLM. Trzecia kategoria przejmuje znane ryzyka LLM (halucynacja, jailbreak, prompt injection) i przesuwa je do warstwy agenta autonomicznie wykonującego akcje. Halucynacja w czacie LLM jest niewygodna, halucynacja u agenta z dostępem do API jest niebezpieczna - agent może wygenerować fałszywą nazwę pliku i nadpisać dokument klienta, halucynować numer rachunku i przelać środki nie tam gdzie trzeba, podstawić błędną sygnaturę i wysłać pismo procesowe do niewłaściwego sądu. Cross-reference do BW/049 Uberti-Bona Marin techno-normative AI accuracy zamyka tę lukę formalnie - cztery techno-normative choices są audytem ryzyka behaviour. Halucynacja agenta nie jest błędem oprogramowania, jest właściwością modelu, którą trzeba traktować jak każde inne ryzyko zawodowe. 4. STRUCTURAL RISKS (s. 11) - kompleksowość integracji. Agentic AI rzadko działa w izolacji - jest częścią pipeline z bazą danych, systemem plików, zewnętrznymi API, innymi agentami. Każde połączenie to powierzchnia ataku. Każdy upgrade jednego komponentu może zerwać założenia bezpieczeństwa innego. Sześć agencji wprost wskazuje na increased complexity jako fundamentalne ryzyko agentic AI - kompleksowość integracji rośnie szybciej niż pojemność zarządzania nią. Polska kancelaria budująca pipeline LegalTech (DMS plus model lokalny plus agent obsługi klienta plus integracja z e-PUAP plus eksport do TFI) musi prowadzić rejestr struktury z mapą zależności - system- theoretic approach rekomendowany na końcu dokumentu nie luksus akademicki ale warunek audytu. 5. ACCOUNTABILITY RISKS (s. 12) - rozproszona odpowiedzialność. Najbardziej istotny dla prawnika obszar - kto odpowiada gdy agent popełnił błąd. Tradycyjnie odpowiedzialność jest u operatora oprogramowania. Przy agentic AI łańcuch jest dłuższy: dostawca modelu (OpenAI, Anthropic, Google), dostawca platformy agentic (Replit, AutoGPT, Anthropic Claude Computer Use), integrator wewnętrzny kancelarii, prawnik korzystający, klient końcowy. Każde ogniwo może zrzucić odpowiedzialność na poprzednie. Polski adwokat odpowiada za starania zawodowe wobec klienta (art. 7 KEA, art. 4 KERP) niezależnie od tego czy używał agenta - argument "to model się pomylił" nie jest argumentem deontologicznym. Mapping na AI Act art. 26: deployer (kancelaria) ma obowiązki dokumentacji, nadzoru i raportowania incydentów - łańcuch odpowiedzialności kończy się u deployer dla obowiązków pod AI Act, ale rozciąga się dalej dla obowiązków cywilnoprawnych. LIFECYCLE CZTERECH ETAPÓW BEST PRACTICES: 1. DESIGNING SECURE AGENTS (s. 14) - principles przy projektowaniu: clear bounds of authority dla agenta, segregacja zadań pomiędzy agentami (jeden agent jeden cel), zasada least privilege wbudowana w architekturę nie dodawana ex post, human-in-the-loop dla decyzji o wysokim ryzyku, audit logs by-design (nie jako add-on). Polska kancelaria wdrażająca agentic AI w 2026 dostaje gotową checklist do audit zaplanowanej architektury zanim padnie pierwsza linia kodu. 2. DEVELOPING SECURE AGENTS (s. 16) - bezpieczne kodowanie: secure SDLC, walidacja inputu, sanityzacja outputu, threat modeling, dependency management (w tym dla bibliotek AI/ML), code review obejmujący prompty systemowe (system prompt jako kod), testy bezpieczeństwa specyficzne dla agentic (czerwony team agentic, testy prompt injection, testy nieautoryzowanego użycia uprawnień). Procurement: SBOM (Software Bill of Materials) wymieniony w paperze jako element minimum dla agentic AI - kancelaria audytująca dostawcę musi otrzymać SBOM. 3. DEPLOYING AGENTS SECURELY (s. 18) - bezpieczne wdrożenie do produkcji: network segmentation, secrets management (klucze API nie w plain text), monitoring od dnia pierwszego, rollback plan przygotowany przed go-live, ograniczone uprawnienia (read-only initial, modyfikacja po fazie pilotażowej), mechanizmy kill-switch (możliwość natychmiastowego zatrzymania agenta). Polska kancelaria pilotująca agenta przez kwartał z ograniczonym scope to nie ostrożność - to wymóg cyber security dla critical infrastructure. 4. OPERATING AGENTS SECURELY (s. 21) - utrzymanie agenta w produkcji: continuous monitoring (logi, anomalie, metryki użycia), incident response plan z procedurami na agentic-specific incidents (halucynacja na produkcji, prompt injection w toku, nadużycie uprawnień), regular review uprawnień (privilege creep), patching modeli (gdy dostawca aktualizuje wagi modelu - co kancelaria robi ze swoimi prompts i konfiguracjami), end-of-life plan dla agentów. Polska kancelaria która deployuje agenta i zostawia go bez monitoring na rok działa wbrew rekomendacji Five Eyes z dwoma agencjami USA. DEFEND AGAINST FUTURE RISKS (s. 24-25): - Expand threat intelligence through collaboration (frameworki OWASP 2025 Top 10 LLM/ GenAI Apps i MITRE ATLAS skupiają się na LLM vulnerabilities, industry reports emphasise platform misuse, niektóre attack vectors specyficzne dla agentic AI mogą jeszcze nie być w pełni zidentyfikowane). - Develop robust, agent-specific evaluations. - Leverage system-theoretic approaches to analyse security. APPENDIX A (s. 28+) - Cyber security prerequisites before implementation of AI agents (lista kontrolna gotowości środowiska IT zanim agent w ogóle wejdzie do produkcji). MAPPING NA POLSKIE INSTRUMENTY: RODO art. 32 - środki techniczno-organizacyjne. Pięć ryzyk Five Eyes mapuje wprost na art. 32 RODO. Privilege risks plus Design risks plus Structural risks to obszar środków technicznych (least privilege, segmentacja, walidacja konfiguracji). Behaviour risks i Accountability risks to obszar środków organizacyjnych (polityka AI, szkolenie zespołu, łańcuch odpowiedzialności). Lifecycle czterech etapów to operacyjna struktura artykułu 32 - środki adekwatne do ryzyka muszą obejmować cały lifecycle, nie tylko deployment. DYREKTYWA NIS2 - nowelizacja UKSC w Polsce. NIS2 (Dyrektywa UE 2022/2555) implementowana w Polsce nowelizacją ustawy o krajowym systemie cyberbezpieczeństwa - prezydent podpisał 19 lutego 2026, publikacja w Dzienniku Ustaw 2 marca 2026, wejście w życie po vacatio legis 3 kwietnia 2026. Kluczowe konsekwencje: rozszerzenie z 7 sektorów (NIS1) do 18 sektorów, dwie kategorie podmiotów (kluczowe i ważne), kary do 10 mln EUR lub 2 procent przychodu plus osobista odpowiedzialność zarządu, ex-ante supervision dla podmiotów kluczowych, publiczny rejestr S46 z obowiązkiem self-identification i self-registration do 3 października 2026, pełna implementacja wymogów do 3 kwietnia 2027. Polska kancelaria obsługująca klientów z sektorów NIS2 (energetyka, finanse, ochrona zdrowia, infrastruktura cyfrowa, dostawcy usług ICT) dziedziczy część obowiązków jako podmiot trzeci w łańcuchu dostawców. Pięć ryzyk Five Eyes plus lifecycle są dziś najmocniejszym dostępnym frameworkiem do operacjonalizacji wymagań NIS2 dla agentic AI w środowisku kancelarii - 12 miesięcy do deadline'u kwietnia 2027 to okno na zbudowanie polityki agentic AI zgodnej z NIS2. AI ACT art. 26 - deployer obligations. Polska kancelaria wdrażająca agentic AI jest deployer w rozumieniu AI Act. Art. 26 nakłada sześć obowiązków: dokumentacja użycia AI, nadzór ludzki, zapewnienie reprezentatywności danych wejściowych, monitoring działania, raportowanie incydentów, transparentność wobec osób objętych decyzją. Five Eyes lifecycle daje gotowe mapowanie - Designing pokrywa nadzór ludzki by-design, Developing pokrywa walidację danych, Deploying pokrywa transparentność, Operating pokrywa monitoring i raportowanie. Bez lifecycle Five Eyes deployer obligations są abstrakcyjne; z lifecycle stają się operacyjną listą zadań. TAJEMNICA ZAWODOWA (KEA, KERP). Centralna rekomendacja paperu "never granting agentic AI broad or unrestricted access, especially to sensitive data; only use agentic AI for low-risk and non-sensitive tasks" w polskiej kancelarii oznacza: agent nie ma broad access do akt klientów. Tajemnica zawodowa adwokata (art. 6 prawa o adwokaturze) i radcy prawnego (art. 6 ustawy o radcach prawnych) to po pierwsze obowiązek deontologiczny, po drugie ochrona prawnie chroniona. Agent z broad access do DMS narusza obie warstwy. Polska kancelaria audytująca dostawcę agentic AI ma w ręku argument sześciu agencji - to nie nasza ostrożność, to wymóg cyberbezpieczeństwa. PIĘĆ BRAKUJĄCYCH WARSTW (z perspektywy polskiej kancelarii): brak warstwy EU regulacyjnej (paper nie pokrywa AI Act, ENISA, EUCC, ETSI - mostek do polskich realiów wymaga uzupełnienia cross-reference do BW/049 Uberti-Bona Marin, BW/039 RAII, BW/045 Kenney); brak case studies prawnych (adresat to government plus critical infrastructure plus industry, branża prawnicza nie ma osobnej analizy); brak danych empirycznych o incydentach agentic AI (cross-reference do BW/052 Stanford AI Index 2026 - 362 udokumentowane incydenty AI w 2025 vs 233 w 2024 - zamyka skalę zjawiska); brak warstwy małej kancelarii (Five Eyes implicite zakłada zespół security osobny od zespołu prawniczego - możliwe od 30+ osób); brak warstwy lokalnych modeli LLM (Bielik, PLLuM, Llama on-premise jako kategoria zmniejszająca część Privilege i Structural risks - cross-reference do BW/036 Kuśmierek i BW/051 Supesu). USE CASE'Y: compliance officer/IOD kancelarii wdrażającej agentic AI obowiązkowo (pięć ryzyk plus lifecycle gotowy framework audytu, przejście z generycznych pytań RODO art. 32 do operacyjnej listy kontrolnej); CIO/dyrektor IT kancelarii obowiązkowo (lifecycle czterech etapów plus Appendix A z prerequisites cyber security operacyjny manual decyzji infrastrukturalnych); adwokat doradzający klientowi-spółce wdrażającej agentic AI obowiązkowo jako referencja wobec dostawcy (sześć agencji rządowych w jednej publikacji to argument silniejszy niż uchwała pojedynczego regulatora krajowego); adwokat doradzający klientom z sektorów NIS2 (energetyka, finanse, ochrona zdrowia, infrastruktura cyfrowa) obowiązkowo (mapping pięciu ryzyk na obowiązki NIS2 gotowy materiał audytowy); partner zarządzający dużej kancelarii 30+ tak (decyzja strategiczna o tym czy budować zespół security in-house czy outsourcować); solo praktyk i kancelaria 1-3 osobowa selektywnie (czytaj rozdział o pięciu ryzykach s. 7-13 plus Appendix A s. 28); klient indywidualny szukający prawnika nie polecam; edukator LegalTech/vendor narzędzi prawniczych obowiązkowo (pięć ryzyk to mapa decyzji produktowych, lifecycle to mapa procesu rozwoju); aplikant adwokacki lub radcowski tak (pierwszy materiał operacyjny pokazujący czego wymaga zarządzanie agentic AI w kancelarii w 2026 roku, argument za inwestycją w kompetencje cyber security obok kompetencji prawniczych). PIERWSZY TOM W BAZIE WIEDZY MateMatic Z KATEGORII JOINT GOVERNMENT CYBER SECURITY GUIDANCE. Autorytet wyższy niż pojedynczy regulator krajowy, niezależny od dostawcy. Direct partner BW/048 OASIS CoSAI agentic IAM (tożsamość agentów plus pięć ryzyk plus lifecycle = mapa operacyjna). Direct partner BW/045 Kenney runtime enforcement (continuous authorization w czterech reżimach plus Privilege risks plus Operating securely = jak wymuszać autoryzację w runtime przez cały lifecycle). Direct complement BW/OWASP AIVSS agentic AI (10 ryzyk z metryką oceny plus pięć kategorii z best practices = pełen audyt agenta). Direct partner BW/046 Berkeley CLTC GPAI (governance plus security). Direct complement BW/049 Uberti-Bona Marin techno-normative AI accuracy (cztery techno-normative choices plus Behaviour risks = pełna mapa ryzyka technicznego). Direct partner BW/052 Stanford AI Index 2026 (Stanford skala 362 incydentów plus Five Eyes framework prewencji). Cross-reference do Aktualności 30.04.2026 (Workspace MCP plus Gemini Enterprise) - MCP scoping operacyjna realizacja Privilege risks z paperu Five Eyes. Razem z BW/051 Supesu (87 procent polskich prawników korzysta z AI) i BW/052 Stanford (88 procent adopcji organizacyjnej globalnie plus 362 incydenty AI 2025) Five Eyes guidance domyka triadę: empiryka adopcji w Polsce, empiryka adopcji globalnie, operacyjny framework bezpieczeństwa. CO MateMatic WNIESIE: audyt agentic AI w kancelarii w trzech sesjach z mapowaniem na Five Eyes guidance - pięć ryzyk per scenariusz wdrożenia (DMS, kalendarz, helpdesk klienta, research prawny), lifecycle czterech etapów z explicytnym mapowaniem na art. 32 RODO i AI Act art. 26, procurement i SBOM dla audytu dostawcy LegalTech; deliverable rejestr ryzyk per scenariusz plus polityka lifecycle plus protokół procurement. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/052 - AI Index Stanford HAI 2026. Dziewięć rozdziałów, 362 incydenty, 88 procent adopcji - co kancelaria wyciąga selektywnie. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-04-stanford-hai-ai-index-2026.html Wydawca: Stanford Institute for Human-Centered Artificial Intelligence (HAI), Stanford University. Edycja: dziewiąta (cykl coroczny od 2018). Data publikacji: kwiecień 2026. Stron: 385+. Inicjatywa AI Index zrodzona w ramach One Hundred Year Study on Artificial Intelligence (AI100) Stanforda. Co-chairs: Yolanda Gil i Raymond Perrault. Steering Committee i ponad 40 współautorów: Russ Altman (Stanford), Carla Brodley (Northeastern), Erik Brynjolfsson (Stanford), Jack Clark (Anthropic, OECD), Virginia Dignum (Umeå University), Vipin Kumar (University of Minnesota), James Landay (Stanford), Terah Lyons (JPMorgan Chase), James Manyika (Google, University of Oxford), Juan Carlos Niebles (Stanford, Salesforce), Vanessa Parli (Stanford), Yoav Shoham (Stanford, AI21 Labs), Elham Tabassi (Brookings), Russell Wald (Stanford), Dan Weld (University of Washington), Toby Walsh (UNSW Sydney). Współpraca przy chapterze Science: Schmidt Sciences. Lead i editor-in-chief: Sha Sajadieh. Research manager: Loredana Fattorini. Affiliated researchers: Nestor Maslej, Juan Nicolas Pava, Lapo Santarlasci (IMT School for Advanced Studies Lucca). Licencja: Attribution- NoDerivatives 4.0 International (CC-BY-ND 4.0), potwierdzona dosłownym cytatem na s. 5 raportu - "The AI Index 2026 Annual Report by Stanford University is licensed under Attribution-NoDerivatives 4.0 International". MateMatic NIE hostuje PDF lokalnie ani nie modyfikuje treści (klauzula NoDerivatives), recenzja oparta na prawie cytatu (art. 29 ustawy o prawie autorskim). Strona: https://aiindex.stanford.edu. Disclosure: AI Index korzysta z danych dostarczonych przez partnerów komercyjnych - Epoch AI, GitHub, Lightcast, LinkedIn, McKinsey & Company, Quid, Zeki - każdy z partnerów ma własny model biznesowy w obszarze AI; recenzja MateMatic czyta z eksplicytnym filtrem agendy źródeł danych. STRUKTURA RAPORTU - dziewięć rozdziałów merytorycznych: 1. Research and Development, 2. Technical Performance, 3. Responsible AI, 4. Economy, 5. Science (NOWY chapter w tej edycji, we współpracy ze Schmidt Sciences), 6. Medicine (NOWY chapter), 7. Education, 8. Policy and Governance (zawiera nowy framework AI sovereignty), 9. Public Opinion, plus Appendix. Nowości tej edycji: AI sovereignty framework analityczny, nowe estymacje wartości ekonomicznej generatywnej AI, empiryczne dowody wpływu AI na rynek pracy, standalone chaptery Science i Medicine. PIĘTNAŚCIE TOP TAKEAWAYS edycji 2026: #1 AI capability is not plateauing. It is accelerating and reaching more people than ever. Industry produced over 90% of notable frontier models in 2025. SWE-bench Verified performance rose from 60% to near 100% of meeting human baseline in a single year. Organizational adoption reached 88%, and 4 in 5 university students now use generative AI. #2 The U.S.-China AI model performance gap has effectively closed. DeepSeek-R1 briefly matched the top U.S. model in February 2025, and as of March 2026 Anthropic's top model leads by just 2.7%. South Korea stands out for its innovation density, leading the world in AI patents per capita. #3 The United States hosts the most AI data centers (5,427 - more than 10 times any other country), with the majority of their chips fabricated by one Taiwanese foundry (TSMC). #4 AI models can win a gold medal at the International Mathematical Olympiad but cannot reliably tell time - the jagged frontier of AI. Gemini Deep Think earned IMO gold, yet the top model reads analog clocks correctly just 50.1% of the time. AI agents made a leap from 12% to ~66% task success on OSWorld in a year. #5 Robots still fail at most household tasks (88% failure rate), even as they excel in controlled environments (89.4% success on RLBench). #6 Responsible AI is not keeping pace with AI capability, with safety benchmarks lagging and incidents rising sharply. Documented AI incidents rose to 362, up from 233 in 2024 (55% YoY increase). Recent research found that improving one responsible AI dimension, such as safety, can degrade another, such as accuracy. #7 The United States leads in AI investment (private investment $285.9 billion in 2025, 23 times the $12.4 billion in China; 1,953 newly funded AI companies, more than 10 times the next closest country), but its ability to attract global talent is declining. #8 AI adoption is spreading at historic speed. Generative AI reached 53% population adoption within three years, faster than the PC or the internet. U.S. ranks 24th at 28.3%, while Singapore (61%) and the United Arab Emirates (54%) show higher-than-expected adoption. The estimated value of generative AI tools to U.S. consumers reached $172 billion annually by early 2026. #9 Productivity gains from AI are appearing in many of the same fields where entry-level employment is starting to decline. Studies show productivity gains of 14% to 26% in customer support and software development. In software development, U.S. developers ages 22 to 25 saw employment fall nearly 20% from 2024. #10 AI's environmental footprint is expanding. Grok 4's estimated training emissions reached 72,816 tons of CO2 equivalent. AI data center power capacity rose to 29.6 GW, comparable to New York state at peak demand, and annual GPT-4o inference water use alone may exceed the drinking water needs of 12 million people. #11 AI models for science can outperform human scientists. Frontier models outperform human chemists on average on ChemBench. A 111-million-parameter protein language model, MSAPairformer, beat previous leading methods on ProteinGym. #12 AI is transforming clinical care, but rigorous evidence remains limited. Ambient AI scribes saw substantial adoption in 2025 with up to 83% less time spent writing notes and significant reductions in burnout. A review of more than 500 clinical AI studies found that nearly half relied on exam-style questions rather than real patient data, with only 5% using real clinical data. #13 Formal education is lagging behind AI. Over 80% of U.S. high school and college students now use AI for school-related tasks, but only half of middle and high schools have AI policies in place, and just 6% of teachers say those policies are clear. AI engineering skills are accelerating fastest in the United Arab Emirates, Chile, and South Africa. #14 AI sovereignty is becoming a defining feature of national policy. Four axes: Infrastructure Sovereignty (compute, data centers), Data Sovereignty, Talent Sovereignty, Model Sovereignty. Open-source development is starting to redistribute participation, with contributions from the rest of the world now outpacing Europe and approaching the United States on GitHub. #15 AI experts and the public have very different perspectives. 73% of experts expect a positive impact on jobs, compared with just 23% of the public - a 50-point gap. EU 53% median trust in AI regulation vs USA 37% vs China 27% (Pew Spring 2025). Among 30 surveyed countries, the United States reported the lowest trust in its own government to regulate AI (31%). POLSKA W DANYCH AI INDEX 2026: - Adopcja generatywnej AI: 28,5 procent populacji (pozycja 22 globalnie, +2,10 punktu YoY). Liderzy: ZEA 64 procent, Singapur 60,9 procent, Norwegia 46,4 procent. Polska wyższa niż USA 28,3 procent (poz. 24), Czechy 27,8, Włochy 27,8, Bułgaria 27,3, Finlandia 27,3. Niższa niż Niemcy 28,6 procent, Dania 28,7. - Zaufanie do własnego rządu w regulacji AI (Ipsos 2025): Polska 61 procent - dziesiąte miejsce wśród 30 krajów, znacząco powyżej globalnej mediany 54 procent i wyraźnie wyżej niż USA 31 (najniższe), Wielka Brytania 39, Japonia 32. Liderzy: Singapur 81, Indonezja 76, Malezja 73, Tajlandia 70. - Polskie benchmarki językowe wymienione w Stanford analizie sovereignty językowej: PolEval (~19 tysięcy zamkniętych pytań z polskich egzaminów narodowych w 154 domenach) plus 600 ręcznie skonstruowanych pytań oceniających kompetencje historyczne, geograficzne, kulturalne, artystyczne i gramatyczne. - Polska wymieniona w rankingu sovereignty AI z udziałem około 2,87 procent w jednej z metryk infrastruktury. PIĘĆ OBSERWACJI MateMatic z trzyfilarowego filtra: OBSERWACJA 1 - 88 procent adopcji organizacyjnej globalnie, 87 procent polskich prawników (BW/051 Supesu), jeden trend. Polska kancelaria nie jest tech-laggardem ani pionierem - jest wyrównana z trendem globalnym. Wyłącza retorykę "u nas to jeszcze za wcześnie", zamyka dyskusję "czy wdrażać AI". Pytanie strategiczne dla zarządu kancelarii przesuwa się z "czy wdrożymy" do "czy zarządzamy tym, co już dzieje się w naszej kancelarii". OBSERWACJA 2 - krajobraz duopoli US-Chiny ale rozproszone per oś. USA dominuje w infrastrukturze (5 427 data centers, ponad 10 razy więcej niż drugi kraj) i talencie, Chiny prowadzą w wolumenie publikacji, cytowaniach i instalacjach robotów przemysłowych. Otwarte modele zaczynają rozpraszać udział - kontrybucje GitHub spoza US-Chin teraz przewyższają Europę i zbliżają się do US. Implikacje dla polskiej kancelarii: polski prawnik decyduje o ekosystemie AI w domenie tools wybieranych przez użytkownika końcowego; oba dominujące narzędzia rozwijane poza UE i polską jurysdykcją deontologiczną. OBSERWACJA 3 - top use cases jako mapa decyzji wdrożeniowych. Research prawny 81 procent (Top Takeaway #6 BW/051 Supesu) jako top use case - predyktywny sygnał o ryzyku zawodowym (halucynacja LLM przenosi się wprost na pismo procesowe, sprawa Mata vs. Avianca SDNY czerwiec 2023 - 5000 USD grzywny dla pełnomocników za sześć zmyślonych przez ChatGPT cytowań - jako podręcznikowy precedens). Drugi obszar: automatyzacja powtarzalnych czynności około 56 procent - pole najniższego ryzyka i najwyższego ROI. Trzeci: compliance i monitoring zmian w prawie - obszar potencjału agentów dziedzinowych z HITL oversight. OBSERWACJA 4 - 50-punktowa luka zaufania ekspertów (73 procent pozytywny wpływ AI na pracę) vs publiczności (23 procent), EU 53 procent mediana zaufania w regulacji AI vs USA 37 vs Chiny 27 (Pew). Polska 61 procent zaufania do własnego rządu (Ipsos 2025) - dziesiąte miejsce wśród 30 krajów, mocna pozycja konkurencyjna polskiej kancelarii doradzającej klientowi-spółce wdrażającej AI. Implikacja: 50-punktowa luka oznacza, że pracownicy klienta widzą AI inaczej niż zarząd - wdrożenie AI bez warstwy komunikacji, polityki transparentności, ścieżki opt-out generuje opór organizacyjny. OBSERWACJA 5 - Polska w globalnych danych Stanforda - 28,5 procent adopcja GenAI plus polskie benchmarki językowe (PolEval, 19 tys. pytań) plus 61 procent zaufania do rządu (top 10 globalnie). Implikacja: jeśli kancelaria używa modelu globalnego do polskich tekstów prawnych bez kontekstu polskich benchmarków językowych, prawdopodobnie pracuje z modelem walidowanym na innym typie danych. Argument za korzystaniem z modeli polskich (Bielik, PLLuM) lub modeli globalnych z explicit Polish-language testing - cross-reference do BW/036 Kuśmierek "Polska wobec AGI" i BW/051 Supesu "lokalne LLM jako brakująca kategoria". TRZY LUKI RAPORTU z perspektywy polskiej kancelarii: LUKA PIERWSZA - US-centric bias w chapterze Policy and Governance. Chapter 8 pokrywa US AI policy w stopniu nieproporcjonalnym - federal deregulation, state legislation, Congressional witnesses, public procurement US i Europy. Europa traktowana jako blok, bez dezagregacji na państwa członkowskie. Polski adwokat lub radca radząca klientowi wdrażającemu AI w Polsce nie znajdzie tu sekcji "EU AI Act enforcement timeline 2025-2027" ani analizy uchwał izb adwokackich Niemiec, Francji, Niderlandów. To nie błąd - to scope. LUKA DRUGA - brak tłumaczenia capability benchmarks na metryki kancelaryjne. Chapter 2 raportuje SWE-bench Verified, OSWorld, IMO gold, ChemBench, ProteinGym. Polska kancelaria nie wie z tych liczb, czy AI nadaje się do due diligence umowy SLA, do analizy treści wyroku WSA, do generowania szkicu klauzuli arbitrażowej. AI Index to mapa sposobu mierzenia capability, nie operacyjny manual dla branż. Cross-reference do BW/049 Uberti-Bona Marin techno-normative AI accuracy zamyka tę lukę dla kancelarii. LUKA TRZECIA - partnerstwa danych komercyjnych jako filtr informacyjny. Pomimo deklarowanej niezależności, AI Index korzysta z danych Epoch AI, GitHub, Lightcast, LinkedIn, McKinsey & Company, Quid, Zeki. Każdy z partnerów ma stake w obszarze AI. McKinsey sprzedaje doradztwo wdrożeniowe AI - jego dane o adopcji organizacyjnej (88 procent) przekraczają inne źródła. LinkedIn ma stake w danych talentowych, GitHub w open-source. Niezależność Stanford HAI mocna, ale czytelnik musi mieć świadomość filtra. MAPPING NA POLSKIE INSTRUMENTY: RODO art. 28 i 32 plus AI Act art. 26 - obowiązki deployer. AI Index potwierdza globalnie to, co BW/051 Supesu pokazuje lokalnie - masowa adopcja narzędzi AI bez współmiernej adopcji governance. Polska kancelaria jako deployer AI Act art. 26 ma sześć obowiązków: dokumentacja użycia AI, nadzór ludzki, zapewnienie reprezentatywności danych wejściowych, monitoring działania, raportowanie incydentów, transparentność wobec osób objętych decyzją AI. Liczby 88 procent i 362 incydentów z AI Index są empirycznym argumentem, że obowiązki te wchodzą w fazę praktycznej egzekucji. Tajemnica zawodowa (KEA i KERP) - selektywna lektura chapter Public Opinion. Chapter 9 pokazuje, że obywatele globalnie różnie ufają instytucjom w regulacji AI - EU bardziej niż USA, USA wewnętrznie 31 procent zaufania. KEA i KERP wymagają dochowania tajemnicy zawodowej, niezależności, godności zawodu - tej samej etyki, której obywatele globalnie szukają w komunikacji o AI. Polska kancelaria komunikująca AI klientowi nie tylko spełnia obowiązek deontologiczny, ale buduje przewagę konkurencyjną. Chapter Education i Public Opinion jako materiał edukacyjny dla klienta. 80+ procent uczniów USA i studentów używa AI, ale tylko 50 procent szkół ma politykę AI i 6 procent nauczycieli uważa polityki za jasne. Identyczna dynamika wystąpi w polskich kancelariach w ciągu 12-24 miesięcy. Aplikanci adwokaccy i radcowscy wchodzący do kancelarii w 2026 roku są pokoleniem używającym AI w trakcie studiów. Polityka AI jest oczekiwaną częścią onboardingu. SZEŚĆ BRAKUJĄCYCH WARSTW (z perspektywy polskiej kancelarii): brak tłumaczenia danych globalnych na polski rynek prawniczy (cross BW/051 Supesu zamyka), brak warstwy compliance per dostawca (BW/040 King zamyka), brak case studies prawnych (chapter Medicine ma kliniczne, prawniczego brak), brak warstwy lokalnych LLM dla rynków nieanglojęzycznych (BW/036 Kuśmierek), brak danych adopcji w sektorze prawnym Polski (BW/051 Supesu zamyka), brak warstwy wpływu na rynek pracy prawniczej (chapter Economy raportuje US developerzy 22-25 lat -20 procent, prawnicy entry-level nie analizowani; hipoteza MateMatic do dalszej obserwacji - polski rynek aplikancki za 24-36 miesięcy może pokazać podobną dynamikę dla prac analitycznych research'u prawnego). USE CASE'Y: partner zarządzający kancelarii 5-30 osobowej selektywnie (Top Takeaways plus chapter 8 AI sovereignty); compliance officer/IOD obowiązkowo chapter 3 Responsible AI (362 incydenty argument dla budżetu polityki AI); adwokat doradzający klientowi-spółce wdrażającej AI obowiązkowo chapter 4 Economy plus chapter 9 Public Opinion (50pp luka argument za komponentem komunikacji wewnętrznej); adwokat doradzający klientom publicznym (JST, spółki SP, ministerstwa) obowiązkowo chapter 8 sekcja AI Sovereignty (cztery osie suwerenności jako framework decyzji); adwokat reprezentujący stronę postępowania z udziałem AI selektywnie chapter 3 sekcja incydenty; solo praktyk i kancelaria 1-3 osobowa selektywnie tylko Top Takeaways; HR business partner chapter 7 Education i chapter 4 Economy (entry-level employment shifts); klient indywidualny szukający prawnika nie polecam; edukator LegalTech/vendor narzędzi prawniczych obowiązkowo całość. DRUGI TOM W BAZIE WIEDZY MateMatic Z EMPIRYCZNYMI DANYMI ADOPCJI AI - pierwszy globalny benchmark, uzupełnia BW/051 Supesu (lokalny benchmark Polski) jako para: jak Polska wygląda na tle świata (Stanford) plus jak polskie kancelarie wyglądają w Polsce (Supesu). Direct complement BW/051 Supesu (Stanford 88 procent + Supesu 87 procent = mapa dwustronna); direct partner BW/049 Uberti-Bona Marin (Stanford skala 362 incydentów + Uberti formalny framework czterech techno-normative choices); direct partner BW/044 WEF/Capgemini (AI sovereignty + sektor publiczny); direct complement BW/042 AICDI (13 procent firm globalnie governance + 88 procent adopcji + 362 incydenty = struktura ryzyka systemowego); direct partner BW/041 MIT atlas ryzyk; direct complement BW/040 King vendor assessment; direct partner BW/036 Kuśmierek; cross-reference do Aktualności 30 kwietnia 2026 (Workspace MCP plus Gemini Enterprise). CO MateMatic WNIESIE: audyt adopcji AI w kancelarii w trzech sesjach z mapowaniem na AI Index 2026 - pozycjonowanie kancelarii na trendzie globalnym (skala Stanford 88 procent plus Supesu 87 procent), procedura incident response (z bazy 362 udokumentowanych incydentów Stanforda jako referencji), framework AI sovereignty dla klienta publicznego (cztery pytania audytowe wobec dostawcy AI dla JST, spółek SP, ministerstw); deliverable matryca pozycjonowania kancelarii na trendzie globalnym plus polityka AI plus rejestr scope'ów plus protokół incident response. Razem z BW/051 Supesu raport AI Index domyka mapę dwustronną - Polska na tle świata i polskie kancelarie w Polsce. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/051 - Supesu pyta polskich prawników o AI. 87 procent korzysta, ale ankieta nie pyta o to, co najważniejsze. URL: https://matematicsolutions.com/baza-wiedzy/2026-05-04-supesu-raport-rynku-prawniczego-2025-2026.html Wydawca: Supesu (butik executive search prowadzący projekty rekrutacyjne na stanowiska C-suite, managerskie i prawnicze, doradztwo personalne, szkolenia human skills, assessment center, outplacement, platforma Supesu Social Impact). Edycja: IV (cykl coroczny od 2022/2023). Opracowanie statystyczne: I kwartał 2026 roku. Metoda: CAWI (Computer Assisted Web Interview), ankieta elektroniczna na dedykowanej stronie WWW dystrybuowana przez bazy i kanały komunikacji środowiska prawniczego. Próba: n=507 prawniczek i prawników zatrudnionych w polskich kancelariach prawnych oraz wewnętrznych działach prawnych przedsiębiorstw (in-house) - najwyższa w historii cyklu (poprzednie edycje krążyły wokół 300 odpowiedzi). Zmienne grupujące: płeć, długość doświadczenia zawodowego, zajmowane stanowisko, wielkość organizacji oraz jej lokalny lub międzynarodowy charakter, forma zatrudnienia, miejsce pracy, długość okresu wypowiedzenia. Patronaty merytoryczne i komentarze otwarcia: Marta Bijak-Haiduk (Adwokat, Partnerka w Deloitte Legal, Liderka Zespołu Nieruchomości), Karol Ciszak (Radca prawny, Local Partner w Deloitte Legal, Prawo Korporacyjne), Marta Koremba i Rafał Dziedzic (Co-Managing Partners Bird & Bird), Klaudia Kamińska-Kiempa (Radca Prawny, Associate Partnerka Rödl & Partner), Piotr Bielarczyk (Dyrektor Zarządzający Agencji Rozwoju Przemysłu S.A.), Dorian Duda (Head of Legal Toggl). Inicjatywa LEMI (Legal Mental Health Initiative) jako sygnowane wydzielenie zdrowotne raportu. Licencja: brak wyraźnej licencji CC - opracowanie własne Supesu, MateMatic NIE hostuje PDF lokalnie; recenzja referencyjna oparta na publicznie udostępnionym raporcie pod prawem cytatu (art. 29 ustawy o prawie autorskim) z atrybucją liczb i wniosków do Supesu i jej patronów. Disclosure: trzy patronaty raportu (Deloitte Legal, Bird & Bird, Rödl & Partner) to kancelarie aktywnie konkurujące o klientów na polskim rynku - ich komentarze otwarcia mają strategiczną agendę pozycjonowania, recenzja MateMatic czyta z eksplicytnym filtrem agendy patronów. Strona Supesu: https://www.supesu.pl. STRUKTURA RAPORTU - siedemnaście rozdziałów merytorycznych: wstęp (s. 4), metodologia (s. 5), grono osób eksperckich (s. 6), komentarz otwarcia (s. 8), charakterystyka osób ankietowanych (s. 10), wynagrodzenia i podwyżki (s. 18), kobiety w zarządzie (s. 23), czas pracy (s. 25), benefity pozapłacowe (s. 28), premia (s. 33), zmiana zatrudnienia (s. 35), narzędzia AI (s. 41), jakość życia i pracy - poziom dobrostanu (s. 44), inne możliwości zawodowe (s. 59), wewnętrzne działy prawne (s. 61), obowiązki WOB whistleblowing (s. 74), lobbying i regulacje UE, dyrektywa o przejrzystości wynagrodzeń (s. 80), PILA i środowiska prawnicze (s. 84), elastyczne wsparcie prawne flexible legal resourcing (s. 86, nowość edycji), zarobki w przekroju województw i specjalizacji (s. 88). CENTRALNA EMPIRYKA AI w polskim rynku prawniczym (sekcja Narzędzia AI, s. 41-43): 87 procent respondentów deklaruje korzystanie z narzędzi wspieranych przez sztuczną inteligencję w codziennej pracy. Mapa narzędzi: ChatGPT 63 procent, Copilot 56 procent (Microsoft), Perplexity 18 procent, Claude i DeepL w jednocyfrowych procentach (DeepL 6,53 procent), inne narzędzia 30 procent (lokalne LLM, narzędzia branżowe). Top use cases AI (pytanie wielokrotnego wyboru): wyszukiwanie informacji i research prawny 81 procent, automatyzacja powtarzalnych czynności około 56 procent, przegląd zgodności i compliance, monitoring zmian w prawie, tworzenie raportów i KPI, zarządzanie zadaniami i projektami prawnymi, obsługa klienta przez narzędzia helpdeskowe. OSOBNA SEKCJA O TRANSFORMACJI WEWNĘTRZNYCH DZIAŁÓW PRAWNYCH zawiera niezależne pytanie o kroki transformacji: Wdrożenie nowych narzędzi 46 procent, Automatyzacja procesów 34 procent, Wdrożenie AI 33 procent, Reorganizacja zespołu 22 procent, Outsourcing 9 procent. Sekcja Narzędzia AI agreguje obie populacje (kancelarie + in-house) podczas gdy sekcja transformacji in-house ma własne pytanie - tych dwóch widoków raport NIE zestawia obok siebie. DODATKOWE DANE: dobrostan i wypalenie - 50 procent respondentów deklaruje objawy wypalenia zawodowego, ponad dwie trzecie przyznaje, że przynajmniej raz rozważało zmianę pracy z powodu zdrowia psychicznego. Model pracy: hybryd 64 procent (dominujący), stacjonarnie 25 procent, w pełni zdalnie około 11 procent. Czas pracy: zdecydowana większość 40-50 godzin tygodniowo. Specjalizacje dominujące: prawo cywilne, prawo handlowe i korporacyjne, compliance, M&A, własność intelektualna, spory, ochrona danych. Najwyższe średnie wynagrodzenia: woj. mazowieckie 24 445 PLN (rednia miesięczna), wielkopolskie, łódzkie; najniższe: lubuskie, lubelskie, zachodniopomorskie. Dominujący model współpracy: B2B (54 procent zatrudnionych w organizacjach międzynarodowych); 41 procent premii przekracza 20 procent wynagrodzenia. CZTERY OBSERWACJE MateMatic z trzyfilarowego filtra: 1. EMPIRYCZNA MAPA ADOPCJI AI W POLSKICH KANCELARIACH - wartość dla polskiej kancelarii nie leży w samej liczbie 87 procent, leży w tym że jest to pierwszy w Polsce numer, który wyłącza dyskusję "czy". Przed raportem Supesu w polskim środowisku prawniczym dało się rozmawiać o AI w trybie "czy w ogóle prawnicy używają", "czy to nie jest jeszcze za wcześnie". Po raporcie ta rozmowa się kończy. 87 procent prawników w Polsce już używa. Pytanie strategiczne dla zarządu kancelarii przesuwa się z "czy wdrożymy" do "czy zarządzamy tym, co już dzieje się w naszej kancelarii". Zarząd, który zakłada że "my jeszcze nie używamy AI", w świetle raportu prawdopodobnie zarządza shadow IT - 8 z 10 jego prawników już wkleja fragmenty pism do ChatGPT z prywatnego konta. Bez polityki, bez DPA, bez świadomości art. 6 prawa o adwokaturze. 2. KRAJOBRAZ NARZĘDZI Z DOMINACJĄ DUOPOLI - przy pytaniu wielokrotnego wyboru ChatGPT 63 procent i Copilot 56 procent oznacza, że większość respondentów używa obu narzędzi równolegle - polski rynek prawniczy w sferze AI jest zdominowany przez OpenAI i Microsoft. Trzy strategiczne konsekwencje: (a) polski prawnik decyduje o ekosystemie AI w domenie tools wybieranych przez użytkownika końcowego, nie przez zarząd kancelarii czy CIO; (b) oba dominujące narzędzia są rozwijane poza UE i poza polską jurysdykcją deontologiczną, co stawia centralne pytanie o DPA, legal hold i tajemnicę zawodową; (c) Perplexity 18 procent, Claude i DeepL w jednocyfrowych procentach to długi ogon alternatyw obecny jako nisza, nie jako mainstream - raport nie pyta, czy to wynik nieświadomości, świadomego wyboru ekosystemu, czy bariery wejścia (cena, integracja, język). 3. TOP USE CASES JAKO MAPA DECYZJI WDROŻENIOWYCH - research prawny 81 procent jako top use case to predyktywny sygnał o tym, gdzie w pierwszej kolejności pojawi się ryzyko zawodowe. Research to obszar, w którym halucynacja LLM (zmyślony cytat z wyroku, zmyślony numer sygnatury, zmyślona linia orzecznictwa) wprost przenosi się na pismo procesowe. Sprawa Mata vs. Avianca (Southern District of New York, czerwiec 2023) - 5000 USD grzywny dla pełnomocników za sześć zmyślonych przez ChatGPT cytowań w piśmie procesowym - jest dziś podręcznikowym precedensem; w polskim środowisku NRA i KIRP nie publikowały dotąd analogicznych orzeczeń dyscyplinarnych, ale ryzyko jest tożsame. Drugi obszar - automatyzacja powtarzalnych czynności około 56 procent - to pole najniższego ryzyka i najwyższego ROI w skali kwartalnej. Trzeci - compliance i monitoring zmian w prawie - obszar największego potencjału agentów dziedzinowych z human-in-the-loop oversight. 4. KORELACJA AI ZE ZDROWIEM PSYCHICZNYM (UWAŻNIE) - raport łączy adopcję AI z poziomem dobrostanu pośrednio. 50 procent respondentów deklaruje objawy wypalenia, ponad dwie trzecie rozważało zmianę pracy z powodu zdrowia psychicznego. Inicjatywa LEMI jest sygnowanym wydzieleniem zdrowotnym raportu. Raport tej zależności nie testuje empirycznie. Otwarte pytanie dla kolejnych edycji: czy AI faktycznie zmniejsza wypalenie (przez automatyzację rutynowych zadań), czy je zwiększa (przez podniesienie tempa pracy, oczekiwań klientów, weekendową dostępność). TRZY LUKI ANKIETY (czego raport nie pyta): LUKA PIERWSZA - brak rozróżnienia tier i DPA. Pytanie "czy korzystasz z narzędzi wspieranych przez sztuczną inteligencję" ChatGPT i Copilot odpowiadają binarnie - tak/nie. 63 procent użytkowników ChatGPT to pula trzech zupełnie różnych przypadków regulacyjnych: (1) ChatGPT Free konto prywatne (consumer ToS, brak DPA, treść może być użyta do treningu); (2) ChatGPT Plus konto prywatne (consumer ToS, opcja opt-out treningu, brak DPA); (3) ChatGPT Team lub Enterprise (DPA, no-training default, audit logs). Z perspektywy art. 28 RODO i art. 6 prawa o adwokaturze są to trzy różne światy regulacyjne. Ankieta Supesu traktuje je jako jedno zjawisko - ukrywa największe ryzyko branży: prawnicy używający consumer tier do pracy ze sprawą klienta. Analogicznie dla Copilot - osobna licencja Microsoft 365 Copilot for Business z DPA Workspace ekwiwalentnym vs Copilot consumer w przeglądarce Edge bez DPA. 87 procent korzysta - ale ile z poszanowaniem DPA? LUKA DRUGA - brak rozróżnienia konto firmowe vs konto prywatne. Prawnik wprowadzający fragmenty sprawy do ChatGPT na koncie firmowym kancelarii (z polityką AI, ze świadomością scope'ów) działa inaczej niż prawnik kopiujący ten sam fragment do prywatnego konta z domu po godzinach. Pierwszy mieści się w art. 32 RODO i art. 26 AI Act jako działanie pod nadzorem deployer. Drugi to klasyczny shadow IT: poza polityką, poza monitorowaniem, poza DPA. Hipoteza MateMatic z analizą polskiego rynku: w kancelariach 1-5 osobowych dominuje konto prywatne, w 5-30 osobowych mix, w BigLaw firmowy z polityką. LUKA TRZECIA - self-selection bias i overrepresentation tech-savvy. Metoda CAWI plus dystrybucja przez kanały Supesu i patronów (Deloitte Legal, Bird & Bird, Rödl & Partner - duże kancelarie) niesie self-selection bias. Prawnik o niskiej kompetencji cyfrowej rzadziej wypełnia ankietę elektroniczną. Próba 507 osób jest przesunięta w kierunku prawnika cyfrowo dojrzałego, pracującego w średniej lub dużej organizacji. Wniosek operacyjny: liczba 87 procent jest dolnym progiem adopcji w segmencie tech-savvy, nie estymatorem dla całej populacji prawnika polskiego (która obejmuje też kancelarie jednoosobowe poza zasięgiem patronów badania). Raport sam nie deklaruje tego ograniczenia, a powinien. MAPPING NA POLSKIE INSTRUMENTY: Tajemnica zawodowa (art. 6 prawa o adwokaturze, art. 6 ustawy o radcach prawnych) - 87 procent korzystania z AI = 87 procent prawników w pewnym momencie wprowadza do narzędzia AI jakąś treść związaną ze sprawą (nazwa klienta, fragment umowy, opis stanu faktycznego, treść pisma procesowego). Każdy z tych elementów jest prima facie tajemnicą zawodową. Wprowadzenie tajemnicy do narzędzia AI bez DPA z dostawcą i bez zgody klienta to potencjalne naruszenie art. 6 PoA i art. 6 RP. Audyt adopcji AI w kancelarii to dziś nie luksus - to obowiązek deontologiczny. RODO art. 28 i 32 - DPA per edycja, scope, monitoring. Cross-reference z Aktualnościami MateMatic z 30 kwietnia 2026 (Workspace MCP plus Gemini Enterprise oraz Workspace jako natywne środowisko AI): Workspace Business Standard/Plus, Enterprise Standard/Plus mają DPA i no-training default; Workspace Individual, Business Base, prywatne konta nie mają. Identyczna logika dla Microsoft 365 Copilot for Business vs Copilot consumer. Zarząd kancelarii czytając Supesu musi zadać pytanie: na jakiej edycji licencji nasi prawnicy używają AI. Bez tej odpowiedzi liczba 87 procent jest pustym fact'em. AI Act art. 26 - deployer obligations. Polska kancelaria używająca narzędzi AI ogólnego przeznaczenia (ChatGPT, Copilot, Perplexity, Claude, Gemini) jest deployer w rozumieniu AI Act. Art. 26 nakłada obowiązki: dokumentacja użycia AI, nadzór ludzki, zapewnienie reprezentatywności danych wejściowych, monitoring działania, raportowanie incydentów. Z 87 procent kancelarii korzystających z AI ułamek prowadzi rejestr scope'ów, politykę AI, szkolenie zespołu pod art. 26. Kodeks etyki adwokackiej (KEA) i radcowskiej (KERP) - nie zawierają jeszcze eksplicytnych norm o AI, ale zawierają normy o staranności zawodowej, dochowaniu tajemnicy, niezależności, niewykonywaniu zawodu w sposób który podważa godność. Każda filtruje 87 procent użycia AI. NRA i KIRP do kwietnia 2026 nie wydały dedykowanej uchwały o AI - to luka, którą zarząd kancelarii zamyka politykę firmową, nie czekając na regulator samorządowy. SZEŚĆ BRAKUJĄCYCH WARSTW (z perspektywy polskiej kancelarii): brak rozróżnienia DPA i tier per narzędzie (najpoważniejsza luka, w przyszłej edycji 2026/2027 ankieta powinna zadać oddzielnie free/personal/Team-Enterprise z DPA), brak rozróżnienia konto firmowe vs prywatne, brak korelacji adopcja AI - polityka AI w kancelarii (hipoteza MateMatic ułamek tych 87 procent), brak korelacji adopcja AI - szkolenie z AI (po szkoleniu vs samouk z YouTube), brak rozdzielenia in-house od kancelarii zewnętrznej w sekcji narzędzi AI mimo że transformacja in-house ma osobne pytanie z 33 procent wdrożenia AI, brak kategorii lokalnych LLM i suwerennej infrastruktury (Bielik, PLLuM, Llama on-premise, Mistral - jedyne narzędzia gwarantujące pełną zgodność z tajemnicą zawodową). USE CASE'Y: partner zarządzający kancelarii 5-30 osobowej - obowiązkowo (najszerszy benchmark polskiego rynku); compliance officer/IOD kancelarii - obowiązkowo (liczby 87 procent są argumentem dla zarządu, że polityka AI to nie kwestia czasu, to kwestia zaległości); dyrektor ds. ludzi/HR business partner - obowiązkowo (wynagrodzenia, benefity, dobrostan, wypalenie); solo praktyk i kancelaria 1-3 osobowa - selektywnie; lider działu in-house - tak (osobne sekcje in-house i flexible legal resourcing); kandydat na aplikację adwokacką lub radcowską - tak (mapa rynku); klient-osoba fizyczna szukająca prawnika - nie polecam bezpośrednio; edukator LegalTech/vendor narzędzi prawniczych - obowiązkowo (mapa narzędzi i top use cases jako empiryczna mapa popytu). PIERWSZY TOM W BAZIE WIEDZY MateMatic Z EMPIRYCZNYMI DANYMI ADOPCJI AI W POLSKIM RYNKU PRAWNICZYM otwiera nową kategorię w katalogu BW - "raporty branżowe Polska". Direct complement do BW/050 Krause Moneyball (Krause uczy jak liczyć kancelarię, Supesu pokazuje jak polskie kancelarie używają AI - razem dwustronna mapa zarządcza); direct partner do BW/040 King vendor assessment (King daje 33 pytania audytowe, Supesu pokazuje których dostawców polski rynek już używa); direct complement do BW/039 RAII polityka AI (RAII daje szablon, Supesu pokazuje skalę problemu - 87 procent prawników bez polityki); direct partner do BW/036 Kuśmierek polski kontekst LegalTech (jakościowo-ilościowa mapa polskiego rynku LegalTech 2026); cross-reference do Aktualności 30.04.2026 (Workspace MCP plus Gemini Enterprise oraz Workspace jako natywne środowisko AI - operacyjne pytanie na jakiej edycji licencji Microsoft 365 prawnicy używają Copilot, czy mamy DPA, czy treść trafia poza Tenant); cross-reference do BW/049 Uberti-Bona Marin techno-normative AI accuracy (research prawny 81 procent jako top use case oznacza najczęstszy obszar gdzie halucynacja AI niekontrolowana wprost przekłada się na pismo procesowe - bez frameworku Uberti-Bona kancelaria nie wie kiedy AI jest gotowe do produkcji w research prawnym); cross-reference do BW/044 WEF/Capgemini (mapa dwukierunkowa sektor publiczny i prywatny); razem z BW/042 AICDI Responsible AI (13 procent firm globalnie ma framework governance, 87 procent prawników w PL używa AI - gap masowa adopcja narzędzi vs minimalna adopcja governance to luka, którą MateMatic wypełnia jako vendor-agnostic edukator). CO MateMatic WNIESIE: audyt adopcji AI w kancelarii w trzech sesjach - tier i DPA per narzędzie (ChatGPT, Copilot, Perplexity, Claude, lokalne LLM), polityka firmowa i scope'y (kto może używać czego, w jakich sprawach, na jakich danych), szkolenie zespołu z mapowaniem na art. 6 prawa o adwokaturze, art. 28 i 32 RODO, art. 26 AI Act. Trzy sesje, deliverable: polityka AI plus rejestr scope'ów plus program szkoleniowy. Razem z BW/050 Krause raport Supesu domyka mapę zarządczą polskiej kancelarii (ekonomia praktyki plus adopcja technologiczna - dwie warstwy decyzji zarządu, których do tej pory brakowało w jednym miejscu). Autor recenzji: Wiesław Mazur · MateMatic. ### BW/050 - Krause uczy kancelarie liczyć jak Billy Beane. Profit Formula z pięcioma składnikami i system ocen klientów A-F. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-30-krause-moneyball-for-lawyers.html Autor: Jeffrey S. Krause (Affinity Consulting Group, partner, atorney, technology guru, regularny speaker ABA TECHSHOW). Wydawca: Affinity Consulting Group (US-based legal technology consulting firm). Opis: "Moneyball for Lawyers: Using Data to Build a Major-League Practice" - prezentacja konferencyjna i ebook (2017-2025). Brak licencji CC - ebook komercyjny, paywall Affinity Consulting; MateMatic NIE hostuje PDF lokalnie. RECENZJA REFERENCYJNA oparta na publicznych syntezach pod prawem cytatu (art. 29 ustawy o prawie autorskim) z pięciu źródeł: (1) Krause J. "Inside Track: Moneyball for Lawyers", Wisconsin Bar InsideTrack vol. 11 issue 21, grudzień 2019; (2) Krause J. "Moneyball for Lawyers", Illinois State Bar Association IBJ, kwiecień 2017; (3) "Moneyball analytics: What law firms can learn from sports", Missouri Bar News; (4) Lawyerist Podcast #474 "Unlocking Profitability in Your Law Firm with Moneyball Tactics with Jeff Krause", listopad 2023 (Stephanie Everett, Zack Glaser, Sara Muender); (5) Lawyerist Podcast "The Hidden Cost of Bad Clients with Jeff Krause", grudzień 2025. Strona Krause'a: affinityconsulting.com/author/jeff-krause. DISCLOSURE: Krause to konsultant Affinity Consulting sprzedający usługi doradcze - jego framework ma agendę sprzedażową, recenzja MateMatic czyta z eksplicytnym filtrem agendy. CENTRALNA TEZA: kancelarie prawne robią z danymi to samo, co Major League Baseball robił przed 2002 rokiem - patrzą na surface numbers (revenue, expenses, billable hours), ignorują głębsze metryki, decydują "gut feeling" zamiast danymi. Krause przekłada zasady, którymi Billy Beane i Oakland Athletics przewrócili baseball, na zarządzanie kancelarią. TRZY OPERACYJNE NARZĘDZIA: 1. PROFIT FORMULA z pięcioma multiplikatywnymi składnikami: (Leads × Conversion × Klienci) × Transactions × Rate × Margin = Profit. Pięć składników: Leads (prospekty wchodzące do pipeline), Conversion (% leads → klienci, branża 20-30%, kancelarie deklarują 90%), Transactions (per klient - powtórzenia, dodatkowe usługi, retainer), Rate (stawka godzinowa/ryczałtowa/success fee), Margin (% przychodu zatrzymywany jako zysk). Przykład Krause'a Lawyerist Podcast 474: "100 leads × 25% conversion = 25 clients × 2 transactions × $5,000 = $250,000 revenue × 40% margin = $100,000 profit". EFEKT ZŁOŻONY: 10% wzrost w każdym z pięciu składników daje 61% wzrost zysku (nie 50% sumarycznie - mnożone). Cztery z pięciu składników = sales i marketing - kancelarie obsesyjnie tną koszty tylko piątego składnika margin. 2. SYSTEM OCEN KLIENTÓW A-F z korelacją do źródeł leadów. Klasyfikacja klienta: A (great to work with, pay on time, when phone rings happy to take call, send other people your way), B (reliable, low-maintenance), C (somewhat demanding, occasional late payment), D/F (take up a lot of extra time, make unreasonable demands, complain about bill, demand discounts, don't pay on time). STRATEGIA: korelować D-client sources z marketing efforts to eliminate unprofitable channels, while doubling down on A and B-client sources. Klient z polecenia od istniejącego A: prawdopodobnie A. Klient z reklamy Google Ads "tani prawnik": niemal zawsze D lub F. 3. HIDDEN COST OF BAD CLIENTS (rozwinięty Lawyerist Podcast grudzień 2025). Trzy ukryte koszty: opportunity cost (czas zespołu spędzony z F to czas niedostępny dla A), koszt moralny zespołu (zespoły obsługujące trudnych klientów rotują częściej, koszt rekrutacji i onboardingu), koszt reputacyjny (F polecający kancelarię w swoim networku przyniesie kolejnych F nie A). Klient F to nie minus przychodów, to minus instytucji. KLUCZOWE METRYKI których kancelarie nie śledzą: Lead Conversion Rate (kancelarie deklarują 90% prawda branżowa 20-30%, "huge eye-opener when a firm really sits down and tracks that"), Collection Realization (% klientów płacących na czas - billing 8 hours collecting for 5 generuje mniej profit niż billing 6 collecting all 6), Client Source Correlation (które kanały marketingowe dają jakie kategorie klientów), Time Allocation (godziny tracone na non-billable porządkowanie biurka otwieranie poczty - "how little time you are spending on the things that really matter"). REVENUE vs PROFITABILITY: Discount = ukryty koszt (aby osiągnąć $250K przy zniżce trzeba 28 klientów zamiast 25 - 11% więcej acquisition burden); 10% rate increase = możesz stracić 10% klientów i utrzymać przychód; Monthly/weekly tracking > Annual tracking ("the real story is how it's growing month to month, or week to week" - "final score happens for a reason"). MAPPING NA POLSKIE INSTRUMENTY: warstwa tajemnicy zawodowej i deontologii - oceny A-F nie mogą być przedmiotem dyskusji z osobami trzecimi (art. 6 PoA, art. 3 ustawy o radcach prawnych - wewnętrzny dokument zarządczy chroniony tajemnicą zawodową); zakończenie współpracy z F musi spełniać art. 7 KEA (etyczne zakończenie pełnomocnictwa) i art. 16 KEA (obowiązek poinformowania o terminach procesowych) - nie można "wyrzucić" klienta z dnia na dzień jeśli grozi to naruszeniem jego praw procesowych; system A-F nie może być instrumentem dyskryminacji - oceny musi być oparte na obiektywnych kryteriach (rentowność, terminowość płatności, jakość komunikacji), nie na cechach osobowych. warstwa RODO - system Krause'a wymaga profilowania klienta w rozumieniu art. 4 ust. 4 RODO - trzy obowiązki: art. 30 RODO rejestr czynności przetwarzania jako odrębny cel "zarządzanie wewnętrzne kancelarii i ocena rentowności klientów"; art. 32 RODO ograniczenie dostępu do ocen do wąskiego kręgu osób (zarząd, partner odpowiedzialny za klienta); art. 15 RODO odpowiedź na żądanie klienta o dostęp - jeśli klient zażąda kopii danych kancelaria musi przekazać również ocenę A-F z uzasadnieniem; PRAKTYCZNA GRANICA: nie pisz w bazie nic czego nie chciałbyś przekazać klientowi pod art. 15 RODO. warstwa polskiego rynku prawniczego - struktura odmienna od USA: kancelarie 1-5 osobowe 60% rynku, 5-30 osobowe 30%, BigLaw 30+ 10%; Profit Formula skalowalna ale system A-F sprawdza się najlepiej w kancelariach 5-30 osobowych (solo intuicyjnie zna swoich klientów, BigLaw potrzebuje automatyzacji której Krause nie omawia); polski rynek ma istotną kategorię klientów publicznych (jednostki samorządu, spółki Skarbu Państwa, ministerstwa) skomplikowaną w ocenie - klient publiczny może być F finansowo (długie terminy płatności, biurokracja) ale A reputacyjnie (referencja w sektorze). warstwa AI i mostek do MateMatic - Profit Formula i system A-F są operacyjnym fundamentem dla wdrożenia agentów AI w kancelarii; klient F zajmujący 20% czasu zespołu to dokładnie zadania które agent AI z human-in-the-loop oversight może obsłużyć z mniejszym kosztem (automatyczne odpowiedzi na powtarzalne pytania, generowanie szkiców pism, wstępna analiza dokumentów); bez systemu A-F kancelaria nie wie gdzie wdrażać agentów - mając system A-F precyzyjnie alokuje agentów AI do klientów F oszczędzając ludzkie godziny dla klientów A; strategiczna komplementarność której Krause sam nie wskazuje, polski rynek MateMatic ją wskazuje. PIĘĆ BRAKUJĄCYCH WARSTW: brak warstwy AI i agentów dziedzinowych (Krause od 2017 - przed erą operacyjnych agentów AI w kancelariach; Profit Formula 2026 powinna mieć SZÓSTY składnik AI Augmentation Ratio - procent rutynowych zadań delegowanych do agentów AI; polska kancelaria dopisuje ten składnik dając formułę sześcioskładnikową z efektem złożonym 77% wzrostu zysku przy 10% wzroście każdego składnika); brak warstwy regulacyjnej (amerykańska specyfika gdzie state bar association skupia się na deontologii nie ekonomii praktyki - polski adwokat NRA i radca KIRP filtruje rekomendacje przez zasady etyki samorządowej, "double down on A-source channels" wymaga w Polsce filtra czy kanał zgodny z zasadami etyki adwokackiej i radcowskiej); brak warstwy polskiej skali (Krause $200K-500K rocznie kancelaria solo USA, polska 800K-2M PLN kancelaria solo 5-osobowa - margins niższe niższe stawki godzinowe niż w USA, ale Profit Formula skalowalna; polska kancelaria dopisuje benchmark z badań branżowych Rzecznik Praw Adwokackich, raporty kancelarii rankingowych Rzeczpospolita/Forbes Polska); brak warstwy data analytics tooling (Krause "track these metrics" bez konkretnych narzędzi - polska kancelaria potrzebuje stack: CRM dla leadów HubSpot/Pipedrive/polski LiveSpace, billing software Mecenas Pro polski lub Clio amerykański, data warehouse Google Workspace + Looker Studio); brak warstwy "enough is enough" (Krause sprzedaje optymalizację co naturalne dla konsultanta - przeciwwaga: niektóre polskie kancelarie świadomie pozostają 5-osobowe ze względu na jakość życia partnerów; Profit Formula = środek do życia nie cel sam w sobie). USE CASE'Y: partner zarządzający kancelarii 5-30 osobowej - obowiązkowo (Profit Formula plus system A-F = natywne narzędzia decyzji zarządczych, wartość 60-70% wzrost zysku w skali roku przy systematycznym wdrożeniu pięciu mikro-eksperymentów); solo praktyk planujący skalowanie do 3-5 osób - tak (matematyczny argument w którym składniku typically conversion lub margin tkwi największy potencjał wzrostu - determinuje kogo zatrudnić następnego); compliance officer/IOD kancelarii - selektywnie (system A-F wymaga audytu pod RODO art. 4 ust. 4 profilowanie plus art. 32 zabezpieczenia, wartość: nauczenie się jak wdrożyć system zarządczy zgodnie z RODO i tajemnicą zawodową); marketingowiec/dyrektor sprzedaży kancelarii - obowiązkowo (korelacja źródeł leadów do A-F = natywna mapa decyzji budżetowych marketing - eliminacja kanałów F-generujących, double-down na A-generujących); zarząd kancelarii BigLaw 30+ - selektywnie (Profit Formula skalowalna ale A-F wymaga automatyzacji której Krause nie dostarcza; wartość koncepcyjna mapa, trzeba zaimplementować na własnych narzędziach Salesforce, Tableau); adwokat doradzający korporacji - tak (system A-F i Profit Formula transferowalne na klienta B2B w branżach deweloperskiej/doradczej/IT); klient indywidualny szukający kancelarii - nie polecam bezpośrednio (narzędzie dla zarządu kancelarii nie dla klienta wybierającego prawnika). PIERWSZY TOM W BAZIE WIEDZY POŚWIĘCONY WEWNĘTRZNEJ EKONOMII KANCELARII - otwiera DWUNASTĄ WARSTWĘ STACK'U GOVERNANCE MateMatic obok jedenastu dotychczasowych warstw etyki AI, regulacji, runtime architektury, polityki firmowej, audytu dostawców. POWIĄZANIE Z INNYMI TOMAMI: direct complement do BW/049 Uberti-Bona Marin techno-normative AI accuracy (rygor pomiaru accuracy AI plus rygor pomiaru profitability kancelarii - dwa tomy razem dają framework data-driven law firm: AI bez ekonomii nie generuje wartości, ekonomia bez AI nie skaluje się); direct partner do BW/047 Turing PBG Framework (etyka AI sektora publicznego plus ekonomia kancelarii prywatnej - dwa tomy mapują dwie strony rynku LegalTech: kancelaria obsługująca administrację plus kancelaria optymalizująca własną ekonomię); direct complement do BW/040 King AI Vendor Assessment (King 33 pytania audytowe do dostawcy LegalTech plus Krause struktura w której polska kancelaria decyduje czy w ogóle warto kupować LegalTech - Profit Formula składnik 5 margin pokazuje rozmiar oszczędności na automatyzacji, King daje listę pytań audytujących konkretnego dostawcę - matematyczna decyzja "czy" plus operacyjna decyzja "który"); razem z BW/044 WEF/Capgemini Public Sector (WEF mapuje gotowość sektora publicznego do AI, Krause mapuje gotowość sektora prywatnego kancelarii); razem z BW/042 AICDI Responsible AI (AICDI 13% firm globalnie ma framework AI governance, Krause jeszcze mniej kancelarii ma framework profitability - polska kancelaria może być w 10% mających oba = dyferencjacja konkurencyjna); razem z BW/048 Komisja Europejska DMA Review (DMA chroni biznesowych użytkowników gatekeeperów, Krause uczy kancelarie jak być rentownym biznesem - nie być "bad client" wobec własnych dostawców LegalTech). DLA MateMatic: WARSTWA WEWNĘTRZNEJ EKONOMII KANCELARII w stack'u governance. DWUNASTOWARSTWOWY STACK obejmuje teraz: BW/009 taksonomia ryzyk, BW/038 akademia etyki europejskiej, BW/039 polityka firmowa, BW/040 vendor assessment, BW/042 benchmark globalny, BW/044 sektor publiczny, BW/045 runtime architektura, BW/046 synteza standardów, BW/047 procesowy framework etyki, BW/048 regulacja konkurencji, BW/049 rygorystyczny pomiar accuracy, plus BW/050 ekonomia praktyki kancelarii. Bez tej warstwy stack mówi jak zbudować bezpieczny i etyczny system AI ale nie mówi jak ten system ma się zwracać kancelarii w wymiernym zysku. Krause domyka pętlę. CO MateMatic WNIESIE - audyt Profit Formula plus mapowanie A-F dla polskiej kancelarii w trzech sesjach: warstwa pomiaru pięciu składników z benchmarkiem polskiego rynku, warstwa klasyfikacji klientów z filtrem deontologicznym i RODO, warstwa AI Augmentation Ratio jako szóstego składnika formuły dostępnego w erze agentów dziedzinowych - Profit Formula zwraca się przez agentów AI obsługujących klientów F-kategorii oszczędzając godziny zespołu dla klientów A. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/049 - Maastricht i Tübingen mówią adwokatowi: "accuracy" nie jest pomiarem, jest wyborem normatywnym. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-30-uberti-bona-marin-techno-normative-ai-accuracy.html Autorzy: Lucas G. Uberti-Bona Marin (Law & Tech Lab, Maastricht University), Bram Rijsbosch (Law & Tech Lab, Maastricht University), Kristof Meding (Computational Law Lab, University of Tübingen), Gerasimos Spanakis (Law & Tech Lab, Maastricht University), Gijs van Dijck (Law & Tech Lab, Maastricht University), Konrad Kollnig (Law & Tech Lab, Maastricht University). Maastricht Law & Tech Lab - jeden z najbardziej cytowanych europejskich ośrodków prawa AI i danych, powiązany z European Law Institute. Wydawca: ACM (FAccT '26), arXiv preprint. Opis: "Is your AI Model Accurate Enough? The Difficult Choices Behind Rigorous AI Development and the EU AI Act", FAccT '26 - ACM Conference on Fairness, Accountability, and Transparency, Montreal QC Canada, 25-28 czerwca 2026 (19 stron). arXiv:2604.03254v2 [cs.CY], 28.04.2026. Licencja: CC BY 4.0 - MateMatic hostuje PDF lokalnie z atrybucją. arXiv: arxiv.org/abs/2604.03254. FAccT to wiodąca światowa konferencja etyki AI, cytowane miejsce publikacji dla badań cytowanych następnie przez OECD, Komisję Europejską i regulatorów krajowych. CENTRALNA TEZA: accuracy w systemach AI nie jest property obiektywnym, mierzalnym i czysto technicznym - jest sumą czterech techno-normative choices, z których każdy ma konsekwencje prawne pod art. 15 AI Act i społeczne dla affected persons w obszarach high-risk (healthcare, public administration, law enforcement). KLUCZOWE POJĘCIE: techno-normative choices - choices that are simultaneously technical and normative, where the technical implementation determines how normative assumptions materialise in practice. Nie istnieje czysto techniczne rozwiązanie problemu accuracy w high-risk AI - każda decyzja inżynieryjna jest jednocześnie decyzją etyczno-prawną. STRUKTURA 8 SEKCJI: 1 Introduction (teza i terminologia); 2 Accuracy in the EU AI Act (2.1 High-Risk Requirements including accuracy, 2.2 Function of the Accuracy Obligation); 3 From Legal Requirements to Technical Practice (3.1 Accuracy and performance evaluations in ML workflows, 3.2 Structure of the Analysis and Illustrative Use Case); 4 Choice 1: Selecting Metrics (4.1 relevance for AI Act, 4.2 technical considerations); 5 Choice 2: Balancing multiple metrics (5.1 relevance, 5.2 technical considerations); 6 Choice 3: Measuring accuracy metrics (6.1 relevance, 6.2 technical considerations); 7 Choice 4: Determining acceptance thresholds for accuracy (7.1 relevance, 7.2 technical); 8 Conclusions: How to Reach More Meaningful Performance Evaluations. Każda sekcja choice'a ma identyczną strukturę - relevance plus technical - co ułatwia przekład na operacyjną listę pytań audytowych dla polskiej kancelarii. CZTERY TECHNO-NORMATIVE CHOICES jako szkielet pracy compliance officera: Choice 1 Selecting Metrics - precision (chroni przed false positives gdy koszt fałszywego oskarżenia wysoki), recall (chroni przed false negatives gdy koszt przeoczenia wysoki - rak, terror), F1 (średnia harmoniczna), MCC Matthews Correlation Coefficient (najbardziej rygorystyczny dla niezbalansowanych klas), AUC (mierzy klasyfikator niezależnie od progu, ale ukrywa rzeczywiste decyzje progowe), accuracy mylące dla zbiorów niezbalansowanych (np. bazowa częstość 2% to model "zawsze brak" osiąga 98% accuracy); Choice 2 Balancing multiple metrics - tension precision-recall, optymalizacja jednego pogarsza drugie; pytanie strategiczne który błąd droższy: bank pranych pieniędzy (false positive tani, false negative kara KNF), diagnostyka medyczna (false positive niepotrzebna operacja, false negative niewykryty rak), scoring kredytowy (false positive default banku, false negative odmowa obywatelowi); decyzja zarządu z dokumentacją uzasadnienia, NIE inżyniera; Choice 3 Measuring metrics - sample bias (dataset 2018 deployment 2026 - distribution shift psuje accuracy), internal test split (zawyża accuracy) vs out-of-distribution external dataset (realistyczne ale zwykle niższe), reprezentacja grup demograficznych klienta (etniczność, region, dochód) - jeśli grupa nie reprezentowana accuracy nie ma znaczenia dla niej; Choice 4 Determining acceptance thresholds - próg zależy od (a) kosztu błędu, (b) bazowej częstości problemu, (c) dostępności alternatyw, (d) regulacyjnego minimum, (e) ekonomii deploymentu; "appropriate level" art. 15 AI Act jest kontekstualne, kancelaria buduje własny próg z protokołu uchwały zarządu, nie akceptuje progu narzuconego przez dostawcę. MAPPING NA POLSKIE INSTRUMENTY: warstwa AI Act - Choice 1 i 2 → art. 15 (accuracy/robustness/cybersecurity) plus art. 9 (risk management); Choice 3 → art. 10 (data and data governance - jakość, prowenience, reprezentatywność); Choice 4 → art. 14 (human oversight - decyzja o progu z nadzorem ludzkim); wszystkie cztery razem → art. 13 (transparency to deployers - dokumentacja czterech wyborów) plus art. 26 (deployer obligations - klient-deployer ma obowiązek zrozumieć cztery wybory dostawcy); siedem high-risk requirements AI Act mapowane systemowo. warstwa RODO - art. 22 (zautomatyzowane decyzje) plus art. 35 (DPIA) razem wymagają dokumentacji wyborów wpływających na osobę; cztery techno-normative choices SĄ dokładnie tą dokumentacją; bez dokumentacji decyzja zautomatyzowana nie spełnia art. 5 ust. 2 RODO (rozliczalność) ani art. 15 ust. 1 lit. h RODO (prawo do informacji o logice decyzji). warstwa polskiego sektora LegalTech - dostawcy (Gaius-Lex, Datapoint, Lexagent, mniejsze startupy) prezentują benchmarki accuracy bez ujawniania czterech wyborów; cztery konkretne pytania audytowe dla polskiej kancelarii kupującej LegalTech: jaką metrykę optymalizujecie i dlaczego (Choice 1), jak balansujecie precision/recall i kto ustalił trade-off (Choice 2), na jakim datasecie mierzyliście i czy obejmuje polskie orzecznictwo z ostatnich 24 miesięcy (Choice 3), jaki jest próg akceptacji i czy klient może go renegocjować dla swojego use case (Choice 4) - zmieniają dynamikę rozmowy zakupowej. warstwa tajemnicy zawodowej adwokackiej i radcowskiej - Choice 3 (Measuring metrics) musi być wykonywane na datasecie który nie zawiera akt klientów lub jest fully anonymized zgodnie z art. 4 ust. 5 RODO; specyficzny polski wymóg którego paper nie omawia ale którego strukturę pozwala wprowadzić. PIĘĆ BRAKUJĄCYCH WARSTW: brak warstwy LLM-ów i generatywnej AI (paper o klasyfikacji nie generative - cztery choices aplikowalne ale wymagają tłumaczenia z metryki klasyfikacyjnej na metrykę generative jak halucynacje, faithfulness, groundedness, citation correctness); brak konkretnego illustrative use case z sektora prawnego (use case prawdopodobnie healthcare lub public sector classification - polska kancelaria wykonuje własny use case dla LegalTech); brak rekomendacji konkretnych progów accuracy dla różnych domen (słusznie ale luka praktyczna, mitigacja: wzorowanie się na progach w sektorach pokrewnych medycyna/lotnictwo plus własna dokumentacja uzasadnienia z art. 9 AI Act); brak warstwy odpowiedzialności cywilnoprawnej za błędy modelu (paper o konsekwencjach społecznych nie cywilnych - polska kancelaria dopisuje art. 415/471 KC plus projektowane dyrektywy unijne o odpowiedzialności za AI); brak pomysłu na automatyzację audytu czterech choices (agenda przyszła, polskie Tech Lab'y uniwersyteckie UJ/PW/AGH jako uczestnicy). KEY INSIGHT: dotychczas dostawca LegalTech mówił "nasz model ma 94% accuracy więc spełnia art. 15 AI Act"; po tym paperze polska kancelaria odpowiada "94% pod jaką metryką, balansowaną w jaki sposób, na jakiej próbie, z jakim progiem akceptacji - i kto poniesie koszt błędów po waszej stronie wyboru"; argument akademicki, który przesuwa ciężar dowodu z obywatela/klienta na dostawcę/organ. USE CASE'Y: compliance officer kancelarii doradzającej dostawcy LegalTech - obowiązkowo (cztery techno-normative choices wprost do regulaminu wewnętrznego dokumentacji art. 15 AI Act); adwokat reprezentujący klienta-deployera kupującego LegalTech - obowiązkowo (cztery pytania audytowe zmieniają dynamikę rozmowy zakupowej); adwokat reprezentujący stronę postępowania administracyjnego z udziałem AI - obowiązkowo (argument accuracy jako techno-normative choice przesuwa ciężar dowodu); IOD organów administracji i regulatorów - obowiązkowo (mapowanie czterech choices na art. 35 RODO DPIA - struktura raportu); polski startup LegalTech jako narzędzie sprzedażowe - obowiązkowo (dokumentacja czterech choices to inwestycja w wiarygodność); klient-zarząd polskiej spółki bez doradcy - tylko Sekcja 1 i 8; mała kancelaria 5-10 osobowa bez klientów-deployerów AI - selektywnie (lepsza inwestycja BW/047 Turing lub BW/039 RAII). POWIĄZANIE Z INNYMI TOMAMI: direct partner do BW/034 Kumaran (LLM biases pomiaru choice-supportive bias plus hypersensitivity to contradiction) - razem stanowią parę: biasy modelu plus biasy pomiaru = empiryczny argument za rygorystyczną dokumentacją; direct complement do BW/035 Laban (LLMs corrupt documents) - Laban mierzy degradację jakości dokumentu po 20 iteracjach delegacji LLM, Uberti-Bona Marin pokazuje jak w ogóle mierzymy jakość - bez paperu Maastricht/Tübingen pomiar Labana byłby naiwny; direct complement do BW/047 Turing PBG Framework (sześć zasad SSAFE-D plus jedenaście etapów cyklu - cztery choices są operacyjną dekompozycją zasady Safety w etapach Model Testing & Validation oraz System Use & Monitoring); direct complement do BW/046 Berkeley CLTC GPAI Profile (cztery funkcje GMMM - Choice 1-4 pogłębiają funkcję MEASURE w czterech wyborach z drabinką decyzyjną); direct complement do BW/045 Kenney runtime enforcement (Zasada 2 continuous authorization - cztery choices są continuous techno-normative re-evaluation, Zasada 2 w wymiarze operacyjnym); direct complement do BW/040 King AI Vendor Assessment Guide V2.0 (33 pytania audytowe w 12 domenach plus cztery dodatkowe pytania performance evaluation - polski adwokat kupujący LegalTech używa równolegle); razem z BW/038 Smuha Cambridge Handbook akademia europejska - Smuha encyklopedia, Uberti-Bona Marin precyzyjne narzędzie operacyjne dla jednego z głównych obowiązków AI Act. DLA MateMatic: WARSTWA POMIARU I RYGORU TECHNICZNEGO w stack'u governance. JEDENASTOWARSTWOWY STACK obejmuje teraz: BW/009 taksonomia ryzyk, BW/038 akademia etyki europejskiej, BW/039 polityka firmowa, BW/040 vendor assessment, BW/042 benchmark globalny, BW/044 sektor publiczny, BW/045 runtime architektura, BW/046 synteza standardów, BW/047 procesowy framework etyki, BW/048 regulacja konkurencji, plus BW/049 rygorystyczny pomiar accuracy. Bez tej warstwy stack mówi co robić z accuracy ale nie mówi jak ją audytować. CO MateMatic WNIESIE - audyt czterech techno-normative choices w polityce AI klienta-deployera w trzech sesjach: warstwa wyboru metryki dla konkretnego use case (precision/recall/F1/MCC z mapowaniem na koszt błędów), warstwa balansowania trade-offów z dokumentacją uchwały zarządu, warstwa pomiaru na reprezentatywnym datasecie z polskimi danymi i grupami demograficznymi, warstwa progu akceptacji z cyklem rewizji. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/048 - Komisja ocenia własną ustawę o gatekeeperach. Polska kancelaria czyta to za sprzedawcę z Allegro. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-30-ec-dma-review-swd-2026-123.html Autorzy: European Commission (DG CNECT, DG COMP). Pierwszy oficjalny przegląd Digital Markets Act zgodnie z art. 53 DMA - termin statutowy 3 maja 2026, opublikowany 28 kwietnia (cztery dni wcześniej). Wydawca: European Commission, Brussels. Opis: Commission Staff Working Document SWD(2026) 123 final, towarzyszący Report from the Commission to the European Parliament, the Council and the EESC, COM(2026) 178 final - Review of Regulation (EU) 2022/1925 of the European Parliament and of the Council on contestable and fair markets in the digital sector and amending Directives (EU) 2019/1937 and (EU) 2020/1828 (Digital Markets Act), in accordance with Article 53 thereof. Brussels, 28.04.2026 (87 stron). Licencja: CC BY 4.0 wedle Decision 2011/833/EU - oficjalne dokumenty Komisji dostępne do reuse z atrybucją; MateMatic hostuje PDF lokalnie. Strona: commission.europa.eu, EUR-Lex. SIEDMIU DESIGNOWANYCH GATEKEEPERÓW na 30.04.2026: Alphabet (Google Search/Maps/Play/Chrome/ YouTube/Android/Ads), Apple (App Store/iOS/iPadOS/Safari), Meta (Facebook/Instagram/WhatsApp/ Messenger/Marketplace/Ads), Amazon (Marketplace/Ads), Microsoft (Windows/LinkedIn), ByteDance (TikTok), Booking.com (online intermediation services). STRUKTURA 4 SEKCJI: Sekcja 1 Introduction - kontekst regulacyjny, scope pierwszego review, metodologia (dane od gatekeeperów compliance reports plus trzecich stron plus Working Groups technical workshops plus public consultation 2025), struktura; Sekcja 2 Assessment of DMA's contributions toward more contestable and fair digital markets w sześciu obszarach: 2.1 giving users back control over their data (art. 5), 2.2 opening-up ecosystems (art. 6 - defaults i choice screens art. 6(3), data portability art. 6(9), interoper- ability art. 7, FRAND access art. 6(7), sideloading art. 6(4), anti self-preferencing art. 6(5), zakaz used data o sprzedawcach do konkurencji art. 6(2)), 2.3 fair online search, 2.4 fair online marketplaces, 2.5 advertising transparency, 2.6 other DMA obligations; Sekcja 3 Reporting requirements: 3.1 reporting on concentrations art. 14 DMA (notyfikacja transakcji M&A przez gatekeeperów niezależnie od progów EUMR 139/2004), 3.2 audited consumer profiling report art. 15 DMA (osobno dla każdego CPS); Sekcja 4 Assessment of scope DMA: 4.1 cloud computing services (obecnie poza zakresem DMA - AWS, Microsoft Azure jako cloud, Google Cloud Platform - sygnał regulacyjny rozszerzenia), 4.2 inne core platform services i online intermediation services. KLUCZOWE POJĘCIE - ex ante regulatory framework: DMA wprowadza nowy reżim regulacyjny działający prewencyjnie, nakładający obowiązki na gatekeepera niezależnie od wykazania szkody konkurencyjnej (różny od ex post art. 102 TFUE i art. 9 ustawy o ochronie konkurencji i konsumentów). Polska kancelaria reprezentująca biznesowego użytkownika gatekeepera zyskuje narzędzie do działania zanim szkoda wystąpi - lub do egzekucji obowiązku, który DMA już nakłada. EMPIRYCZNA MAPA COMPLIANCE SOLUTIONS PER GATEKEEPER: Meta "Consent or Pay" advertising model uznany non-compliant z art. 5(2) DMA decyzją Komisji 24.04.2025 (Meta apeluje); Meta wprowadza alternatywę "less-personalised ads"; ByteDance wprowadza consent screen dla personalizowanych reklam łączących dane z różnych usług; Microsoft daje końcowym użytkownikom wybór mniej spersonalizowanej wersji LinkedIn jeśli nie zgadzają się na łączenie danych z innymi usługami; Apple wdraża choice screens dla wyszukiwarek, możliwość deinstalacji preinstalowanych aplikacji, sideloading aplikacji spoza App Store na iOS; Alphabet rolluje data portability APIs (rozszerzenie Article 20 GDPR), choice screens, anti self-preferencing w Google Search; Booking.com zmiana praktyk MFN (rate parity) i marketingowej data portability; Amazon zmiany w wykorzystywaniu danych o sprzedawcach na Marketplace. ARTYKUŁY KLUCZOWE: art. 5 obowiązki samowykonalne (data combination, anti-steering business users, MFN klauzule), art. 6 obowiązki specyfikacji (data portability art. 6(9), FRAND access do features OS art. 6(7), sideloading art. 6(4), choice screens art. 6(3), anti self-preferencing art. 6(5), zakaz used data o sprzedawcach do konkurencji art. 6(2), interoperability hardware art. 6(7)), art. 7 interoperability messaging plus open question rozszerzenia na social networking services, art. 14 notyfikacja koncentracji niezależnie od progów EUMR, art. 15 audytowane raporty profilowania konsumentów osobno dla każdego CPS. MAPPING NA POLSKIE INSTRUMENTY: warstwa polskiej ustawy o ochronie konkurencji - DMA jest aktem unijnym bezpośrednio stosowalnym w Polsce, jedynym egzekutorem Komisja Europejska wedle art. 38 DMA, polskie organy nie mogą wszczynać postępowań na podstawie DMA; jednocześnie UOKiK ma własną jurysdykcję pod art. 9 ustawy o ochronie konkurencji i konsumentów (nadużycie pozycji dominującej) - może zachodzić równolegle z DMA, polska kancelaria buduje matrycę decyzyjną dwóch ścieżek dla każdego klienta-skarżącego (ścieżka unijna preferowana dla obowiązków samowykonalnych z art. 5 DMA, ścieżka krajowa szybsza dla nadużyć w polskim rynku referencyjnym). warstwa AI Act - art. 5 DMA (zakaz łączenia danych użytkowników bez zgody) i AI Act art. 5(1)(a) (prohibited manipulative AI techniques) mają nakładające się obszary - gatekeeper stosujący AI-powered targeting łączący dane z dwóch CPS bez zgody narusza oba reżimy jednocześnie; art. 15 DMA (audited consumer profiling) jest technologiczną implementacją wymogów AI Act art. 12 record-keeping i art. 27 FRIA dla high-risk AI systems w zakresie profilowania; polski advertiser broniący się przed nieuczciwym targetingiem konkurenta na Meta/Google ma dwie warstwy prawne na jeden problem. warstwa polskich biznesowych użytkowników gatekeeperów - sprzedawcy Amazon Marketplace (DMA art. 6(2) zakaz used data o sprzedawcach do konkurencji), polscy deweloperzy aplikacji w App Store i Google Play (art. 5(7) alternative payment methods, art. 6(4) sideloading), polscy advertiserzy płacący Meta i Google Ads (art. 5(2) zgoda na łączenie danych, art. 6(8) data portability for advertisers), polskie hotele rozliczające się z Booking.com (art. 5(3) anti-MFN), polscy wydawcy publikujący w wynikach Google Search (art. 6(5) anti self-preferencing) - każda kategoria ma w DMA konkretne uprawnienie egzekwowalne przez polską kancelarię. warstwa tajemnicy zawodowej - specyficzny problem komunikacji adwokata z klientem przez Gmail (Alphabet), iMessage (Apple), WhatsApp (Meta), Microsoft Teams, LinkedIn Messaging - wszystko platformy designowanych gatekeeperów; gdy klient skarży gatekeepera potencjalny konflikt strukturalny; mitigacja: end-to-end encrypted komunikacja przez kanały spoza ekosystemu (Signal, Threema), klauzula tajemnicy w umowie z klientem, dokumentacja kanałów komunikacji z timestampem. warstwa odpowiedzialności cywilnoprawnej - SWD nie omawia odzyskania odszkodowania za szkodę z non-compliance gatekeepera, polski adwokat dopisuje: art. 415 KC (delikt) plus art. 471 KC (odpowiedzialność kontraktowa) plus dyrektywa 2014/104/UE private antitrust enforcement implementowana w Polsce ustawą z 2017 roku - ścieżka przez sądy polskie niezależna od enforcement Komisji. CZTERY BRAKUJĄCE WARSTWY: brak wymiaru polskiego rynku (SWD ogólnounijny - brakuje danych ile polskich business users skorzystało z DMA enforcement, jakie polskie spółki dotknięte non-compliance); brak deklaracji agendy autorskiej (Komisja ocenia akt którego sama jest autorem, sama implementuje, sama egzekwuje - strukturalny konflikt interesów); brak warstwy odpowiedzialności cywilnoprawnej (jak business user ma odzyskać odszkodowanie); brak praktycznego przewodnika dla MŚP (język urzędniczo-akademicki, brak flowchartu decyzyjnego); brak warstwy enforcement priorities Komisji w 2026-2027. KEY INSIGHT: ex ante regulatory framework DMA daje polskiej kancelarii fundamentalnie nowe narzędzie wobec dotychczasowego art. 102 TFUE i art. 9 ustawy polskiej - regulacja działa zanim szkoda wystąpi, business user może egzekwować obowiązek gatekeepera niezależnie od wykazania szkody konkurencyjnej w polskim rynku referencyjnym. USE CASE'Y: adwokat reprezentujący polskiego business usera gatekeepera (Allegro nie jest gatekeeperem ale Amazon jest, ścieżka decyzyjna inna) - obowiązkowo; kancelaria doradzająca polskim deweloperom aplikacji w App Store/Google Play - obowiązkowo (sideloading, choice screens, FRAND access, alternative payments); adwokat doradzający polskim sprzedawcom Amazon Marketplace - obowiązkowo (art. 6(2) zakaz used data plus art. 5(3) anti-MFN); kancelaria doradzająca polskim hotelom rozliczającym się z Booking.com - obowiązkowo (art. 5(3) rate parity, art. 6(8) data portability marketingowa); adwokat w M&A z gatekeeperami - obowiązkowo (art. 14 notyfikacja koncentracji nawet poniżej progów EUMR); UOKiK i polski regulator - tak jako materiał benchmarkowy metodologiczny; compliance officer kancelarii bez klientów-business users gatekeeperów - selektywnie (operacyjnie lepiej BW/047 Turing lub BW/039 RAII); klient-zarząd polskiej spółki bez doradcy - nie polecam bezpośrednio (język regulacyjny, abstrakcja prawno-ekonomiczna). POWIĄZANIE Z INNYMI TOMAMI: PIERWSZY TOM W BAZIE WIEDZY POŚWIĘCONY REGULACJI KONKURENCJI sektora cyfrowego, otwiera dziesiątą warstwę stack'u governance MateMatic; direct complement do BW/001 Kenney Governing Agents (cztery reżimy regulacyjne plus DMA jako PIĄTY reżim dla agentów AI działających w ekosystemach gatekeeperów - polski adwokat doradzający dostawcy LegalTech którego agent integruje się z Google Workspace/Microsoft 365/Apple Business Chat musi czytać Kenneya plus DMA jako jedną mapę regulacyjną); direct complement do BW/047 Turing AI Ethics (Turing framework etyki AI dla sektora publicznego, DMA framework regulacji konkurencji dla sektora prywatnego - razem pokrywają dwa najważniejsze obszary high-risk AI w UE); direct complement do BW/044 WEF/Capgemini Public Sector (WEF gdzie sektor publiczny może wdrażać AI, DMA jak sektor prywatny już wdraża AI w CPS - pełna mapa regulacyjna AI w UE); razem z BW/030 ENISA Security-by-Design (security w cyklu życia produktu vs otwartość/contestability DMA - napięcie art. 6(7) FRAND access bez kompromisu integrity); razem z BW/043 OASIS CoSAI (capability-based authorization plus DMA art. 6(7) FRAND plus DMA art. 7 interoperability - architektura agenta AI w ekosystemie gatekeepera z wyraźną tożsamością i prawem do interoperability). DLA MateMatic: NOWA WARSTWA STACK'U - regulacja rynkowa. Dziesięciowarstwowy stack (BW/009 taksonomia ryzyk, BW/038 akademia etyki europejskiej, BW/039 polityka firmowa, BW/040 vendor assessment, BW/042 benchmark globalny, BW/044 sektor publiczny, BW/045 runtime architektura, BW/046 synteza standardów, BW/047 procesowy framework etyki) zyskuje dziesiątą warstwę BW/048 regulacja konkurencji ekosystemów cyfrowych. Bez tej warstwy stack rozumie etykę i bezpieczeństwo AI ale nie rozumie struktury rynku w którym AI jest dystrybuowane i monetyzowane. CO MateMatic WNIESIE - audyt uprawnień klienta-business usera gatekeepera w trzech sesjach: mapowanie obowiązków DMA wobec konkretnego gatekeepera (art. 5/6/7 plus reporting), opracowanie matrycy decyzyjnej "ścieżka unijna vs polska UOKiK vs cywilnoprawna sądy polskie", przygotowanie szablonu skargi do Komisji lub UOKiK z uwzględnieniem powiązań DMA-AI Act-RODO. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/047 - Alan Turing Institute pisze etykę AI dla brytyjskiego urzędnika. Polska kancelaria czyta to za polskiego. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-30-leslie-turing-ai-ethics-governance-introduction.html Autorzy: David Leslie, Cami Rincón, Morgan Briggs, Antonella Perini, Smera Jayadeva, Ann Borda, SJ Bennett, Christopher Burr, Mhairi Aitken, Michael Katell, Claudia Fischer (Public Policy Programme, Ethics Theme, The Alan Turing Institute). David Leslie - Director of Ethics and Responsible Innovation Research at Turing, jeden z najbardziej cytowanych autorów w etyce AI, członek OECD AI Network of Experts. Wydawca: The Alan Turing Institute (brytyjski narodowy instytut AI). Opis: "AI Ethics and Governance in Practice: An Introduction", 2023, Version 1.2 (68 stron). Licencja: CC BY 4.0 - MateMatic hostuje PDF lokalnie z atrybucją wszystkich jedenastu autorów. Strona programu: turing.ac.uk/ai-ethics-governance. PIERWSZY Z OŚMIU WORKBOOKÓW curriculum aktualizującego oryginalne UK Government Public Sector Guidance on AI Ethics and Safety z 2019 roku (Office for AI plus Government Digital Service plus Alan Turing Institute). Aktualizacja zlecona w UK National AI Strategy 2021 jako "key action". Finansowanie: UKRI Strategic Priorities Fund, EPSRC Grant EP/W006022/1, Office for AI. PROGRAMME CURRICULUM 8 WORKBOOKÓW: ten Introduction plus AI Sustainability in Practice (Part One i Part Two), AI Safety in Practice, AI Accountability in Practice, AI Fairness in Practice, AI Transparency and Explainability in Practice, Responsible Data Stewardship in Practice plus jeden tom horyzontalny zarządzania programem. TRÓJPOZIOMOWA ARCHITEKTURA NORMATYWNA: poziom 1 SUM Values jako fundament moralny (basic and fundamental beliefs that guide and motivate attitudes or actions); poziom 2 SSAFE-D Principles jako sześć actionable goals (Sustainability, Safety, Accountability, Fairness, Explainability, Data Stewardship); poziom 3 PBG Framework Process-Based Governance jako mechanizm integracji SSAFE-D w design/development/deployment processes plus szablon dokumentowania działań governance. JEDENASTOETAPOWY CYRKULARNY CYKL ŻYCIA AI/ML (z Burr i Leslie 2022) z trzema meta-fazami: DESIGN (Project Planning, Problem Formulation, Data Extraction or Procurement, Data Analysis); DEVELOPMENT (Preprocessing & Feature Engineering, Model Selection & Training, Model Testing & Validation); DEPLOYMENT (System Implementation, User Training, System Use & Monitoring, Model Updating or Deprovisioning) - cyrkularnie zwrotnie do Project Planning kolejnej iteracji. KEY CONCEPT SOCJOTECHNICZNY: agenda-setting power - władza ustawiania agendy, fenomen w którym sama decyzja nie jest największym źródłem problemu tylko fakt że pojawiła się jako temat do rozważania podczas gdy alternatywne podejścia zostały wykluczone z dyskusji jeszcze przed jej rozpoczęciem. Workbook zachęca prawnika do cofnięcia się o jeden krok - od "czy to zgodne z RODO" do "czy w ogóle warto wdrażać AI w tej domenie". CARE i ACT Framework dla Responsible Research and Innovation jako uzupełnienie. MAPPING NA POLSKIE INSTRUMENTY: warstwa AI Act - SSAFE-D razem mapuje się na rdzeń wymogów dla high-risk AI systems w Załączniku III: Sustainability → art. 13 trwała transparentność plus art. 72 post-market monitoring; Safety → art. 9 risk management throughout lifecycle plus art. 15 accuracy/robustness/cybersecurity; Accountability → art. 14 human oversight plus art. 26 deployer obligations plus art. 50; Fairness → art. 10 data and data governance plus motyw 56; Explainability → art. 13 plus art. 86 right to explanation; Data Stewardship → art. 10 training/validation/testing data sets plus pełen reżim RODO. Administracja publiczna w Polsce wdrażająca AI w decyzjach świadczących/nadzorze/ sądownictwie/migracji niemal zawsze high-risk Załącznika III. warstwa RODO - Data Stewardship z 5 podzasad mapowane 1:1 na art. 5 RODO: quality → art. 5 ust. 1 lit. d, provenance → art. 5 ust. 1 lit. a plus art. 14, integrity → art. 5 ust. 1 lit. f, fairness → art. 5 ust. 1 lit. a, data minimization → art. 5 ust. 1 lit. c. PBG Framework jako mechanizm dokumentowania → art. 5 ust. 2 rozliczalność. PBG faza Design (Project Planning plus Problem Formulation) → art. 35 RODO DPIA jako natywny ekwiwalent procedury. warstwa polskiego sektora publicznego - workbook dostarcza importowanego know-how którego polski rynek nie ma (UK ma od 2019 oficjalne wytyczne, Polska nie ma operacyjnego curriculum mimo Polityki Rozwoju Sztucznej Inteligencji MC 2024). Kancelaria obsługująca KPRM/MC/samorządy/ regulatory branżowe (UODO/KNF/UKE) adaptuje SUM Values do polskich wartości konstytucyjnych: art. 30 godność człowieka, art. 32 równość wobec prawa, art. 2 państwo prawa. Polityka etyki AI w polskiej administracji jurysdykcyjnie polska w warstwie wartości, regulacyjnie unijna w warstwie zasad, operacyjnie brytyjska w warstwie procesu. warstwa tajemnicy zawodowej - workbook milczy bo brytyjski sektor publiczny nie ma odpowiednika polskiej tajemnicy adwokackiej i radcowskiej. Polska kancelaria dopisuje. Tajemnica adwokacka art. 6 PoA i KEA, radcowska art. 3 ustawy o radcach prawnych i KERP wchodzi w napięcie z Data Stewardship gdy adwokat doradza urzędowi w sprawach w których strona postępowania jest jednocześnie klientem kancelarii w innej sprawie - PBG Framework etap Data Extraction plus walling jako wewnętrzna ściana informacyjna. Rozliczalność dwuwarstwowa wobec organu publicznego i wobec NRA/KIRP. CZTERY BRAKUJĄCE WARSTWY: brak referencji do AI Act i unijnego prawa (workbook 2023, AI Act 2024); brak referencji do ECHR i KPP UE (cytuje brytyjski Equality Act i Human Rights Act, nie art. 6/8 EKPC, nie art. 21/22 KPP UE); UK-specific case studies (NHS≠NFZ, council≠urząd gminy); brak warstwy responsabilizacji cywilnoprawnej (accountability jako audytowalność, polski adwokat dopisuje art. 417 i art. 417¹ KC). Format warsztatowy Activities zamiast operacyjnej listy kontrolnej dla solo praktyka. KEY INSIGHT: trójpoziomowa architektura SUM-SSAFE-D-PBG to brakujący wzorzec polityki etyki AI dla polskiego sektora publicznego - większość frameworków operuje na jednym poziomie zasad ogólnych bez wskazania jak zasady mają być wbudowane w konkretny etap pracy zespołu. Turing rozdziela: SUM Values to to w co wierzymy, SSAFE-D to to co robimy, PBG Framework to to gdzie i kiedy to robimy. Bez trzeciej warstwy pierwsze dwie są pobożnym życzeniem. USE CASE'Y: kancelaria obsługująca administrację publiczną KPRM/ministerstwa/samorządy/sądy administracyjne - obowiązkowo (gotowy wzorzec polityki po sześciu mapowaniach); compliance officer kancelarii świadczącej AI advisory - obowiązkowo (sześć zasad SSAFE-D do regulaminu plus PBG operacjonalizuje art. 5 ust. 2 RODO i art. 12 AI Act); adwokat doradzający urzędowi przed wdrożeniem AI - obowiązkowo (agenda-setting power); IOD organów administracji - tak (Data Stewardship plus PBG = art. 5 i art. 35 RODO); konsultant LegalTech dla dostawcy AI dla administracji - tak (jedenastoetapowy cykl plus delineated boundary = klarowna granica odpowiedzialności kontraktowej); mała kancelaria bez klientów-administracji - selektywnie (operacyjnie lepiej BW/039 RAII lub BW/040 King); klient-zarząd urzędu bez doradcy - nie polecam bezpośrednio (zamiast tego BW/044 WEF/Capgemini Public Sector). POWIĄZANIE Z INNYMI TOMAMI: direct partner do BW/044 WEF/Capgemini Public Sector Readiness (decyzja strategiczna o gotowości plus decyzja projektowa o etyce = kompletna mapa decyzyjno- operacyjna sektora publicznego); direct continuation BW/038 Smuha Cambridge Handbook (akademia plus praktyka); direct complement do BW/039 RAII Policy Template (RAII struktura, Turing warstwa procesowa); direct complement do BW/045 Kenney Runtime Enforcement (Kenney pięć warstw architektonicznych, Turing jedenaście etapów procesowych); direct complement do BW/046 Berkeley CLTC GPAI Profile (Berkeley stack standardów dla high-risk privatnego, Turing stack zasad dla public sector AI); razem z BW/009 MIT AI Risk Repository (taksonomia plus procedura); razem z BW/030 ENISA Security-by-Design (cross-cutting w cyklu życia); razem z BW/001 Kenney Governing Agents (cztery reżimy plus jedenaście etapów procesu). DLA MateMatic: warstwa procesowo-edukacyjna w dziewięciowarstwowym stacku governance. BW/047 Turing zamyka stack od strony cyklu życia projektu - bez tej warstwy stack jest mapą bez procesu. Pozostałe 7 workbooków serii kandyduje na kolejne tomy Bazy Wiedzy. CO MateMatic WNIESIE - audyt edycji polityki etyki AI dla klienta-administracji w trzech sesjach: warstwa wartości polskich (SUM Values z mapowaniem na art. 30/32/2 Konstytucji), warstwa zasad SSAFE-D mapowanych na AI Act i RODO, warstwa procesu PBG Framework z punktami sprawdzającymi w jedenastu etapach. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/046 - Berkeley CLTC syntetyzuje NIST plus ISO plus EU GPAI Code w jednym profilu. Polska kancelaria dostaje meta-mapę governance. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-29-berkeley-cltc-gpai-risk-management-profile.html Autorzy: Nada Madkour, Jessica Newman, Deepika Raman, Krystal Jackson, Evan R. Murphy, Charlotte Yuan, Dan Hendrycks (UC Berkeley Center for Long-Term Cybersecurity CLTC, AI Security Initiative, Berkeley AI Research Lab). Dan Hendrycks - dyrektor Center for AI Safety (CAIS), znany researcher kierunku AI safety. Wydawca: UC Berkeley CLTC. Opis: "General-Purpose AI Risk-Management Standards Profile", Version 1.2, kwiecień 2026 (~150-200 stron, drugi annual update po V1.1 z 2025). Licencja: CC BY 4.0 dla większości treści plus fair use NIST license dla cytatów AI RMF Playbook w Sekcji 3 - MateMatic hostuje PDF lokalnie z atrybucją autorów. Strona: cltc.berkeley.edu/publication/ai-risk-management-standards- profile-v1.2. SYNTEZA PIĘCIU ŹRÓDEŁ w jednym Profile (kompiluje istniejące standardy w tradycji NIST Cybersecurity Framework Profiles): NIST AI RMF (cztery funkcje GOVERN/MAP/MEASURE/MANAGE), ISO/IEC 23894 (norma ISO dla AI risk), EU GPAI Code of Practice EC 2025a (kodeks dobrych praktyk wedle art. 56 AI Act), International AI Safety Report (Bengio et al. 2025), NIST AI 800-1 2pd. To nie kolejny standard - to profil obejmujący istniejące standardy. STRUKTURA: cztery warstwy. Warstwa konceptualna - Sekcja 1 z key terms (GPAI Model wedle art. 3 ust. 63 AI Act, GPAI System wedle art. 3 ust. 66, frontier models GPT-5.4/Claude Sonnet 4.6/Gemini 3.1 Pro/Llama 4.1) plus benefits dla developerów/deployerów/regulators plus Sekcja 1.5 limitations and challenges. Warstwa metodologiczna - Sekcja 2 components and how to use the Profile, Section 2.2 Impact Areas/Harm Factors/Trustworthiness, Section 2.2.1 Risk Taxonomies kompilująca cztery taksonomie. Warstwa preskryptywna - Sekcja 3 Guidance jako rdzeń dokumentu z konkretnymi sub-kategoriami i działaniami z NIST AI RMF Playbook plus dodatki Berkeley plus EU GPAI Code mapping. Warstwa eksperymentalna - appendices z Roadmap (Appendix 3) zapowiadającym przyszłe rozszerzenia (restructuring wokół risk taxonomy z Section 2.2.1, targeted supplementary guidance dla różnych stakeholderów, expanded internal deployment, enhanced risk-to-mitigation mapping). JEDENAŚCIE HIGH-PRIORITY SUBCATEGORIES (każda osobna checklist audytowa): Govern 1.4 (oversight, risk thresholds, incident response plans), Govern 2.1 (roles, responsibilities, lines of communication, plus sandbagging during evaluations w v1.2), Govern 4.2 (documentation), Govern 5.1 NEW v1.2 (external feedback, third-party evaluations - "Recognizing the critical role of external feedback, especially third-party evaluations, in robust AI risk management, we included a dedicated sub-category"), Govern 6 (third-party software/data supply chain), Map 1.1 (intended purposes, context-specific laws), Map 1.5 (organizational risk tolerances), Map 5.1 (likelihood/magnitude of impacts, plus manipulation/deception/sandbagging/situational awareness/socioeconomic disruption/ backdoor intractability w v1.2), Measure 1.1 (risk metrics, red-teaming i benchmark capability evaluations w v1.2), Measure 1.3 (response approaches), Measure 2.7 (backdoor intractability), Measure 2.9 (transparency), Measure 3.1 (transparency v1.2), Manage 1.3 (high-priority risk responses: mitigate/transfer/avoid/accept), Manage 4.1 NEW v1.2 (post-deployment monitoring, incident response, change management, decommissioning - "Risk management does not end following a model's deployment; continuous monitoring is required"). SECTION 2.2.1 RISK TAXONOMIES (synteza czterech źródeł): MIT Risk Repository używa domain-based structure - 7 kategorii: dyskryminacja/toxicity, prywatność/security, misinformation, malicious actors, human-computer interaction, socioeconomic/environmental, AI system safety/failures/ limitations. International AI Safety Report agreguje przez pathways - 3 klasy: malicious use, malfunctions, systemic issues. NIST GAI Profile wymienia 12 ryzyk specyficznych dla generatywnej AI: confabulation, information security, data privacy, abusive content i inne. EU GPAI Code of Practice wprowadza multi-dimensional framework: risks by affected social interests (public health, safety, fundamental rights), source of risk (model capabilities/propensities/affordances), specified list of systemic risks (CBRN, loss of control, cyber offense, harmful manipulation). Berkeley nie wybiera jednej - kompiluje wszystkie cztery w Profile-specific consolidated organization (intencjonalnie tylko dla potrzeb analitycznych Profile, może być refined w przyszłych wersjach). EKOSYSTEM 5 DOKUMENTÓW v1.2: główny Profile + Quick Guide + Frontier AI Company Practices Evaluation (testy konkretnych modeli Claude Opus 4.5/GPT-5/Llama 4/Gemini 3 Pro porównawczo V1.1 vs V1.2) + Mapping Key Standards and Regulations (z dodatkiem EU GPAI Code w v1.2) + Transparency Documentation and Reporting Recommendations + osobny Agentic AI Risk-Management Standards Profile. ZMIANY V1.2 vs V1.1: dodanie dwóch high-priority subcategories (Govern 5.1, Manage 4.1), dodanie Section 2.2.1 risk taxonomies, terminology refinement (GPAI/foundation models → GPAI models), additional resources dla Map 1.5 risk thresholds/Measure 1.1 red-teaming/Govern 1.4 incident response, dodanie EU GPAI Code actions, updated International AI Safety Report (Bengio et al. 2025) i NIST AI 800-1 2pd, expansion AI risks (manipulation/deception, sandbagging, situational awareness, socioeconomic/labor market disruption, backdoor intractability), updated Roadmap przyszłych wersji. MAPPING NA POLSKIE INSTRUMENTY: warstwa AI Act - GOVERN → art. 9 (system zarządzania ryzykiem), art. 17 (system zarządzania jakością dla dostawców high-risk), art. 26 ust. 1-2 (deployer obowiązki organizacyjne); MAP → art. 9 ust. 2 (identyfikacja i analiza ryzyk), art. 27 (FRIA Fundamental Rights Impact Assessment dla deployerów high-risk z Załącznika III); MEASURE → art. 15 (accuracy, robustness, cybersecurity), art. 71 (registration database), art. 12 (record-keeping); MANAGE → art. 9 ust. 5 (risk mitigation measures), art. 26 ust. 4-5 (deployer monitoring i informowanie), art. 72 (post-market monitoring) gdzie Manage 4.1 jest implementacyjnym wzorcem; explicit dolewa EU GPAI Code (EC 2025a) jako piąte źródło - kodeks dobrych praktyk wedle art. 56 AI Act, dla polskiego dostawcy GPAI reference framework po sierpniu 2026, Berkeley v1.2 mapuje EU GPAI Code na NIST AI RMF subcategories (gotowa translacja obowiązków pod EU GPAI Code na operacyjny język NIST). Warstwa RODO: GOVERN 5.1 third-party evaluations operacjonalizuje art. 35 ust. 9 RODO (DPIA z opinią ekspercką) i art. 25 ust. 3 (certyfikacja jako dowód compliance), MAP 1.5 organizational risk tolerances mapuje na art. 24 RODO (środki uwzględniające ryzyko), MANAGE 4.1 post-deployment monitoring jest implementacją art. 5 ust. 2 (rozliczalność) i art. 32 ust. 1 lit. d (regularne testowanie skuteczności środków technicznych). Warstwa tajemnicy zawodowej i KSH: MANAGE 4.1 dla kancelarii oznacza monitorowanie czy agent nie ujawnia tajemnicy zawodowej w długim cyklu interakcji continuously not point-in-time; GOVERN 1.4 incident response plan to instrument który zarząd musi mieć przygotowany przed incydentem - decyzja o jego architekturze jest decyzją z art. 293 KSH (staranność); GOVERN 6 third-party software/data supply chain to praktyczna realizacja audytu dostawcy LegalTech razem z BW/040 King. KEY INSIGHT TRZECH ŹRÓDEŁ: Manage 4.1 Berkeley CLTC = Zasada 2 Kenneya BW/045 (continuous authorization not point-in-time) = imperatyw #6 OASIS CoSAI BW/043 (prove control on demand). Trzy niezależne źródła zbiegają się na ten sam wymóg architektoniczny - najsilniejsza ewidencja jaką może mieć compliance officer kancelarii w rozmowie z zarządem niedowierzającym że post-deployment monitoring jest standard nie luksus. CZTERY BRAKUJĄCE WARSTWY DLA POLSKIEJ KANCELARII: brak warstwy małego deployera (kancelaria 5-50 osób nie jest developerem ani large-scale deployerem - jest downstream user, wartość delegacyjna jako checklist zakupowy "wybieramy dostawcę spełniającego 11 high-priority Berkeley CLTC"); brak polskiej warstwy regulacyjnej (Berkeley mapuje EU GPAI Code na poziomie EU jako całości, ale nie polskie ustawy implementujące AI Act gdy zostaną przyjęte, polskie regulacje sektorowe UODO/KNF/ UKE/PUODO, kodeksy etyki zawodowej KEA/KERP); brak warstwy odpowiedzialności cywilnoprawnej (Profile o accountability w ujęciu organizacyjnym, nie cywilnej za szkodę GPAI - polski adwokat dopisuje art. 415/471 KC i projektowane dyrektywy o odpowiedzialności za AI); brak agendy autorskiej w deklaracji (Berkeley CLTC i CAIS Hendrycksa mają jasną pozycję w debacie AI safety vs AI ethics vs AI capability - Profile neutralny w tonie ale wybór taksonomii odzwierciedla kierunek safety, polska kancelaria czyta z świadomością że nie wszystkie taksonomie są neutralne politycznie). USE CASE'Y: compliance officer kancelarii budujący politykę AI - obowiązkowo (cztery funkcje plus 11 high-priority subcategories tworzą gotowy spis treści, kancelaria 50-osobowa w całości, 5-osobowa kompresuje do GOVERN 1.4/2.1 plus MAP 1.1/1.5 plus MEASURE 1.1 plus MANAGE 4.1 plus własny rozdział "Tajemnica zawodowa i AI"); adwokat doradzający dostawcy GPAI lub LegalTech - obowiązkowo plus osobny dokument Frontier AI Company Practices Evaluation jako benchmark własnego modelu wobec konkurencji; adwokat doradzający kancelarii kupującej LegalTech - obowiązkowo (11 high-priority subcategories jako kryteria wyboru obok BW/040 King); IOD kancelarii - tak (mapping GOVERN 5.1 na art. 35 RODO DPIA z third-party feedback i Manage 4.1 na art. 32 RODO regularne testowanie); partner zarządzający bez compliance officera - tylko Sekcja 1 executive summary plus Sekcja 2.3 high-priority steps overview plus 1.5 limitations (reszta dla zespołu wdrożeniowego); klient bez poradnika prawnego - nie polecam (zamiast tego BW/044 WEF/Capgemini Readiness Framework na poziomie funkcji). POWIĄZANIE Z INNYMI TOMAMI: Temat 03 Compliance i governance regulacyjne - razem z BW/008 Bird&Bird, BW/013 FAQ AI Act, BW/038 Smuha Cambridge Handbook, BW/039 RAII Policy Template, BW/044 WEF/Capgemini tworzy pełen stos dokumentów regulacyjnych - Berkeley jedyny który kompiluje pięć źródeł w jeden Profile; direct complement do BW/011 NIST AI 800-4 Monitoring (Berkeley rozszerza NIST AI RMF o GPAI-specific guidance i włącza NIST AI 800-1 jako jedno z pięciu źródeł); direct complement do BW/045 Kenney Runtime Enforcement (Manage 4.1 = Zasada 2 = trzy niezależne źródła tej samej tezy architektonicznej z OASIS CoSAI BW/043 imperatyw #6); razem z BW/040 King para audytowa (King skrypt rozmowy z dostawcą 33 pytania w 12 domenach, Berkeley Frontier Eval gotowe oceny czterech największych dostawców GPAI globalnie - rozmowa plus benchmark); razem z BW/035 Laban LLMs Corrupt Documents wzmacnia argumentację dla Manage 4.1 (empiryka degradacji 20-iteracyjnej plus norma Berkeley); direct complement do BW/044 WEF/Capgemini Readiness Framework (WEF mapuje 70 funkcji rządu - mapa decyzyjna, Berkeley dostarcza meta-framework risk management dla każdej funkcji wybranej z mapy - razem path: gdzie wdrożyć plus jak zarządzać ryzykiem); razem z BW/043 OASIS CoSAI Agentic IAM i BW/045 Kenney Runtime Enforcement TRÓJKĄT WARSTWY MANAGE - OASIS protokoły IAM, Kenney zasady enforcement, Berkeley profile NIST z 11 high-priority subcategories - trzy poziomy abstrakcji jednego problemu. Dla MateMatic warstwa syntezy regulacyjnej zamykająca OŚMIOWARSTWOWY STACK GOVERNANCE: BW/039 polityka, BW/040 vendor assessment, BW/041 forecasting, BW/042 benchmark globalny, BW/043 architektura techniczna, BW/044 mapa decyzyjna sektora publicznego, BW/045 zasady runtime enforcement, BW/046 synteza regulacyjna pięciu standardów. Recenzja: headline, "O czym jest ten materiał" z 5 kluczowymi liczbami (5 źródeł, 11 high-priority, 2 nowe v1.2, 4 taksonomie, v1.2 jako drugi annual update) i listą 11 subcategories wprost, cztery h3 recenzji właściwej (Section 2.2.1 risk taxonomies jako synteza, dwie nowe high-priority v1.2 z trzema-źródłowym potwierdzeniem Manage 4.1, GOVERN/MAP/MEASURE/MANAGE jako szkielet polityki, Frontier AI Company Practices Evaluation jako benchmark dostawców), "Mapping na polskie instrumenty prawne" w trzech warstwach (AI Act, RODO, tajemnica/KSH), "Czego brakuje" w czterech warstwach z eksplicytnym filtrem agendy Berkeley/CAIS, "Komu polecam komu odradzam" w sześciu adresatach, "Powiązanie z innymi tomami" budujące ośmiowarstwowy stack i trójkąt warstwy MANAGE, boardroom "Wniosek dla kancelarii" z syntezą trzech wartości operacyjnych. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/045 - Enforcement nie jest szóstą warstwą. Kenney rozprasza go po pięciu istniejących i tłumaczy dlaczego. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-29-kenney-runtime-enforcement-governance-stack.html Autor: Noah M. Kenney - Founder & Principal Consultant Digital 520 (advisory na AI governance, privacy, security implementation), President & Chief Scientist Disruptive AI Lab, President Ethical Tech Forum. Posiada Master of Engineering oraz CIPM (Certified Information Privacy Manager) z International Association of Privacy Professionals. Autor Governing Intelligence: Law, Privacy, Security, and Compliance in the Age of Artificial Intelligence (2026) - freely available textbook. Opis: "Runtime Enforcement and the AI Governance Stack: Embedding Execution Constraint Across the Governance Lifecycle", companion paper do Governing Intelligence (2026), Digital 520, 8 stron. Licencja: proprietary © 2026 Noah M. Kenney - Digital 520 (MateMatic NIE hostuje PDF lokalnie, link do digital520.com; cytowanie w recenzji w ramach prawa cytatu art. 29 ustawy o prawie autorskim). DRUGI TOM KENNEYA W BAZIE WIEDZY MATEMATIC obok BW/001 (Cztery reżimy regulacyjne dla agentów AI: GDPR, EU AI Act, NIST AI RMF, ISO/IEC 42001) - kontynuacja autorskiej linii w wymiarze implementacyjnym; cztery reżimy mówią KIM agent musi się rozliczyć, runtime enforcement mówi KIEDY i JAK. STRUKTURA: 8 sekcji w gęstym wykonaniu. Sekcja 1-2 - postawienie problemu i przejście od advisory do agentic AI (kiedy human-in-the-loop był naturalnym enforcement point i przestał). Sekcja 3 - kluczowa teza: enforcement NIE jest szóstą warstwą tylko cross-cutting capability (analogia security cross-cutting w architekturze IT - firewalls + input validation + encryption + monitoring, nie jedna z czterech). Sekcja 4 - enforcement capabilities w każdej z pięciu warstw Stack'a. Sekcja 5 - sześć zasad design. Sekcja 6 - regulatory alignment z AI Act i NIST AI RMF. Sekcja 7 - cztery developments na ścieżce do dojrzałości. Sekcja 8 - conclusion. ENFORCEMENT CAPABILITIES PER WARSTWA: L1 Data Governance - freshness gates (mechanizmy weryfikacji currency danych przed permitting consequential actions; przykład: model robi credit decision na danych ingested 90 dni temu, regulacja wymaga 30-day currency, layer blokuje akcję nie tylko loguje), dynamiczna data authorization (purpose limitation at runtime nie static data use agreement); L2 Model Governance - conditional validity rozszerzające validation at deployment do ongoing question whether outputs remain trustworthy under current conditions: population drift detection, concept drift detection, regulatory drift detection - automated gate constraint nie human reviewer kwartalnego raportu; L3 System Integration - circuit-breaker architectures (auto-halt gdy error rate przekracza threshold), policy-as-code engines (executable policies evaluated at runtime), capability-based authorization (specific scoped permissions zamiast broad access); L4 Control & Monitoring - shift z observation do governance (observation produces information, governance produces constraint), automated escalation policies constraining behavior in real time gdy detection-response loop liczony w milisekundach a nie godzinach; L5 Audit & Evidence - contemporaneous evidence (compliance evidence: was the action justified at the moment it occurred? nie forensic: what happened?) plus runtime evidence generation dla art. 72 AI Act post-market monitoring jako foundation real-time compliance verification. SZEŚĆ ZASAD DESIGN (intencjonalnie na poziomie governance nie implementacji): (1) Enforcement must be distributed, not centralized - żaden komponent ani warstwa nie ponosi sole responsibility; (2) Authorization must be continuous, not point-in-time - conditions które uzasadniały deployment muszą być continuously verified throughout operation, violations trigger automated constraint; (3) Evidence must be contemporaneous, not reconstructed - justification any consequential action captured at the moment of execution, immutable record supporting internal governance i external regulatory review; (4) Constraints must be proportional to consequences - rygor enforcement skaluje z potencjalnym impactem akcji, low-risk z logging alone, high-risk multi-factor authorization gates plus real-time evidence; (5) Enforcement mechanisms must be context-specific - prescriptive one-size-fits-all nie sprawdzi się w diversity AI applications, industries, regulatory environments; (6) Governance must degrade gracefully - gdy enforcement mechanisms fail lub become unavailable, systems default to more restrictive behavior, not less. KEY QUOTE: "The failure mode of a governance system should be constraint, not permission". REGULATORY ALIGNMENT (Sekcja 6): EU AI Act art. 9 risk management throughout lifecycle, art. 11 technical documentation reflecting current state, art. 72 post-market monitoring systems (continuous governance, not periodic and external); NIST AI Risk Management Framework GOVERN i MAP functions jako ongoing processes informing MEASURE i MANAGE throughout AI system lifecycle; critical challenge - brak unifying federal AI policy w US standardyzującej enforcement requirements across industries, paper's principles-based approach designed to accommodate diversity przy wskazaniu common architectural direction. PATH FORWARD (Sekcja 7): cztery developments - (i) maturation policy-as-code tooling pozwalającego express governance rules in machine-executable formats evaluated at runtime audited automatically; (ii) industry-specific enforcement standards (financial services, healthcare, critical infrastructure prowadzą due to existing regulatory density); (iii) regulatory shift compliance-at-deployment do compliance-in-operation (EU AI Act post-market monitoring jako early step, future guidance bardziej specific); (iv) organizational maturity w governance infrastructure (most organizations still building basic monitoring i audit capabilities, enforcement requires foundation instrumentation, observability, governance tooling). MAPPING NA POLSKIE INSTRUMENTY PRAWNE: warstwa RODO - L1 freshness gates → art. 5 ust. 1 lit. d RODO prawidłowość danych at moment of action; L1 dynamic data authorization → art. 5 ust. 1 lit. b RODO ograniczenie celu purpose limitation at runtime; L4 monitoring jako constraint plus L5 contemporaneous evidence → art. 5 ust. 2 RODO rozliczalność i art. 32 ust. 1 lit. d regularne testowanie skuteczności środków technicznych; warstwa AI Act - zasada 2 continuous authorization → art. 9 plus art. 26 deployer obligations, zasada 3 contemporaneous evidence → art. 12 automatic recording of events, zasada 4 proportional constraints → art. 9 risk-based proportionality, zasada 6 graceful degradation → art. 14 effective human oversight + art. 26 ust. 4 deployer obowiązek informowania providera o serious incidents; explicit cytat art. 72 post-market monitoring jako miejsce gdzie L5 runtime evidence generation jest technologiczną implementacją prawnego wymogu nie alternatywą; warstwa tajemnicy zawodowej - tajemnica adwokacka (art. 6 PoA, KEA) i radcowska (art. 3 ustawy o radcach prawnych, KERP) NIE są at-design constraint tylko at-execution constraint; adwokat nie udostępnia akt klienta agentowi raz, musi upewnić się że agent nie udostępnia ich nikomu z zewnątrz w kolejnych setkach interakcji; zasada 2 Kenneya continuously verified not point-in-time jest dokładnie tym mechanizmem - tajemnica zawodowa potrzebuje runtime enforcement, nie at-deploy enforcement, bez tej warstwy każda kolejna minuta agentowej interakcji jest potencjalnym ujawnieniem. CZTERY BRAKUJĄCE WARSTWY DLA POLSKIEJ KANCELARII: brak warstwy odpowiedzialności cywilnoprawnej (paper o accountability w sensie audytowalności nie odpowiedzialności za szkodę - kto odpowiada gdy fail-closed Zasady 6 zawiedzie i agent działa nie jak powinien); brak warstwy KSH dla zarządu kancelarii jako spółki (Zasada 6 fail-closed default wymaga decyzji zarządu z art. 293 KSH staranność członka zarządu - fail-closed jako uchwała nie domyślne ustawienie inżyniera); brak warstwy małej kancelarii (sześć zasad to wymóg organizacyjny dla kancelarii z compliance officerem, kancelaria 5-10 osobowa nie ma zasobów - wartość delegacyjna jako checklist zakupowy "nasz dostawca LegalTech musi spełniać te sześć zasad runtime, inaczej nie kupujemy"); brak link do oryginału Governing Intelligence w paperze (kontakt digital520.com, na stronie wymaga się szukać linku do książki). USE CASE'Y: compliance officer kancelarii budujący politykę AI runtime - obowiązkowo (sześć zasad wprost do regulaminu wewnętrznego, jeden z najczystszych instrumentów w całej Bazie Wiedzy); adwokat doradzający dostawcy LegalTech - obowiązkowo (Sekcja 4 enforcement capabilities plus Sekcja 6 alignment z AI Act dostarczają dwóch list pytań architektonicznych); adwokat doradzający kancelarii kupującej LegalTech - obowiązkowo (sześć zasad jako kryteria wyboru plus art. 72 AI Act argumentacja dla "musimy mieć runtime, nie tylko at-deploy"); IOD kancelarii - obowiązkowo (L1 freshness gates + dynamic data authorization = operacjonalizacja art. 5 ust. 1 lit. b i d RODO, bez nich rejestr czynności niekompletny); partner zarządzający kancelarii bez compliance officera - tylko Sekcja 1 motywacja, Sekcja 3 cross-cutting nie discrete, Sekcja 5 sześć zasad (świadomość że Zasada 6 fail-closed wymaga decyzji zarządu); klient kancelarii bez poradnika prawnego - nie polecam (język techniczny, abstrakcja architektoniczna, klient czyta zamiast tego BW/044 WEF/Capgemini decyzja na poziomie funkcji). POWIĄZANIE Z INNYMI TOMAMI: direct kontynuacja BW/001 Kenney Governing Agents (ten sam autor rok później z architektoniczną odpowiedzią na pytanie postawione w BW/001); direct complement do BW/043 OASIS CoSAI Agentic IAM (imperatyw #5 OASIS enforce na każdym hopie i last-mile to techniczne wykonanie Zasady 1 Kenneya distributed; imperatyw #6 prove control on demand to implementacja Zasady 3 contemporaneous evidence; OASIS dostarcza protokoły IAM SPIFFE/RFC 8693/ OCSF/CEF, Kenney dostarcza zasady dla których te protokoły są właściwym wyborem; Sekcja 4.3 Kenneya o circuit-breaker architectures, policy-as-code engines, capability-based authorization mapuje się 1:1 na imperatywy OASIS); razem z BW/035 Laban LLMs Corrupt Documents para empiryczno-zasadnicza (Laban mierzy degradację 50% po 20 iteracjach, Kenney tłumaczy że to empiryczny argument za Zasadą 2 continuous authorization bo punkt-in-time validation nie wykryje 20-iteracyjnej degradacji); razem z BW/030 ENISA Security-by-Design potwierdza analogię security cross-cutting; BW/011 NIST AI 800-4 rozszerza Zasadę 2 i 3 w wymiarze monitoringu; razem z BW/044 WEF/Capgemini para poziomów decyzyjnych (WEF gdzie wdrożyć - mapa funkcji, Kenney jak wdrożyć z runtime constraint - zasady architektoniczne, razem dają sektorowi publicznemu kompletną mapę decyzyjno-architektoniczną); direct complement do BW/039 RAII Policy Template (RAII struktura polityki, Kenney warstwa zasad runtime których RAII nie szczegółowił - wzorzec polityki AI: szkielet RAII plus rozdział "Runtime enforcement" oparty na sześciu zasadach Kenneya); warstwa zasad implementacyjnych obok warstwy architektury technicznej (BW/043) i warstwy decyzyjnej (BW/044), rozszerza sześciowarstwowy stack governance MateMatic do siedmiowarstwowego. Recenzja: headline, "O czym jest ten materiał", cztery h3 recenzji właściwej (cross-cutting not localized, sześć zasad design z polskim mapowaniem prawnym inline, analogia bezpieczeństwa, regulatory alignment z AI Act art. 9/11/72), "Mapping na polskie instrumenty prawne" w trzech warstwach (RODO, AI Act, tajemnica zawodowa), "Czego brakuje" w czterech warstwach, "Komu polecam komu odradzam" w sześciu adresatach, "Powiązanie z innymi tomami", boardroom "Wniosek dla kancelarii" z eksplicytnym kontekstem siedmiowarstwowego stack'u i autorskiej linii Kenneya od BW/001 do BW/045 jako jednej spójnej historii. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/044 - Pięćdziesiąt procent funkcji rządu jest gotowych. WEF i Capgemini mówią które, polska kancelaria pyta po co. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-29-wef-capgemini-agentic-ai-government.html Wydawcy: World Economic Forum (prywatna fundacja z siedzibą w Cologny pod Genewą, organizator forum w Davos) w kolaboracji z Capgemini (francuska firma konsultingowo-IT z agendą sprzedażową w obszarze agentic AI dla sektora publicznego). Foreword sygnatariusze: Martina Klement (Permanent Secretary for Digital Transformation, State of Berlin), Fabian Mehring (State Minister Digital Affairs, Free State of Bavaria), Mohamed Bin Taliah (Assistant Minister Cabinet Affairs, UAE), Ammar Alkassar (Member Board GovTech Deutschland), Roshan Soorunsingh Gya (CEO Northern Europe Capgemini), Stephan Mergenthaler (Managing Director, Chief Technology Officer World Economic Forum). Opis: "Making Agentic AI Work for Government: A Readiness Framework", Insight Report, kwiecień 2026, 37 stron. Licencja: All Rights Reserved - MateMatic NIE hostuje PDF lokalnie, link kieruje do oryginału na weforum.org; cytowanie w recenzji w ramach prawa cytatu (art. 29 ustawy o prawie autorskim). DEKLARACJA FILTRU TRZECH FILARÓW: WEF jako instytucja jest w polskim dyskursie politycznym kontrowersyjny i Capgemini ma jasną agendę sprzedażową ("pomożemy wam wdrożyć agentic AI") - recenzja MateMatic bierze metodologię i empiryczne dane, NIE endorsuje wydawcy ani sponsora, NIE endorsuje tezy "agentic state" jako pożądanego docelowego modelu państwa. Z tym filtrem dokument jest wartościowy. STRUKTURA RAPORTU: cztery warstwy. Warstwa konceptualna - przesunięcie z "process digitization" do "outcome orchestration" (Sekcja 1) plus pojęcie "agentic state" jako modelu administracji publicznej. Warstwa metodologiczna - 70 core government functions w 9 kategoriach (Public services 15 funkcji, Policy and governance, Regulation, Justice, Defence and security, Education, Health, Finance and tax, Infrastructure), oparte na klasyfikacji UN COFOG ale zorganizowane wokół workflows nie wydatków. Warstwa analityczna - scoring każdej funkcji na dwóch wymiarach po trzy sub-kryteria, calculation readiness score = potential minus complexity, kategoryzacja w trzy readiness areas (thresholdy >1,5 / 1,0 / <1,0). Warstwa praktyczna - case studies wdrożeń (Berlin, Bavaria, UAE) plus regional roadmap. KLUCZOWE LICZBY: 70 funkcji rządu w 9 kategoriach, 14% high-readiness (10 funkcji), 36% medium-readiness (25 funkcji), 50% low-readiness (35 funkcji), 50% functions medium-to-high readiness, 40% agentic AI projektów anulowanych do 2027 (Gartner cytowany przez WEF jako cautionary note), Capgemini survey baseline 350 public-sector orgs globalnie w 6 sektorach. DWA WYMIARY SCORINGU: Potential (3 sub-kryteria) - (1) Potential for automation (czy funkcja inherentnie wymaga ludzkiego osądu), (2) Tangible benefits (oszczędność czasu, redukcja kosztów, jakość usługi), (3) Citizen impact (skala oddziaływania na obywateli). Complexity (3 sub-kryteria) - (1) Technical implementation barriers, (2) Risk and ethical impact (ethical threat, error consequence i function criticality, privacy and data issues), (3) Organizational and capacity barriers. TOP 4 HIGH-READINESS FUNCTIONS: cybersecurity monitoring, public information and guidance provision, systems performance monitoring, service appointment and queue management. Pięć z dziewięciu kategorii ma reprezentację w high-readiness; "Public services" daje 3 z top 10. Empiryczny dowód że agentic AI najlepiej startuje od funkcji obsługujących, nie decyzyjnych. CZTERY MOCNE WARSTWY DLA POLSKIEJ KANCELARII: (1) function-based assessment lens jako alternatywa department-based - transposable na funkcje kancelarii (research orzecznictwa, FAQ klienta, monitoring zmian regulacyjnych = high; contract review wstępny, draft umowy z szablonu = medium; doradztwo strategiczne, opinia zarządcza, reprezentacja procesowa = low); (2) capability-impact matrix jako mapa którą partner zarządzający stawia na stole zarządu, działająca nawet bez cytowania WEF; (3) calculation methodology readiness=potential-complexity jako gotowy szablon scoringu - adwokat dolewa polską warstwę RODO art. 9 (dane wrażliwe), tajemnica służbowa, art. 26 AI Act dla deployerów publicznych, art. 27 FRIA; (4) augmentation not replacement jako linia obrony w rozmowie z zarządem klienta uważającego że agentic AI to wymiana pracowników na boty, pasująca do art. 14 AI Act (human oversight). CZTERY BRAKUJĄCE WARSTWY: brak warstwy AI Act art. 26 (deployer obligations dla podmiotów publicznych) i art. 27 (FRIA - Fundamental Rights Impact Assessment) - dokument globalny, traktuje EU jako jeden region; brak warstwy KSH dla spółek komunalnych i Skarbu Państwa (art. 293 staranność zarządu w przypadku wdrożeń agentic AI bez analizy ryzyka i dokumentacji decyzji); brak deklaracji agendy autora (Capgemini sprzedaje wdrożenia agentic AI dla rządów, czytelnik nieświadomy konfliktu interesów odbiera raport jako neutralny benchmark - jest neutralny w danych, nie jest w doborze tezy końcowej "rząd musi wdrażać"); brak warstwy polskiej (Singapur/Estonia/ Berlin/Bawaria/ZEA tak, Polska/Czechy/Słowacja/Litwa nie - regional roadmap wymaga polskiej iteracji ile z 70 funkcji polskie ministerstwa już realizują z AI). USE CASE'Y: adwokat doradzający klientowi z sektora publicznego (ministerstwo, JST, agencja wykonawcza, spółka skarbu państwa) - tak, ale czytany metodologicznie (Sekcje 2 framework i A1 metodologia tak, Sekcje 1 foreword/3 case studies Capgemini-friendly/Conclusion z agendą - zostawić), mapować 70 funkcji na funkcje konkretnego klienta z polską warstwą regulacyjną; partner zarządzający kancelarii myślący o własnej transformacji - tak, jako koncept function-based lens applikowany do kancelarii (cytuj metodę myślenia, nie dokument - klient może mieć anti-WEF reakcję); compliance officer kancelarii - tak, jako uzupełnienie BW/043 (architektura techniczna) i BW/039 (polityka); klient kancelarii bez poradnika prawnego - nie polecam (język konsultancki, ukryte założenia o "agentic state", agenda sprzedażowa); krytyk WEF z pozycji politycznej - tak, jako materiał krytyczny (dane weryfikowalne - 40% projektów anulowanych do 2027 Gartner, 70 funkcji opracowanie własne; tezy końcowe "agentic state" zostają na koncie autorów). POWIĄZANIE Z INNYMI TOMAMI: Temat 04 (Mapa ryzyk AI) - razem z BW/035 Laban LLMs corrupt documents odpowiada "co się dzieje gdy delegujemy obszar wrażliwy" przez perspektywę sektora publicznego; Temat 03 (Compliance i governance regulacyjne) - komplementarne do BW/039 RAII Policy Template (RAII pisze jak napisać politykę, WEF/Capgemini od jakich funkcji zacząć); Temat 02 (Audyt dostawców LegalTech) - methodology potential×complexity rezonuje z capability- impact matrix z BW/043 OASIS CoSAI Sekcja 3.2 (ten sam wzorzec myślenia w innym kontekście); direct complement do BW/043 (OASIS CoSAI - jak technicznie zabezpieczyć agenta dla sektora publicznego, WEF/Capgemini gdzie wdrożyć); razem z BW/036 Kuśmierek (Polska wobec AGI) tworzy parę: Kuśmierek polskie postulaty makro (LVT, UBI, infrastruktura), WEF/Capgemini globalna mikro-mapa funkcji rządu - kancelaria czyta obie warstwy z filtrem trzech filarów; komplementarne do BW/012 OWASP AIVSS (OWASP threat model, WEF opportunity map - sektor publiczny potrzebuje obu naraz); razem z BW/039 (polityka), BW/040 (vendor assessment), BW/041 (forecasting), BW/042 (benchmark globalny), BW/043 (architektura techniczna) zamyka sześciowarstwowy stack governance AI - z warstwą decyzyjną dedykowaną sektorowi publicznemu, z eksplicytnym dystansem do agendy wydawcy. Recenzja: headline, "O czym jest ten materiał", cztery h3 recenzji właściwej (function-based assessment lens, capability-impact matrix dla 70 funkcji, calculation methodology, augmentation not replacement), "Czego brakuje" w czterech warstwach (AI Act art. 26 i 27, KSH art. 293, agenda autora, brak polskiej iteracji), "Komu polecam, komu odradzam" w pięciu adresatach z eksplicytnym filtrem politycznym, "Powiązanie z innymi tomami", boardroom "Wniosek dla kancelarii" - wszystko z eksplicytnym dystansem do WEF/Capgemini wbudowanym w treść, nie post-hoc. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/043 - Agent musi mieć tożsamość. OASIS CoSAI dostarcza brakujące ogniwo audytu wdrożeń AI w kancelarii. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-29-oasis-cosai-agentic-iam.html Wydawca: OASIS Open / Coalition for Secure AI (CoSAI), projekt OASIS Open zrzeszający Anthropic, IBM, Intel, Google, Microsoft, Meta, Cisco, Amazon, PayPal, Red Hat, ServiceNow, Dell, Palo Alto Networks, Adversa AI, EQTY Lab, ProCap360, Evinova. Co-chairs Technical Steering Committee: Akila Srinivasan (Anthropic), J.R. Rao (IBM). Workstream Leads: Sarah Novotny, Ian Molloy (IBM), Raghu Yeluri (Intel), Alex Polyakov (Adversa AI). Editors: Asmae Mhassni (Intel), Zeal Somani (Evinova). Opis: "Agentic Identity and Access Management - Workstream 4: Secure Design Patterns for Agentic Systems", version 1.0, zatwierdzony przez Technical Steering Committee 20 marca 2026, 18 stron. Licencja: OASIS Open Project rules - perpetual permission do kopiowania, tłumaczenia i derivative works "without restriction" pod warunkiem zachowania noty copyrightowej. MateMatic hostuje PDF lokalnie z atrybucją. Dokument jest "Non-Standards Track Work Product" - rekomendacja, nie norma. Zakres CoSAI eksplicytnie wyklucza ethics, fairness, explainability, bias, safety, content safety - to czysta warstwa secure deployment, nie governance jako całość. STRUKTURA: cztery warstwy. Warstwa zasad - osiem imperatywów Agentic Identity (Sekcja 1.2) plus dziewiąty alignment z zero-trust i regulacjami. Warstwa diagnostyczna - cztery scenariusze awarii (Sekcja 2.1) plus siedem powtarzających się tematów zagrożeń. Warstwa pojęć - capability-impact matrix, mechanizmy autoryzacji, cykl życia tożsamości, governance jako control plane. Warstwa praktyczna - end-to-end przykład agenta przetwarzającego faktury, fazowa adopcja w trzech krokach, appendices A-G. OSIEM IMPERATYWÓW: (1) agent jako first-class identity z agent card i runtime instance identity, (2) Zero Standing Privilege (ZSP) - krótkie tokeny zamiast długożywotnych szerokich uprawnień, (3) separacja praw agenta i on-behalf-of (OBO) z widoczną delegation chain, (4) bind do kodu i modelu - signed manifest plus runtime attestation, (5) enforce na każdym hopie i last-mile (anty confused-deputy), (6) prove control on demand - immutable logs i lineage, (7) reuse istniejącego IAM (OAuth/OIDC/PKI) jako control plane, (8) gateways jako policy boundaries (MCP endpoints, API gateways, service mesh), plus dziewiąty alignment z zero-trust i regulacjami. SIEDEM THREAT THEMES: over-permissioning, loss of actor clarity, shadow agents, broken delegation chains, unsigned/swapped models, indirect prompt injection, agent collusion. CAPABILITY-IMPACT MATRIX (cztery kwadranty: low cap/low risk, high cap/low risk, low cap/high risk, high cap/high risk) + DRABINA AUTONOMII L0-L5 (no autonomy, assisted, guided, semi-autonomous, highly autonomous, fully autonomous), L3+ to "high capability". END-TO-END PRZYKŁAD invoice-processing agent: agent card derived from code+config+policy, runtime instance identity z atrybutami (version, environment, capability, risk tier), short-lived per-MCP-server credentials (Document MCP read, ERP MCP read-only, Payment MCP write z limitami), SSO + OBO token z view:invoices i propose:payments, actor/subject claims, token exchange dla per-MCP server tokens, ABAC/PBAC enforcement (act.role, sub.role, amount, supplier IN approved_suppliers, risk_score < 70), immutable logs zdarzeń (provisioning, token issuance, action.executed, anomaly.detected), revocation cascade. FAZOWA ADOPCJA: Faza 1 Visibility (rejestracja agentów, eliminacja współdzielonych kont, immutable action logging), Faza 2 Contextual access (krótkożywotne tokeny, ABAC/PBAC, intent i kontekst), Faza 3 Full Agentic IAM (cross-domain delegation, continuous evaluation, human-in-the-loop, auto-discovery). APPENDICES A-G: A autonomy levels L0-L5; B identity i attestation (SPIFFE SVID, DID, TEE-backed Intel TDX/AMD SEV-SNP/ARM TrustZone), C lifecycle workflows (provisioning przez CI/CD, rotation, decommissioning), D struktury tokenów (sub, act.sub, scope, authorization_details, azp, csc; RFC 8693 Token Exchange, RFC 9396 Rich Authorization Requests, RFC 7009 Token Revocation; ABAC/PBAC w OPA/Rego albo Cedar), E governance i logging (agent registry, OCSF/CEF schemas, correlation_id, "prove control on demand" queries), F gateway patterns (MCP, API gateway, service mesh; tenant isolation; OAuth Federation), G glosariusz (Agent, Attestation, Model manifest, OBO, ZSP, MCP). MAPPING NA POLSKIE INSTRUMENTY PRAWNE: art. 5 ust. 1 lit. c RODO (minimalizacja - imperatyw #2), art. 5 ust. 2 RODO (rozliczalność - imperatywy #1, #6), art. 25 RODO (privacy by design - #2), art. 30 RODO (rejestr czynności - rozszerzony o warstwę agentów dzięki #6), art. 32 RODO (środki bezpieczeństwa - #4 signed manifest, #5 last-mile enforcement), art. 5 lit. f RODO (integralność i poufność - #4 attestation), art. 9 AI Act (system zarządzania ryzykiem - capability-impact matrix), art. 12 AI Act (record-keeping - immutable logs z OCSF/CEF i correlation_id), art. 14 AI Act (human oversight - high-impact actions wymagają HITL/step-up), art. 26 AI Act (deployer obligations - cały framework Agentic IAM), art. 293 KSH (staranność członka zarządu w razie incydentu z agentem), tajemnica zawodowa adwokacka i radcowska (art. 6 PoA, art. 3 ustawy o radcach prawnych, KEA, KERP - OBO token jako techniczny dowód delegacji w imieniu klienta). OSIEM PYTAŃ AUDYTOWYCH DO DOSTAWCY LegalTech: (1) czy każda instancja agenta dostaje osobne identity z agent card; (2) czy credentials są short-lived z TTL minutowym; (3) czy tokeny zawierają osobne actor/subject claims wedle OAuth OBO; (4) czy macie signed manifest z runtime attestation i notyfikacje przy zmianie modelu; (5) czy enforcement zachodzi tylko na bramce, czy na poziomie pojedynczego API i narzędzia; (6) czy macie immutable logs z correlation_id, ABAC/PBAC w OPA/Rego/Cedar, integrację z naszym SIEM; (7) czy używacie standardów OAuth/OIDC, SPIFFE, RFC 8693, RFC 9396 czy parallel stack; (8) czy MCP endpoints terminują tokeny i forwardują tylko scoped OBO zgodnie z CoSAI MCP Security. CZTERY BRAKUJĄCE WARSTWY DLA POLSKIEJ KANCELARII (do dopisania samodzielnie): warstwa AI Act i RODO (dokument dystansuje się od broader governance), warstwa tajemnicy zawodowej (OBO token jako dowód prawny, nie tylko techniczny), warstwa odpowiedzialności cywilnej za szkody (kto odpowiada gdy agent w autoryzowany sposób wyrządzi szkodę), warstwa małej kancelarii 10-50 osób (rola delegacyjna do dostawcy zamiast samodzielnego wdrożenia SIEM/Vault/policy engine). USE CASE'Y: compliance officer kancelarii budujący politykę AI - obowiązkowo (BW/043 jako brakująca warstwa techniczna pięciowarstwowego stack'u); adwokat doradzający dostawcy LegalTech budującemu produkt z agentami - obowiązkowo (osiem imperatywów to baseline); adwokat doradzający kancelarii kupującej LegalTech - obowiązkowo (osiem pytań audytowych); IOD kancelarii - obowiązkowo (mapping na art. 5/25/30/32 RODO, rejestr czynności rozszerzony o warstwę agentów); partner zarządzający bez compliance officera - tylko Sekcje 1 (executive summary) i 5 (transitioning); klient kancelarii - nie polecam bezpośrednio (zamiast tego BW/042 AICDI Investor Engagement Checklist). POWIĄZANIE Z INNYMI TOMAMI: Temat 02 (Audyt dostawców LegalTech) - razem z BW/040 King Vendor Assessment komplementarna para (King o organizacji dostawcy, BW/043 o architekturze technicznej); Temat 03 (Compliance i governance regulacyjne) - implementacyjna warstwa BW/039 RAII Policy Template w domenach Risk i Procurement; direct complement do BW/012 OWASP AIVSS Agentic AI (threat-model + control-framework para); BW/030 ENISA Security-by-Design (technical baseline europejski + BW/043 patterns IAM); BW/032 Secure AI Sandboxes (testowanie przed Fazą 1 Visibility); razem z BW/042 AICDI para empiryczno-architektoniczna (AICDI: 13% firm globalnie ma framework; BW/043: oto jak ten framework wygląda technicznie); razem z BW/039, BW/040, BW/041 i BW/042 zamyka pięciowarstwowy stack governance MateMatic - z warstwą techniczną mówiącą tym samym językiem co warstwa prawna. Recenzja: headline, "O czym jest ten materiał", cztery h3 recenzji właściwej (threat model, capability- impact matrix + L0-L5, end-to-end invoice agent, fazowa adopcja), "Mapping na polskie instrumenty prawne" w trzech warstwach (RODO, AI Act, KSH+tajemnica), "Pytania audytowe do dostawcy LegalTech", "Czego brakuje", "Komu polecam, komu odradzam", "Powiązanie z innymi tomami", boardroom "Wniosek dla kancelarii". Autor recenzji: Wiesław Mazur · MateMatic. ### BW/042 - Trzynaście procent firm ma framework AI governance. Thomson Reuters i UNESCO mierzą rozjazd między deklaracją a praktyką. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-aicdi-responsible-ai-in-practice.html Wydawcy: Thomson Reuters Foundation (charytatywne ramię Thomson Reuters, Londyn) + UNESCO (agenda ONZ). Opis: "Responsible AI in Practice - 2025 global insights from the AI Company Data Initiative (AICDI)", marzec 2026, 94 strony, ISBN 978-92-3-100863-4, DOI 10.54678/YJWP8855. Licencja: CC-BY-SA 3.0 IGO - MateMatic hostuje PDF lokalnie z atrybucją, klauzula SA wymaga tej samej licencji dla pochodnych. AICDI zbudowana na fundamencie UNESCO Recommendation on the Ethics of AI (przyjęta przez 193 państwa członkowskie). Pilot year obejmuje 2 972 spółki z 18 krajów (m.in. Brazylia, Indie, Niemcy, Hiszpania, USA, Wielka Brytania, Włochy), 100 000 punktów danych, 36 pytań ankietowych. SIEC pisze o tym jako "world's largest study assessing corporate AI adoption globally". SZEŚĆ KLUCZOWYCH STATYSTYK Z POPULACJI 2972: (1) 13% spółek deklaruje formalny framework AI governance, z czego 53% wskazuje EU AI Act jako reference framework; (2) 43,7% publicznie komunikuje, że ma strategię AI; (3) 72% NIE raportuje żadnego impact assessment AI; (4) 7% prowadzi Human Rights Impact Assessment (z 28% prowadzących assessment); (5) 12% oferuje structured AI training z comprehensive coverage (z 31% oferujących training); (6) 76% spółek z training programmami nie ma polityki ewaluacji jakości danych treningowych. STRUKTURA RAPORTU: cztery warstwy. Warstwa empiryczna - dane z ankiet 2 972 spółek wedle 36 pytań w pięciu kategoriach (governance & frameworks, strategy, workforce, ethics & environment, data) plus sentiment analysis. Warstwa diagnostyczna - 5 Thematic Findings. Warstwa praktyczna - 8 case studies. Warstwa decyzyjna - Investor Engagement Checklist + Responsible AI Principles for Proxy Voting. PIĘĆ THEMATIC FINDINGS: (1) Public commitment to AI governance frameworks remains low, signalling inconsistent governance practices - 13% spółek; (2) Companies publish strategies on AI but it is less clear how these are put into practice - governance opisane konceptualnie nie operacyjnie, references to policies committees high-level oversight appear more frequently than evidence of operational controls dedicated resources escalation pathways monitoring; (3) Companies do not demonstrate adequate protections for workers as AI reshapes jobs - workforce transition and skills development acknowledged ale rzadko widać jak programmes affect outcomes; (4) Ethical issues - including human rights and environmental impacts - are being sidelined in AI governance and risk management - principles framed but rarely linked to measurable processes; (5) Limited company policies on AI training data, third-party data controls, and user data rights - transparency around training data third-party systems user rights remains uneven, accountability across vendor ecosystems difficult to trace. OSIEM CASE STUDIES: Case 1 TELUS (diversity i inclusion), Case 2 Vodafone (data systems cybersecurity), Case 3 SAP (impact on workers), Case 4 Telefónica (AI governance strategic institutional), Case 5 Banco Bradesco/BASF/Infosys/Telefónica/TELUS/Prudential (AI skills training), Case 6 Gruppo TIM/BASF/TELUS/Telefónica (environmental considerations), Case 7 Banco Bradesco/SAP (review of AI governance mechanisms), Case 8 Cementos Argos/BASF (workers rights). INVESTOR ENGAGEMENT CHECKLIST (strony 81-90): 30+ pytań w 5 kategoriach (Governance and frameworks, Implementation and controls, Workforce and impact, Ethics environment human rights, Data and third-party providers), każde pytanie z polem "what it tells you about their approach to responsible AI"; pytania mapowane na konkretne survey questions AICDI (np. survey question 1.4, 1.7, 1.8, 1.14). RESPONSIBLE AI PRINCIPLES FOR PROXY VOTING (strony 87-89) - konkretne zasady głosowania inwestora instytucjonalnego na WZA spółki w sprawach AI; dla polskiej kancelarii reprezentującej fundusz/TFI/OFE/inwestora indywidualnego z znaczącym pakietem to materiał obronny "głosowaliśmy przeciw uchwale bo nie spełniała Responsible AI Principles for Proxy Voting publikowanych przez UNESCO i Thomson Reuters Foundation". NAJMOCNIEJSZE WARSTWY DLA POLSKIEJ KANCELARII: (1) Investor Engagement Checklist jako wzorzec audytu klienta korporacyjnego przed rundą ESG, kancelarii reprezentującej inwestora w DD, audytu wewnętrznego kancelarii i jej dostawców LegalTech; (2) pięć Thematic Findings jako argumentacja empiryczna w rozmowie z zarządem - "wasza spółka jest w pierwszych 13% globalnie albo w pozostałych 87%, pierwsze 13% wytrzymuje DD funduszu ESG, pozostałe 87% nie wytrzymuje"; (3) osiem case studies jako materiał porównawczy dla zarządu (TELUS, Vodafone, SAP, Telefónica, BASF, Banco Bradesco, Infosys, Prudential, Gruppo TIM, Cementos Argos) - dojrzałe praktyki wykonalne i udokumentowane przez wiarygodne źródło UNESCO+TR Foundation; (4) Responsible AI Principles for Proxy Voting jako materiał obronny dla głosowania funduszu/TFI/OFE na WZA. POŁĄCZENIE FINDINGS Z POLSKIM KONTEKSTEM PRAWNYM: Finding 3 (worker protection) łączy się z art. 22[1] KP zwolnienia zbiorowe + art. 94 KP oceny pracownicze + art. 22[3] KP monitoring; Finding 4 (ethical issues) łączy się z FRIA art. 27 AI Act; Finding 5 (data policies) łączy się z RODO art. 28 umowa powierzenia + art. 22 zautomatyzowane decyzje + AI Act art. 10 data governance. CZTERY BRAKUJĄCE WARSTWY: (a) brak polskich spółek w datasecie 2972 - polski rynek powinien świadomie naprawić w kolejnej iteracji; (b) brak warstwy KSH - raport pisany z perspektywy globalnego inwestora ESG, nie omawia odpowiedzialności prawnej zarządów polskich spółek z art. 293 KSH (kancelaria dopisuje - findings AICDI to materiały do rozmowy o staranności decyzji zarządu, czyta razem z BW/041 RAND); (c) brak warstwy zawodowej kancelarii - Investor Engagement Checklist nie pyta o tajemnicę zawodową art. 6 PoA, art. 3 ustawy o radcach, KEA, KERP; (d) brak warstwy małych firm - próba 2972 to głównie duże korporacje, kancelaria 50-osobowa wymaga adaptacji 18 z 30 pytań. USE CASE'Y: kancelaria doradzająca klientowi przed rundą finansowania - Investor Engagement Checklist jako self-audit klienta, kilkanaście godzin pracy = zaakceptowana runda; kancelaria reprezentująca fundusz/TFI/OFE/inwestora indywidualnego - Responsible AI Principles for Proxy Voting jako materiał obronny umotywowania głosowania na WZA; compliance officer kancelarii budujący wewnętrzną politykę AI - 5 Findings + 8 case studies jako benchmark własnej dojrzałości; klient bez kancelarii - Executive Summary i Key Statistics ze strony 10 wystarczy żeby zrozumieć że "13% spółek ma framework" to empiryczna miara w której zarząd musi się umieścić. KOMPLEMENTARNY do BW/039 (RAII Policy Template - struktura wewnętrzna, AICDI mierzy ile firm rzeczywiście ma framework) jako para definicja-pomiar; BW/040 (King Vendor Assessment - audyt dostawców, AICDI audyt zarządu klienta) jako para skrypt-rozmowy z dwoma stronami; BW/041 (RAND AGI Forecasting - trajektoria czasowa, AICDI stan obecny) jako para diagnoza-prognoza; BW/008/013/038 (regulacje AI Act) jako definicja co powinno być, AICDI jako pomiar co jest. Dla MateMatic to fundament empiryczny wszystkich pozostałych tomów stack'u governance - bez AICDI argumentacja byłaby normatywna ("powinniście"), z AICDI staje się porównawcza ("13% jest powyżej, gdzie wasza spółka"). Struktura recenzji: lede ("100 tysięcy punktów danych z 2972 spółek"), hook (kartka i czerwony długopis), source card z dwoma CTA (Pobierz oryginał PDF, Kopiuj cytowanie), sześć kluczowych statystyk w stat-grid, sekcje: O czym jest materiał (4 warstwy struktury), Recenzja właściwa (4 najmocniejsze warstwy: Investor Engagement Checklist, 5 Thematic Findings z mapą na polskie regulacje, 8 case studies, Responsible AI Principles for Proxy Voting), Czego brakuje (4 brakujące warstwy w tym brak polskich spółek w pilocie), Komu polecam komu odradzam (4 use case'y w tym pierwszy z funduszem/TFI/OFE), Powiązanie z innymi tomami BW (cross-link do 7 tomów + przedstawienie AICDI jako fundamentu empirycznego pięciowarstwowego stack'u), boardroom z jednym wnioskiem operacyjnym - dwa nowe instrumenty profesjonalne dla kancelarii (audyt gotowości ESG + materiał obronny WZA). Autor recenzji: Wiesław Mazur · MateMatic. ### BW/041 - RAND o prognozach AGI: nie zgadujemy daty, scenariuszami planujemy. Co kancelaria mówi klientowi pytającemu o pięć lat. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-rand-agi-forecasting.html Autorzy: Gopal P. Sarma, Sunny D. Bhatt, Michael Jacob, Rachel Steratore (RAND Corporation, Center on AI, Security, and Technology w dziale Global and Emerging Risks). Opis: "Artificial General Intelligence Forecasting and Scenario Analysis: State of the Field, Methodological Gaps, and Strategic Implications", Research Report RR-A4692-1, marzec 2026, 75 stron. Licencja RAND Limited Distribution Rights - linkowanie dozwolone, hostowanie zabronione, dlatego MateMatic nie hostuje PDF, link kieruje na rand.org. RAND Corporation - niezależna nonpartisan organizacja non-profit założona 1948, jeden z najstarszych think-tanków świata, rygorystyczne standardy research integrity. Drafting raportu eksperymentalnie przez modele LLM (GPT 5.1, Gemini 3 Pro, Claude 4.5 Opus) z human researchers providing direction, peer review, fact-checking, revision (transparentnie ujawnione, Figure 1.1). KLUCZOWE DANE Z EXECUTIVE SUMMARY: (1) AGI timeline estimates shifted earlier across methods - directional movement we wszystkich czterech metodach forecasting; (2) Forecasting infrastructure is immature - field lacks resolved forecasts for calibration, benchmarks resistant to saturation/gaming, continuous real-time insight, independent validation; (3) Definitional ambiguity drives some, but not all, disagreement - różne definicje (HLMI, FAOL, transformative AI), różne targets (technical capability vs operational deployment vs societal transformation). KONKRETNE LICZBY: Grace et al. 2025 mediana HLMI 2047 (kompresja 13 lat względem 2022), kompresja FAOL 48 lat, FAOL 2116 (różnica 69 lat między HLMI a FAOL), prediction markets i compute-centric models stawiają centralne lata 2030-te, framing effects shift estimates 10-15 lat. OSIEM ROZDZIAŁÓW: 1 Introduction, 2 Defining the Target, 3 Forecasting Methodologies, 4 Understanding Disagreement (Cruxes - cztery archetypy ekspertów z różnymi crux positions: compute optimist - czy compute wystarczy bez nowych paradygmatów; paradigm pessimist - czy potrzebne są nowe algorytmy; deployment skeptic - czy deployment ekonomiczna idzie szybciej niż capability; capability hawk - czy generalizacja liniowa czy nieliniowa), 5 Validation Challenge, 6 Strategic Implications: Decisionmaking Under Uncertainty (Asymmetry of Costs, Policies by Timeline Sensitivity, Distinguishing Strategy and Policy Triggers, Indicators for Ongoing Assessment, Principles for Strategy Under Uncertainty), 7 Building Better Forecasting Infrastructure (Adversarial Validation, Intermediate Milestone Forecasting, Robust Capability Measurement, Economic Diffusion Modeling, Monitoring Infrastructure), 8 Conclusion. CZTERY NAJMOCNIEJSZE WARSTWY DLA POLSKIEJ KANCELARII: (1) Asymmetry of Costs - jeśli koszt nieprzygotowania na scenariusz X dużo wyższy niż koszt przygotowania, nawet niska prawdopodobieństwo X uzasadnia przygotowanie (analogia z planowaniem awaryjnym wobec ataków terrorystycznych); kancelaria odpowiada klientowi nie "tak/nie" tylko "lista pytań asymetrycznych kosztowo dla branży"; (2) "Treat forecasts as scenario-structuring tools, not point estimates to optimize around. Rather than debate precise probabilities, planners should focus on scenarios that are plausible, consequential, and challenging - particularly those that lack adequate preparation" - skrypt rozmowy adwokata z klientem; klient nie potrzebuje daty, potrzebuje listy scenariuszy plus listy decyzji robust under all scenarios vs sensitive to specific scenarios (polityka AI jest robust, inwestycja w konkretną platformę LegalTech jest sensitive); (3) Capability Trajectory Indicators (Tabela 6.1) - wzorcowy scoreboard kwartalny/półroczny do monitorowania kontekstu obejmujący: postępy benchmarkach odpornych na saturację, demonstracje agentic capabilities w realnych task'ach, sygnały od frontier laboratorów (ekonomiczne/organizacyjne/security), sygnały infrastrukturalne (compute/energy/hardware), sygnały regulacyjne i polityczne; kancelaria oferuje "monitoring strategiczny AI" jako usługę uzupełniającą politykę AI i audyt dostawców; (4) Cruxes i cztery archetypy ekspertów jako materiał obronny w razie zarzutów akcjonariuszy o staranność decyzji AI zarządu (art. 293 KSH) - "zarząd nie zignorował ryzyka, zarząd przyjął rygorystyczną metodologię scenariuszową opartą o publikację RAND" jest argumentacją odporniejszą niż "zarząd polegał na opinii konsultanta zewnętrznego". CZTERY BRAKUJĄCE WARSTWY DO DOPISANIA: (a) warstwa europejska - RAND pisze z perspektywy amerykańskiej (US executive branch, Congress, national security community), nie omawia AI Act i implikacji dla planowania scenariusza krótkich timeline'ów (timeline 2026-2027 staje się niewystarczający w scenariuszu kompresji); (b) warstwa odpowiedzialności prawnej zarządów spółek kapitałowych - art. 293 KSH, dokumentacja decyzji chroni przed roszczeniami akcjonariuszy o staranność, inny tryb dla zarządu publicznego inny dla prywatnego; (c) warstwa zawodowa branż regulowanych - kancelaria adwokacka, doradztwo finansowe (KNF), sektor zdrowia, sektor obronny, każda ma timeline'y i indicator'y specyficzne; (d) warstwa budżetowa - RAND nie operacjonalizuje ekonomicznej deployment dla średniej polskiej spółki, kancelaria dopisuje w jakim budżecie IT klient operuje (5 mln zł rocznie typowo) i jak chronić przed scenariuszem 10x inwestycji konkurencji bez tracenia głównej ścieżki. USE CASE'Y: kancelaria + klient korporacyjny strategia AI 5-10 lat - framework asymmetry of costs + scenario-structuring approach + Capability Trajectory Indicators jako podstawa usługi monitoring strategiczny AI; kancelaria pisząca artykuł o niepewności AI w polskiej dyskusji - cytat scenario-structuring tools jako rdzeń argumentacji odpornej na zarzuty zarówno z obozu AGI-optimist jak i AGI-skeptic; adwokat reprezentujący zarząd w sprawie staranności decyzji AI - cruxes i archetypy jako materiał obronny w razie zarzutów akcjonariuszy; klient bez kancelarii - Executive Summary plus rozdz. 6 (20 stron) wystarczy, żeby klient zrozumiał że odpowiedź "nie znamy daty" nie jest unikiem tylko najuczciwszą analizą stanu pola. KOMPLEMENTARNY: BW/036 (Kuśmierek - Polska wobec AGI) jako polska perspektywa scenariuszy - razem RAND framework metodologiczny + Kuśmierek polskie dane diagnostyczne; BW/039 (RAII Policy Template) jako wewnętrzna struktura operacyjna pod RAND meta-warstwę; BW/040 (King Vendor Assessment) jako zewnętrzna procedura audytu pod RAND meta-warstwę; BW/006 (MindForge AI Risk Management) i BW/037 (MIT AIRI Navigator) jako inwentarz ryzyk dla RAND wymiaru czasowego; BW/034 (Kumaran) i BW/035 (Laban) jako empiryczne dowody dla cruxowych pozycji "current LLM at limits" vs "early in trajectory". RAND jest WARSTWĄ STRATEGICZNĄ stack'u governance MateMatic, w której pojedyncze tomy operacyjne dostają wymiar czasowy; kancelaria nie tylko wdraża politykę AI - kancelaria monitoruje trajektorię, która zmienia priorytety polityki. Struktura recenzji: lede ("synteza czterech metodologii forecasting AGI"), hook (kartka i czerwony długopis), source card z dwoma CTA (Pobierz oryginał RAND, Kopiuj cytowanie), sekcje: O czym jest materiał (8 rozdziałów + 3 kluczowe dane), Recenzja właściwa (4 najmocniejsze warstwy: asymmetry of costs, scenario-structuring, capability indicators, cruxes), Czego brakuje (4 brakujące warstwy z polskim kontekstem), Komu polecam komu odradzam (4 use case'y w tym pierwsza wzmianka klienta bez kancelarii czytającego sam ES + rozdz. 6), Powiązanie z innymi tomami BW (cross-link do 7 tomów + przedstawienie RAND jako warstwy strategicznej stack'u), boardroom z jednym wnioskiem operacyjnym - czterowarstwowy stack governance AI MateMatic. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/040 - Trzydzieści trzy pytania, dwanaście domen, trzy poziomy. Praktyczny audyt dostawcy AI w rozmowie, nie w ankiecie. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-king-ai-vendor-assessment-guide.html Autor: Dennis Ah King - praktyk AI governance publikujący materiały operacyjne pod marką "AI Governance Blueprint", mapowane na ISO/IEC 42001, NIST AI RMF i EU AI Act. Opis: "AI Vendor Assessment Guide - 33 Curated Questions, 12 Domains, 3 Tiers", V2.0, kwiecień 2026 (61 stron). Licencja CC-BY-NC-SA 4.0 - MateMatic hostuje PDF lokalnie z atrybucją (klauzula NC oznacza brak odsprzedaży jako produkt komercyjny, klauzula SA wymaga tej samej licencji dla pochodnych). STRUKTURA: dwie warstwy. (1) Metodyka rozmowy z dostawcą - pierwsze 15 stron - dlaczego ankieta papierowa nie działa dla AI vendor: paper trail problem (dostawca konstruuje wiarygodnie brzmiące odpowiedzi bez zobowiązań - "we take AI safety seriously" jako non-answer przechodzący każdy checkbox review), vendor fatigue przy długich ankietach (jakość odpowiedzi spada wraz z numerem pytania), questionnaire jako document review nie intelligence-gathering (uczysz się co dostawca jest skłonny napisać, nie jak skuteczna jest kontrola). Alternatywa King'a: KIEROWANA ROZMOWA 60-90 minut z konkretnym scenariuszem pytań tier'owych, scoringiem live i raportem na końcu. Dostawca który odpowiada płynnie z konkretami to wyraźnie inna propozycja niż dostawca który potrzebuje 2 tygodni i działu prawnego. (2) Bank 33 pytań uporządkowany w 12 domen × 3 tiery, każde pytanie ma 4 pola opisu. PIĘĆ PYTAŃ SCREENINGOWYCH (VQ1-VQ5) ustalają tier przed audytem: VQ1 Decision Impact & Data (decyzje wpływające na pracowników/operacje/ finanse/bezpieczeństwo + dane osobowe/poufne/komercyjnie wrażliwe/regulowane), VQ2 Regulatory Scope (regulacje branżowe, EU AI Act, RODO, HIPAA), VQ3 External Visibility (outputy widoczne dla klientów/ regulatorów/publiczności), VQ4 Board-Level Exposure (awaria/incident/breach generujący board-level concern lub material legal exposure), VQ5 Agentic Capability (autonomiczne agenty, agentic workflows, zdolność wykonania działań bez ludzkiej akceptacji każdego kroku). Reguła King'a: "When in doubt, go one tier higher". TIERY (kumulatywne): Tier 1 Basic 12 pytań - low risk minimum baseline, Tier 2 Intermediate 22 pytania (T1 + 10) - medium risk dane wrażliwe, Tier 3 Comprehensive 33 pytania - high risk regulowane dane, board-level concern. DWANAŚCIE DOMEN: D01 AI Governance & Oversight, D02 Regulatory Compliance & AI Act, D03 AI Agent Use Case Scope & Boundaries, D04 Model Performance & Evaluation, D05 Bias Fairness & Ethical AI, D06 Data Management Practices, D07 Security Robustness & Resilience, D08 Privacy Compliance & Legal, D09 Model Cards & Technical Documentation, D10 Incident Response & Continuous Monitoring, D11 Commercials SLAs & Change Management, D12 Legal Liability & Insurance. CZTERY POLA OPISU dla każdego z 33 pytań: Why It Matters (ryzyko biznesowe/regulacyjne które ujawnia pytanie), Look For (sygnały dojrzałej odpowiedzi), Watch Out For (odpowiedzi brzmiące akceptowalnie ale wymagające dopytania), Red Flags (reakcje wskazujące na governance gap lub niemożność/niechęć odpowiedzi). SCORING ✓ Satisfactory (dojrzała praktyka, brak akcji) / ⌑ Follow Up (niepełna odpowiedź, dodaj do listy do rozwiązania przed kontraktem) / ✗ Concern (red flags, eskalacja, rozważ przerwanie). REGUŁA DECYZYJNA: 1-3 follow ups bez concern - kontynuuj rozwiąż przed kontraktem; jakiekolwiek concern - eskaluj; multiple concerns - pauza, prezentacja stakeholderom przed dalszym zaangażowaniem. CZTERY BRAKUJĄCE WARSTWY DLA POLSKIEJ KANCELARII: (a) RODO operacyjne - D08 wspomina GDPR jako przykład regulacji, nie operacjonalizuje wymagań; polska kancelaria dopisuje konkretne pytania o rolę dostawcy (procesor/administrator art. 4 RODO), umowę powierzenia art. 28, transgraniczne przekazania rozdz. V (adekwatność/SCC), retencja, prawa osób art. 12-22, DPIA dostawcy zintegrowane z DPIA klienta. (b) AI Act - D02 wspomina ogólnie; po sierpniu 2026 kancelaria pyta konkretnie: jurysdykcja Provider/Deployer/Importer/Distributor art. 16-26, klasyfikacja wysokiego ryzyka Załącznik III, dokumentacja techniczna Załącznik IV, CE marking, rejestracja w bazie EU, FRIA, AI literacy. (c) Tajemnica zawodowa kancelarii - D06 i D08 zakładają korporacyjny kontekst klienta; kancelaria adwokacka i radcowska podlega innemu reżimowi (art. 6 PoA, art. 3 ustawy o radcach prawnych); pytania King'a o data isolation zaostrzone do "czy treść promptu jest logowana, czy logi dostępne personelowi dostawcy, czy dane treningowe modeli zawierają outputy klientów, czy dostawca podpisał klauzulę zachowania tajemnicy zawodowej w rozumieniu art. 6 PoA". (d) Polskie realia rynkowe - kto z polskiej strony rozmawia, kompetencje po polsku, polski DPO, przepływ danych przez Polskę, regulacje sektorowe UODO/KNF dla doradztwa finansowego/Ministerstwo Cyfryzacji dla zamówień publicznych. USE CASE'Y: kancelaria + klient korporacyjny rozważający zakup SaaS z AI - bierze framework jako szkielet rozmowy + dopisuje 30-50% objętości pod polski kontekst, deliverable opinia z audytu którą klient niesie do zarządu; kancelaria sama negocjująca z dostawcą LegalTech - 5 pytań screeningowych jako pierwszy filtr (czy dostawca wart godzinnej rozmowy), Tier 1/2 jako sam audyt, scoring jako wewnętrzny dokument decyzyjny zarządu kancelarii; klient korporacyjny bez kancelarii - JEDEN Z NIELICZNYCH frameworków który ma sens dawać klientowi do samodzielnego użycia, zwłaszcza Tier 1 (12 pytań); 5 pytań screeningowych + Tier 1 podczas pierwszego spotkania z dostawcą wyłapuje 70% czerwonych flag; King wprost rekomenduje NIE wysyłać dokumentu dostawcy - to materiał wewnętrzny zespołu klienta; framework który MateMatic może zaadaptować do polskiego kontekstu i dystrybuować jako bezpłatny moduł w Akademii. DWA ARTEFAKTY KOMPANIONOWE: AI Vendor Intelligence Scorecard (self-contained HTML tool dla rozmowy live, eksport PDF) - dostępny; AI Vendor Question Repository (pełen bank pytań z guidance dla finalnego stage'u przed kontraktem) - zapowiedziany jako kolejny artefakt toolkitu. KOMPLEMENTARNY do BW/039 (RAII Policy Template - rozdz. XI Procurement to wzorzec klauzul kontraktowych, King to wzorzec ROZMOWY przed kontraktem; obydwa razem dają pełen cykl), BW/034 (Kumaran - pytania architektoniczne #1-2 do uzupełnienia D04/D07/D09), BW/035 (Laban - pytania architektoniczne #3-4 do D04/D07/D11 long-horizon i ablation tools), BW/037 (Michaels AIRI Navigator - pytanie #5 mapowania funkcji na Risk Domain Taxonomy do D02/D04/D05), BW/006 (MindForge AI Risk Management - drugi framework ryzyk wewnątrzorganizacyjny vs zewnętrzny King), BW/008 (Bird & Bird AI Act Guide - regulacyjny szkielet dla D02), BW/013 (FAQ AI Act Service Desk - oficjalna interpretacja Komisji dla D02). King jest BRAKUJĄCYM OGNIWEM między teorią (BW/008, BW/013), inwentarzem ryzyk (BW/006, BW/037), polityką (BW/039) a empirycznymi pytaniami architektonicznymi (BW/034, BW/035) - operacjonalizuje wszystkie te warstwy w jednej godzinie rozmowy. Struktura recenzji: lede ("33 pytania, 12 domen, 3 tiery"), hook ("kartka obok i czerwony długopis"), source card z dwoma CTA (Pobierz oryginał PDF, Kopiuj cytowanie), sekcje: O czym jest materiał (2 warstwy + 12 domen + 3 tiery), Recenzja właściwa (4 najmocniejsze warstwy: rozmowa zamiast ankiety, 5 pytań screeningowych, 4 pola opisu na pytanie, scoring ✓⌑✗), Czego brakuje (4 brakujące warstwy z polskim kontekstem), Komu polecam komu odradzam (3 use case'y w tym pierwszy framework który ma sens dla klienta bez kancelarii - Tier 1), Powiązanie z innymi tomami BW (cross-link do 7 tomów + przedstawienie King'a jako brakującego ogniwa), boardroom z jednym wnioskiem operacyjnym - audyt dostawcy AI jako konkretna usługa godzinna z deliverable. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/039 - Wzorzec polityki AI w czterdziestu sześciu stronach. Co polska kancelaria bierze, a co musi dopisać sama. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-rai-institute-ai-policy-template.html Wydawca: Responsible AI Institute (RAII) - amerykańska organizacja non-profit założona w 2017 roku, partnerzy korporacyjni m.in. IBM, BSI, Microsoft, Boston Consulting Group; specjalizuje się w certyfikacji systemów AI i operacjonalizacji ISO/IEC 42001 i NIST AI RMF. Opis: "AI Policy Template - Build Your Foundational Organizational AI Policy", first draft, czerwiec 2024, 46 stron, 14 rozdziałów + Aneks A + strony do podpisu sygnatariuszy. Licencja: All Rights Reserved · Do Not Use Without Permission - MateMatic NIE hostuje PDF, link kieruje na stronę RAII (responsible.ai). Recenzja MateMatic cytuje fragmenty w ramach uczciwego użycia (fair use / dozwolony użytek) i analizuje strukturę z perspektywy polskiego kontekstu prawnego. STRUKTURA TEMPLATE: cztery warstwy. (I) Fundament - rozdz. I Purpose and Scope, II AI Principles (przejrzystość/sprawiedliwość/kontrola człowieka/bezpieczeństwo), III AI Objectives and Strategy z mierzalnymi KPI. (II) Operacyjna - IV Governance (Steering Committee co 2 miesiące + Operational Committee co 2 tygodnie z reprezentacją Information Security/Procurement/Legal/HR), V Data Management (provenance, jakość, security, procurement zbiorów), VI Risk Management oparte o AI Impact Assessment z severity score zgodnym z impact taxonomy organizacji. (III) Cykl życia - VII Project Management z governance gates, VIII Stakeholder Management, IX Workforce Management, X Regulatory Compliance, XI AI Procurement (Responsible Supplier Assessment + Low-Touch AIIA + must-have list + klauzule kontraktowe: liability, data sharing, PII processor/controller, force majeure, termination). (IV) Zamknięcie - XII Documentation Management z inwentarzami (AI system inventory, data inventory, project inventory, AI Incident-Impact-Risk database), XIII Review and Enforcement, XIV Conclusion ze stronami sygnatur. Każda klauzula ma footnote z odsyłaczem do konkretnej klauzuli ISO/IEC 42001 lub funkcji NIST AI RMF (MAP, MEASURE, MANAGE, GOVERN). Język normatywny - "shall be established", "shall convene", "shall document". CZTERY NAJMOCNIEJSZE WARSTWY według MateMatic: (1) IV Governance - rozdzielenie strategii (Steering) od egzekucji (Operational); model bezpośrednio użyteczny dla 200-osobowej kancelarii i klienta korporacyjnego, dla 10-osobowej kancelarii kompresowany do jednego zespołu raz w miesiącu z partnerem zarządzającym + IT + osobą RODO. (2) VI Risk Management - AIIA jest analogonem DPIA z RODO i FRIA z art. 27 AI Act; template wprost dopuszcza komplementarność, "compatible with, but distinct from, other existing impact or risk assessments"; polski adwokat dostarcza klientowi jedną zintegrowaną AIIA + DPIA + FRIA. (3) XI AI Procurement - Responsible Supplier Assessment to checklist'a do umowy z dostawcą LegalTech; klauzule kontraktowe w paragrafie 7 ("delineation of liability and responsibility for corrective action in downstream impacts; data sharing, deletion, and privacy agreements; PII processor or controller role; force majeure clause; termination clause") to bezpośrednio polski wzorzec umowy. (4) XII Documentation - inwentarze są fundamentem obrony prawnej organizacji w razie skargi do UODO, kontroli sektorowej KNF/UKE albo sporu sądowego. CZTERY BRAKUJĄCE WARSTWY (po stronie polskiego adwokata): (a) RODO - rozdz. V traktuje dane osobowe jako jeden z typów PII, brak osobnego rozdziału opartego o art. 5/6/9/22/25/32/35 RODO i wytyczne EROD; bez tego dokument nie pójdzie pod podpis polskiego DPO. (b) AI Act - jednowyrazowa wzmianka o roli organizacji (Provider/Deployer), brak operacjonalizacji wymagań: klasyfikacja systemów na zakazane/wysokiego/ograniczonego/minimalnego ryzyka, obowiązki Providers (art. 16), Deployers (art. 26), FRIA (art. 27), rejestracja w bazie EU (art. 71), AI literacy (art. 4), kary; polska polityka AI w 2026 musi mieć osobny rozdział mapowania na AI Act z timeline'em zastosowania (2 lutego 2025 zakazy, 2 sierpnia 2026 większość przepisów, 2 sierpnia 2027 high-risk AI w produktach regulowanych). (c) Tajemnica zawodowa - art. 6 Prawa o adwokaturze, art. 3 ustawy o radcach prawnych, Kodeks Etyki Adwokackiej, Kodeks Etyki Radcy Prawnego; kancelaria adwokacka i radcowska podlega rygorom, których RAII nie zna; polska polityka AI w kancelarii ma osobny pierwszy rozdział "Tajemnica zawodowa i AI". (d) Wytyczne sektorowe - polskie UODO o przetwarzaniu danych przez AI, rekomendacje KNF, wytyczne UKE, standardy Ministerstwa Cyfryzacji dla zamówień publicznych z AI; dopisane jako osobny aneks. REKOMENDACJE: kancelaria z klientem korporacyjnym - bierze RAII Template jako szkielet, dopisuje 30-50% objętości pod polski kontekst (RODO, AI Act, sektorowe), kancelaria nie dopisuje rozdziału tajemnicy zawodowej dla klienta nieadwokackiego; kancelaria 200-osobowa - template wprost; kancelaria 10-osobowa - kompresuje do rozdziałów IV/VI/XI/XII plus własny pierwszy rozdział "Tajemnica zawodowa i AI" (15-25 stron polityki); klient bez kancelarii - odradzam, fail-points ukryte w odsyłaczach do ISO 42001 i NIST AI RMF, klauzule "appropriate technical and organizational measures" z AI Act stają się ryzykiem. KOMPLEMENTARNY do BW/008 (Bird & Bird AI Act Guide) i BW/013 (FAQ AI Act Service Desk) na warstwę AI Act, BW/029 (CoE CDDH Handbook) na prawa człowieka i EKPC, BW/030 (ENISA Security Playbook) na ISO 27001 i security klauzul kontraktowych, BW/037 (MIT AIRI Navigator) na bazę ryzyk dla rozdz. VI, BW/034 (Kumaran) i BW/035 (Laban) na pytania audytowe do dostawców AI w rozdz. XI. Struktura recenzji: lede ("46 stron, 14 rozdziałów, fundament w ISO 42001 i NIST AI RMF"), hook ("kartka obok i czerwony długopis"), source card z dwoma CTA (Pobierz oryginał z RAII, Kopiuj cytowanie), sekcje: O czym jest materiał (4 warstwy strukturalne), Recenzja właściwa (4 najmocniejsze rozdziały), Czego brakuje (4 brakujące warstwy z polskim kontekstem), Komu polecam komu odradzam (3 use case'y), Powiązanie z innymi tomami BW (cross-link do 7 tomów), boardroom z jednym wnioskiem operacyjnym. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/038 - Smuha i KU Leuven mapują europejską etykę AI w jednym tomie. Polska kancelaria czyta selektywnie. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-smuha-cambridge-handbook-ai.html Redakcja: Nathalie A. Smuha (KU Leuven Faculty of Law and Criminology), autorka "Algorithmic Rule by Law" (2024). Autorzy poszczególnych rozdziałów: interdyscyplinarny zespół europejskich badaczy z KU Leuven, Tilburg, Oxford i innych ośrodków. Opis: "The Cambridge Handbook of the Law, Ethics and Policy of Artificial Intelligence", Cambridge University Press, około 600 stron, około 25 rozdziałów. Licencja: CC-BY 4.0, Open Access dostępne na Cambridge Core. Najpełniejsze otwartoźródłowe akademickie kompendium prawa i etyki AI w Europie 2026. Multidyscyplinarne, peer-reviewed, europejski focus. Cztery warstwy strukturalne: I. Foundations (rozdz. 1-6: perspektywa techniczna, filozofia AI, etyka Design for Values, fairness, responsibility gap, AI i władza); II. Prawo (rozdz. 7-12: GDPR, tort, competition, consumer, IP, AI Act); III. Sektory (rozdz. 13+: edukacja, media, healthcare, finance, prawdopodobnie więcej); IV. Cross-cutting (zaufanie, transparentność, governance globalne). RECENZJA SELEKTYWNA - 7 rozdziałów priorytetowych dla polskiej kancelarii: (a) Rozdz. 12 Smuha+Yeung "The European Union's AI Act: Beyond Motherhood and Apple Pie?" - krytyczna analiza AI Act przez samą redaktorkę naczelną, materiał obowiązkowy, czyta razem z BW/008 Bird&Bird i BW/013 FAQ Komisji; (b) Rozdz. 7 Dewitte "AI Meets the GDPR" - mapowanie art. 5/9/22/25/35 RODO na cykl życia systemu AI; (c) Rozdz. 8 De Bruyne, Ooms "Tort Liability and AI" - odpowiedzialność deliktowa, kontekst AI Liability Directive (wycofana 2025); (d) Rozdz. 11 Vanherpe "AI and IP Law" - prawa autorskie, fine-tuning, output AI, czyta razem z BW/036 Kuśmierek (sekcja 16.4.2 Lex AI Copyright); (e) Rozdz. 4 Naudts, Vedder "Fairness and AI" - dyskryminacja algorytmiczna, indywidualna vs grupowa vs strukturalna; (f) Rozdz. 5 Lauwaert, Oimann "Moral Responsibility and Autonomous Technologies: Does AI Face a Responsibility Gap?" - filozoficzny fundament dla rozdz. 8; (g) Rozdz. 9 Bostoen "AI and Competition Law" - algorithmic collusion, self-preferencing platform AI. CZTERY ROZDZIAŁY SEKTOROWE do późniejszego czytania per branża klienta: Rozdz. 13 Education (Molenaar et al.), Rozdz. 14 Media (Dutkiewicz et al. KU Leuven), Rozdz. 15 Healthcare Data (Verhenneman), Rozdz. 16 Financial Services. POZOSTAŁE ~10 ROZDZIAŁÓW filozoficznych i ogólnoteoretycznych - do gruntowania mental modelu w wolnym czasie. POLSKI FILTR: bez korekty (rozdz. 7 RODO, rozdz. 12 AI Act, rozdz. 4 Fairness, rozdz. 5 Moral Responsibility) vs z adaptacją (rozdz. 8 Tort - art. 415, 430, 444 KC; rozdz. 11 IP - polski PrAut + dyrektywa 2019/790; rozdz. 9 Competition - UOKiK + art. 101/102 TFUE). Ograniczenia: brak polskiej perspektywy, brak skupienia na praktyce kancelaryjnej (akademik+decydent target), stan na rok publikacji, większość autorów z jednej szkoły (KU Leuven). KOMPLEMENTARNY do istniejącej Bazy Wiedzy MateMatic - Smuha ramuje akademicko, tomy operacyjne (Levy BW/031, Kumaran BW/034, Laban BW/035, Michaels BW/037) konkretyzują protokół kancelaryjny. Licencja CC-BY pozwala MateMatic hostować PDF lokalnie. Struktura recenzji: lede + hook ("600 stron Cambridge Handbook, 7 rozdziałów do polskiej praktyki"), source card z 3 CTA (Cambridge Core, PDF lokalny, Kopiuj cytowanie), sekcje O czym jest materiał, Recenzja właściwa z 7 chapter-card boxes, Cztery rozdziały sektorowe, Polski filtr (bez korekty / z adaptacją), Czego paper nie pokrywa, Co z tego wynika, callout, boardroom. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/037 - MIT centralizuje cztery bazy ryzyk AI w jedno narzędzie. Co compliance kancelarii może z tego wyciągnąć. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-michaels-airi-navigator.html Autorzy: Spencer Michaels, Alexander Saeri, Peter Slattery (MIT AI Risk Initiative). Opis: "Introducing the AI Risk Navigator: An Exploration Tool for the AI Risk Initiative" (2026, licencja CC BY 4.0). Krótki paper wprowadzający (kilka stron) plus narzędzie webowe airi-navigator.com. Cambridge Boston Alignment Initiative finansowała fellowship Spencera Michaelsa. Cztery datasety MIT AIRI zintegrowane w wersji 1: (1) AI Risk Repository - tysiące skatalogowanych ryzyk z literatury akademickiej (MateMatic recenzował w BW/029); (2) AI Incident Database - udokumentowane incydenty AI klasyfikowane wedle Risk Domain Taxonomy; (3) governance documents - dokumenty regulacyjne globalne z mapowaniem na Risk Domain Taxonomy; (4) mitigation actions - akcje rekomendowane przez wiodące frameworki (NIST AI RMF, ISO 42001, OECD). Spinka między bazami: shared Risk Domain Taxonomy. Funkcje: filterable card-based views per dataset, modal z detalami, full data page, global semantic + keyword search, per-chart export. Trzy grupy odbiorców według autorów: researchers, policymakers, industry practitioners. Polska kancelaria w trzeciej grupie - "industry practitioners can assess their exposure against AIRI's taxonomy, benchmark against the incident record, and identify which governance frameworks apply to their risk areas". Trzy operacyjne case'y dla kancelarii: (a) audyt klienta - mapowanie ryzyka X przez wszystkie cztery warstwy w jednym interfejsie; (b) due diligence dostawcy LegalTech - sprawdzenie obietnic dostawcy w incident record + governance + mitigation; (c) polityka użycia AI w kancelarii - jeden interfejs zamiast czterech baz. Powiązanie z BW: warstwa interfejsu nad BW/029 (AI Risk Repository), BW/026 (NIST AI RMF), BW/032 (Bird & Bird AI Act Guide), BW/021 (AI Act Service Desk FAQ). Ograniczenia: brak polskiej perspektywy (governance skewed US/EU/UK), methodological limitations rozproszone w bazach (incidents single-domain klasyfikacja, governance US-skewed), wersja 1 ma 4 datasety z 7 zapowiadanych, brak interpretacji dla niespecjalisty - Navigator pokazuje dane, nie syntetyzuje decyzji. Pytanie audytowe #5 dla checklisty MateMatic LegalTech (uzupełnienie BW/034 Kumaran i BW/035 Laban): "Czy aplikacja LegalTech mapuje swoje funkcje na Risk Domain Taxonomy MIT AIRI lub inną ustabilizowaną taksonomię ryzyka AI? Jeśli tak - poproś o mapę. Jeśli nie - poproś dostawcę o opisanie własnej taksonomii i sprawdź ją w Navigatorze pod kątem pokrycia." Licencja CC BY 4.0 pozwala MateMatic hostować PDF lokalnie z atrybucją. Wartość MateMatic przesuwa się o krok dalej - na polską interpretację i wdrożenie operacyjne, bo pierwsza warstwa pracy compliance officera nad ryzykiem AI właśnie się zewnętrzyła. Struktura recenzji: lede + hook ("Cztery rozproszone bazy MIT AIRI w jednym interfejsie"), source card z trzema CTA (Otwórz Navigator, Pobierz PDF, Kopiuj cytowanie), osiem sekcji - O czym jest materiał (4 datasety + Risk Domain Taxonomy), trzy grupy odbiorców i mapowanie na kancelarię (3 case'y), Funkcje Navigatora, Powiązanie z BW (Slattery BW/029), Czego paper nie pokrywa, Co znaczy dla checklist audytu LegalTech (#5), Co z tego wynika, ramka "Dla zarządu kancelarii". Autor recenzji: Wiesław Mazur · MateMatic. ### BW/036 - Polska wobec AGI: 95 stron strategii. Co kancelaria z tego bierze, a co zostawia ekonomistom państwa. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-kusmierek-polska-wobec-agi.html Autor: Maksymilian Kuśmierek (AGIPoland), kontakt: max.kusmierek@agipoland.eu. Opis: "Polska w obliczu AGI - Raport strategiczny. Mapa drogowa dla rządu, gospodarki i społeczeństwa na erę sztucznej inteligencji ogólnej", AGIPoland, marzec 2026 (95 stron). Pierwszy obszerny polski raport autorski o AGI w 2026 roku. Status: self-published, nie peer-reviewed, nie wydany przez instytucję publiczną ani think-tank o ustabilizowanej pozycji. Autor wprowadza rygorystyczne rozróżnienie trzech warstw twierdzeń: (1) twarda diagnoza - dane GUS, PIE, PSE, ABSL, Eurostat, IMF; (2) scenariusze - ekstrapolacje trendów technologicznych oparte na danych Anthropic, debacie Citrini-Citadel, prognozach McKinsey/Goldman Sachs/Epoch AI; (3) rekomendacje - autorskie postulaty ustrojowe i fiskalne (LVT, Trust Danych, spółdzielnie AI, PPIAI). Struktura: 19 rozdziałów, 5 filarów transformacji 2026-2040 (I. Infrastruktura cyfrowa, II. Reforma fiskalna od podatku od pracy do podatku od ziemi LVT, III. Ludzie i kompetencje, IV. Własność i instytucje, V. Nowy kontrakt społeczny). Glosariusz polski: AGI, ASI, Agentic AI, AI pact. Recenzja MateMatic czyta paper z filtrem vendor-agnostic dzielącym zawartość na trzy grupy. CO KANCELARIA POLECA: rozdział 5 (twarda diagnoza polskiego rynku z danymi GUS/PIE/ABSL), rozdziały 2 i 9 (ekspozycja AGI/agenty), filar III (ludzie i kompetencje - bezpośrednio do Akademii MateMatic), sekcja 16.4.2 Lex AI Copyright (pierwszy polski autorski projekt regulacji prawa autorskiego ery AI - materiał obowiązkowy dla adwokata IP, niezależnie od oceny propozycji). CO MATEMATIC CZYTA JAKO KONTEKST: rozdział 6 (przegląd ekonomistów - Acemoglu, Brynjolfsson, Mokyr, Korinek, Trammell), rozdział 7 (rola związków zawodowych), filar V (nowy kontrakt społeczny). CZEGO MATEMATIC NIE ENDORSUJE: filar II (Land Value Tax), rozdział 3 (matematyka UBI 1000 zł), filar IV w części dotyczącej spółdzielni AI, Trust Danych, PPIAI. Powód: vendor-agnostic principle - MateMatic jako edukator dla kancelarii prawnych nie zajmuje stanowiska w polskiej polityce gospodarczej; LVT, UBI, spółdzielnie AI to legitimate punkt widzenia jednego eksperta i należą do debaty ekonomistów państwa, nie naszej domeny LegalTech. Recenzja w Bazie Wiedzy nie jest endorsement - to mapowanie co można operacyjnie wykorzystać i wyraźne zaznaczenie granicy domeny MateMatic. Ograniczenia: brak peer review, brak konkretnego rozdziału o kancelariach prawnych (paper na poziomie ogólnym o pracy umysłowej), brak dyskusji relacji do AI Act i RODO (BW/029 CoE CDDH i BW/030 ENISA są lepszymi źródłami w obszarze unijnym), brak mapy konkretnych polskich aktorów LegalTech (Gaius-Lex, Legora - nie pokrywane). Struktura recenzji: lede + hook ("Twarda diagnoza polskiego rynku AI: bierzemy. Land Value Tax i UBI: nie nasza domena"), source card z mailto autora (mailto:max.kusmierek@agipoland.eu), dziewięć sekcji w tym dedykowana sekcja "Filtr MateMatic - trzy grupy zawartości" z kolorowym oznaczeniem ✓ poleca / ⚠ kontekst / ✕ nie endorsuje. Autor recenzji: Wiesław Mazur · MateMatic. ### BW/035 - Po dwudziestu poprawkach LLM-em twój dokument to nie jest już twój dokument. Microsoft mierzy 25-50%. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-laban-llms-corrupt-documents.html Autorzy: Philippe Laban, Tobias Schnabel, Jennifer Neville (Microsoft Research). Opis: LLMs Corrupt Your Documents When You Delegate, preprint arXiv:2604.15597v1 [cs.CL], 17 kwietnia 2026, status under review. Empiryczna praca eksperymentalna z dwoma głównymi wkładami: (1) DELEGATE-52, benchmark 310 środowisk pracy w 52 domenach zawodowych (kodowanie, krystalografia, genealogia, notacja muzyczna, dokumenty prawne, finansowe, naukowe, kreatywne; każde środowisko: prawdziwe dokumenty 3-5k tokenów + dystraktor 8-12k tokenów + 5-10 zadań edycyjnych); (2) round-trip relay simulation - metoda ewaluacji long-horizon bez reference solutions. Każde zadanie ma forward edit + backward edit; po n round-tripów dokument powinien wrócić do oryginału; Reconstruction Score RS@k mierzy similarity. Dziewiętnaście modeli przetestowanych: GPT (4o, 4.1, 5 Nano, 5 Mini, 5 Chat, 5, 5.1, 5.4, o1, o3), Claude (4.6 Sonnet, 4.6 Opus), Gemini (3 Flash, 3.1 Pro), Mistral Large 3, xAI Grok 4, OSS 120B, Kimi K2.5. Wszystkie modele degradują wraz z liczbą interakcji. Średnia degradacja przez wszystkie 19 modeli: 50 punktów procentowych po 20 interakcjach. Modele frontierowe (Gemini 3.1 Pro, Claude 4.6 Opus, GPT 5.4) - 25%. Najlepszy model (Gemini 3.1 Pro) jest "ready for delegated workflows" tylko w 11 z 52 domen. Ustalenie przeciw- intuicyjne (sekcja 4.2): basic agentic harness (file read/write/code execution) NIE poprawia wyników - pogarsza je średnio o 6 punktów procentowych. Powód: long-context cost (8-12 tooli na zadanie, 2-5x więcej tokenów wejściowych). Pozostałe ustalenia: Document Size Effect (większy doc = większa degradacja), Length of Interaction (logarytmiczne narastanie błędów - pierwsze 5 tur tanie, 5-15 środkowe, 15-20 plateau ale wciąż akumulacja), Distractor Effect (niepowiązany kontekst pogarsza wynik), Short interaction nie predykcyjna dla long-horizon (kluczowe dla oceny dostawców LegalTech opartej na demos). Konsekwencja dla kancelarii: pipeline iteracyjnej pracy z LLM nad umową/pismem procesowym/opinią ma wbudowaną stratność systemową. Verification Stack v3 (propozycja MateMatic, nie ustalenie autorów) - rozszerzenie v2 (Kumaran) o wymiar czasowy: (#1 czasowa) limituj iteracje na jednym dokumencie do 5-7, po piątej turze wracaj do oryginału (nie do ostatniej wersji modelu) i zaczynaj fresh session; (#2 czasowa) po każdej sesji rób diff oryginał vs ostatni output, sprawdzaj nie tylko "czy dodano X" ale "czy gdzieś indziej coś nie zniknęło"; (#3 czasowa) jedna sesja = jeden dokument, nie wklejaj umowy z trzema referencyjnymi orzeczeniami (Distractor Effect); (#1 architektoniczna) nie używaj agentic harness ze standardowymi toolami jako rozwiązania na degradację - eksperyment Microsoft pokazuje że to nie pomaga w naiwnej implementacji; (#2 architektoniczna) wybór modelu pod konkretną domenę pracy ma znaczenie ("11 z 52 domen"), kancelaria powinna mieć własny mini-benchmark - 20 round-trip edits na typowej umowie. Dwa nowe pytania audytowe do dostawcy LegalTech (uzupełnienie 5 pytań z Kumaran): (#3) czy aplikacja ma testy long-horizon na DELEGATE-52 lub własnym benchmarku z minimum 20 interakcjami; (#4) ablation analysis architektury z toolami pokazujący że nie pogarsza wyników w stosunku do prostego LLM call. Ograniczenia: single-turn interaction (multi-turn pogłębiłby degradację); document size 3-5k tokenów - poniżej kancelaryjnej skali (umowy 30-200 stron, dossier 100-500 stron); brak modeli specjalistycznych LegalTech (Bielik, Gaius-Lex, Legora). Kluczowe pojęcia (definicje.html): delegate-52, round-trip-relay, reconstruction-score, long-horizon-evaluation, document-degradation-llm. Struktura recenzji: lede + hook ("Każda iteracja popraw to kosztuje"), source card z linkiem arXiv, 9 sekcji - O czym jest materiał, Główny wynik (wszystkie degradują), Tools nie pomagają, Inne ustalenia (Document Size, Length, Distractor, Short vs Long Horizon), Verification Stack v3 (propozycja MateMatic), Audyt dostawców LegalTech (pytania #3 i #4), Czego paper nie pokrywa, Co z tego wynika, ramka "Dla zarządu kancelarii w trzech zdaniach". Autor recenzji: Wiesław Mazur · MateMatic. ### BW/034 - Dwa błędy w pewności LLM. DeepMind diagnozuje, dlaczego model raz się upiera, raz kapituluje. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-28-kumaran-llm-confidence-biases.html Autorzy: Dharshan Kumaran (Google DeepMind), Stephen M. Fleming (UCL Institute of Cognitive Neuroscience), Larisa Markeeva, Joe Heyward, Andrea Banino, Mrinal Mathur, Razvan Pascanu, Simon Osindero, Petar Velickovic, Viorica Patraucean (Google DeepMind / Google Research), Benedetto De Martino (UCL Institute of Cognitive Neuroscience). Opis: Competing Biases underlie Overconfidence and Underconfidence in LLMs (Nature Machine Intelligence, Vol. 8, kwiecień 2026, s. 614-627; DOI: 10.1038/s42256-026-01217-9; otrzymano 2 lipca 2025; zaakceptowano 9 marca 2026; opublikowano online 22 kwietnia 2026). Empiryczna praca eksperymentalna z modelem obliczeniowym dwuparametrowym, przetestowanym przez transfer między datasetami SimpleQA (faktografia) i GSM-MC (rozumowanie matematyczne). Paradygmat dwuetapowy (two-stage paradigm): w etapie pierwszym model odpowiada na pytanie zamknięte; w etapie drugim widzi (lub nie) swoją wcześniejszą odpowiedź, dostaje radę od drugiego LLM (Opposite/Same/Neutral Advice) i dokonuje finalnego wyboru. Metryki: CoM rate (Change of Mind) oraz OUCS (Over/Underconfidence Score) względem idealnego obserwatora Bayesowskiego. Ustalenie pierwsze - choice-supportive bias: w warunku Answer Shown - Neutral Advice OUCS = +0,210 (p<0,001 testem permutacyjnym n=10000); w warunku Answer Hidden - Neutral Advice bias zanika; gdy odpowiedź atrybuowana "innemu LLM" bias całkowicie znika - dowód, że mechanizm jest specyficzny dla self-recognition (drive for self-consistency), nie ogólnym anchoring. Ustalenie drugie - hypersensitivity to contradiction: model aktualizuje pewność znacznie silniej w odpowiedzi na Opposite Advice niż wskazywałby idealny obserwator Bayesowski; Same Advice traktowana w przybliżeniu zgodnie z normą - asymetria, nie symetria. Ustalenie trzecie - generalizacja: oba błędy w sześciu modelach (Gemma 12B, Gemma 27B, GPT-4o, GPT o1-preview, DeepSeek-Chat 671B, Llama 70B Instruct), w obu domenach (faktografia, rozumowanie), model Bayesowski z dwoma parametrami transferuje z zamrożonymi parametrami SimpleQA→GSM-MC. Skala nie pomaga (12B-675B). Hipoteza pochodzenia (autorzy nie udowadniają przyczynowości): RLHF + sycophancy. Konsekwencja dla kancelarii: pipeline "AI sprawdza AI" ma uprzedzenie wbudowane w architekturę - Verification Stack v2 (propozycja MateMatic, nie ustalenie autorów): pięć reguł - (#1 zakaz) nie pokazuj modelowi własnej odpowiedzi przy walidacji, (#2 zakaz) nie waliduj LLM-2 odpowiedzi LLM-1 z prośbą o znalezienie błędów - LLM-2 dostaje tylko pytanie, (#3 obowiązek) kontra do AI musi być cytowana (art./sygnatura/paragraf), (#4 obowiązek) high-stakes - finalna weryfikacja treści przez człowieka, nie delegowana do drugiego AI, (#5 obowiązek) demo dostawcy LegalTech - dwa pytania o architekturę modułu weryfikacji. Ograniczenia: API z jawnym confidence score nie zawsze dostępny w deployment; multiple-choice format - generalizacja na zadania otwarte wymaga ostrożności; hipoteza RLHF nie udowodniona przyczynowo; brak modeli polskojęzycznych (Bielik, polskie fine-tune'y) i specjalistycznych LegalTech (Gaius-Lex, Legora) - do replikacji empirycznej. Kluczowe pojęcia (definicje.html): choice-supportive-bias-llm, hypersensitivity-to-contradiction-llm, OUCS, two-stage-paradigm, self-consistency-preservation. Struktura recenzji w Bazie Wiedzy MateMatic: lede + hook ("AI sprawdzające AI jest architekturą z wbudowanym uprzedzeniem"), source card z DOI, dziewięć sekcji - "O czym jest ten materiał", paradygmat dwuetapowy, ustalenie pierwsze (choice-supportive), ustalenie drugie (hypersensitivity), ustalenie trzecie (skala), Verification Stack v2 (propozycja MateMatic), konsekwencje dla pracy adwokata, czego paper nie pokrywa, "Co z tego wynika", ramka "Dla zarządu kancelarii w trzech zdaniach". Autor recenzji: Wiesław Mazur · MateMatic. ### BW/033 - Policja używa AI bez ujawnienia. UNICRI dostarcza adwokatowi trzy warstwy argumentacji. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-27-unicri-decoding-transparency-law-enforcement.html Autorzy: UNICRI (United Nations Interregional Crime and Justice Research Institute) Opis: Decoding Transparency: How to Foster Public Trust in Responsible AI Innovation in Law Enforcement (kwiecień 2026, 96 stron) - część projektu AI4Citizens finansowanego przez Norweską Radę Badań, prowadzonego przez NTNU z udziałem BI, Sussex, Agder. Trzy rozdziały: trust + transparency, communicating about AI, public engagement. Adresat formalny: agencje ścigania. Adresat operacyjny dla polskiej kancelarii: trzy warstwy argumentacji procesowej w postępowaniu z udziałem AI po stronie organu - transparentność jako warunek legitymacji (art. 6 EKPC kontradyktoryjność), obowiązek komunikacji jako standard staranności (art. 5 RODO i dyrektywa 2016/680), public engagement jako standard udziału grup wrażliwych (art. 8 EKPC i art. 5 AI Act). Argumentacja UNICRI o vendor restrictions: klauzule kontraktowe między agencją a dostawcą AI nie mogą być pretekstem do uchylenia się od obowiązku transparentności wobec obywatela. Use Case Snapshots oparte na fikcyjnym scenariuszu privacy-preserving crowd monitoring. Dokument niszowy - i właśnie dlatego, gdy nisza staje się sprawą, jego waga argumentacyjna jest większa niż dokumentu ogólnego. ### BW/032 - Twoja kancelaria już ma shadow AI. Sandbox to sposób, żeby tajemnica zawodowa to przeżyła. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-27-secure-ai-sandboxes-safe-to-experiment.html Autorzy: Thought Leadership publication (autorstwo zbiorowe, niesygnowane) Opis: Safe to Experiment - How Secure AI Sandboxes Give Teams Space to Innovate, Fail, and Learn (kwiecień 2026, 7 stron) wprost adresuje "legal and compliance practitioners". Pięcioetapowy roadmap budowy secure AI sandbox: 1) isolation layer (microVMs Firecracker/Kata, gVisor, BYOC E2B/Northflank/ Daytona, AWS SageMaker, Azure AI Studio, Agent Sandbox na K8s), 2) provision safe data (synthetic data MOSTLY AI/Neosync/Tonic.ai), 3) lock down access and networking (SSO, RBAC, VPC; ostrzeżenie: DNS filtering bypass via DNS tunneling, Unit 42/Palo Alto Networks 2025), 4) instrument everything (audit trails, SIEM), 5) governance and graduation criteria. Mapping do NIST AI RMF 1.0 (Govern→Map→Measure→Manage). Statystyka IBM/Ponemon Cost of a Data Breach 2025: 1/5 organizacji miało incydent shadow AI o średnim dodatkowym koszcie ~670k USD. Dla polskiej kancelarii pięć kroków mapuje się do art. 28 i 32 RODO, art. 25 RODO + tajemnica zawodowa (art. 6 PoA, art. 3 ust. 3 ust. RP), art. 5(2) RODO accountability, art. 26 AI Act deployer. Przed jurysdykcyjnym precedensem polski adwokat musi mieć sandbox albo ma shadow AI - to dychotomia, nie skala. ### BW/031 - Trzynaście rozdziałów Levy. Polski adwokat czyta dziewięć z nich bez Westlawa. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-27-levy-ai-litigation-practice.html Autorzy: Colin S. Levy Opis: AI in Litigation Practice (2026) jest drugim tomem serii praktycznych przewodników Levy'ego po AI in the Courtroom (skierowanym do sędziów). Trzynaście rozdziałów na trzydziestu stronach: Discovery Reckoning, Drafting Briefs Without Falling Into Mata, Deposition Preparation, Trial Preparation, Damages/Settlement/ADR, Authenticating AI-Generated Evidence (deepfake, FRE 901), Compliance Layer (standing orders), Privilege, Vendors, Ethics (Model Rule 1.1, 5.1, 3.3, ABA Op. 512), Building AI Stack, What Comes Next. Z perspektywy polskiej kancelarii jedenaście rozdziałów ma realne przełożenie na praktykę pod KPC, KPK i Kodeksem Etyki Adwokackiej (z rozdziałem 6 częściowo - szacowanie szkód działa, amerykańskie ADR nie); trzy zostają jako amerykańska egzotyka (jury research, US ADR, mapa US vendorów). Kluczowy fragment: Verification Stack z rozdziału 3 jako wzorzec polskiego protokołu weryfikacji pism przed pierwszą polską sankcją typu Mata v. Avianca. ### BW/030 - ENISA pisze do producentów. Kancelaria czyta to w trzech rolach naraz. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-27-enisa-security-by-design-default.html Autorzy: European Union Agency for Cybersecurity (ENISA) Opis: Security by Design and Default Playbook wydany w marcu 2026 (v0.9 final draft, CC-BY 4.0) zawiera 22 konkretne praktyki, 16 zasad bezpieczeństwa w 4 grupach (Architectural Foundations, Operational Integrity, Default Hardening, Guided Protection), sekcję o Machine-Readable Security Manifest oraz Aneks C mapujący zasady do Annex I rozporządzenia 2024/2847 (Cyber Resilience Act, obowiązuje od grudnia 2027). Dla polskiej kancelarii to jeden dokument do trzech ról: jako klient zamawiający oprogramowanie i AI tools, jako vendor LegalTech wytwarzający własne narzędzia, jako doradca klientów- producentów wchodzących pod CRA i NIS2. Praktyczne klauzule kontraktowe dla SBOM, restrictive initial access, machine-readable manifest powinny zacząć trafiać do umów IT już teraz, nie w 2027. ### BW/029 - AI w sądzie nie jest neutralna. Handbook CDDH liczy artykuły ECHR, które to rozbija. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-27-coe-cddh-handbook-human-rights-ai.html Autorzy: Council of Europe, Steering Committee for Human Rights (CDDH) Opis: Handbook on Human Rights and Artificial Intelligence wydany w kwietniu 2026 zestawia w jednym tekście EKPC, Europejską Kartę Społeczną, Framework Convention on AI i AI Act, czytając je nie po regulatorach, lecz po sektorach public governance. Sekcja 4.1 Administration of Justice mapuje pięć kategorii AI w sądach (search, decision support, prediction, ODR, case allocation) do podpunktów art. 6 EKPC. Dla kancelarii: trzy wektory praktyczne - sędzia używa AI (niezależność tribunalu), jedna ze stron ma AI a druga nie (equality of arms), prokuratura sięga po predictive tools (domniemanie niewinności). Sekcja 3.2 Business and Human Rights traktuje kancelarię jako adresata zobowiązań praw człowieka. Paragraf 98 nadaje się do bezpośredniego cytowania w sprawach karnych z udziałem narzędzi AI po stronie oskarżenia. ### BW/028 - Praktyczna obskurność umarła. Carlini, Tramèr i koniec taniej pseudonimizacji. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-carlini-tramer-llm-deanonymization.html Autorzy: Lermen, Paleka, Swanson, Aerni, Carlini, Tramèr (ETH Zurich, Google DeepMind) Opis: Badanie demonstruje, że LLM-y potrafią deanonimizować dane "zaciemnione" klasycznymi metodami (usuwanie imion, dat, miejsc). Dla kancelarii: pseudonimizacja dokumentów przed wysłaniem do modelu nie jest już wystarczającym zabezpieczeniem tajemnicy klienta. ### BW/027 - Europa ma kapitał. Europa nie ma pośpiechu. European AI Report 2026. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-european-ai-report-2026.html Autorzy: Dealroom.co, Bloisi Opis: Roczny raport o inwestycjach AI w Europie. Wniosek: pieniądze są, tempo wdrożeń niższe niż w USA. Dla polskiej kancelarii: większa presja regulacyjna, ale też większa szansa na dojrzałe wdrożenia zamiast MVP na produkcji. ### BW/026 - Mapa aktywności, mapa ryzyka. MIT mierzy, gdzie naprawdę siedzi AI. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-mit-malone-where-can-ai-be-used.html Autorzy: Malone i in. (MIT) Opis: MIT mapuje aktywności zawodowe, które można skutecznie zautomatyzować LLM-em. Dla kancelarii: lista zadań z wysoką gęstością AI (draftowanie, ekstrakcja, podsumowania) vs. zadań z niską gęstością (negocjacja, osąd, etyka). ### BW/025 - Siedem modeli zagrożeń. Bengio i Russell patrzą poza alignment. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-piedrahita-ai-risks-democratic-systems.html Autorzy: Piedrahita, Bengio, Russell, Schölkopf i in. Opis: Siedem klas ryzyk AI dla systemów demokratycznych (dezinformacja, koncentracja władzy, erozja procesów deliberacyjnych). Dla kancelarii: mapa ryzyk compliance wykraczająca poza typowy GRC. ### BW/024 - Oferty pracy zdradzają strategię. Magic Circle i AI widziane przez 4447 ogłoszeń. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-futurice-ai-hiring-intelligence-legal.html Autorzy: Matthew Edwards (Futurice) Opis: Analiza ogłoszeń rekrutacyjnych Magic Circle pokazuje, jak BigLaw faktycznie buduje stack AI. Wniosek: więcej inwestycji w architekturę danych niż w same modele. ### BW/023 - Pięć lat po Stochastic Parrots. Papuga siedzi już w kancelarii. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-bender-gebru-stochastic-parrots.html Autorzy: Bender, Gebru, McMillan-Major, Shmitchell Opis: Pięć lat po słynnym artykule "stochastic parrots" - tezy Bender i Gebru w świetle 2026 roku. Dla kancelarii: model nie "rozumie" - generuje statystycznie prawdopodobne kontynuacje tekstu. Skutki dla doradztwa i dokumentów. ### BW/022 - Partner konsultuje AI. AI się myli. Partner jest pewniejszy. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-shaw-nave-cognitive-surrender.html Autorzy: Shaw, Nave (Wharton) Opis: Zjawisko cognitive surrender - eksperci, którzy konsultują AI, stają się pewniejsi swoich błędów. Dla kancelarii: architektura HITL musi być tak zaprojektowana, żeby nadzór był realny, nie fasadowy. ### BW/021 - Pięćset miliardów dolarów. GovAI liczy cybercrime, żeby policzyć AI. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-govai-global-cybercrime-damages.html Autorzy: Lukosiute, Halstead, Righetti (GovAI) Opis: Metodologia liczenia globalnych szkód z cyberprzestępczości jako punkt odniesienia dla szacowania przyszłych szkód z AI. Dla kancelarii: argumentacja w sprawach odpowiedzialności za AI. ### BW/020 - Warstwa procesu, warstwa osądu. Bifurkacja BigLaw i polska kancelaria. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-bifurcation-of-biglaw.html Autorzy: Analiza branżowa Opis: BigLaw dzieli się na dwie warstwy: procesową (automatyzowalna AI) i warstwę osądu (niezautomatyzo walna). Dla polskiej kancelarii: trzeba decydować, po której stronie się gra. ### BW/019 - Dziesięć słabości deep learningu. Marcus w 2018, kancelaria w 2026. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-marcus-deep-learning-critical-appraisal.html Autorzy: Gary Marcus Opis: Dziesięć krytycznych słabości deep learningu - artykuł z 2018, wciąż aktualny dla kancelarii, które planują wdrożenie LLM-ów. Brak zdrowego rozsądku, brak przyczynowości, brak stabilności out-of- distribution. ### BW/018 - Umiejętność to nie inteligencja. Chollet dla kancelarii, która kupuje agenta. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-chollet-measure-of-intelligence.html Autorzy: François Chollet Opis: Definicja inteligencji jako umiejętności generalizacji, nie jako kolekcji wyuczonych zadań. Dla kancelarii: kryteria oceny agenta AI - czy potrafi poradzić sobie z nową sprawą, czy tylko powtarza szablony. ### BW/017 - Cztery iluzje, jedna kancelaria. Mitchell o tym, dlaczego AI jest trudniejsza, niż myślimy. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-mitchell-why-ai-is-harder.html Autorzy: Melanie Mitchell Opis: Cztery iluzje poznawcze badaczy AI (iluzja ogólnej inteligencji, iluzja abstrakcji, iluzja przyczynowości, iluzja skalowania). Dla kancelarii: jak czytać obietnice dostawców AI. ### BW/016 - Governance AI ma ulubione ryzyka. MIT liczy, o których milczy. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-mit-mapping-ai-governance.html Autorzy: MIT (mapping AI governance) Opis: Mapa ryzyk, które są adresowane w politykach AI governance, i tych, które są pomijane. Dla kancelarii: luki w compliance stack - co trzeba dopowiedzieć samemu. ### BW/015 - Agent to nie paralegal. Levy wraca z toolkitem. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-levy-ai-agents-for-lawyers.html Autorzy: Colin S. Levy Opis: Praktyczny toolkit AI agents for lawyers - rozróżnienie agent vs asystent vs automat. Dla polskiej kancelarii: jak ułożyć architekturę delegowania zgodnie z art. 14 AI Act. ### BW/014 - Słownik amerykański, rzeczywistość europejska. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-iapp-cybersecurity-law-key-terms.html Autorzy: IAPP (International Association of Privacy Professionals) Opis: Glosariusz IAPP w dziedzinie cybersecurity law. Dla polskiej kancelarii: mapping terminów amerykańskich na europejskie (NIS2, DORA, RODO) - co się pokrywa, co nie. ### BW/013 - Governance AI ma ulubione ryzyka. MIT liczy, o których milczy. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-mit-mapping-ai-governance.html Autorzy: MIT Opis: Drugi tom serii MIT - szczegółowa analiza kategorii ryzyk, które są niedoreprezentowane w politykach publicznych. ### BW/012 - FAQ Komisji, który mówi mniej, niż powinien. URL: https://matematicsolutions.com/baza-wiedzy/2026-04-22-ai-act-service-desk-faq.html Autorzy: European Commission - AI Act Service Desk FAQ Opis: Recenzja oficjalnego FAQ Komisji Europejskiej do AI Act. Wskazanie pytań, na które Komisja odpowiada, i tych, które pozostają bez odpowiedzi. Dla kancelarii: mapa niepewności prawnej. ### BW/011 - Jeden atlas, siedemdziesiąt cztery mapy. MIT porządkuje chaos ryzyka AI. URL: https://matematicsolutions.com/baza-wiedzy/2026-ai-risk-repository-mit.html Autorzy: MIT AI Risk Repository Opis: Repozytorium 74 taksonomii ryzyka AI zintegrowanych w jeden atlas. Dla kancelarii: punkt wyjścia do własnej matrycy ryzyk w DPIA. ### BW/010 - Cztery reżimy, jeden agent. O czym nie pisze polski compliance. URL: https://matematicsolutions.com/baza-wiedzy/2026-governing-agents-kenney.html Autorzy: Noah M. Kenney Opis: Jednoczesne obowiązywanie GDPR, EU AI Act, NIST AI RMF i ISO/IEC 42001 przy wdrożeniu agenta. Dla polskiej kancelarii: compound regime jako domyślny kontekst każdej architektury. ### BW/009 - Przewodnik pisany przed obowiązywaniem. Rok później. URL: https://matematicsolutions.com/baza-wiedzy/2026-ai-act-guide-bird-and-bird.html Autorzy: Bird & Bird LLP Opis: Przewodnik po EU AI Act napisany przed pełnym wejściem w życie. Co się potwierdziło, co wymaga rewizji. Dla kancelarii: lista pytań do zadawania klientom. ### BW/008 - Deepfake o dziewiątej rano. Brytyjska instrukcja, polskie pytanie. URL: https://matematicsolutions.com/baza-wiedzy/2026-ai-information-threats-crisis-response.html Autorzy: McDonald, Stockwell Opis: Brytyjski playbook response na incydenty z deepfake. Dla polskiej kancelarii: wzorzec procedury wewnętrznej + szkolenie zespołu PR. ### BW/007 - Model Rules bez RODO. Amerykański etyczny playbook w polskim biurze. URL: https://matematicsolutions.com/baza-wiedzy/2026-ai-ethics-for-lawyers-levy.html Autorzy: Colin S. Levy - AI ethics for lawyers Opis: Kodeks etyczny wdrożenia AI w kancelarii według ABA Model Rules. Dla polskiej kancelarii: co z tego jest do zaadaptowania, co wymaga uzupełnienia o RODO. ### BW/006 - Playbook, którego w Europie brakuje. MindForge jako wzorzec operacyjny. URL: https://matematicsolutions.com/baza-wiedzy/2026-mindforge-ai-risk-management.html Autorzy: MindForge Consortium Opis: Operacyjny playbook zarządzania ryzykiem AI - od ról, przez role cards, po matryce decyzyjne. Dla kancelarii: wzorzec, którego brakuje w europejskich wytycznych. ### BW/005 - Model konformistyczny, model dogmatyczny. Dwa fenotypy jednego asystenta. URL: https://matematicsolutions.com/baza-wiedzy/2026-clinician-input-lopez-horvitz.html Autorzy: Lopez, Everett, Chen, Chaudhari, Horvitz Opis: Badanie pokazuje dwa fenotypy działania tego samego LLM: konformistyczny (zgadza się z lekarzem) i dogmatyczny (trzyma się swojej odpowiedzi). Dla kancelarii: problem pewności agenta i jej wpływ na osąd prawnika. ### BW/004 - Dziesięć pytań, cztery minuty, jedna skala. Psychometria dla halucynacji. URL: https://matematicsolutions.com/baza-wiedzy/2026-shs-muller-holzinger.html Autorzy: Müller, Steiger, Plass, Holzinger Opis: Skala halucynacji Stanford Hallucination Scale (SHS) - dziesięciopytaniowy kwestionariusz do mierzenia skłonności modelu do halucynacji. Dla kancelarii: narzędzie do oceny dostawców LLM przed kontraktem. ### BW/003 - Lepsze myślenie, gorsze narzędzia. Paradoks reasoning-owych modeli. URL: https://matematicsolutions.com/baza-wiedzy/2026-reasoning-trap-yin.html Autorzy: Yin, Sha, Cui, Meng, Li Opis: Paradoks reasoning: modele "myślące" (o1, o3) lepiej radzą sobie z logiką, ale gorzej z użyciem narzędzi. Dla kancelarii: wybór modelu zależy od typu zadania (draftowanie vs. wyszukiwanie). ### BW/002 - NIST mówi: monitorować musicie. I dodaje: nie do końca potrafimy. URL: https://matematicsolutions.com/baza-wiedzy/2026-nist-ai-800-4-monitoring.html Autorzy: NIST AI 800-4 Opis: Wytyczne NIST w zakresie monitorowania systemów AI produkcyjnych. Recenzja: zakres obowiązków jest szeroki, zestaw narzędzi ograniczony. Dla kancelarii: ryzyko rozjazdu "powinniśmy - możemy". ### BW/001 - Reset relacji. CLO Intela wyznacza granicę. URL: https://matematicsolutions.com/baza-wiedzy/2026-ai-make-or-break-boise.html Autorzy: April Miller Boise (CLO Intel) Opis: Keynote CLO Intela o relacji prawnik - AI. Cztery warunki resetowania relacji z dostawcami. Dla polskiej kancelarii: punkt odniesienia w rozmowach z partnerami zarządzającymi. ### BW/000 - Dziesięć sposobów, żeby agent zrobił coś, czego nie miał robić. URL: https://matematicsolutions.com/baza-wiedzy/2025-owasp-aivss-agentic-ai.html Autorzy: Huang, Bargury, Narajala, Gupta, Marple - OWASP AIVSS v0.8 Opis: OWASP AIVSS v0.8 - dziesięć kategorii podatności agentów AI. Dla kancelarii: baseline threat model każdego wdrożenia agenta z nadzorem ludzkim. ## Optional - [Polityka prywatności](https://matematicsolutions.com/polityka-prywatnosci.html) - [Sitemap XML](https://matematicsolutions.com/sitemap.xml) - [Robots.txt](https://matematicsolutions.com/robots.txt) - [llms.txt (krótka wersja)](https://matematicsolutions.com/llms.txt)