Model dojrzałości wdrożeń AI w organizacji

Obserwując pierwsze wdrożenia programów AI można odnieść wrażenie, że organizacje podchodzą do nich z różnym zapałem. Czasem jest to wejście na pełnym rozpędzie w bramkę z kijem, krążkiem i hokeistami, a czasem ostrożnie postępuje niczym kot omijający rozrzucone na podłodze zabawki.

Postanowiłem podjąć próbę ułożenia tych inicjatyw na drabinie dojrzałości od poziomu pojedynczych pracowników nieśmiało promptujących pod kocem, po całą organizację podporządkowaną governance sterowanemu przez wielki sztuczny mózg.

Poziom 1 – Partyzanckie promptowanie

Na tym poziomie dominuje tzw. shadow AI, czyli wykorzystywanie modeli językowych na własną rękę przez niektórych pracowników. Najczęściej wykorzystywane są do tłumaczeń, wyszukania informacji, podsumowania, napisania wiadomości, przygotowania fragmentów kody, np. zapytania SQL, narysowania obrazka. Nie ma tutaj centralnej strategii, ani oficjalnej polityki, są tylko oddolne inicjatywy. Ponieważ wykorzystywane są modele w chmurze poza kontrolą, to pojawia się ryzyko wycieku danych lub generowania treści niezgodnych z polityką firmy.

Poziom 2 – Copilot na każdym biurku

Na tym poziomie każdy pracownik otrzymuje dostęp do modelu językowego i ogłasza się, że ten model jest oficjalny i nie można korzystać z innych. Na ogół jest to Copilot, choć powoli do firm wkracza też Claude i Perplexity. Na tym poziomie dojrzałości na ogół nie ma zasad korzystania i centralnej polityki. Na ogół też nie ma integracji z przepływem w procesie, czyli pracownik, wykonując zadanie, musi przełączyć do okienka czatu, a potem wynik przekleić do procesu. Rzadko pojawia się integracja LLM z innymi systemami firmowymi, a jeżeli już to jest to zwykle pakiet oferowany przez Microsoft, czyli SharePoint, Teams, poczta, kalendarz.

Ryzyko polega przede wszystkim na braku strategicznego kierunku wdrażania AI i wykorzystywaniu go do różnych celów przy jednoczesnym wzroście kosztów tokenów. Zatem ryzykiem jest niewykorzystany potencjał tej technologii. Wśród zastosowań zaczyna pojawiać się podsumowywanie spotkań, pisanie tekstów z użyciem danych wrażliwych (wszak to oficjalny AI w firmie).

Poziom 3 – Pierwsze procesy ze zintegrowanym AI w wybranych krokach

Na tym poziomie dojrzałości pojawiają się pierwsze procesy, w których model językowy jest integralnym elementem procesu, czyli nie można wykonać danego kroku bez ingerencji AI. To znacząco obniża barierę adopcji, bowiem pracownik wykonuje swoje zadania jak dotąd, a jedynie dostaje w pojedynczych krokach procesu dodatkowe wsparcie, np. wstępnie wypełniony formularz, podsumowane pismo, przypisane kategorie do zgłoszenia itd.

Ten poziom wymaga po raz pierwszy projektów wdrożeniowych, ponieważ trzeba przerobić istniejące rozwiązania informatyczne. Pojawiają się integracje z wewnętrznymi systemami oraz wykorzystanie narzędzi i kompetencji (z ang. tools i skills). Narzędzia to zdolność LLM nie tylko do udzielania odpowiedzi, ale również wywoływania komend, np. sprawdź pogodę w zewnętrznym systemie, pokaż dane sprzedażowe za ostatni miesiąc, ściągnij rekord klienta itd. Kompetencja zaś to rodzaj dodatkowego promptu (systemowego), który wyznacza sposób wykonania zadania, np. przekazuje, że ogłoszenie o pracę powinno składać się ze stałego zestawu sekcji. Na tym poziomie spada halucynacja modelu i można zacząć wykorzystywać wewnętrzne dane firmowe w automatyzacji.

Poziom 4 – AI jako frontend

Pierwsze wewnętrzne procesy obsługiwane z poziomu czatu z AI. Na tym poziomie zmienia się paradygmat pracy. Dzisiaj obserwujemy tę zmianę przede wszystkim w środowisku programistycznym, gdzie analitycy i programiści przeszli od promptowania i wklejania kawałków kodu, do pracy w edytorze typu VS Code ze zintegrowanymi agentami, które w tle same edytują kod, wywołują polecenia terminala, łączą się z internetem po to, aby ściągnąć dokumentację.

W procesach biznesowych taka zmiana wymaga pokonania wyższego progu, bo konieczne jest przebudowanie warsztatu pracy w procesie. Od tego momentu centralnym punktem kontaktu człowiek–komputer staje się czat z LLM, a nie okienko systemu workflow, ERP czy poczty.

Poziom 5 – Nadzór speckitem na krokami w procesach

Speckit to zestaw narzędzi i kompetencji sprofilowany pod konkretny krok w konkretnym procesie biznesowym – rodzaj metodyki pracy zapisanej po to, aby LLM pilnował pracownika. W projektach IT przykładem takiego poziomu jest Specification-Driven Development (SDD), skąd zaczerpnięto termin speckit.

Na tym poziomie dojrzałości czaty są wszędzie. Są wyposażone w zestaw narzędzi zintegrowanych z systemami firmowymi, kompetencji, pamięć kontekstową i mają dostęp do firmowych baz wiedzy za pomocą wyszukiwania semantycznego. Pojawia się koncepcja Generative UI, czyli interfejsu użytkownika dynamicznie modyfikowanego pod potrzeby bieżących zadań. Pracownik nie widzi takiego samego ekranu codziennie – w zależności od napływających zleceń albo promptów ekran przebudowuje się, przytaczając dodatkowe tabelki, wykresy, ukrywając niepotrzebne informacje, udostępniając nowe polecenia itd.

Na tym poziomie następuje rozdzielenie roli nadzoru nad wykorzystywaniem AI w procesach od roli operatora AI. Osoba w pierwszej z tych ról identyfikuje kroki, gdzie warto wdrożyć AI, i definiuje ramy oraz kompetencje pracy człowieka z AI – speckit. Osoba w drugiej z tych ról wykonuje zadania na danym kroku i jest nadzorowana oraz wspierana przez AI zgodnie ze speckitem, aby dostarczyła rezultat wysokiej jakości.

Przykładem może być zadanie polegające na wysłaniu oferty na montaż okien, w którym speckit opisuje, jakie odpowiedzi trzeba uzyskać przed wygenerowaniem oferty, wytycza rodzaje okien, ich ceny oraz możliwości konfiguracji, a także podpowiada treści oferty. Na tym poziomie halucynacje są zredukowane dzięki ściąganiu prawdziwych danych z systemów oraz dzięki pilnowaniu kryteriów jakościowych pracy ludzkiej przez AI.

Poziom 6 – Korporacyjny „umysł' (corporate mind)

Na tym poziomie mamy zintegrowane kluczowe systemy z centralnym modelem językowym – a tak naprawdę organizacja wykorzystuje wiele LLM do różnych zadań po to, aby optymalizować koszty i jakość odpowiedzi. Wszystkie zautomatyzowane kroki są nadzorowane z perspektywy przestrzegania speckit i z reguły pierwszym audytorem stanowisk jest inny LLM (tzw. LLM as a judge), dopiero potem wchodzi człowiek audytor i sprawdza wybrane przypadki. Mamy tutaj nie tylko politykę AI jak na poziomie 2 lub 3, ale dodatkowo zdefiniowane metodyki pracy na dziesiątkach kroków i dziesiątkach procesów. Powstaje centralna baza human-AI governance.

Druga perspektywa to zarządzanie wiedzą. Ponieważ AI jest frontem dla dużej części pracowników, to większość wiedzy przelewa się przez AI. Dzięki temu efektem wykonywania zadań są nie tylko odpowiedzi, pisma i zmiany w systemach firmowych, ale i wiedza o tym, jak ludzie pracują i odpowiadają. Ta metawiedza nieustannie się akumuluje i pozwala na kolejne cykle doskonalenia organizacji – to można rzec jest święty Graal zarządzania wiedzą.

Trzecią perspektywą są koszty – na tym poziomie organizacja pożera ogromne ilości tokenów. Nie tylko w trakcie czatów, ale również wskutek działania setek agentów w tle, w nocy. Pewna korporacja przejadła miesięczny budżet tokenów w jedną noc, bo jeden z pracowników kazał swojemu agentowi myśleć i odpalać kolejnych agentów. Organizacja musi zatem wprowadzić budżety tokenowe na działy, procesy i pojedynczych pracowników oraz nadzorować koszty. Nie zawsze AI jest tańszy od człowieka.


Oczywiście powyższy model dojrzałości jest tylko metaforą i poszczególne poziomy mogą się na siebie nakładać. Możemy mieć część pracowników będących w strefie shadow AI, część promptujących na oficjalnym czacie i pierwszy proces, w którym AI jest frontem. Natomiast powyższy model wskazuje ogólny kierunek dojrzewania wdrożeń modeli językowych.

Powyższy tekst pochodzi z książki Zarządzanie projektami AI dla początkujących, jak ukaże się w 2026 roku