Weryfikacja AI z użyciem argumentacji assurance case

Wiarygodność i kompletność dokumentacji ma kluczowe znaczenie w certyfikacji systemów. Zastosowanie AI skutecznie przyspiesza przygotowanie takiej dokumentacji, ale może jednocześnie mieć wpływ na jej jakość. Jak efektywnie sprawdzać taką dokumentację, gdy jest duża? Ważne jest, aby informacje były przedstawiane w formie ułatwiającej realizację przeglądów przez człowieka. Taką formą są strukturalne argumentacje assurance case. Ułatwiają prowadzenie weryfikacji i kontroli.

Na ile problem jest poważny i czy taka weryfikacja jest potrzebna? W kwietniu FDA wydało Warning Letter odrzucając zgłoszenie rejestracji leku i wskazując na poważne błędy procesowe, w tym związane z niewłaściwym zastosowaniem AI (zajrzyj do sekcji „Inappropriate Use of Artificial Intelligence”). Podejście FDA jest bardzo restrykcyjne. Konsekwencje przedstawienia nieprawdziwych informacji w zgłaszanej dokumentacji mogą być bardzo poważne. Gdzie są przyczyny tych problemów? Czy dokumenty tworzone przez AI tylko przykrywają błędy ludzi? Niestety AI nie tylko halucynuje, ale też generuje błędy. Publikacja Microsoft Research „LLMs Corrupt Your Documents When You Delegate” wskazuje, że AI może skutecznie uszkodzić nawet 25% dokumentacji po wykonaniu 20 iteracji pracy nad nią. Z jednej strony AI przyspiesza prace, ale jednocześnie tworzy nowe zagrożenie.

Strukturalne argumentacje powstały w  celu uporządkowania informacji pod kątem ich weryfikacji oraz ułatwienia przeglądów dokumentacji złożonych systemów. Powiązane informacje, które powinny być sprawdzone razem, bo prowadzą do określonego konkretnego wniosku, są w argumentacji obok siebie. Osoba weryfikująca ma je razem podane na tacy, nie musi ich szukać. Assurance case ułatwia życie weryfikującym, nie twórcom systemu. Jeżeli AI tworzy jakąś dokumentację systemu, to możemy też delegować do AI zadanie uporządkowania informacji z tej dokumentacji w formie argumentacji. Zwykle nie będzie potrzebna żadna modyfikacja samej dokumentacji systemu, bo argumentacja jest dodaną strukturą informacji, która może po prostu odwoływać się do poszczególnych dokumentów i ich fragmentów. Tworzona argumentacja pozwala trochę spojrzeć na dokumentację okiem audytora. Samo zadanie tworzenia argumentacji może pomóc AI w lepszym zrozumieniu celów i poprawy dokumentacji. Niech AI tworzy takie argumentacje, a człowiek niech je sprawdza. Maksimum efektu przy minimum wysiłku.

Jak argumentacje ułatwiają weryfikację?

  1. Argumentacje w jawny sposób pokazują wnioskowanie w jaki sposób możemy wykazać cechy systemu, takie jak bezpieczeństwo, na podstawie dokumentacji. Wnioskowanie jest podzielone na małe kroki o jasno określonych kryteriach akceptacji. Nie oceniamy dużych bloków informacyjnych, ale małe i konkretne kroki wnioskowania. Jeżeli któryś z kroków jest niekompletny, na przykład niepełny zakres testów, łatwo to wskazać.
  2. Kroki wnioskowania są ze sobą połączone i tworzą razem spójną całość. Gdy zauważymy niespójność kontekstu, można wskazać konkretne miejsce do poprawy. Na przykład wymagania dotyczące środowiska eksploatacyjnego komponentu mogą nie być spójne ze środowiskiem docelowym systemu.
  3. Argumentacja jest trwałym zapisem informacji. Jeżeli wskażemy nieprawidłowe kroki argumentacji, to problem ten jest rejestrowany i czeka na rozwiązanie w kolejnej wersji. Mamy w assurance case pełną historię przeglądów. Kontrolujemy proces dochodzenia do pełnej akceptacji.
  4. Argumentacje zachowują powiązania w całej dokumentacji od celów na poziomie systemu, takich jak poziom bezpieczeństwa (safety), zabezpieczeń (security) lub zgodności z normami. Gdy znajdziemy lukę lub błąd w argumentacji, łatwo można to powiązać z wymaganiami i celami określonymi dla systemu.
  5. Mając argumentację możemy wygenerować raport przeglądu. Raport taki stanowi dowód nadzoru człowieka nad procesem i zadaniami AI. Take dowody są istotne w certyfikacji systemu.
Assurance case argument used for verification of AI-generated documentation

Argumentacje assurance case mogą być wykorzystywane jako narzędzie weryfikacji wyników dostarczanych przez AI. Podejście takie jest łatwiejsze dla ludzi niż analiza wprost dokumentacji, choć jej też nie da się całkowicie uniknąć.

Planujesz zastosowanie argumentacji assurance case do weryfikacji wyników generowanych przez AI? A może już prowadzisz takie działania? Podziel się swoimi doświadczeniami lub pytaniami.