
Security System
PythonAnthropic SDKPlaywrightClick CLIpytest
Dwa narzedzia do automatycznego audytu i naprawy bezpieczenstwa kodu.
Autosweep — autonomiczna petla naprawcza
Inspirowany konceptem autoresearch. Pracuje w cyklu:
- Uruchom skanery, zmierz metryki
- AI proponuje poprawke
- Zastosuj, uruchom testy
- Zmierz ponownie
- Lepiej — commit. Gorzej — revert. Powtarzaj.
- Twarda regula: co najmniej jedna metryka sie poprawia, zadna sie nie pogarsza
- 3 tryby: jakosc kodu, bezpieczenstwo, kombinowany
- 3 jezyki: Python, PHP, Drupal
- Tryb adversarial: AI generuje hipotezy ataku w 10 kategoriach, pisze testy exploitow
Security Audit Skill — wieloagentowy audytor
4-fazowy pipeline:
- Recon — mapowanie powierzchni ataku (endpointy, auth, zaleznosci)
- Rownolegly audyt — 3-5 agentow, 12 kategorii (auth, injection, crypto, race conditions...)
- Weryfikacja — niezalezny agent z 5-czesciowa bramka odrzucen
- Ocena testow — pokrycie testami vs znaleziska
- Kazde znalezisko wymaga dowodu: plik:linia, snippet, kroki exploita
- 10 twardych regul anti-halucynacji
- Benchmark OWASP Juice Shop: 68 podatnosci, 92% pokrycie, ~79% mniej false positive