Cochise: Un'imbracatura Python di 597 righe per il penetration testing con LLM
Un team di ricercatori ha presentato Cochise, un'imbracatura di riferimento Python composta da 597 righe, progettata per esperimenti di penetration testing autonomo. Questo sistema collega un agente basato su LLM a un host di esecuzione Linux tramite SSH e facilita ambienti target controllati. Presenta una distinta architettura Planner-Executor, con la gestione dello stato a lungo termine che avviene al di fuori del contesto LLM. I comandi vengono emessi da un executor in stile ReAct che si autocorregge in base agli output ricevuti. L'imbracatura è stata valutata utilizzando il testbed Game of Active Directory (GOAD). Questa ricerca mira a distinguere i contributi architetturali da altri elementi di design nei framework di penetration testing basati su LLM.
Fatti principali
- Cochise è un'imbracatura di riferimento Python di 597 LOC
- Collega l'agente LLM all'host Linux tramite SSH
- Utilizza un'architettura Planner-Executor con stato esterno
- Executor in stile ReAct con autocorrezione
- Valutato contro il testbed Game of Active Directory (GOAD)
- Pubblicato su arXiv con ID 2605.11671
- Mira a isolare i contributi di diverse scelte progettuali
Entità
Istituzioni
- arXiv