Cochise: Un'imbracatura Python di 597 righe per il penetration testing con LLM

ai-technology · 2026-05-13

Un team di ricercatori ha presentato Cochise, un'imbracatura di riferimento Python composta da 597 righe, progettata per esperimenti di penetration testing autonomo. Questo sistema collega un agente basato su LLM a un host di esecuzione Linux tramite SSH e facilita ambienti target controllati. Presenta una distinta architettura Planner-Executor, con la gestione dello stato a lungo termine che avviene al di fuori del contesto LLM. I comandi vengono emessi da un executor in stile ReAct che si autocorregge in base agli output ricevuti. L'imbracatura è stata valutata utilizzando il testbed Game of Active Directory (GOAD). Questa ricerca mira a distinguere i contributi architetturali da altri elementi di design nei framework di penetration testing basati su LLM.

Fatti principali

Cochise è un'imbracatura di riferimento Python di 597 LOC
Collega l'agente LLM all'host Linux tramite SSH
Utilizza un'architettura Planner-Executor con stato esterno
Executor in stile ReAct con autocorrezione
Valutato contro il testbed Game of Active Directory (GOAD)
Pubblicato su arXiv con ID 2605.11671
Mira a isolare i contributi di diverse scelte progettuali

Cochise: Un'imbracatura Python di 597 righe per il penetration testing con LLM

Fatti principali

Entità

Istituzioni

Fonti