ARTFEED — Contemporary Art Intelligence

Cochise: Un'imbracatura Python di 597 righe per il penetration testing con LLM

ai-technology · 2026-05-13

Un team di ricercatori ha presentato Cochise, un'imbracatura di riferimento Python composta da 597 righe, progettata per esperimenti di penetration testing autonomo. Questo sistema collega un agente basato su LLM a un host di esecuzione Linux tramite SSH e facilita ambienti target controllati. Presenta una distinta architettura Planner-Executor, con la gestione dello stato a lungo termine che avviene al di fuori del contesto LLM. I comandi vengono emessi da un executor in stile ReAct che si autocorregge in base agli output ricevuti. L'imbracatura è stata valutata utilizzando il testbed Game of Active Directory (GOAD). Questa ricerca mira a distinguere i contributi architetturali da altri elementi di design nei framework di penetration testing basati su LLM.

Fatti principali

  • Cochise è un'imbracatura di riferimento Python di 597 LOC
  • Collega l'agente LLM all'host Linux tramite SSH
  • Utilizza un'architettura Planner-Executor con stato esterno
  • Executor in stile ReAct con autocorrezione
  • Valutato contro il testbed Game of Active Directory (GOAD)
  • Pubblicato su arXiv con ID 2605.11671
  • Mira a isolare i contributi di diverse scelte progettuali

Entità

Istituzioni

  • arXiv

Fonti