世界互聯網大會|美創數據安全風險監測智能體發布
2025-11-10
世界互聯網大會|美創科技無侵入數據安全多智體治理技術首發
2025-11-07
從“穩定運行”到“極限生存”:一場國企數字基座的韌性突圍戰
2025-11-05
每周安全速遞3?? | Qilin勒索組織利用Linux載荷和BYOVD入侵
2025-10-31
美創科技“AI+數據安全”新產品、新技術亮相烏鎮
2025-10-31
存儲域
數據庫加密 諾亞防勒索訪問域
數據庫防水壩 數據庫防火墻 數據庫安全審計 動態脫敏流動域
靜態脫敏 數據水印 API審計 API防控 醫療防統方運維服務
數據庫運維服務 中間件運維服務 國產信創改造服務 駐場運維服務 供數服務安全咨詢服務
數據出境安全治理服務 數據安全能力評估認證服務 數據安全風險評估服務 數據安全治理咨詢服務 數據分類分級咨詢服務 個人信息風險評估服務 數據安全檢查服務
mkdir pentagi && cd pentagi

下載并重命名配置文件
curl -o .envhttps://raw.githubusercontent.com/vxcontrol/pentagi/master/.env.example

編輯.env文件,填入自己的大模型apikey,這里使用的是deepseek大模型
vim .env
主要是對Custom LLM provider配置項進行修改
LLM_SERVER_URL=https://api.deepseek.com/v1
LLM_SERVER_KEY=sk-xxxxxx
LLM_SERVER_MODEL=deepseek-reasoner
LLM_SERVER_CONFIG_PATH=
LLM_SERVER_LEGACY_REASONING=

下載docker-compose.yml文件,拉取并啟動docker鏡像
curl -Ohttps://raw.githubusercontent.com/vxcontrol/pentagi/master/docker-compose.yml
docker-compose up -d

最后訪問https://ip:8443/,然后使用初始賬號密碼admin@pentagi.com/admin登錄即可。


提示詞為
“幫我對http://xx.xx.xx.xx:8765/這個系統進行滲透測試,找出盡可能多的可利用漏洞,并輸出詳細的滲透測試報告”。
可以看到PentAGI會把任務分割為一個個子任務,然后針對每個子任務自動下載相應的安全工具進行測試。如nmap、sqlmap等。

當前階段的子任務完成后會輸出當前子任務的成果信息,并開啟下一階段的子任務。同時會根據該階段的成果對后續的子任務進行自動化持續優化。

比如在SQL注入測試子任務中,PentAGI可以正確的根據上一階段目錄掃描以及在線知識庫搜索的結果,識別出潛在的sql注入URL和參數,并調用sqlmap命令進行測試。

在Terminal窗口中可以看到PentAGI為了完成任務而執行的命令。

Screenshots窗口則可以看到在運行過程中調用瀏覽器進行網頁搜索的一些截圖。

從上述過程來看PentAGI似乎是一個比較“可用”的AI自動化滲透測試平臺,但是在繼續等待測試的過程中,PentAGI的一些缺點也暴露了出來,一個是測試的過程非常漫長,因為PentAGI是使用配置大模型API key的方式全自動運行,支持openai、deepseek等主流LLM大模型,過程中不需要人工介入,會不斷自動調整,所以比較依賴于大模型本身的響應速度。
如下圖可以看到,前5個子任務從下午16時35分一直執行到了晚上的22時26分,耗時將近6個小時。
另一個缺點就是如上圖所示,發現在運行到第6個子任務時就終止了,這其實是因為測試使用的deepseek api額度耗盡了。所以PentAGI的另一個缺陷就是非常耗tokens,本次測試前在deepseek賬戶中充值了15元,發現在執行完5個子任務后,api額度已經用盡。
總結
通過上述的使用過程發現,PentAGI的自動化程度比此前測試的HexStrike-AI要高很多,部署搭建過程也非常便捷,從階段任務測試結果看來也比HexStrike-AI要好不少。PentAGI不同于HexStrike-AI的服務端客戶端分開的模式,而是統一集成在一個Web平臺中,使用過程簡單,結果展示直觀,是一個比較“可用”的AI自動化滲透測試平臺,具備一定的商業化前景。但是PentAGI的缺陷也比較明顯,一個是自動化程度高帶來過程的介入困難,整個滲透的過程都交給AI自動決策,無法進行人工調整,耗時較長;另一個是成本較高,比較適合在擁有本地自建大模型的前提下進行使用。