講座題目:多智能體沙盒模擬引擎AgentSims的介紹及使用指南
主講人:趙浩然 北京航空航天大學
地點:學院210
講座信息:2023年11月21日10:00
講座內(nèi)容摘要:
AgentSims是一款專門設計用于評估語言模型(LLM)的多智能體沙盒模擬引擎。傳統(tǒng)的LLM評估方法常受限于能力評估范圍、測評正當性和評價標準的透明度等問題,AgentSims旨在通過復雜任務模擬的方式,有效提升評估的廣度和深度。AgentSims以仿真社區(qū)為平臺,要求AI智能體完成設計者預設的任務,證實其在特定方面的能力。得益于Smallville——斯坦福小鎮(zhèn)的初步構(gòu)想,AgentSims在此基礎上進一步擴展,克服了Smallville固定地圖和角色限制的短板,為模擬更大規(guī)模社會互動提供可能。AgentSims強化了用戶自定義實驗的能力,包括靈活的地圖、物品,以及人物數(shù)量設定。尤其重要的是,AgentSims在經(jīng)濟系統(tǒng)模擬方面的努力,包括價格設定、存款管理和工資支付等經(jīng)濟參數(shù),構(gòu)建了一個初步的經(jīng)濟模擬框架。為確保各學科研究人員能簡單地地使用AgentSims,它設有簡潔的GUI界面和高度抽象的代碼結(jié)構(gòu),使得初學者能輕松地修改或添加新模塊,即使無代碼經(jīng)驗的用戶也能夠便捷地定制自己的模擬社區(qū)。AgentSims致力于實現(xiàn)一個開放、多元的學術(shù)社區(qū),通過跨學科合作推進LLM在多領域中的應用和評估,并期待搭建一個支撐科研共榮的基礎設施平臺。本報告將介紹AgentSims框架的基本原理,并致力于教學用戶進行二次開發(fā),搭建自己感興趣的模擬任務。
主講人簡介:
趙浩然,北京航空航天大學博士,研究興趣為人工智能和多智能體系統(tǒng)。發(fā)表SCI論文2篇,會議及預印本論文數(shù)篇。代表作AgentSims及AeroAgent被多家媒體轉(zhuǎn)發(fā)報道,其中AgentSims Github 獲超過550 Stars,瀏覽量逾1200。