2025年3月20日,實(shí)在智能召開了備受矚目的第八次新品發(fā)布會(huì)。在此次發(fā)布會(huì)上,一款具備“自主感知環(huán)境、規(guī)劃路徑、自動(dòng)操作一切軟件/APP,支持端到端全流程商業(yè)場景閉環(huán)”能力的通用智能體——實(shí)在Agent正式亮相,這一創(chuàng)新成果為企業(yè)智能化轉(zhuǎn)型注入了全新的活力。
發(fā)布會(huì)伊始,實(shí)在智能創(chuàng)始人兼CEO孫林君發(fā)表開場致辭。他指出,實(shí)在智能憑借三大核心技術(shù)突破,成功構(gòu)建起擁有自主決策能力的數(shù)字生命體——實(shí)在Agent。這一成果為企業(yè)智能化轉(zhuǎn)型提供了一套可落地、可進(jìn)化、可擴(kuò)展的全棧式解決方案。孫林君表示:“實(shí)在智能的愿景是讓每個(gè)人、每家企業(yè)都能擁有專屬的數(shù)字員工,并且無需依賴API即可實(shí)現(xiàn)跨系統(tǒng)協(xié)作。”隨著智能體技術(shù)的不斷進(jìn)化,未來將構(gòu)建起“與AI共舞,掌控萬物”的智能生態(tài),推動(dòng)人機(jī)協(xié)作邁向決策協(xié)同的全新紀(jì)元。
隨后,實(shí)在智能合伙人兼核心算法部負(fù)責(zé)人歐陽小剛深入且系統(tǒng)性地闡述了構(gòu)建通用智能體的三大核心技術(shù)體系,即「理解和推理能力」、「鏈接能力」、「適應(yīng)能力」。
在類人級的語言理解和邏輯推理能力方面,TARS大模型作為實(shí)在Agent推理能力的基石,具備趨近人類思維的理解能力。無論是清晰明確的用戶命令,還是簡潔的一句描述,實(shí)在Agent都能夠?qū)⑵渚珳?zhǔn)拆分成多個(gè)可執(zhí)行的子任務(wù)或步驟。
在步驟拆解和組件生成能力上,TARS大模型的準(zhǔn)確率超越了GPT-4和DeepSeek;在中文理解能力上,TARS大模型與各個(gè)SOTA模型實(shí)力相當(dāng),并且在部分領(lǐng)域處于領(lǐng)先地位。尤為值得一提的是,TARS大模型實(shí)現(xiàn)了全棧國產(chǎn)化適配,支持英偉達(dá)、昇騰及國產(chǎn)自主架構(gòu)的訓(xùn)練與微調(diào)部署,為技術(shù)的安全可控發(fā)展提供了有力保障。
實(shí)在Agent還具備快速落地實(shí)際場景的適應(yīng)能力。與常見的端到端或大模型+API的解決方案不同,實(shí)在智能通過自動(dòng)仿真技術(shù)開展特定場景的強(qiáng)化訓(xùn)練,極大地優(yōu)化了識別與拆解效果。
實(shí)在智能Agent首席產(chǎn)品專家張譯顥對產(chǎn)品創(chuàng)新特性與亮點(diǎn)進(jìn)行了詳細(xì)解讀。實(shí)在Agent具有低門檻使用的特點(diǎn),零配置啟動(dòng),無需安裝復(fù)雜插件或特定瀏覽器,僅需下載單一客戶端,安裝后登錄即可使用;賬號無縫銜接,新用戶注冊即享完整功能,老用戶賬號自動(dòng)同步歷史數(shù)據(jù)與配置。
其交互設(shè)計(jì)簡單便捷,擁有全場景入口,通過快捷鍵(如Ctrl+SPACE)一鍵喚起智能體,支持語音輸入、文本輸入、文件拖拽(如Excel/PDF)三種交互方式,基于自然語言處理(NLP)技術(shù),能夠精準(zhǔn)解析意圖,支持模糊指令并自動(dòng)拆解為任務(wù)步驟。在實(shí)時(shí)過程掌控方面,任務(wù)執(zhí)行透明化,實(shí)時(shí)顯示進(jìn)度條與操作日志;用戶可隨時(shí)動(dòng)態(tài)干預(yù),暫停任務(wù)、修改參數(shù)、切換執(zhí)行路徑;智能體在獨(dú)立沙盒環(huán)境中運(yùn)行,避免與用戶當(dāng)前工作沖突,支持并行操作。
此外,實(shí)在Agent不僅是使用終端,還是功能完備的創(chuàng)作平臺(tái),用戶能以其生成的產(chǎn)物為基礎(chǔ),借助全新封裝的模型技能庫與便捷的編排工具,開發(fā)專屬業(yè)務(wù)需求的AI智能體。實(shí)在Agent智能體搭建平臺(tái)具備RPA與AI深度融合的特點(diǎn),傳統(tǒng)RPA流程畫布升級為“智能體畫布”,新增多種節(jié)點(diǎn),存量RPA流程可一鍵轉(zhuǎn)換為智能體形態(tài);還具備靈活開發(fā)與協(xié)作的功能,開放技能庫,支持用戶自定義技能封裝,企業(yè)內(nèi)多個(gè)智能體可相互調(diào)用,形成業(yè)務(wù)閉環(huán)。
實(shí)在Agent智能體不僅可作為個(gè)人助理,還支持打造企業(yè)級智能體解決方案——企業(yè)大腦。實(shí)在智能產(chǎn)品創(chuàng)新負(fù)責(zé)人周春照深度解讀了「企業(yè)大腦」,它具備專屬的知識庫RAG,企業(yè)可將各類文檔、數(shù)據(jù)、系統(tǒng)以及業(yè)務(wù)操作技能沉淀其中,員工也能方便地貢獻(xiàn)崗位知識與工作技能。企業(yè)大腦擁有專屬業(yè)務(wù)系統(tǒng)操作知識,不同企業(yè)可依托自身已有系統(tǒng)構(gòu)建自動(dòng)化操作流程,員工可通過實(shí)在Agent隨時(shí)調(diào)用。同時(shí),它支持模型接入,實(shí)在Agent成本可控、安全可用、靈活接入,企業(yè)可根據(jù)業(yè)務(wù)特性選擇或接入微調(diào)過的大模型。此外,與實(shí)在Agent配套的數(shù)字員工運(yùn)營管理平臺(tái)可在多種環(huán)境中私有化部署,支持國產(chǎn)化適配,具備多種管理功能。
實(shí)在智能創(chuàng)新研發(fā)負(fù)責(zé)人趙明現(xiàn)場展示了手機(jī)端Agent——口袋AI助手的創(chuàng)新技術(shù)與實(shí)用功能。在新技術(shù)方面,采用原子技能架構(gòu)重構(gòu)手機(jī)操作邏輯,基于PC端屏幕語義理解技術(shù)ISSUT,重構(gòu)手機(jī)端元素識別能力并原子化封裝,為交互、流程調(diào)度提供技術(shù)支持;通過模型驅(qū)動(dòng)決策,實(shí)現(xiàn)手機(jī)TARS助手“需求拆解、路徑規(guī)劃、反饋學(xué)習(xí)”的完整閉環(huán);運(yùn)用雙模交叉執(zhí)行,基于視覺理解+UI結(jié)構(gòu)分析,讓智能體大模型和視覺理解小模型交叉執(zhí)行,使智能體流程運(yùn)行更順暢。
新功能方面,設(shè)有流程市場,提供豐富自動(dòng)化流程供用戶自主調(diào)用;具備任務(wù)調(diào)度功能,通過定時(shí)執(zhí)行、API觸發(fā)等方式滿足B端用戶辦公需求;支持云端控制,手機(jī)TARS助手可控制云端智能體運(yùn)行PC端任務(wù),實(shí)現(xiàn)智能體7×24小時(shí)永不掉線。
自2020年發(fā)出第一聲“Hello,數(shù)字員工”的問候,到2025年推出“你說PC /手機(jī)/車機(jī)做,所說即所得”的實(shí)在Agent,短短五年間,實(shí)在智能始終堅(jiān)持產(chǎn)品迭代和技術(shù)創(chuàng)新,通過數(shù)字員工助力客戶提質(zhì)降本增效,解決真實(shí)商業(yè)場景痛點(diǎn)堵點(diǎn),推動(dòng)AI實(shí)實(shí)在在地落地應(yīng)用。后續(xù),實(shí)在智能將逐步開放實(shí)在Agent在各類智能硬件(人形機(jī)器人、機(jī)器狗、車機(jī)、智能家居、VR眼鏡……)上的使用功能,屆時(shí),實(shí)在Agent將全方位融入生活工作,用AI掌控萬物,開啟智能生活的全新篇章。