4月24日,由中國軟體行業協會主辦的第三屆中國國際軟體發展大會暨中國軟體行業協會成立40週年紀念活動在北京召開。本次大會以“智慧時代的軟體産業”為主題,聚焦軟體根技術、開源軟體和生成式人工智能對全行業的根本性變革,探討數據要素和未來産業對全行業的深遠影響,並回顧中國軟體産業40年發展歷程,引領整個軟體行業做一次深刻的總結,重裝上陣再出發。大會設置開幕式、高峰論壇等環節,邀請兩院院士、領軍企業代表、相關行業機構代表、高校專家等到會。
北京航空航天大學軟體學院院長胡春明致辭。以下是發言實錄:
尊敬的各位領導大家好,非常感謝有這樣的機會以軟體研究者的視角談談最近的感受。在過去的一段時間內,人工智能、機器學習,特別是最近的大模型和軟體産業、軟體工程發生緊密地交織,從學術論文的視角看,幾乎是井噴的趨勢,而且這些工作已經滲透到軟體開發、軟體運營等環節。
大模型語言能力的涌現,體現了從量變到質變不是在於某一種能力的運用,而是在於一組能力的融合,特別是在語義理解、問答、數字的理解方面出現了非常高的能力提升。這個能力的提升,自然就帶來了一種嘗試——大模型能不能輔助到軟體開發的全過程,比如説我們看到文獻的分析過程、軟體設計、軟體開發、軟體品質確保、軟體維護與管理等方面都看到很多已有的工作在發揮作用。
總體來看,我們認為大模型似乎有了一種能力來整合軟體的開發、運維,提升軟體的開發效率和品質。如果這些能力進一步往前優化,而且這個事情一定會發生,我們在考慮大量的low-level底層的編碼任務可以通過可信賴、自動化的基於模型的處理來完成的時候,我們的軟體開發過程會帶來怎樣的變化?很多年以前編譯工具幫助我們把思考問題提升到高級語言的層次,不考慮組合語言的底層細節,如果有這樣的智慧輔助工具,在行級、段級和函數級的代碼編程上能夠提供支撐,我們的軟體建模理解是不是可以比現在的高級語言再上一個層次?
今天已經看到的是,代碼的大模型在輔助生成代碼任務上已經見到很好的效果,特別在一些細分領域,剛才百度的王海峰老師也提到,現在百度做的Comate推介代碼生成率已經達到45%,意味著使用這樣的工具對軟體産業的開發效率帶來了事實上的提升。
我們還能夠看到的,包括學術論文裏面看到的特點,大模型正在作為“平庸”的專家在發揮作用,這裡面的“平庸”並不是貶義,大模型雖然現在取代不了行業精英,取代不了深入的思考,大模型目前基本的理解能力已經能夠在特定任務流的關鍵環節發揮一般專家能夠發揮的作用,這樣的現實需要被很好地整合到軟體開發過程當中,因為反應開發很多環節是人力密集型的開發工作,基於規則理解的人力密集型開發活動,有可能在未來一段時間能夠得到某種形式的替代。
我們也看到另外的例子,比如在安全軟體的形式化驗證方面,我們做形式化驗證必須抽取些性質,以前都是專家的工作,有很多研究者試著用傳統小模型的方式解決,有一定效果,但是我們看到現在通過LLM+有限的Prompt能夠從自然語言抽取安全攸關性質的理念,可以看到大模型能夠從一些領域發揮有限的專家作用。
還有一個可以看到的變化,剛才在企業很多嘗試裏面已經看到,Agent-oriented能夠解決一定的問題,很多複雜的任務,比如在代碼級編程再往上走,很多複雜的任務上有可能基於多Agent的相互協作和溝通,去完成和物理環境的交互,和信息的交互,進一步完成高層軟體任務的開發。在這裡面,工業界也有些嘗試,像微軟開源的AutoGen,儘管我們做了嘗試,想更靈活地使用還有挑戰,但總體上我們已經能看到這種方法在軟體開發過程中能夠發揮的作用。
儘管當前LLM大語言模型存在局限性,比如大家會challenge生成代碼的安全性。軟體設計和形式驗證等抽象任務中的表現今天還做得不夠,正好也是下一步繼續發展大模型在軟體、軟體工具上地切入點。
總體上有這麼幾種新的考慮,既然模型要在軟體的運行、軟體的開發、軟體的工具環境裏面扮演這麼重要的角色,未來的軟體會是怎樣的形態?以前有種提法叫軟體1.0、2.0、3.0,3.0,它不是簡單的捏合,而是某種程度更深入的結合。剛才百度海峰總的報告提到系統1、系統2的提法,某種程度上基於大模型構造Agent就是系統1和系統2耦合的嘗試,這種場合也許有其他的模式,正好是學術界應該更多探索和嘗試的。
作為軟體人機協作智慧交互的新範式,以前通過群智化的方法已經有很多探索,結合我們講的模型到片段級的生成,在此基礎上向上走,我們相信在人機協作、多Agent協作上應該有更大的空間。再延伸一步,我們以前講的在安全攸關,成為更加廣泛地基於大模型的開發新範式。在這裡面我們看到些例子,比如在PLC安全代碼生成,可以用大模型做中間的嘗試,基於模型的設計診斷和恢復、形式化驗證做些輔助的裁減,形成代碼生成的方式。
複雜任務場景下的多Agent的協同,也有可能是未來我們做軟體工具、軟體開發方法上很重要的探索方向,多Agent的設計範式去構造應用軟體,可以通過自然語言、軟體模型、軟體代碼的混編實現動態的對話和功能的高速調用。這些今天都是從學術界的研究看到的趨勢方向,其實有些方面已經在我們的軟體企業、大的平臺類企業做嘗試,未來有很多的發展空間,學術界更應該和快速發展的軟體産業一道,共同把新的方向探索好,把它轉化成新質生産力,以上是我的彙報,謝謝大家。
(聲明:所有會議實錄均為現場速記整理,未經演講者審閱,國際在線登載此文出於傳遞更多信息之目的,並不意味著贊同其觀點或證實其描述。)
1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。
2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。
3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。
已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。
任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。
4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。
5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。