Suzhou Outuo Lifting Technology Co., Ltd
科技日報訊(記者李禾)近日,由昌大AI團隊研發的模子Watt-tool-70B及Newsbang/homer-72B,登上國際知名AI排行榜榜首。此中,Watt-tool-70B是由昌大旗下Watt團隊研發的旗艦模子,今朝位列BFCL Leaderboard總榜單第一。

據悉,榜單BFCL Leaderboard是由加州年夜學伯克利分校開發的評估LLM東西挪用能力基準測試平臺。作為今朝年夜語言模子(LLM)最熱點的研究標的目的之一,東西挪用(Function-Calling)是為了讓LLM理解,并能正確利用API(運用步伐編程接口),來履行更繁雜而詳細的使命。于近期宣布的最新一輪評估成果中,Watt的“多輪對于話履行能力”相較在排名第二的GPT-4o 領先11分,比排名第十的Gemini-1.5-Pro 領先近40分。
“這個模子將加快年夜模子落地‘交融’歷程。”Watt有關賣力人說,還有有助在從底層數據標注到人機交互的系統化設置裝備擺設,讓年夜模子開端實現從“言而不行”到“能文能武”。
此外,由昌大集團NewsBang團隊開發的Newsbang/homer-72B 模子位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模子評測平臺進級版本,采用更周全及嚴酷評估尺度,對于各種開源年夜語言模子舉行多維度測試及排名。Newsbang/homer-72B器重晉升模子于推理及思索方面的能力,經由過程搭配數據篩選機制等,于多個焦點評測維度,該模子機能有了年夜幅晉升。
據公然報導,2023年頭,昌大集團公布All in AI戰略,去年10月,結合多家高校發表了AI與持久影象方面的論文,其自研的OMNE年夜模子多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜志《Science》互助推出全世界AI驅動科學年夜獎,舉辦及撐持包括“AI+精力康健”于內的各類高程度國際集會及夏校項目,助力造就跨學科青年AI人材等。
科技日報訊(記者李禾)近日,由昌大AI團隊研發的模子Watt-tool-70B及Newsbang/homer-72B,登上國際知名AI排行榜榜首。此中,Watt-tool-70B是由昌大旗下Watt團隊研發的旗艦模子,今朝位列BFCL Leaderboard總榜單第一。
據悉,榜單BFCL Leaderboard是由加州年夜學伯克利分校開發的評估LLM東西挪用能力基準測試平臺。作為今朝年夜語言模子(LLM)最熱點的研究標的目的之一,東西挪用(Function-Calling)是為了讓LLM理解,并能正確利用API(運用步伐編程接口),來履行更繁雜而詳細的使命。于近期宣布的最新一輪評估成果中,Watt的“多輪對于話履行能力”相較在排名第二的GPT-4o 領先11分,比排名第十的Gemini-1.5-Pro 領先近40分。
“這個模子將加快年夜模子落地‘交融’歷程。”Watt有關賣力人說,還有有助在從底層數據標注到人機交互的系統化設置裝備擺設,讓年夜模子開端實現從“言而不行”到“能文能武”。
此外,由昌大集團NewsBang團隊開發的Newsbang/homer-72B 模子位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模子評測平臺進級版本,采用更周全及嚴酷評估尺度,對于各種開源年夜語言模子舉行多維度測試及排名。Newsbang/homer-72B器重晉升模子于推理及思索方面的能力,經由過程搭配數據篩選機制等,于多個焦點評測維度,該模子機能有了年夜幅晉升。

據公然報導,2023年頭,昌大集團公布All in AI戰略,去年10月,結合多家高校發表了AI與持久影象方面的論文,其自研的OMNE年夜模子多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜志《Science》互助推出全世界AI驅動科學年夜獎,舉辦及撐持包括“AI+精力康健”于內的各類高程度國際集會及夏校項目,助力造就跨學科青年AI人材等。
-LEWIN樂玩