在備受矚目的WAIC 2024世界人工智能大會上,中國新興的AI明星企業階躍星辰階躍星辰首發了三款 Step 系列通用大模型新品:Step-2 萬億參數語言大模型正式版、Step-1.5V 多模態大模型、Step-1X 圖像生成大模型。這是自今年三月正式亮相以來,階躍星辰團隊在短短 100 天左右達成的突破,實現了從千億參數到萬億參數,從語言模型到多模態模型,從理解到生成的全面進步。
階躍星辰于 2023 年 4 月成立,以“智能階躍,十倍每一個人的可能”為使命,以實現通用人工智能為目標。階躍星辰的創始人和 CEO 是前微軟全球副總裁,微軟亞洲互聯網工程院首席科學家姜大昕博士,同時也是算法負責人。核心創始團隊包括系統負責人朱亦博博士,擁有多次單集群萬卡以上的系統建設與管理實踐經驗;數據負責人焦斌星,此前擔任微軟必應引擎核心搜索團隊負責人。公司聚集了來自微軟、谷歌、字節、騰訊等公司的頂尖人才。
回顧今年3月23日,階躍在2024全球開發者先鋒大會上正式亮相并發布了3款模型,即Step-1千億參數語言大模型、Step-1V千億參數多模態大模型、Step-2萬億參數MoE語言大模型(預覽版)。7月4日,WAIC 2024大會現場,我們注意到階躍星辰Step家族已經得到全面升級。Step-2萬億參數大模型預覽版已經更新為正式版,企業和開發者可以通過階躍星辰開發平臺申請體驗。
階躍星辰創始人、CEO姜大昕博士介紹,Step-2 萬億參數語言大模型采用了創新的 MoE 混合專家模型架構,在數理邏輯、編程、知識、指令跟隨等方面體感全面逼近國際主流模型。姜大昕博士認為,攀登 AGI 山峰,“萬億參數”和“多模融合”缺一不可。他表示,萬億參數規模,是實現 AGI 的基礎門檻;多模態大模型,是通向 AGI 的必經之路。面向未來,階躍星辰將持續將模型做大做強,打造超級模型,同時讓模型服務于工作和生活,十倍每個人的可能。”
除了Step-2萬億基礎模型的重大突破,階躍星辰最新研發的多模態大模型——Step-1.5V也備受關注,為AI技術在更多場景的應用打開了想象空間。
據了解,階躍星辰Step-1.5V是對其原有多模態大模型的全面升級。相比于之前的版本,Step-1.5V在圖像感知和理解能力上實現了質的飛躍,并具備了出色的視頻理解能力。這意味著,AI技術不僅可以更好地理解和分析圖像信息,還可以更深入地理解和處理視頻內容。
具體而言,Step-1.5V能夠準確地識別視頻中的物體、人物和環境,并理解視頻的整體氛圍與人物情緒。這使得AI技術在視頻監控、智能安防、內容審核等領域的應用更加精準和高效。同時,Step-1.5V還能夠根據圖像內容進行解答數學題、編寫代碼、創作詩歌等高級推理任務,為AI技術在教育、編程、藝術創作等領域的應用提供了新的思路。
此外,階躍星辰還發布了其在圖像生成領域的最新成果——Step-1X圖像生成大模型。該模型采用了全鏈路自研的DiT模型架構,具備更加強大的語義對齊和指令跟隨能力,能夠生成更具中國風格和文化特色的圖像內容。這為AI技術在文化傳承、創意設計等領域的應用開辟了新的可能性。
在應用落地方面,階躍星辰的多模態大模型已經在多個領域取得了顯著成果。例如,其與上海報業旗下界面財聯社合作推出的君弘靈犀大模型,將大模型能力全面融入了客戶智能化服務體系之中,為客戶帶來了全新的智能投顧問答和投研內容生產體驗;而在內容創作領域,階躍星辰聯合上海電影在“AI+IP”領域進行創新探索,雙方圍繞《大鬧天宮》和《葫蘆兄弟》兩款國民級 IP 進行了AI互動游戲開發和視頻生成能力的展示。