訊飛星火認知大模型V1.5來了,加速搶跑用行動證明領先
#1
發表於 2023-6-10 00:23
人工智能發展如火如荼,大模型的誕生風起雲湧,不過雖然看到了很多大模型的發佈,但還是很少能看到大模型的進步,讓人不由得懷疑大部分企業是不是隻在跟風。
不過,剛剛發佈一個月的訊飛星火大模型卻緊鑼密鼓地又召開了一次升級發佈會,可以看出訊飛是真正在大模型時代發力狂奔,而這次發佈的“訊飛星火認知大模型”V1.5甚至超越了上次發佈會所承諾的更新速度,不僅在多種交互能力上實現了突破,在教育醫療等多個垂直領域也獲得了巨大進步。
高考題上見真章
這兩天恰逢高考,關於AI和高考的話題自然也就熱了起來。搜狐科技使用五款AI大模型對2023高考上海數學試卷的10道填空題進行了測試,結果科大訊飛星火認知大模型答對了5題,正確率50%。ChatGPT和百度文心一言都答對了4題,正確率40%。而阿里通義千問和360智腦則10道題全錯,正確率0%。
從這個結果上來看,上次訊飛發佈會所說的訊飛星火大模型文本生成、數學能力已超過ChatGPT並非是吹牛。而在6月9號的發佈會上,“訊飛星火認知大模型”V1.5重點呈現大模型在知識問答、數學能力、多輪交互中的升級,可以說AI能力又進一步,相信在領先幅度上又有加大。
所以無論從那個角度來看,訊飛都是在大模型領域做的最認真也是迭代速度更快的。我覺得大模型的競爭是一個分秒必爭的競爭,大家不僅各自在模型學習上永無止境,在算法和功能的落地體驗上,也要不斷的適配。大模型最終不會是一個聊天軟件,而是真正要形成生產力的AI發動機,從這個角度來說,在針對場景化的落地上,比如教育、醫療、應用適配方面,訊飛星火大模型確實還是走在前面的。
要知道,大模型最終的分界點還是要看誰能夠先實現“智慧湧現”,也就是一下子形成一個質的飛躍和變化。這種跨越式的升級會一下子拉開各家之間的差距,就好像高中生高考進入大學一樣。並不是所有的大模型最終都能實現“智慧湧現”的,這可能也是最終判斷大模型是否能夠成功的關鍵。
能力升級,應用落地
在大模型的能力判斷上,行業其實還沒有統一標準,大部分測試也都相對侷限,在這一點上,作為人工智能“國家隊”之一,科大訊飛被授予人工智能關鍵技術和應用評測工業和信息化部重點實驗室大模型工作組的副組長單位,參編中國信通院大模型標準體系2.0的建設,正在用我們自己的能力去構建行業的標準。
而在後者的應用落地上,顯然這是訊飛最大的優勢所在,無論是軟件還是硬件,現在都已經有了成熟的產品應用,而在大模型產品的加持下,訊飛硬件產品在這次618大促上的表現也異常出色,大促開場不久就完成了去年全天的銷售額,訊飛AI學習機系列激活同比增長214%,訊飛智能辦公本系列激活同比增長176%,訊飛聽見網站新增用戶同比增長205%。
6月9日,是科大訊飛的24週年慶,而在這次的發佈會上,訊飛星火認知大模型V1.5主要的升級核心有兩點,一個是訊飛星火大模型在能力上的升級,一個則是訊飛星火大模型在應用上的落地。訊飛星火認知大模型V1.5除了大模型本身能力的整體提升外,還在綜合能力上實現三大升級,包括:開放式知識問答取得突破,多輪對話、邏輯和數學能力再升級。
在現場,科大訊飛總裁吳曉如、研究院院長劉聰針對性的進行了測試,提出了諸如“2023年全國高考甲卷的作文題是什麼,並分析一下它傳遞的意義。“ “高考剛剛結束,孩子即將開啟新的起點,請給你的孩子寫一封暖心的信。”這樣更為開放性的問題,以及“一條船上有三個人,但是有兩個父親,兩個兒子,請問是怎麼回事?” “1個魚缸裡有很多條魚,共有5個品種,至少要撈出多少條魚,才能保證其中有4條相同品種的魚?”這樣邏輯性和數學性兼顧的問題,都獲得了很好的回答。現場甚至還演示了拍照識別數學試卷,大模型準確答卷的測試,充分體現出了訊飛星火大模型V1.5的能力增強。
為了更好的服務用戶,在現場星火APP同步大模型發佈,成為大模型的具體載體,而面向生活、工作等用戶高頻使用場景上線200+小助手,把AI落地做到了實處。科大訊飛還表示將進一步推動星火認知大模型在教育、醫療、工業、辦公等領域落地應用,賦能星火語伴APP、醫療診後康復管理平臺、羚羊工業互聯網平臺、訊飛聽見智慧屏等產品,並開放了訊飛星火開發接口,攜手開發者共建“星火”生態。
如果說五月份科大訊飛董事長劉慶峰表示“星火大模型距離ChatGPT差距不遠,有些地方甚至有所超越”還讓人覺得有點吹牛的成分,那麼這次的展示顯然凸顯出了科大訊飛的底氣。劉慶峰表示,“今天我們再次如期發佈星火大模型的最新成果,是因為我們所有的技術平臺都是完全自主研發的,我們對每一個階段的技術都是可控的,也非常有信心。訊飛不僅要致敬和追趕OpenAI,更要在源頭上做自主創新,在類腦智能、神經網絡大模型、博弈智能等方面探索通用人工智能的更多潛在路徑和前沿交叉研究機會。”
自國內大模型批量上市之後,很多人都會發現一個問題,就是感覺各大通用大模型似乎沒有太大差距,基本都能做到有問有答,但好玩之餘似乎沒有什麼地方能夠用到。即便是在海外,同樣的問題依舊存在,不少領域真正實用的大模型實際上並非通用大模型,而ChatGPT的各種產品落地,也並沒有帶來更為驚豔的用戶體驗,依舊還是一個加強版的搜索引擎。
所以,從這裡我們可以看出,大模型的發展方向有兩個關鍵點,一個是“智慧湧現”的關鍵節點,一個是具體場景的落地應用。前者似乎有些不可預測,但後者則是完全可以嘗試領先一步的。畢竟,我國的科技行業一直在應用端有著無可比擬的優勢,率先在應用端實現領先突破似乎是逆襲ChatGPT的關鍵路徑。
科大訊飛一早就建立了認知大模型“1+N”專項攻關的體系,其中“1”就是通用的認知智能大模型,“N”就是將“訊飛星火”在教育、辦公、汽車、人機交互、醫療等領域進行應用落地。而這次訊飛星火認知大模型V1.5更進一步拓寬了對“N”個行業領域的賦能。
比如AI口語助手升級的星火語伴APP,已經可以像外語口語老師一樣進行開放式對話、情景交流,並進行實時口語糾錯,配合虛擬老師形象,可以讓用戶可以身臨其境的練習口語,並支持9種語言文本、語音和圖片翻譯。
在辦公領域,科大訊飛發佈了業界首個搭載大模型的會議室智能終端——訊飛聽見智慧屏。它可以實現動態會議記錄、會議內容自動整理輸出,一鍵生成多種類型的會議文案,助力用戶高效辦公。
在醫療方面,訊飛醫療全面升級醫療診後康復管理平臺,將專業的診後管理和康復指導延伸到院外,可以根據患者健康畫像自動分析,平臺可為患者智能生成個性化康復計劃,包括重點關注、用藥指導、康復運動、出院隨訪、健康知識、患者諮詢等,並督促患者按計劃執行。
在工業領域,在星火大模型的基礎上,羚羊平臺推出了工業AI——“羚機一動”。中小企業在羚羊平臺上自由發佈需求,羚機一動針對企業需求給出專業化建議策略,智能匹配方案、服務商、專家等資源,等等。可以說,訊飛星火大模型正如其名稱一樣,真正地已經在各個領域開始星火燎原了。
劉慶峰在現場宣佈,訊飛將開放星火認知大模型開發接口,將七大維度能力、200+小助手對應能力全面開放給開發者,並且支持多端接入快速集成,支持私有化部署,與廣大開發者共建生態。他表示:“通用人工智能的全新時代將是一個偉大的歷史進程,絕不是一蹴而就的,所以我們既要有短期攻關的雄心,更要有長期主義的恆心。這是我們應該遵循的產業邏輯和科研發展應有的規律,這樣才能夠在長跑中真正勝出,真正的解決社會剛需,建設美好世界。”
原文連結:https://inewsdb.com/其他/訊飛星火認知大模型v1-5來了,加速搶跑用行動證明/
inewsdb.com 日日新聞 . 掌握每日新鮮事
inewsdb.com 日日新聞 . 掌握每日新鮮事
|