當大家都習慣了遇事不決問豆包的時候,沉寂了很久的Deepseek,突然發布了最新版V4的預覽版,一下就炸開了鍋。
![]()
為什么這個發布萬眾期待?這個東西到底哪里變得更牛了?為什么很多人說,英偉達的黃仁勛擔心的事還是發生了?
另外,這次的V4版本性能算是對得起等這么久。專家模式能和美國的頂流模型像Claude,GPT,以及Gemini的主流版本打的有來有回,至少目前來看是這樣。
![]()
但別忘了,Deepseek是開源模型,另外那幾個都是閉源的。曾經開源和閉源的性能差距,類似李小冉去和流行天后比唱歌。
簡單來講,目前的Deepseek,算是全球開源模型里的頂流,部分性能更是不輸頂級的閉源模型。
而這對我們普通人來說,這可是好事兒啊!
以前的很多大模型都有個通病,就是健忘。類似你經常去個飯館,老板都跟你熟了,以后你每次去不用說老板都知道你的口味:不要蔥,多放辣。可結果某天你去了之后老板突然一臉職業微笑:你好,請問你要吃點啥?
你以為和人有默契了,結果人家恢復出廠設置了。
![]()
另外,新版的Deepseek專家模式,理論上來講已經可以自己完成一整套工作流程,比如幫你安排行程收發消息做PPT搞數據分析,當前臺是夠嗆,當助理那估計沒什么壓力。
總之,搞企業的尤其是中小企業,個體戶,一人公司,搞科研的,搞投資的,搞咨詢的,干脆普通用戶,理論上都能有更好的體驗。
更妙的是,這樣的性能了,依然遠遠比國外的閉源模型便宜。
全球公認的最強編程模型Claude,百萬詞元調用量的價格是25美元,而DeepSeek是24人民幣!
![]()
不過物美價廉,好像也已經是Deepseek的祖傳藝能了。
有很多家人表示,不就是一個更好更便宜的AI大模型么,至于這么激動嗎?
你以為這只是中國和美國之間的AI大戰嗎?有沒有一種可能,真正的戰場,其實是在芯片。
過去中外的大模型,幾乎都依賴英偉達的算力芯片,和相應的CUDA工具。大模型性能再強,其實也就意味著給黃仁勛打工越狠,英偉達的護城河就會越深。
對中國人來說,尷尬的地方就在于,我們越是在那訓練追趕AI,就越是在給別人的生態添磚加瓦。
很多人說我們用自己的芯片不行嗎?
科技圈里有消息說,其實DeepSeek早就在拿華為昇騰芯片做訓練了,但是,一度遇到了像穩定性不足、場景崩潰、速度達不到預期等等各種各樣的問題,但沒有經過官方正式確認,所以還不好說。現在擺脫英偉達,根本就沒那么容易。
![]()
但至少,DeepSeek已經邁開了第一步。這次發布的V4版本,不但把測試權限交給了華為昇騰和寒武紀這些國產芯片,這還意味著他們就需要把大量的代碼和各種資源從英偉達的CUDA遷移到華為的架構上。
這可能是DeepSeek的一小步,但很有可能是中國AI的一大步。模型再強,只要還是依賴別人的硬件和工具,咱們腰桿子肯定就硬不了。讓咱們自己的模型,在自己的芯片、自己的工具、自己的生態上能穩定便宜地跑起來,哪怕過程一步三坑,也足夠重要,也是特別值得的。
![]()
中美的AI競爭,表面看是模型大戰,背后其實是芯片大戰,最終是生態大戰。芯片生態歇菜了,模型打得再熱鬧,也只是像放個煙花。
總結一下,Deepseek新版面世,理論上來看意味著,更多的中國人,無論過日子,還是生產力,都慢慢能用上高性價比的大模型。這對國產算力相關,以及中小企業,包括各種專業機構,尤其是能用AI節省成本的企業機構,都算是迎來機會了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.