人工智能(ai)的發展速度超乎想象,是不知疲倦的探索者,正以前所未有的力量推動著各個行業的變革。近期,deepseek公司憑借其r1大語言模型在華爾街掀起了一場風暴,引發了美國公司模型成本及人工智能股票泡沫破裂的廣泛討論,進而導致美股科技股拋售潮的出現。然而,這僅僅是deepseek帶給我們的震撼的開始。
deepseek的r1大語言模型憑借其強大的性能,不僅震撼了矽穀,更讓華爾街的投資者們措手不及。一時間,科技股紛紛下跌,其中芯片巨頭英偉達股價暴跌約16.86%,單日市值蒸發約600億美元(原文中的6000億美元應為筆誤,根據上下文及市場常識判斷應為600億美元),博通、超威半導體公司、美光科技、台積電等芯片及科技企業股價也紛紛走低。此外,與人工智能相關的衍生品,如電力供應商也未能幸免,美國聯合能源公司和vistra的股價分別下跌了20.85%和28.33%。這一係列連鎖反應,無疑彰顯了deepseek r1模型在業界的巨大影響力。
然而,麵對這場風暴,白宮人工智能和加密貨幣總管david sacks卻持樂觀態度。他在社交媒體上表示,deepseek r1的表現證明了人工智能競爭的激烈程度,並認為美國總統特朗普廢除拜登行政命令是正確的決定。sacks認為,拜登的行政命令束縛了美國的人工智能公司,而deepseek等企業的崛起則展示了美國在該領域的強大實力。他強調:“我對美國充滿信心,但我們不能自滿。”
就在r1模型引發廣泛討論的同時,deepseek又在深夜放出了大招。1月27日晚間,deepseek創始人梁文鋒在社交媒體上透露,新版本即將發布。僅僅三個多小時後,人工智能開源社區huggingface就展示了deepseek發布的一係列開源多模態模型,包括janus-pro和janusflow,這些模型的參數大小從10億到70億不等。這一消息再次震驚了業界,也讓我們看到了deepseek在多模態領域的深厚積累。
本次發布的janus-pro係列模型,在文生圖能力方麵取得了顯著突破。其中,70億參數的janus-pro-7b在geneval和dpg-bench基準測試中,分別以80%和84.2%的準確率擊敗了openai的dall-e3和stablediffusion等頂尖圖像生成模型。這一成績不僅證明了janus-pro的強大性能,也彰顯了deepseek在多模態理解和生成方麵的深厚實力。
據deepseek發布的報告介紹,janus-pro是此前發布的janus模型的改進版本。相較於janus,janus-pro在訓練策略、訓練數據以及模型規模等方麵都進行了優化。這些改進使得janus-pro在多模態理解和文本到圖像指令跟隨能力方麵取得了顯著進步,同時提升了文本到圖像生成的穩定性。
作為一種新穎的自迴歸框架,janus-pro將多模態理解和生成統一起來,通過解耦視覺編碼來實現這一目標。它將視覺編碼解耦為單獨的路徑,以解決以前方法的局限性,同時仍然使用單一、統一的轉換器架構進行處理。這種設計不僅提高了模型的性能,還使得模型在處理多模態任務時更加靈活和高效。
值得注意的是,deepseek在訓練janus-pro模型時投入了大量的計算資源。對於1.5b和7b這兩個參數的模型,整個訓練過程在16\/32節點的集群上進行,每個節點配備8塊nvidia a100(40gb)gpu。經過7\/14天的訓練,deepseek就成功訓練出了能夠擊敗openai dall-e3和stablediffusion的模型。這一成績不僅彰顯了deepseek的技術實力,也讓我們看到了ai技術在不斷突破極限。
除了強大的文生圖能力外,janus-pro-7b還具備圖像識別功能。它能夠根據提供的圖片猜測地點,並給出詳細的描述和分析。例如,當給janus-pro-7b提供一張中國杭州西湖的圖片時,它能夠準確識別出圖片中的景點是三潭映月島,並進一步分析出圖片中的建築、湖水和山脈等特點。這一功能不僅展示了janus-pro-7b在圖像識別方麵的強大性能,也為我們帶來了更加智能和便捷的圖像處理體驗。
事實上,deepseek一直在多模態領域進行探索和創新。去年,他們就推出了基於自迴歸的多模態理解與生成統一模型janus。而進入2025年,他們將janus進一步升級至janus-pro。這一係列動作不僅彰顯了deepseek在多模態領域的深厚積累和創新精神,也讓我們看到了ai技術在不斷推動各個行業的變革和發展。
然而,盡管deepseek在c端應用上主要聚焦於文本能力,還無法直接生成圖片或識別圖像,但隨著janus-pro的發布和技術的不斷進步,用戶或許很快就可以使用deepseek進行圖像、視頻等領域的創作。這將為用戶帶來更加智能和便捷的創作體驗,也將推動ai技術在更多領域的應用和發展。
綜上所述,deepseek憑借其強大的技術實力和創新精神,在多模態領域取得了顯著突破。janus-pro的發布不僅為ai技術的發展注入了新的活力,也為我們帶來了更加智能和便捷的生活體驗。在未來的發展中,我們有理由相信,deepseek將繼續引領ai技術的潮流,推動各個行業的變革和發展。讓我們共同期待ai技術為我們帶來的更加美好的未來!
deepseek的r1大語言模型憑借其強大的性能,不僅震撼了矽穀,更讓華爾街的投資者們措手不及。一時間,科技股紛紛下跌,其中芯片巨頭英偉達股價暴跌約16.86%,單日市值蒸發約600億美元(原文中的6000億美元應為筆誤,根據上下文及市場常識判斷應為600億美元),博通、超威半導體公司、美光科技、台積電等芯片及科技企業股價也紛紛走低。此外,與人工智能相關的衍生品,如電力供應商也未能幸免,美國聯合能源公司和vistra的股價分別下跌了20.85%和28.33%。這一係列連鎖反應,無疑彰顯了deepseek r1模型在業界的巨大影響力。
然而,麵對這場風暴,白宮人工智能和加密貨幣總管david sacks卻持樂觀態度。他在社交媒體上表示,deepseek r1的表現證明了人工智能競爭的激烈程度,並認為美國總統特朗普廢除拜登行政命令是正確的決定。sacks認為,拜登的行政命令束縛了美國的人工智能公司,而deepseek等企業的崛起則展示了美國在該領域的強大實力。他強調:“我對美國充滿信心,但我們不能自滿。”
就在r1模型引發廣泛討論的同時,deepseek又在深夜放出了大招。1月27日晚間,deepseek創始人梁文鋒在社交媒體上透露,新版本即將發布。僅僅三個多小時後,人工智能開源社區huggingface就展示了deepseek發布的一係列開源多模態模型,包括janus-pro和janusflow,這些模型的參數大小從10億到70億不等。這一消息再次震驚了業界,也讓我們看到了deepseek在多模態領域的深厚積累。
本次發布的janus-pro係列模型,在文生圖能力方麵取得了顯著突破。其中,70億參數的janus-pro-7b在geneval和dpg-bench基準測試中,分別以80%和84.2%的準確率擊敗了openai的dall-e3和stablediffusion等頂尖圖像生成模型。這一成績不僅證明了janus-pro的強大性能,也彰顯了deepseek在多模態理解和生成方麵的深厚實力。
據deepseek發布的報告介紹,janus-pro是此前發布的janus模型的改進版本。相較於janus,janus-pro在訓練策略、訓練數據以及模型規模等方麵都進行了優化。這些改進使得janus-pro在多模態理解和文本到圖像指令跟隨能力方麵取得了顯著進步,同時提升了文本到圖像生成的穩定性。
作為一種新穎的自迴歸框架,janus-pro將多模態理解和生成統一起來,通過解耦視覺編碼來實現這一目標。它將視覺編碼解耦為單獨的路徑,以解決以前方法的局限性,同時仍然使用單一、統一的轉換器架構進行處理。這種設計不僅提高了模型的性能,還使得模型在處理多模態任務時更加靈活和高效。
值得注意的是,deepseek在訓練janus-pro模型時投入了大量的計算資源。對於1.5b和7b這兩個參數的模型,整個訓練過程在16\/32節點的集群上進行,每個節點配備8塊nvidia a100(40gb)gpu。經過7\/14天的訓練,deepseek就成功訓練出了能夠擊敗openai dall-e3和stablediffusion的模型。這一成績不僅彰顯了deepseek的技術實力,也讓我們看到了ai技術在不斷突破極限。
除了強大的文生圖能力外,janus-pro-7b還具備圖像識別功能。它能夠根據提供的圖片猜測地點,並給出詳細的描述和分析。例如,當給janus-pro-7b提供一張中國杭州西湖的圖片時,它能夠準確識別出圖片中的景點是三潭映月島,並進一步分析出圖片中的建築、湖水和山脈等特點。這一功能不僅展示了janus-pro-7b在圖像識別方麵的強大性能,也為我們帶來了更加智能和便捷的圖像處理體驗。
事實上,deepseek一直在多模態領域進行探索和創新。去年,他們就推出了基於自迴歸的多模態理解與生成統一模型janus。而進入2025年,他們將janus進一步升級至janus-pro。這一係列動作不僅彰顯了deepseek在多模態領域的深厚積累和創新精神,也讓我們看到了ai技術在不斷推動各個行業的變革和發展。
然而,盡管deepseek在c端應用上主要聚焦於文本能力,還無法直接生成圖片或識別圖像,但隨著janus-pro的發布和技術的不斷進步,用戶或許很快就可以使用deepseek進行圖像、視頻等領域的創作。這將為用戶帶來更加智能和便捷的創作體驗,也將推動ai技術在更多領域的應用和發展。
綜上所述,deepseek憑借其強大的技術實力和創新精神,在多模態領域取得了顯著突破。janus-pro的發布不僅為ai技術的發展注入了新的活力,也為我們帶來了更加智能和便捷的生活體驗。在未來的發展中,我們有理由相信,deepseek將繼續引領ai技術的潮流,推動各個行業的變革和發展。讓我們共同期待ai技術為我們帶來的更加美好的未來!