第1330章 deepseek震撼發布janus－pro，ai多模態領域迎來新變革

2024年行情作者：一360一投票推薦加入書簽留言反饋

    人工智能（ai）的發展速度超乎想象，是不知疲倦的探索者，正以前所未有的力量推動著各個行業的變革。近期，deepseek公司憑借其r1大語言模型在華爾街掀起了一場風暴，引發了美國公司模型成本及人工智能股票泡沫破裂的廣泛討論，進而導致美股科技股拋售潮的出現。然而，這僅僅是deepseek帶給我們的震撼的開始。

    deepseek的r1大語言模型憑借其強大的性能，不僅震撼了矽穀，更讓華爾街的投資者們措手不及。一時間，科技股紛紛下跌，其中芯片巨頭英偉達股價暴跌約16.86%，單日市值蒸發約600億美元（原文中的6000億美元應為筆誤，根據上下文及市場常識判斷應為600億美元），博通、超威半導體公司、美光科技、台積電等芯片及科技企業股價也紛紛走低。此外，與人工智能相關的衍生品，如電力供應商也未能幸免，美國聯合能源公司和vistra的股價分別下跌了20.85%和28.33%。這一係列連鎖反應，無疑彰顯了deepseek r1模型在業界的巨大影響力。

    然而，麵對這場風暴，白宮人工智能和加密貨幣總管david sacks卻持樂觀態度。他在社交媒體上表示，deepseek r1的表現證明了人工智能競爭的激烈程度，並認為美國總統特朗普廢除拜登行政命令是正確的決定。sacks認為，拜登的行政命令束縛了美國的人工智能公司，而deepseek等企業的崛起則展示了美國在該領域的強大實力。他強調：“我對美國充滿信心，但我們不能自滿。”

    就在r1模型引發廣泛討論的同時，deepseek又在深夜放出了大招。1月27日晚間，deepseek創始人梁文鋒在社交媒體上透露，新版本即將發布。僅僅三個多小時後，人工智能開源社區huggingface就展示了deepseek發布的一係列開源多模態模型，包括janus-pro和janusflow，這些模型的參數大小從10億到70億不等。這一消息再次震驚了業界，也讓我們看到了deepseek在多模態領域的深厚積累。

    本次發布的janus-pro係列模型，在文生圖能力方麵取得了顯著突破。其中，70億參數的janus-pro-7b在geneval和dpg-bench基準測試中，分別以80%和84.2%的準確率擊敗了openai的dall-e3和stablediffusion等頂尖圖像生成模型。這一成績不僅證明了janus-pro的強大性能，也彰顯了deepseek在多模態理解和生成方麵的深厚實力。

    據deepseek發布的報告介紹，janus-pro是此前發布的janus模型的改進版本。相較於janus，janus-pro在訓練策略、訓練數據以及模型規模等方麵都進行了優化。這些改進使得janus-pro在多模態理解和文本到圖像指令跟隨能力方麵取得了顯著進步，同時提升了文本到圖像生成的穩定性。

    作為一種新穎的自迴歸框架，janus-pro將多模態理解和生成統一起來，通過解耦視覺編碼來實現這一目標。它將視覺編碼解耦為單獨的路徑，以解決以前方法的局限性，同時仍然使用單一、統一的轉換器架構進行處理。這種設計不僅提高了模型的性能，還使得模型在處理多模態任務時更加靈活和高效。

    值得注意的是，deepseek在訓練janus-pro模型時投入了大量的計算資源。對於1.5b和7b這兩個參數的模型，整個訓練過程在16\/32節點的集群上進行，每個節點配備8塊nvidia a100（40gb）gpu。經過7\/14天的訓練，deepseek就成功訓練出了能夠擊敗openai dall-e3和stablediffusion的模型。這一成績不僅彰顯了deepseek的技術實力，也讓我們看到了ai技術在不斷突破極限。

    除了強大的文生圖能力外，janus-pro-7b還具備圖像識別功能。它能夠根據提供的圖片猜測地點，並給出詳細的描述和分析。例如，當給janus-pro-7b提供一張中國杭州西湖的圖片時，它能夠準確識別出圖片中的景點是三潭映月島，並進一步分析出圖片中的建築、湖水和山脈等特點。這一功能不僅展示了janus-pro-7b在圖像識別方麵的強大性能，也為我們帶來了更加智能和便捷的圖像處理體驗。

    事實上，deepseek一直在多模態領域進行探索和創新。去年，他們就推出了基於自迴歸的多模態理解與生成統一模型janus。而進入2025年，他們將janus進一步升級至janus-pro。這一係列動作不僅彰顯了deepseek在多模態領域的深厚積累和創新精神，也讓我們看到了ai技術在不斷推動各個行業的變革和發展。

    然而，盡管deepseek在c端應用上主要聚焦於文本能力，還無法直接生成圖片或識別圖像，但隨著janus-pro的發布和技術的不斷進步，用戶或許很快就可以使用deepseek進行圖像、視頻等領域的創作。這將為用戶帶來更加智能和便捷的創作體驗，也將推動ai技術在更多領域的應用和發展。

    綜上所述，deepseek憑借其強大的技術實力和創新精神，在多模態領域取得了顯著突破。janus-pro的發布不僅為ai技術的發展注入了新的活力，也為我們帶來了更加智能和便捷的生活體驗。在未來的發展中，我們有理由相信，deepseek將繼續引領ai技術的潮流，推動各個行業的變革和發展。讓我們共同期待ai技術為我們帶來的更加美好的未來！

溫馨提示：按迴車[Enter]鍵返迴書目，按 ←鍵返迴上一頁，按 →鍵進入下一頁，加入書簽方便您下次繼續閱讀。

2024年行情所有內容均來自互聯網，繁體小說網隻為原作者一360一的小說進行宣傳。歡迎各位書友支持一360一並收藏2024年行情最新章節。