本文匯總了2025年3月6日的人工智慧技術亮點與最新產品,包括通用智能體Manus、阿里巴巴QwQ-32B模型、ChatGPT 4.5開放消息,以及多項開源及商業應用進展。
Manus作為首個通用智能體,引發了廣泛討論。它憑藉「手腦並用」完成複雜任務的能力,不僅能獨立執行長達30分鐘以上的任務,還能產出令人驚艷的結果。用戶更可在官網回顧其他人的任務操作,進一步檢視其強大潛力。
然而,業內專家警告,目前的AI能力仍受限於現有技術框架,儘管如此,Manus在GAIA評分超越OpenAI的DeepResearch,展示了其超前的性能。
AiBase提要:
官網:Manus
阿里巴巴推出的QwQ-32B開源推理模型採用了320億參數架構,並支持131072 tokens的上下文長度,顯示出在數學推理和程式設計基準測試中的卓越表現。這項技術有別於傳統大模型,顯存需求更低,性能卻可媲美更大的DeepSeek R1模型。
該模型還結合了聯網與深度思維,進一步探索複雜問題解決的潛力。
AiBase提要:
模型參考:
OpenAI的GPT-4.5最近面向ChatGPT Plus用戶開放。雖然改進了對話能力,但在更高水平的複雜推理任務中仍存限制。我個人測試時,發現4.5與之前的GPT-4差別不大。但需要注意,其高昂的使用成本(一百萬tokens需150美元)可能限制該模型的普及度。
AiBase提要:
Windsurf 推出其最新版本 Wave 4,新增了Preview功能,允許用戶實時預覽生成結果,並做到「指哪改哪」,精確調整頁面元素的展現方式。該功能旨在提升設計效率,賦予開發者更靈活的實驗空間。
騰訊公佈了其最新的圖生視頻開源模型HunyuanVideo-I2V,允許用戶在Github上自由下載進行研究與應用。該模型的發布標誌著業界在生成式AI視頻領域的一次重要推進。
相關連結:
6.1 LTX-Video 0.9.5 發布:支持商業許可,並新增關鍵幀條件支持,提升視頻生成靈活性與質量。
6.2 Spark-TTS 文本轉語音模型:支持零樣本語音克隆,並加入細粒控制功能,拓展應用邊界。
6.3 Google Whisk Animate 預覽版:藉AI技術,能將靜態畫面轉化成8秒短片,拓展創意可能。
6.4 抖音集團招募 AI 部門標註資源:尋求成熟數據服務供應商,瞄準醫療、法律行業需求。
6.5 高端 AI 代理服務(by OpenAI):每月費用高達2萬美元,專供金融或醫療專業應用。
以上資訊突顯了AI技術與應用的最新進展,期待未來有更多創新助力各領域的發展。