2025 年 1 月 23 日 AI 資訊

發布日期：2025-01-23

#人工智能 #技術動態

今天我們為您帶來最新的 AI 資訊，從技術前沿到業界動態，全面探索人工智能的發展。

📖 TokenVerse: Whisk 背後的技術原理

谷歌發表了一篇技術論文，詳細介紹了 Whisk 的技術原理，標誌著在圖像生成領域的突破。該技術可從多張圖片中提取元素並生成最終影像效果，目前主要應用於 DiT 繪畫模型。研究表明，這套技術未來將在開源社群中釋出，進一步促進開發者的創作效率。

此外，OpenAI 在一篇文章中提出提升大型語言模型（LLM）安全性的新方法——延長推理時間（增加 inference-time compute）。通過延長模型“思考”的時間，它可以有效提升模型的對抗穩健性，從而降低攻擊成功率至趨近零的水平。

🌱 字節跳動加碼 AGI：Seed Edge 團隊組建

字節跳動成立了名為“Seed Edge”的團隊，專注於通用人工智能（AGI）的基礎研究，並確定了包括推理與感知能力、模型設計、學習范式等在內的五大研究方向。這顯示出字節跳動對於探索 AI 基礎理論和技術突破的高度重視，其目標是成為業界的領頭羊，為 AGI 的發展奠定堅實基礎。

公司同時推出了“Top Seed 人才計劃”，與全球高校合作招募頂尖研究人才，以促進核心技術的快速革新。

💻 智譜 GLM-PC 智能體：個人電腦 AI 體驗新時代

基於 CogAgent 技術的智譜 GLM-PC 提供了創新的智能體交互方式，具備邏輯推理和“深度思考”模式，支持 Windows 系統環境，同時優化了代碼生成功能和複雜任務處理效率。

這一大模型的設計靈感來自人類左右腦分工，通過邏輯與創造性的深度融合，使其能高效完成任務。此外，智譜正在與全球 PC 廠商合作，重塑個人電腦中 AI 的應用價值。

🎥 階躍星辰視頻生成模型 Step-Video V2 上線

上海階躍星辰智能科技有限公司正式發布了 Step-Video V2 版本，為視頻生成技術帶來革命性提升。通過採用優化的 VAE 模型和 DiT 架構，該模型的計算效率與生成質量得到了顯著提升。同時，其新增的基礎文字生成功能為視頻內容創作增添了更多可能性，拓寬了技術的應用場景。

🤖 谷歌 Gemini AI 助手升級：多應用聯動與圖像分析能力強化

谷歌對 Gemini AI 助手進行了多方面升級，新推出的“Gemini Live”功能允許用戶在對話中直接插入圖片、視頻和文件，大幅提升了多媒體處理能力及應用間的協作性能。在未來的 Project Astra 計劃中，Gemini 還將加入屏幕共享和即時視頻流功能，推動智能助手的全面進化。

💬 特朗普 5000 億美元 AI 投資計劃引發爭議：馬斯克的反擊

特朗普最近宣布了一項名為「星際之門」的人工智能豪華投資計劃，總預算高達 5000 億美元，由 OpenAI、甲骨文和軟銀聯合資助。然而，特斯拉 CEO 馬斯克對此計劃公開表示質疑，稱其為“財務鬧劇”，並懷疑資金的真實性。對此，OpenAI 的 CEO 阿爾特曼則給予某種程度的反擊，指出 AI 社群不應該相互攻擊。

⏩ Anthropic 領導人預測：AI 將在 2-3 年內超越人類

Anthropic CEO Dario Amodei 在一次訪談中表態，未來 2-3 年內 AI 系統或將在多個領域全面超越人類。他強調，希望 AI 能與人類形成協同關係，提升工作效率，而非替代人類勞動。此外，Amodei 鼓勵年輕人接受 AI 工具，並培養批判性思維以應對未來信息爆炸時代的挑戰。

📱 年輕創業者靠 ChatGPT 獲利：Cal AI 應用賺 5600 萬美元

18 歲少年 Zach Yadegari 和 Blake Anderson 開發的 Cal AI 應用，以其獨創的圖片識別食物熱量功能登上 AI 應用熱門榜。應用憑借操作簡單及高準確率（達 90%）吸引用戶，並通過與 KOL 合作及社交平台推廣，實現了 5600 萬美元的收入。

Cal AI 以用戶為中心的低訂閱費（月費僅 10 美元）使得其擁有穩定的市場表現，成為創業學子的典範之一。

📲 三星 Galaxy S25 首款支持內容憑據標準

三星在最新的發布會上宣布 Galaxy S25 系列手機支持 Adobe 推出的內容憑據標準（C2PA）。該功能旨在為用戶提供類似“營養標籤”的內容生成和編輯信息，幫助識別 AI 生成功能內容，並防範數字時代的信息虛假與誤導。

AI 技術的快速發展正在持續改變我們的生活方式，從技術進步到商業創新，未來的潛力無可限量。期待更多突破性成果的到來。

參考連結

引用來源