今天我們為您帶來最新的 AI 資訊,從技術前沿到業界動態,全面探索人工智能的發展。
谷歌發表了一篇技術論文,詳細介紹了 Whisk 的技術原理,標誌著在圖像生成領域的突破。該技術可從多張圖片中提取元素並生成最終影像效果,目前主要應用於 DiT 繪畫模型。研究表明,這套技術未來將在開源社群中釋出,進一步促進開發者的創作效率。
此外,OpenAI 在一篇文章中提出提升大型語言模型(LLM)安全性的新方法——延長推理時間(增加 inference-time compute)。通過延長模型“思考”的時間,它可以有效提升模型的對抗穩健性,從而降低攻擊成功率至趨近零的水平。
字節跳動成立了名為“Seed Edge”的團隊,專注於通用人工智能(AGI)的基礎研究,並確定了包括推理與感知能力、模型設計、學習范式等在內的五大研究方向。這顯示出字節跳動對於探索 AI 基礎理論和技術突破的高度重視,其目標是成為業界的領頭羊,為 AGI 的發展奠定堅實基礎。
公司同時推出了“Top Seed 人才計劃”,與全球高校合作招募頂尖研究人才,以促進核心技術的快速革新。
基於 CogAgent 技術的智譜 GLM-PC 提供了創新的智能體交互方式,具備邏輯推理和“深度思考”模式,支持 Windows 系統環境,同時優化了代碼生成功能和複雜任務處理效率。
這一大模型的設計靈感來自人類左右腦分工,通過邏輯與創造性的深度融合,使其能高效完成任務。此外,智譜正在與全球 PC 廠商合作,重塑個人電腦中 AI 的應用價值。
上海階躍星辰智能科技有限公司正式發布了 Step-Video V2 版本,為視頻生成技術帶來革命性提升。通過採用優化的 VAE 模型和 DiT 架構,該模型的計算效率與生成質量得到了顯著提升。同時,其新增的基礎文字生成功能為視頻內容創作增添了更多可能性,拓寬了技術的應用場景。
谷歌對 Gemini AI 助手進行了多方面升級,新推出的“Gemini Live”功能允許用戶在對話中直接插入圖片、視頻和文件,大幅提升了多媒體處理能力及應用間的協作性能。在未來的 Project Astra 計劃中,Gemini 還將加入屏幕共享和即時視頻流功能,推動智能助手的全面進化。
特朗普最近宣布了一項名為「星際之門」的人工智能豪華投資計劃,總預算高達 5000 億美元,由 OpenAI、甲骨文和軟銀聯合資助。然而,特斯拉 CEO 馬斯克對此計劃公開表示質疑,稱其為“財務鬧劇”,並懷疑資金的真實性。對此,OpenAI 的 CEO 阿爾特曼則給予某種程度的反擊,指出 AI 社群不應該相互攻擊。
Anthropic CEO Dario Amodei 在一次訪談中表態,未來 2-3 年內 AI 系統或將在多個領域全面超越人類。他強調,希望 AI 能與人類形成協同關係,提升工作效率,而非替代人類勞動。此外,Amodei 鼓勵年輕人接受 AI 工具,並培養批判性思維以應對未來信息爆炸時代的挑戰。
18 歲少年 Zach Yadegari 和 Blake Anderson 開發的 Cal AI 應用,以其獨創的圖片識別食物熱量功能登上 AI 應用熱門榜。應用憑借操作簡單及高準確率(達 90%)吸引用戶,並通過與 KOL 合作及社交平台推廣,實現了 5600 萬美元的收入。
Cal AI 以用戶為中心的低訂閱費(月費僅 10 美元)使得其擁有穩定的市場表現,成為創業學子的典範之一。
三星在最新的發布會上宣布 Galaxy S25 系列手機支持 Adobe 推出的內容憑據標準(C2PA)。該功能旨在為用戶提供類似“營養標籤”的內容生成和編輯信息,幫助識別 AI 生成功能內容,並防範數字時代的信息虛假與誤導。
AI 技術的快速發展正在持續改變我們的生活方式,從技術進步到商業創新,未來的潛力無可限量。期待更多突破性成果的到來。