2025.4.27 AI 技術與創新日報

發布日期：2025-04-27T00:00:00.000-04:00

這份報告涵蓋了最新的AI技術創新、模型發布及其在產業應用中的發展趨勢，並展示了世界各地重要的人工智慧進展。

🖼️ Step1X-Edit：開源圖像編輯新標杆

Step1X-Edit由Stepfun AI團隊推出，是一種開源圖像編輯模型，結合了多模態大語言模型與擴散變換器，展現出強大的圖像生成能力。其功能類似於GPT-4o、Gemini、豆包等模型，通過輸入文字即可修改圖片，包括動作、風格、文字等編輯能力。雖然實際效果較GPT-4o遜色，但其開源特性和高性能表現吸引了業界廣泛關注。其唯一的優點是編輯尺度稍微更大，但視覺效果一般。內容創作者和開發者可借助該模型推動圖像編輯技術發展。

⚙️ EasyEdit2：即插即用的LLM行為調整框架

EasyEdit2是一個無需額外訓練即可在推理時干預LLM事實性、安全性和推理模式的框架。這個即插即用的工具為開發者提供了快速調整語言模型行為的能力，簡化了複雜的開發過程。EasyEdit2不僅提高了LLM的可控性，還增強了安全性和準確性。

📚 RLHF Book：強化學習綜述

這篇論文詳述了基於人類反饋的強化學習（RLHF），涵蓋從指令調整到訓練獎勵模型再到拒絕採樣、強化學習、直接對齊算法的方方面面。全文超過100頁，是對RLHF領域的全面綜述，適合研究者對相關技術深入了解。

🔊 Moonshot AI發布Kimi-Audio: 開源音頻基礎模型樹立新標杆

Moonshot AI推出的Kimi-Audio是一款開源音頻基礎模型，基於Qwen2.5-7B架構結合Whisper技術，支持語音識別和音頻問答。憑藉超過13億小時的多樣化音頻數據訓練，該模型在多項基準測試中表現出色，推動了音頻AI技術的發展。開源策略降低了音頻AI技術的使用門檻，促進了全球AI技術的民主化進程。

📷 夸克AI超級框升級上線“拍照問夸克”功能: 啥都能答

阿里巴巴旗下的夸克AI超級框發布“拍照問夸克”功能，利用視覺理解和推理模型，快速識別和理解用戶遇到的問題。用戶可通過拍照獲取信息和答案，涵蓋文物講解、商品識別、健康分析等多個領域。該功能還支持多種語言提問和翻譯，適合旅行、健康、工作等多場景應用。

📱 國行版蘋果AI智能即將推出 iOS18.5正式版預計5月推送

蘋果公司計劃在5月推送iOS18.5正式版更新，為中國用戶帶來Apple智能功能。這項基於個人場景的AI系統提供照片消除、智能回覆等服務。然而，只有iPhone15Pro及以上機型支持該功能，並需保證設備有足夠的存儲空間。此舉標誌著蘋果進入生成式AI時代。

🌐 谷歌AI發布601個真實世界的生成式AI應用案例

谷歌雲發布報告展示了來自全球企業的601個生成式AI應用案例，顯示出技術的廣泛應用和快速增長。相比去年僅有的101個案例，增長六倍，覆蓋汽車、金融、醫療等多個行業。這些案例突顯了生成式AI在運營和戰略中的重要性。

📟 微軟發布新Agent操作系統UFO² 深度整合Windows與智能自動化

微軟推出UFO²版本，實現了與Windows系統的深度整合，能夠直接調用原生API，提升了自動化任務的執行效率。在多個測試場景中，其成功率高於OpenAI的Operator，尤其在處理複雜任務時表現出色。

🤖 OpenAI 推出 ChatGPT 新版本: 更智能、更直觀的 GPT-4o

OpenAI更新的ChatGPT GPT-4o版本重點優化了記憶保存與STEM技能，旨在提升模型智能水平與對話引導能力。儘管存在某些“光滑”過度問題，OpenAI承諾將進行改進。開發者可選擇新的GPT-4.1系列以獲得更穩定的API體驗。

📝 Ema推新型語言模型EmaFusion: 成本和準確性方面擊敗O3、Gemini

Ema公司推出的EmaFusion語言模型，在成本和準確性上超越了其他知名AI模型。採用“級聯”判斷系統，動態平衡成本與準確性，並允許用戶微調任務需求。其準確率達到94.3%，運行成本顯著降低，成為企業AI發展的新選擇。

📱 Liquid AI推出Hyena Edge 開創智能手機邊緣設備的新时代

Liquid AI推出了Hyena Edge卷積模型，為智能手機及邊緣設備提供高效AI解決方案。該模型超越傳統Transformer++模型，適合資源受限環境，在多個標準語言模型基準測試中表現優異。計劃未來開源以促進技術普及。

📽️ LemonAI 推出實時音視頻 AI 數字人模型 Slice Live

LemonAI發布Slice Live，即全球首創的實時音視頻AI模型，用户通過上傳照片即可與虛拟角色進行實時視頻通話。採用先進的Transformer模型，以每秒25幀速度渲染每個像素，確保畫面流暢。此產品在娛樂和教育領域展示巨大潛力，并計劃擴展到AR、VR和元宇宙應用。

🤝 智譜與生數科技達成戰略合作專注大模型聯合創新

清華大學旗下的智譜與生數科技宣佈戰略合作，將通過在大語言模型和多模態生成模型的技術積累，共同推進國產大模型的技術創新與產業落地。合作涵蓋聯合研發、產品聯動、解決方案整合，聚焦多個行業，推動AI技術應用與發展。

🚗 寶馬中國宣佈新車型接入DeepSeek 含5系、全新X3

寶馬中國計劃於第三季推出搭載DeepSeek技術的新車型，提升智能車載系統的互動體驗。此技術增強了車主與車輛的互動，通過BMW智能個人助理實現自然語言交流，能有效理解並響應用戶指令，提供便捷的駕駛體驗。

這些AI新聞揭示了各大科技公司在推動技術創新及其應用上所做的努力，同時也展示了各類AI技術正在如何改變各行各業的面貌。

參考連結

引用來源