2025年3月17日AI資訊報告

#AI #人工智慧 #技術新聞

歡迎來到【AI日報】欄目!以下是精選的AI領域即時新聞,涵蓋技術突破、產品應用與產業趨勢。

🤖 不使用歸一化的Transformer

引入了「動態雙曲正切(DyT)」操作公式:`DyT(x) = tanh(alpha * x)`,作為歸一化層的直接替代品。研究表明,該操作的性能可匹敵甚至超越傳統歸一化版本的表現,推動Transformer結構的無歸一化進展,可能減少模型訓練中的收斂問題。

🔒 隱形圖像攻擊

當某些視覺模式在訓練數據中反覆出現時,模型可能在生成階段「自然」重現這些模式,即使用戶未觸發相關關鍵詞;這顯示出「隱形圖像投毒」的潛在風險,對生成式AI安全性帶來挑戰。

📚 LLM Post-training綜述

一篇關於大規模語言模型(LLM)後期訓練技術的綜述論文,深入探討了此類模型的後處理方法,以進一步提升模型性能及適應特定應用場景。

⚡ 快手可靈AI全面接入DeepSeek-R1

快手旗下的可靈AI現已接入DeepSeek-R1,幫助用戶快速將靈感轉化為專業提示詞,從而降低創作門檻、提升效率。DeepSeek靈感版還與其靈感詞庫功能聯動,使普通用戶亦可創作出高質量視頻與圖片內容。

...

🚀 OpenAI預測:AI將於2025年底超越人類程序員

OpenAI高管表示,人工智能預計將在2025年底之前於編碼基準測試中超越人類程序員。AI分析與推理技能的快速進步表明,未來幾乎所有代碼生成工作將可能由AI完成。

以上是2025年3月17日的AI領域重大進展及技術動態。我們期待AI在未來能為世界帶來更多的創新與價值。