2025年3月17日AI資訊報告

發布日期：2025-03-17

#AI #人工智慧 #技術新聞

歡迎來到【AI日報】欄目！以下是精選的AI領域即時新聞，涵蓋技術突破、產品應用與產業趨勢。

🤖 不使用歸一化的Transformer

引入了「動態雙曲正切（DyT）」操作公式：`DyT(x) = tanh(alpha * x)`，作為歸一化層的直接替代品。研究表明，該操作的性能可匹敵甚至超越傳統歸一化版本的表現，推動Transformer結構的無歸一化進展，可能減少模型訓練中的收斂問題。

當某些視覺模式在訓練數據中反覆出現時，模型可能在生成階段「自然」重現這些模式，即使用戶未觸發相關關鍵詞；這顯示出「隱形圖像投毒」的潛在風險，對生成式AI安全性帶來挑戰。

一篇關於大規模語言模型（LLM）後期訓練技術的綜述論文，深入探討了此類模型的後處理方法，以進一步提升模型性能及適應特定應用場景。

快手旗下的可靈AI現已接入DeepSeek-R1，幫助用戶快速將靈感轉化為專業提示詞，從而降低創作門檻、提升效率。DeepSeek靈感版還與其靈感詞庫功能聯動，使普通用戶亦可創作出高質量視頻與圖片內容。

...

OpenAI高管表示，人工智能預計將在2025年底之前於編碼基準測試中超越人類程序員。AI分析與推理技能的快速進步表明，未來幾乎所有代碼生成工作將可能由AI完成。

以上是2025年3月17日的AI領域重大進展及技術動態。我們期待AI在未來能為世界帶來更多的創新與價值。

參考連結

引用來源