AI 日報：2025 年 2 月 23 日動態匯總

以下是今日人工智能領域的重要動態及最新進展：

🚀 S*：代碼領域的混合測試時間縮放框架

S* 是一個專注於代碼生成領域的混合測試時間縮放框架，透過在測試時間增加計算量，顯著提升代碼生成性能。其核心分為生成階段和選擇階段，融合了並行縮放與順序縮放的優勢，並透過自適應輸入合成提升選擇準確性。相關測試結果顯示：

- **Qwen2.5-7B-Instruct + S** 表現超越 32B 模型。
- **GPT-4o mini + S** 得分高於 o1-preview 模型。
- **DeepSeek-R1-Distill-Qwen-32B + S*** 則接近 o1-high 表現水準。

Moonlight 是一個總參數 16B、激活參數 3B 的 Mixture-of-Experts（MoE）模型，基於節省小模型訓練資源的 Muon 優化器，以更少的訓練 FLOP 實現更優性能。該模型在分布式實現中表現出色，現已將訓練過程和代碼完全開源。

應用方向：Moonshot 開始開展更多開源工作，以促進研究者的使用與創新。

Crawl4LLM 是一個基於大語言模型（LLM）預訓練需求而開發的爬蟲工具。傳統網絡爬取數據質量參差不齊，而 Crawl4LLM 將只爬取高品質的網絡內容，以提升模型訓練的效率：

它基於 LLM 的預訓練偏好探索網絡結構。

數據效率：只需爬取 21% 的網絡數據，即可實現達到全部爬取數據的性能水準。

每日 AI 熱點，盡在此處！