AI 日報:2025 年 2 月 23 日動態匯總

#人工智能 #技術更新 #開源

以下是今日人工智能領域的重要動態及最新進展:

🚀 S*:代碼領域的混合測試時間縮放框架

S* 是一個專注於代碼生成領域的混合測試時間縮放框架,透過在測試時間增加計算量,顯著提升代碼生成性能。其核心分為生成階段和選擇階段,融合了並行縮放與順序縮放的優勢,並透過自適應輸入合成提升選擇準確性。相關測試結果顯示:

- **Qwen2.5-7B-Instruct + S** 表現超越 32B 模型。
- **GPT-4o mini + S** 得分高於 o1-preview 模型。
- **DeepSeek-R1-Distill-Qwen-32B + S*** 則接近 o1-high 表現水準。

Github 連結:https://github.com/NovaSky-AI/SkyThought/tree/main/skythought/test-time-scaling

🌙 Moonlight:Moonshot 開源的高效率 MoE 模型

Moonlight 是一個總參數 16B、激活參數 3B 的 Mixture-of-Experts(MoE)模型,基於節省小模型訓練資源的 Muon 優化器,以更少的訓練 FLOP 實現更優性能。該模型在分布式實現中表現出色,現已將訓練過程和代碼完全開源。

應用方向:Moonshot 開始開展更多開源工作,以促進研究者的使用與創新。

Github 連結:https://huggingface.co/moonshotai

🌐 Crawl4LLM:專為 LLM 預訓練準備的高質量爬蟲工具

Crawl4LLM 是一個基於大語言模型(LLM)預訓練需求而開發的爬蟲工具。傳統網絡爬取數據質量參差不齊,而 Crawl4LLM 將只爬取高品質的網絡內容,以提升模型訓練的效率:

它基於 LLM 的預訓練偏好探索網絡結構。

數據效率:只需爬取 21% 的網絡數據,即可實現達到全部爬取數據的性能水準。

每日 AI 熱點,盡在此處!