AI技術新聞匯總

以下是AI技術領域的最新動態,包括OpenAI、Google、字節跳動等知名企業的最新進展和產品發布。

🚀OpenAI發布兩款多模態推理模型o4-mini、滿血版o3

OpenAI於4月17日發佈了其最新的多模態模型o4-mini和滿血版o3,這兩款模型以其獨特的能力吸引了廣泛的關注。它們能夠同時處理文本、圖像和音頻,並且支持調用外部工具來完成複雜任務。o4-mini在各項測試中表現出色,準確率較o3更高,並在全球編程競賽中榮獲2700分,展現了頂尖的編程能力。ChatGPT付費會員可以使用,但在GitHub上也可以免費使用o4-mini(有使用次數限制)。此外,OpenAI還發布了開源編程輔助工具Codex CLI,以支持開發者進行編程工作。

💡Google AI Studio升級

Google AI Studio進行了一次重大升級,推出了多個Starter Apps新功能。其中包括 GIF Maker、Co-Drawing 以及 Video Toys 等工具,為開發者和用戶帶來了更豐富的互動和創意體驗。這些新功能已經在 Google 的開發者博客上進行了詳細介紹,並且受到了廣泛關注和好評。

📱Droidrun:讓AI操控安卓手機的開源框架

Droidrun推出了一款能夠讓AI操控安卓手機的框架工具,被視作可實現類似於Computer Use的效果。此框架需要安裝ADB進行操作,能夠極大地簡化開發者在移動設備上的測試和自動化操作。其開源項目已經在GitHub上發佈,得到了開發者社區的熱烈響應。

🤖微信首個AI助手 “元寶” 正式上線

騰訊推出的微信平台AI助手“元寶”已正式上線,使用者可以通過微信搜索並添加為好友來獲得智慧互動體驗。元寶支持解析微信公眾號文章、圖片及文件,並且能夠回答使用者的進一步提問,同時關注用戶隱私,具有證件照自動打碼功能。雖然目前不支持語音或視訊通話,但其智慧解析與互動功能已經取得顯著關注。

🔬字節發布豆包1.5深度思考模型:多模態深度思考、延遲低

字節跳動在4月17日的活動中推出了豆包1.5深度思考模型。該模型採用MoE架構,表現出在數學、編程、科學推理及創意寫作等領域的卓越能力。融合了視覺理解技術,使該模型具備分析照片和輔助旅行項目管理的能力。同時,視訊搜索技術的進步也進一步提升了信息的獲取效率。

🔍月之暗面Kimi開源數學定理證明模型Kimina-Prover

Kimi技術團隊發布了Kimina-Prover開源預覽版,該模型在形式化定理證明領域展示了卓越的性能。通過結合強化學習與形式化推理,Kimina-Prover將推理能力和樣本效率提升到了新的高度,miniF2F基準測試中的通過率達到80.7%,超越了此前的最佳結果。

🛠️OpenAI開源超Agent:Codex CLI,五小時內破5000顆星

OpenAI最近發布的Codex CLI是一款輕量級的代碼智能體工具,在發布後短短五小時內便獲得了超過5000顆星的評價。Codex CLI可自動生成、運行、重構和測試代碼,大大提高了開發者的效率。OpenAI表示將繼續推出更多智能體產品,並正計劃收購AI編程平台以增強市場競爭力。

📱谷歌 Gemini Live 功能全面開放,安卓用戶迎來新體驗

谷歌開放了Gemini應用中的Gemini Live功能,所有安卓用戶現已可免費使用。此功能原本僅限於Pixel9和Galaxy S25用戶,能夠實時識別攝像頭和屏幕上的內容,給用戶即時反饋和信息。在功能反饋良好後,谷歌計劃在數周內展開全面推廣。

💼OpenAI 擬以30億美元收購 AI 編程工具 Windsurf

OpenAI正在與AI編程工具Windsurf展開收購談判,預計交易金額約為30億美元。這將是OpenAI最大的一次收購,意味著其在AI開發者工具市場的重要戰略布局。Windsurf作為一款流行的AI編程助手,其代碼生成和解釋功能廣受好評。

💻JetBrains 推出編碼智能體 Junie AI,助力編程與調試新體驗

JetBrains推出了新編碼智能體Junie AI,專注於複雜任務的處理和調試。這標誌著JetBrains在AI工具領域的一項重大進步,該工具支持最新AI模型,並計劃推出免費套餐以吸引更多開發者。

🤖Reachy2開源人形機器人正式開售

Pollen Robotics發布的開源人形機器人Reachy2現已開始銷售,售價7萬美元。其模塊化設計和強大的AI能力改進了人形機器人在研究和教育領域的應用潛力。Reachy2的開源特性和靈活編程支持為開發者提供了廣泛的創新空間。

📚上海人工智能實驗室推出升級版多模態大模型“書生・萬象3.0”

上海人工智能實驗室發布的升級版“書生・萬象3.0”展示了其強大的多模態處理能力,與此同時,模型在性能和用戶體驗上都有顯著提升。該模型的開源策略為開發者提供了全新的平台,鼓勵創新和應用。

🌐豆包深度思考和文生圖3.0模型正式開放API對企業客戶開放

豆包大模型宣布開放API,允許企業和開發者使用其深度思考模型1.5和文生圖模型3.0。在推理和圖像生成任務上的表現卓越,支持企業客戶獲得更高效的AI能力。

總結來看,AI技術的發展正以飛快的速度推動著各個領域的革新,從編碼輔助工具到多模態大模型,每一步都是向未來邁出的重要一步。