以下為今日人工智能領域的最新動態,涵蓋技術創新、產業動態及應用發展,內容詳盡且結構清晰,歡迎閱讀。
olmOCR是一款基於微調後的7B視覺語言模型設計的開源光學字符識別工具。該模型經過260,000頁PDF文檔的微調訓練,支持文本提取、表格處理以及手寫識別功能,具有高效、多樣化的應用場景。用戶可以選擇在線使用或在本地使用GPU進行部署以提高運行效率。
PhotoDoodle是一款創意工具,能夠僅通過文字提示在照片中添加涂鸦元素,實現虛實結合的視覺效果。用戶可以簡單輸入描述,直觀生成酷炫的創作成果,更適合藝術愛好者與內容創作者。
RAG是基於DeepSeek R1開源技術的一項前沿研究,可顯著提升檢索增強式生成技術的效率。該框架有效支持大語言模型在推理過程中的高效數據調用,對於開發者具有重要應用價值。
Scribe由ElevenLabs推出,被譽為當前準確率最高的自動語音識別(ASR)模型。該模型結合最新科技,有助於提升多語言語音轉換的準確性與實用性,廣泛應用於內容創作與智能助手領域。
2025年3月3日,字節跳動推出Trae國內版,這是一款集成最新「Doubao-1.5-pro」技術的AI原生集成開發環境(IDE)。Trae支援自然語言描述生成應用程式,可顯著加速開發過程,並通過動態協作模式提供高效的多場景智能支持。
資深域名經紀人拉里·菲舍爾宣布出售域名ai.com,報價高達1億美元,若成交將成為域名交易史上最貴的記錄。目前該域名的擁有者保持匿名,市場潛在買家包括OpenAI、微軟、谷歌等科技巨頭。
科大訊飛的星火深度推理模型X1已完成全面升級。更新後的模型顯著提升了在數學競賽題目、醫療診斷、教育輔助等多領域的表現,展示了國產大模型技術的強大潛力。
2025年第一季度,中國AI技術進一步逼近全球頂尖水準。中國AI實驗室出色的開源成就,結合本地科技公司(如阿里巴巴、百度)的新模型,表現出驚人的技術適應力與創新潛力。
阿里巴巴推出的萬相2.1版本成為開源社區的熱門模型,在發布僅6天後GitHub的Star數即突破6000,成為全球最受歡迎的大語言模型之一。
Flora的“無限畫布”工具針對文本、影像及多媒體創作,希望為專業創作者提供綜合性、智能化的解決方案。平台提供免費版及16美元的專業版服務。
百度文庫與百度網盤合作推出AI創作平台「自由畫布」,幫助用戶構建多格式的設計流程,並支持AI標註與敏感數據存儲功能。
智譜AI宣布完成超10億元的戰略融資,未來將藉此資金支持GLM模型的升級與開源計劃。
詳細更新,歡迎瀏覽 [AIBase]!