最新AI與技術動態

此文章介紹了多家企業及機構最新發布的AI技術及工具,涵蓋了從OpenAI到谷歌的新探索,展示了AI技術在生活各方面的應用與潛在問題。

🚀 OpenAI o1正式版發布

OpenAI發布了o1正式版,新增了讀取圖片和文件的功能。同時,還推出了每月200美元的Pro會員服務,使用者可以體驗到思考深度更深的o1 Pro模式,且不限量使用。然而,這個模式通常並不是普通使用者所需要的。

📷 PaliGemma 2:谷歌開源視覺模型

谷歌推出了PaliGemma 2,這是一個開源的視覺模型,具有3B、10B和28B三種不同規模。這個模型不僅能描述圖片,還具備識別公式、樂譜等多種能力。

🎨 TRELLIS:微軟開源圖片生成3D模型

微軟推出的TRELLIS是一款開源的圖片生成3D模型工具,效果超出預期。在生成複雜模型方面表現出色,未來可能實現一鍵生成手辦。

🔊 ClearerVoice-Studio:開源語音處理工具

由阿里通義團隊開發的ClearerVoice-Studio是一個開源且可商用的語音處理工具,支持語音降噪和分離,以及視頻中的語音人物識別。

🤖 谷歌發布PaliGemma 2:AI能讀懂情緒?

谷歌發布的PaliGemma 2引發了學術界對其科學性和倫理風險的討論。儘管該模型能分析影像識別情緒,但專家質疑其科學基礎和潛在偏見,認為可能對社會產生負面影響。

💬 開源語音處理技術:ClearerVoice-Studio

阿里巴巴達摩院的ClearerVoice-Studio能夠顯著降低背景噪音,提高語音清晰度。該技術集成了多種功能,使用者可以線上體驗其降噪效果。

🎨 昆侖萬維天工AI發布“AI彩頁”功能

天工AI的新功能,AI彩頁,為使用者提供了強大的編輯器和主題選擇,提升了知識型內容的呈現效果。AI技術使得內容生成更加高效便捷。

🚀 OpenAI推出ChatGPT Pro,每月200美元

OpenAI發布o1正式版,與此同時推出了ChatGPT Pro訂閱服務。o1模型在多個領域的表現更佳,新增的圖片輸入功能增強了使用者體驗。

💸 馬斯克的xAI籌集60億美元融資

xAI公司成功籌集了60億美元融資,現估值已超過400億美元。公司計畫擴展並推出新的AI產品。

🖥️ Humane發布CosmOS操作系統

Humane最新發佈的CosmOS操作系統引入了智能代理協作功能,顛覆了傳統人機互動方式。該系統提供個性化服務,還確保數據的隱私和安全。

⚠️ ComfyUI插件安全隱患

ComfyUI的Impact-Pack插件被發現內含加密貨幣挖礦病毒,用戶需立即卸載進行安全掃描。

🔍 京東發布10大AI行銷工具

京東雲的新行銷平台推出了基於大模型的AI工具,服務超80萬商家,有效提高了內容轉化率和生成效率。

🌐 蘋果iOS18.2RC更新:Siri接入ChatGPT

蘋果推出iOS18.2RC版本,新增了多項智能功能,包括視覺智能和Siri整合ChatGPT來提升問答能力,並計畫推出多語言版本。

這些技術創新展示了AI應用的廣泛性和潛力,同時亦需要警惕潛在的倫理和安全問題。