今天的AI新聞聚焦多個前沿技術與創新應用,以下是詳情:
Meta近日發表了一篇名為「Byte Latent Transformer」的研究論文,提出了基於字節(Byte)而非通常使用的標記(Token)來訓練大型語言模型(LLM)的新方法。這種方法顯著提升了模型的推理效率與魯棒性,為AI推理能力的提升提供了新思路。
ControlNet作者lllyasviel推出了新項目LuminaBrush,其功能猶如IC-Light的升級版。用戶僅需在圖片上畫出兩種顏色的標記即可自由調整圖片的光照效果,展現畫面更嶄新的美學效果。
「DisPose」是一個能夠實現人物動畫化的AI工具。它類似於阿里巴巴的「AnimateAnyone」。用戶只需輸入動作視頻和參考人物,系統就能讓參考人物實現視頻中的動作。
「InvSR」是一款對圖片進行超分辨率處理的工具,其基於Diffusion(擴散模型)的反向推理技術,有助於提升圖像清晰度,演示效果頗具實用性。
X AI正在快速進行大模型開發,其Grok應用程序在有限的區域內開放下載。據悉,該公司擁有十萬卡的大型計算集群,並已研發出專有的大型語言模型和AI繪畫模型,後續有望加速追趕競爭對手。
OpenAI推出的o3 Model為AI推理展開新突破,特別是在數學推理任務中,其輸出準確度破新高。
從新技術的突破到創新產品的誕生,AI領域在不斷推進,人類期待著下一步的重大進展。