QVQ-72B是基於Qwen2-VL-72B訓練的全新視覺推理模型,具備處理圖像與視頻自編碼任務的能力。以下文章介紹了QVQ-72B的特點及其潛在應用場景,並涵蓋AI行業的其他最新動態。
QVQ-72B是基於Qwen2-VL-72B訓練的全新視覺推理模型,具備處理圖像與視頻自編碼任務的能力。在性能評估中,其部分得分甚至可能超過OpenAI o1。不過需注意,目前的評分可信度較低,僅供參考。模型採用高保真視頻編碼技術,大幅提升了重建質量,尤其在細節保留和時序穩定性方面有顯著提高。未來應用場景包括視頻生成、圖像處理等多個領域。
特色亮點:
理想汽車即將推出“理想同學”AI大模型APP,該應用將於12月27日正式上線,旨在將理想汽車的智能體驗延展至手機,成為全能生活助手。此APP具備強大的物體識別和自然語言處理能力,能為用戶提供高效便利的日常解決方案。
Deepseek團隊發布了V3版本,展現出強大的多語言編程能力,性能超越Claude 3.5 Sonnet V2。在aider多語言編程測評中,成功率從17%大幅提升至48%,成為業界導航式應用的標杆之一。
從QVQ-72B到Deepseek V3,AI領域正以跨越式的速度前進,覆蓋範圍從視覺推理到多語言編程模式與實用AI應用,開啟無限未來場景的可能性。