2024 年 12 月 3 日 AI 新闻更新

#AI #科技新聞 #創新科技

本期 AI 新闻聚焦于多家公司发布的最新 AI 模型及技術創新,這些進展推動了 AI 在圖像生成、視頻創建和語音技術等多個領域的應用。

🌐 腾讯開源混元視頻模型

腾讯于今日宣布推出其混元視頻生成模型,配備了 130 億參數,為當前最大規模的開源视频生成引擎之一。即便在 A100 GPU 上生成 5 秒的視頻,也需要超過 20 分鐘的時間,但是生成效果出色。用戶可以通過元寶 APP 申請試用該模型,適用於廣告和創意視頻等多個商業應用場景。此模型的開源推動了 AI 视频生成技术的民主化,降低技术门槛,鼓励创意与开发者的创新。

🔎 Luma 發布文生圖模型:Luma Photon

Luma Labs 發布了全新圖像生成模型 Luma Photon 和其衍生版本 Photon Flash,此次革命性技術在速度和成本上具有顯著優勢。Luma Photon 能夠以顯著低於市場平均的成本生成高質量圖像,可廣泛應用於广告、影视及艺术创作等领域。该模型在多项测试中表现出色,并支持多轮自然语言指令,允许用户不断优化生成效果,在质量和创意上表现突出,适合复杂的创意任务。

🖌 即夢 2.1 支持寫中文

字节跳动旗下的即夢 AI 推出了圖片 2.1 模型,解决了 AI 图像生成中文字体的问题。这项创新令用户能够仅输入文字描述,便快速生成个性化海报,极大提升了设计效率。该模型在广泛的应用场景中,包含海报制作、书籍封面设计和社交媒体配图等,都展现出强大的适应能力。

🖼 World Labs 發布圖片生成 3D 世界模型

李飞飞带领的 World Labs 推出了可以从图片生成 3D 世界的模型,这标志着 AIGC 进入全新时代。用户可以通过提供一张图片或一句话,创造灵活的互动 3D 场景,此场景不仅能精细地复刻细节,还可模拟多种相机效果,为用户提供导演般的控制感。

🎥 階躍星辰视频生成大模型 Step-Video 開啟內測

階躍星辰的 Step-Video 模型現已開啟內測階段,允許文本生成分辨率高達 1080P 的視頻,最长可达 10 秒钟。該模型在自動優化提示詞、美學風格、運動控制上表現出色,尤其對中國風題材的理解和生成尤為精確。

🎬 可靈 AI 導演共創計劃作品即將上線

快手科技宣布將於 12 月 6 日推出中國首個 AIGC 導演共創計劃“可靈 AI 導演共創計劃”,與 9 位知名導演聯合,涵蓋多元題材。所有短片將由可靈 AI 視頻生成技術完成,標誌著 AI 技術在影视创作中的广泛应用。

📚 秘塔 AI 搜索功能升級

上海秘塔网络科技有限公司大幅度升級了其 AI 学术搜索功能,数据量增加了 7 倍,并新增“解釋”功能,帮助用户更好地理解文献中的复杂内容,这将显著提升用户的研究效率。

🕹 李飛飛創業首秀:交互式 3D 世界生成

李飛飛的最新創業項目 World Labs,利用 3D 生成技术仅通过一张图片或一句话,便可创造出互动的 3D 场景,开启 AIGC 交互设计的新篇章。

🔊 Hume AI 推出个性化语音生成功能

Hume AI 推出了“语音控制”功能,用户可通过滑块调整声音特征,创造个性化的 AI 声音,且无需编程技能。这一功能支持多维度的声音调整,以满足多样化的应用需求。

🔍 Cohere 推出 Rerank3.5 搜索模型

Cohere 推出的 Rerank3.5 数据检索模型支持超过 100 种语言的精准查询,尤其实在金融服务领域表现优越,有效地帮助企业节省了搜索时间与成本。

📰 OpenAI CFO 回應广告傳闻

OpenAI CFO Sarah Friar 表示公司目前没有计划引入广告模式,但未来可能会探索其他收入来源。现有商业模式為 OpenAI 的快速增长带来发展机遇。

🚫 神秘詞“David Mayer”引起 ChatGPT 故障

近日,ChatGPT 提到“David Mayer”时系统会立刻崩溃引发热議。有猜测称,可能涉及法律问题,如 GDPR 的被遗忘权,以及导致其他潜在故障的名称。

🗣 WPS Office 推出 AI 语音速记功能

WPS Office 引入了一项 AI 语音速记功能,支持实时录音到文字转换,内含多语种翻译和准确的声纹识别,与 WPS 云文档完美结合。这项功能的发布提升了用户的协作和文档处理效率。

本期 AI 新闻展现了AI技术在不同领域的突破与创新,反映出企业在人工智能应用上的进步与多样化的策略,突出其在图像、视频、语音等领域的影响力。