本期 AI 新闻聚焦于多家公司发布的最新 AI 模型及技術創新,這些進展推動了 AI 在圖像生成、視頻創建和語音技術等多個領域的應用。
腾讯于今日宣布推出其混元視頻生成模型,配備了 130 億參數,為當前最大規模的開源视频生成引擎之一。即便在 A100 GPU 上生成 5 秒的視頻,也需要超過 20 分鐘的時間,但是生成效果出色。用戶可以通過元寶 APP 申請試用該模型,適用於廣告和創意視頻等多個商業應用場景。此模型的開源推動了 AI 视频生成技术的民主化,降低技术门槛,鼓励创意与开发者的创新。
Luma Labs 發布了全新圖像生成模型 Luma Photon 和其衍生版本 Photon Flash,此次革命性技術在速度和成本上具有顯著優勢。Luma Photon 能夠以顯著低於市場平均的成本生成高質量圖像,可廣泛應用於广告、影视及艺术创作等领域。该模型在多项测试中表现出色,并支持多轮自然语言指令,允许用户不断优化生成效果,在质量和创意上表现突出,适合复杂的创意任务。
字节跳动旗下的即夢 AI 推出了圖片 2.1 模型,解决了 AI 图像生成中文字体的问题。这项创新令用户能够仅输入文字描述,便快速生成个性化海报,极大提升了设计效率。该模型在广泛的应用场景中,包含海报制作、书籍封面设计和社交媒体配图等,都展现出强大的适应能力。
李飞飞带领的 World Labs 推出了可以从图片生成 3D 世界的模型,这标志着 AIGC 进入全新时代。用户可以通过提供一张图片或一句话,创造灵活的互动 3D 场景,此场景不仅能精细地复刻细节,还可模拟多种相机效果,为用户提供导演般的控制感。
階躍星辰的 Step-Video 模型現已開啟內測階段,允許文本生成分辨率高達 1080P 的視頻,最长可达 10 秒钟。該模型在自動優化提示詞、美學風格、運動控制上表現出色,尤其對中國風題材的理解和生成尤為精確。
快手科技宣布將於 12 月 6 日推出中國首個 AIGC 導演共創計劃“可靈 AI 導演共創計劃”,與 9 位知名導演聯合,涵蓋多元題材。所有短片將由可靈 AI 視頻生成技術完成,標誌著 AI 技術在影视创作中的广泛应用。
上海秘塔网络科技有限公司大幅度升級了其 AI 学术搜索功能,数据量增加了 7 倍,并新增“解釋”功能,帮助用户更好地理解文献中的复杂内容,这将显著提升用户的研究效率。
李飛飛的最新創業項目 World Labs,利用 3D 生成技术仅通过一张图片或一句话,便可创造出互动的 3D 场景,开启 AIGC 交互设计的新篇章。
Hume AI 推出了“语音控制”功能,用户可通过滑块调整声音特征,创造个性化的 AI 声音,且无需编程技能。这一功能支持多维度的声音调整,以满足多样化的应用需求。
Cohere 推出的 Rerank3.5 数据检索模型支持超过 100 种语言的精准查询,尤其实在金融服务领域表现优越,有效地帮助企业节省了搜索时间与成本。
OpenAI CFO Sarah Friar 表示公司目前没有计划引入广告模式,但未来可能会探索其他收入来源。现有商业模式為 OpenAI 的快速增长带来发展机遇。
近日,ChatGPT 提到“David Mayer”时系统会立刻崩溃引发热議。有猜测称,可能涉及法律问题,如 GDPR 的被遗忘权,以及导致其他潜在故障的名称。
WPS Office 引入了一项 AI 语音速记功能,支持实时录音到文字转换,内含多语种翻译和准确的声纹识别,与 WPS 云文档完美结合。这项功能的发布提升了用户的协作和文档处理效率。
本期 AI 新闻展现了AI技术在不同领域的突破与创新,反映出企业在人工智能应用上的进步与多样化的策略,突出其在图像、视频、语音等领域的影响力。