OPenAI泄露GPT4.5信息：新模型支持AI视频和3D

2023年12月21日

Twitter（X）上关于GPT4.5的一些泄露信息：

最先进的模型带来了跨语言、音频、视觉、视频和 3D 的多模态功能，以及复杂的推理和跨模态理解。
新型号：
• GPT-4.5
• GPT-4.5-64k
• GPT-4.5-音频和语音

巧合的是，关于谷歌新的AI视频生成大模型的消息也在互联网上流传。这意味着，在AI生成图片的功能取得快速进步之后，AI音视频领域的竞争，尤其是生成AI视频的竞争会越来越激烈。这对PIKA、Runway这样的初创公司而言并非好的消息。因为OpenAI和Google这样的巨头带着巨大的投入、完善的产品链、雄厚的技术底蕴杀入AI视频市场，会直接拉高竞争激烈度。

可以预见的是在明年，仅仅产生几秒钟小动画的视频生成技术将面临被淘汰的风险。需要复杂使用技巧，众多参数才能驾驭的AI图片、视频生成技术，除非有非常高的质量优势，否则会很快被淹没在通用聊天机器人的整合功能之中。

现在OpenAI的绘图功能，已经成为很多非专业人士的重要工作助手，能够满足大量的非专业需求。我们可以期待一下，明年的GPT4.5或者5.0，会给我们带来巨大的震撼，让我们在视频创作领域，可以真正用上AI，而不是现在这样，用几秒钟的DEMO抓抓眼球。

标签

2023年12月21日

相关文章

人工智能的双面效应：深度探讨AI的积极与负面影响

AI在艺术和创意产业的应用：引领创新与创作的新浪潮

Stable Video Diffusion VS Pika

AI危机：心理咨询师会被AI取代吗？