AI技术
OPenAI泄露GPT4.5信息:新模型支持AI视频和3D
Twitter(X)上关于GPT4.5的一些泄露信息:
最先进的模型带来了跨语言、音频、视觉、视频和 3D 的多模态功能,以及复杂的推理和跨模态理解。
新型号:
• GPT-4.5
• GPT-4.5-64k
• GPT-4.5-音频和语音
巧合的是,关于谷歌新的AI视频生成大模型的消息也在互联网上流传。这意味着,在AI生成图片的功能取得快速进步之后,AI音视频领域的竞争,尤其是生成AI视频的竞争会越来越激烈。这对PIKA、Runway这样的初创公司而言并非好的消息。因为OpenAI和Google这样的巨头带着巨大的投入、完善的产品链、雄厚的技术底蕴杀入AI视频市场,会直接拉高竞争激烈度。
可以预见的是在明年,仅仅产生几秒钟小动画的视频生成技术将面临被淘汰的风险。需要复杂使用技巧,众多参数才能驾驭的AI图片、视频生成技术,除非有非常高的质量优势,否则会很快被淹没在通用聊天机器人的整合功能之中。
现在OpenAI的绘图功能,已经成为很多非专业人士的重要工作助手,能够满足大量的非专业需求。我们可以期待一下,明年的GPT4.5或者5.0,会给我们带来巨大的震撼,让我们在视频创作领域,可以真正用上AI,而不是现在这样,用几秒钟的DEMO抓抓眼球。