🎥 Midjourney计划推出“文本转视频”模型,扩展AI形象生成器到视频创作领域。
2. Stability AI会关闭。近几个月的人才流失和持续走高的烧钱率使其陷入困境。
斯坦福华人团队开发的炒虾机器人Mobile ALOHA刷屏全网,能完成各种复杂任务,项目成本仅为22万元,全部开源。
根据介绍,该行动计划在2024年底前完成超过8万个重点场所的移动网络深度覆盖,覆盖2.5万公里铁路和35万公里公路以及150条地铁线路。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。