发布日期:2023.12.29
AI大模型DiffPortrait3D:通过一张肖像图就能创作3D表情_小熊AI网
主要内容:DiffPortrait3D是字节跳动团队开发的条件扩散模型,通过零样本方法,DiffPortrait3D能够从单一肖像生成3D一致的新视图,支持不规定相机视角、极端面部表情和多样艺术描绘,无需繁琐微调。引入条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,确保在合成图像中保持面部特征一致性,经过多视角和野外基准测试展现出逼真高质量的3D面部重建。
发布日期:2023.12.29
Spiritme AI:手机拍5分钟视频即可克隆一个虚拟的你
主要内容:利用Spiritme AI,只需用iPhone拍摄5分钟视频,即可捕捉外貌和动作,克隆虚拟形象,无需表演经验。Spiritme AI允许用户输入文本,自动生成虚拟形象演说该文本的视频,实现自然的表情展示。支持自动编写视频对话或旁白,根据用户提供的信息,简化视频制作过程,只需两次点击操作。
发布日期:2023.12.29
雷鸟X2上线自研大模型语音助手RayNeo AI,实现数字世界无感赋能_Rayneo_眼镜_用户
主要内容:雷鸟创新正式发布了大模型语音助手Rayneo AI(beta 版),并首次在雷鸟 X2消费级真AR眼镜内测上线。Rayneo AI基于雷鸟创新的自研AI大模型中控平台,具备多轮自然语言对话、行程规划、便捷百科问答、头脑风暴等多项能力。
配合雷鸟 X2真AR眼镜,Rayneo AI以更自然、智能和无感的方式为用户提供能力延伸。未来,Rayneo AI将引入视觉理解能力,拓展多模态信息交互和不同场景的运用。
发布日期:2023.12.29
字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对-51CTO.COM
主要内容:最近,ByteDance Research团队提出了一种名为GR-1的机器人操作模型,该模型通过大规模的视频生成式预训练,大幅提升了机器人端到端多任务操作方面的性能和泛化能力。在极具挑战性的CALVIN机器人操作仿真数据集上,GR-1在多任务学习、零样本场景迁移、少量数据和零样本语言指令迁移等方面取得了最新的成果。实验证明,GR-1在未见过的场景和物体的表现也大幅领先现有方法。
发布日期:2023.12.29
ChatGPT个性化重磅升级,内部代号Sunshine曝出!明年晋升超智能个人助理
主要内容:OpenAI正在开发让ChatGPT更具「个性化」的新功能,包括更连贯的对话、不断改进和自定义记忆。此外,OpenAI还计划推出「临时聊天」功能,该功能将信息仅在当前的聊天窗口中使用,不会被保存在聊天历史中。这些新功能将在GPT商店中展示,并为用户提供更多选择。
发布日期:2023.12.29
OpenAI员工:未来的关键技能不是提示工程,而是与人类沟通的能力