相关文章
追问weekly | 过去两周,AI领域有哪些新突破?
2024-12-25 08:11

量子科技:澳大利亚的高风险赌局,如何找到前进之路?

全球AI新秩序:主要国家签署里程碑式人工智能条约

生成式AI编码初创公司Magic获得3.2亿美元融资

机器人潜入冰下探秘:NASA欲揭开南极融冰之谜

OpenAI的Converge 2计划:神秘加速器,低调却高效

微软高管呼吁:AI聊天机器人也要学会喊"救命"!

Nvidia财报不及预期,但AI经济仍在高歌猛进

OpenAI的百亿美元烦恼:公益还是营利?

█  大模型与基础建设

通向更好AI的漫长道路:多跳问题如何革新语言模型

RAGLAB:用模块化和透明的RAG革命化AI研究

CircuitNet:脑灵感神经网络架构,提升多领域任务性能

量子隧穿神经网络:AI也能看到视错觉?

NVIDIA发布NVEagle:多模态AI模型展现超凡视觉语言能力

谷歌在乌拉圭启动8.5亿美元数据中心建设

用于个性化多模态AI搜索引擎的代理协作网络

机器也有情绪?进化心理学助力AI情感追踪

Plaud NotePin:AI“记忆胶囊”,让你的笔记如虎添翼

1X NEO Beta:AI驱动的未来助手,简化家务生活

革命性的关系抽取:揭示 AgentRE 的突破性影响

类比增强生成:将类比推理转化为程序知识的魔法师

揭开多智能体系统的神秘面纱:深入探讨图注意力推断

Gaussian Splatting技术:Niantic要建3D世界地图

Clockwise推出Prism:AI助手让日程管理更智能

Adobe Workfront大升级:AI助手来助阵,营销团队如虎添翼

Accenture和AWS联合推出工具:助力负责任的AI采用

NVIDIA推出工作流程:让企业自主构建AI解决方案

谷歌AI听诊:通过咳嗽和呼吸声预测疾病

谷歌Gemini升级记:AI绘画新模型、定制聊天机器人齐上阵

亚马逊的 Alexa 升级:Claude LLM 系列带来新时代

█ 交叉与创新

Taptivities:通过互动故事式冥想,挑战社交媒体吸引力

Midjourney硬件野心:AI绘画巨头欲打造VR新体验?

智商决定电脑技能?新研究颠覆传统认知

人本佛教与人工智能的相遇:通往涅槃的天作之合?

GRATR:多人游戏中的可信度推理——AI侦探时刻待命!




加州立法机构近日通过了一项旨在监管强大人工智能模型的法案——"前沿人工智能模型安全创新法案"(SB 1047)。该法案由加州民主党参议员斯科特·威纳发起,旨在在保障AI技术创新的同时,控制其潜在的安全风险。尽管法案面临批评者的质疑,尤其是认为此举可能抑制AI创新,但支持者认为这是平衡技术发展与公众安全的必要举措。


批评者认为,对一个新兴技术领域进行过度监管可能会扼杀创新,尤其是在加州这个科技创新中心。包括美国国会的部分成员在内的反对者提出,这样的法案可能带来负面影响。然而,埃隆·马斯克表达了有限的支持,认为AI的潜在风险使得适度的监管是合理的。


目前,该法案已提交给加州州长加文·纽森等待签署,州长有直到9月30日的时间来决定是否通过该法案。人工智能安全中心主任丹·亨德里克斯表示,该法案在执行缓解关键AI风险方面提供了一个可行的方向。


为确保法案顺利通过,立法者将违规行为的刑事处罚改为民事处罚,如罚款,以减少硅谷企业的反对。尽管如此,反对声音依然存在,包括加州有影响力的政治人物南希·佩洛西。她认为该法案出发点虽好,但在实施上存在问题。与此同时,OpenAI等科技公司则更倾向于全国性的AI监管,而非在各州实行不一致的法规。


值得注意的是,不仅加州,美国其他40多个州也在今年提出了关于AI监管的法案,部分州已通过相关立法。然而,在联邦层面,由于党派分歧和科技公司的强大游说,全面的AI法案是否能在今年通过仍不确定。


量子科技:澳大利亚的高风险赌局,如何找到前进之路?


量子科技正以惊人的速度发展,带来计算、通信和感知方面的巨大潜力。然而,这也是一场高风险的赌局,世界各国在争夺经济、战略和国防优势。澳大利亚近期将量子计算机列入国防和战略物品控制清单,限制出口,凸显了量子科技在战略中的重要性。


AUKUS伙伴关系使得澳大利亚、美国和英国在量子科技领域展开合作,共享研究和专长,并促进投资。然而,澳大利亚在投资中面临争议,尤其是政府对美国公司PsiQuantum的支持,而非本土企业,引发了透明度和国家利益的质疑。


尽管谷歌、IBM等科技巨头是全球量子科技的领导者,澳大利亚也有几家知名企业,如Quantum Brilliance、Silicon Quantum Computing等,积极参与这一领域。2023年,澳大利亚政府发布了国家量子战略,但如何具体实施仍不清晰。


相比之下,欧洲、美国和英国采用了更为协调的合作机制,如欧洲的量子旗舰项目和美国的QED-C联盟。为解决澳大利亚量子科技发展的分歧,研究者提出量子科技协定,这一协定可以作为一个结构化且正式的机制,协调政府、企业和学术界的利益。


全球AI新秩序:主要国家签署里程碑式人工智能条约


人工智能(AI)正以惊人的速度发展,影响力已深刻渗透到社会的各个领域。为了确保AI的发展有益于人类,近日,美国、英国、欧盟等主要国家和地区签署了一项具有里程碑意义的全球AI条约。这一条约标志着国际社会在AI治理方面达成了重要共识,为AI的未来发展提供了方向。


该AI条约涉及多个关键领域,包括确保AI系统的安全性、可靠性和透明度,防止AI被滥用于危害人类利益的用途,保护个人隐私和数据安全,以及推动AI在医疗、教育、环保等重要领域的应用。条约还强调加强国际合作,促进技术和资源的共享,签约各方承诺通过定期的高层对话,共同应对AI带来的机遇与挑战。


目前,AI已经成为大国竞争的新战场。美国和中国在AI领域居于领先地位,而欧盟、英国、日本等国家也在加紧布局。此次条约的签署,意味着西方阵营在AI治理方面建立了统一战线,预计将对全球AI格局产生深远影响。然而,AI的发展不应是零和博弈。各国应在竞争中合作,共同推动AI造福全人类。


生成式AI编码初创公司Magic获得3.2亿美元融资,瞄准软件开发自动化


生成式AI领域的初创公司Magic近日获得了3.2亿美元融资,这笔资金来自前谷歌CEO埃里克·施密特、Alphabet的CapitalG、Atlassian等知名投资者,使Magic的总融资额达到4.65亿美元,标志着其在AI编码自动化领域的重要地位。投资者们对Magic的未来充满信心,认为其在软件开发自动化方面的创新将释放巨大市场潜力。


Magic的核心技术之一是其LTM-2-mini模型,这一模型拥有处理100万个token的上下文窗口能力,相当于大约1000万行代码或750本小说。相比之下,谷歌的Gemini模型上下文窗口仅为200万个token。LTM-2-mini在HashHopbenchmark测试中展现了其卓越的性能,这一benchmark专门用于评估模型处理随机和不可压缩hash对的能力。


此外,Magic还宣布与Google Cloud合作,计划在其平台上建造两台超级计算机——Magic-G4和Magic-G5,分别采用Nvidia H100 GPU和下一代Blackwell芯片。这些超级计算机预计将达到160 exaflops的计算能力,大幅提升Magic模型的训练和推理效率。


Magic的创始人Eric Steinberger和Sebastian De Ro都有着丰富的AI研究背景,Steinberger自高中时期便开始探索AI,并在加入meta之前就已展现了非凡的天赋。Magic的工具旨在通过AI驱动的自动化解决方案帮助软件工程师完成代码编写、审查和调试任务,目标是未来开发出一种超越人类的通用人工智能(AGI)。


尽管面临着安全和版权等挑战,Magic的技术突破与长期愿景使其在竞争激烈的AI领域中脱颖而出。根据Polaris Research的预测,Magic所瞄准的自动化软件开发市场在2032年可能达到271.7亿美元。


机器人潜入冰下探秘:NASA欲揭开南极融冰之谜


NASA喷气推进实验室(JPL)的工程师们近期在阿拉斯加北部的博福特海成功进行了“冰节点”(IceNode)项目的实验,标志着该项目迈出了重要一步。工程师们将一个圆柱形机器人潜入冰层下的冰冷海水中,收集测试数据,为研究南极冰盖融化提供技术支持。


南极冰盖的融化对全球海平面的上升有着重大影响,若完全融化,海平面可能上升约60米。然而,科学家对冰盖的融化速度,尤其是冰架下方“接地区”的情况知之甚少。该区域是浮冰架、海洋与陆地的交汇处,可能是冰盖融化速度最快的地方。由于传统卫星观测无法穿透厚厚的冰层,而冰面上的环境对人类过于危险,IceNode项目应运而生。


IceNode项目旨在通过一支自主机器人大军来解决这一问题。这些机器人利用海洋洋流和自主定位软件进行导航,无需推进装置。它们将通过钻孔或开阔海域释放,随洋流漂流至冰架下方,利用传感器收集有关海水循环的关键数据,包括温暖咸水的上升和冷淡水的下沉速度。任务结束后,机器人会从冰层底部脱离,漂回开阔海域并通过卫星传输数据。


2024年3月,在博福特海的实验标志着IceNode项目首次进行极地测试。尽管面临零下45摄氏度的恶劣环境,机器人原型成功下潜100米,收集了重要的盐度、温度和水流数据,为未来南极冰架下的全面部署打下了基础。IceNode项目的进展为揭开南极融冰之谜带来了新希望,也为人类探索地球最难到达的区域开辟了新途径。


OpenAI的Converge 2计划:神秘加速器,低调却高效


OpenAI的Converge 2加速器计划自宣布以来,一直笼罩在神秘之中,引发了广泛的猜测和讨论。最初,Converge计划于2022年12月启动,为期六周,旨在支持利用人工智能进行创新的初创企业。第一期计划结束后,公开宣布了四家公司获得了投资。然而,自Converge 2计划于2023年12月宣布启动以来,相关信息变得稀缺,外界几乎无法得知参与公司或进展情况。


Converge 2计划低调的运作方式令人疑惑,尤其是在通常高调的硅谷创业环境中,类似加速器项目往往通过广泛宣传来为参与公司争取更多曝光。然而,OpenAI似乎选择了相反的策略。有消息称,该计划确实在内部进行了运作,参与公司获得了OpenAI Startup Fund提供的100万美元投资,并有机会与OpenAI的研究人员和未发布的AI模型技术互动。


关于Converge 2的低调运作,业内推测参与公司可能签署了严格的非披露协议(NDA),这也是为何几乎没有公开消息的原因之一。尽管如此,OpenAI的投资活动并未停滞。自2024年1月以来,OpenAI Startup Fund已投资了多家新公司,包括Heeyo、Thrive AI Health、New Computer和Ambience Healthcare。


微软高管呼吁:AI聊天机器人也要学会喊"救命"!


微软副总裁维克·辛格近日在接受采访时表示,尽管生成式AI工具在提高企业效率方面具有显著优势,但AI模型在不知所措时应该学会求助。辛格指出,当前的生成式AI应用,如ChatGPT,虽然能按需生成内容,但当AI无法确定答案时,往往不会“举手求助”,这是一个亟需解决的问题。


随着微软和谷歌等公司快速部署这些生成式AI应用,虽然它们表现出强大的功能,但仍然存在“幻觉”或编造答案的风险。对于企业客户,AI系统的不准确性带来的代价是无法承受的。辛格强调,AI应在不确定时寻求人类帮助,这不仅能节省企业成本,还能提高客户体验。


在微软的Copilot团队中,AI工具已经帮助某些企业显著减少开支。例如,电信公司Lumen通过AI系统每年节省约5000万美元。辛格的团队还在努力将Copilot更加自主地集成到微软的软件中,以便更高效地处理日常任务,如提醒销售人员跟进客户或自动发送批准的邮件。



据消息人士透露,苹果和英伟达正在考虑参与OpenAI的新一轮融资,这可能将OpenAI的估值推高至1000亿美元以上。此次融资由Thrive Capital领投,预计投资10亿美元,微软作为OpenAI的主要投资者也可能增持股份。自2019年以来,微软已投资OpenAI 130亿美元,主要通过云基础设施支持。


苹果的投资兴趣紧随其与OpenAI的合作消息之后。苹果计划将ChatGPT技术集成到其即将推出的Apple Intelligence功能中,尤其是增强Siri的能力,让其可以处理更复杂的用户请求。同时,ChatGPT还将为苹果的Writing Tools提供支持,使用户能够校对、改写和总结文本输入。


另一方面,英伟达作为AI芯片巨头,已在多个大型语言模型(LLM)开发商中投资,并支持了Cohere Inc.和Mistral AI等企业。英伟达通过其NIM容器格式优化了这些公司的模型,帮助其在英伟达显卡上更高效地运行。


尽管英伟达与OpenAI的合作具有潜力,OpenAI仍可能寻求减少对英伟达芯片的依赖。最近的传言表明,OpenAI正在与博通和其他半导体供应商商谈设计定制的机器学习加速器,以期在未来自研AI硬件。


Nvidia财报不及预期,但AI经济仍在高歌猛进


尽管Nvidia的最新财报未达到市场的高额预期,但这家芯片巨头在人工智能领域的表现依然强劲。作为AI经济的关键指标,Nvidia的业绩虽然略显失望,却仍显示出持续增长的潜力。第二财季Nvidia的营收达到了300亿美元,同比增长122%,净利润更是增长了229%,达66亿美元,数据中心业务营收同比增长171%,达到158亿美元。然而,虽然这些数字亮眼,但与市场预期的320亿美元营收相比,未来的第三财季预估310亿美元的收入显得略为逊色。


与此同时,AI领域的投资热潮并未放缓。OpenAI报告称,ChatGPT已拥有每周2亿用户,并正以1000亿美元的估值从Nvidia和苹果等公司获得巨额融资。此外,像编程助手等具有明确回报的项目继续吸引大量资金,meta的Llama模型下载量也已突破3.5亿次。


然而,投资者的担忧并非毫无根据。随着Cerebras、IBM和AMD等竞争对手的强势发力,Nvidia的领先地位面临挑战。Cerebras推出了新的推理服务,IBM在其云服务中引入了英特尔的Gaudi芯片,AMD则收购了ZT Systems,显示出这些公司都在抢占AI市场的份额。


Nvidia在AI领域的主导地位仍然稳固,但未来充满不确定性。分析师提醒,AI热潮可能正在接近顶点,投资者对Nvidia的期望可能过高。在AI经济的激烈竞争中,Nvidia需要继续保持创新,同时应对来自多方的压力。


OpenAI的百亿美元烦恼:公益还是营利?


OpenAI,这个以开发“安全通用人工智能”为使命的组织,正面临着一个关乎未来发展的重大抉择:是继续坚持初心,还是向资本低头?据知情人士透露,OpenAI正在考虑改变公司结构,以吸引更多投资者。该公司正在筹集数十亿美元的新融资,估值或超过1000亿美元。微软、英伟达和苹果等科技巨头都有可能参与其中。然而,百亿美元的融资对OpenAI来说,可能既是机遇也是挑战。


最初,OpenAI成立时定位为开发开源AI模型的非营利组织,但在2019年,它成立了营利性子公司,专注于AI的商业化开发,这一决定引发了争议。联合创始人马斯克指责OpenAI背离了最初的使命,称其从“真正的非营利组织”变成了“典型的科技创业公司”。对此,OpenAI反驳称,非营利性依然是其核心使命。


OpenAI的当前结构试图在营利与安全之间取得平衡,其营利性子公司对投资者和员工的回报设有上限,投资者甚至需签署合同,视对OpenAI的投资为一种捐赠。然而,随着融资规模的增加,OpenAI正在考虑取消这一限制,甚至计划重新注册为普通公司,为未来的IPO做准备。


尽管这一转变可能为微软等早期投资者带来机会,但也意味着OpenAI可能陷入“科技创业公司”的常规运营模式。尽管其非营利性使命仍在,但在资本推动下,OpenAI能否坚持初心,还有待时间的检验。这一挑战不仅关乎OpenAI本身,更是整个AI行业在商业利益和社会责任之间寻找平衡的关键课题。


大模型与基础建设


通向更好AI的漫长道路:多跳问题如何革新语言模型


在人工智能领域,研究人员不断寻求使语言模型更聪明、更高效的方法,以应对日益复杂的任务。一篇题为《在构建有效的长上下文多跳指令数据集时,关键因素是什么?洞察与最佳实践》的论文提出了一种有前景的解决方案,可能会彻底改变我们训练和使用大型语言模型(LLMs)的方式。


多跳推理的核心是让AI能够像侦探夏洛克·福尔摩斯一样,从不同的来源拼凑线索来解决复杂问题。这种多步骤推理方法使LLM变得更强大,研究人员为此开发了一个名为多代理互动多跳生成(MIMG)的框架,专注于教AI如何处理复杂的推理任务。这不仅提升了AI的智能,还让它更接近人类的思维方式。


MIMG框架的成功离不开以下几个关键组件:

2. 单跳问题生成代理:创建简单问题并将其组合成复杂的多跳问题。

4. 多跳问题合并代理:将单跳问题整合为多步骤的复杂问题。


这一研究具有广泛的实际应用意义:它显著增强了AI解决复杂问题的能力,通过多跳问题训练,AI能够从多个来源综合信息。MIMG框架提高了训练数据的质量,85%以上的生成样本达到高标准。研究发现,这种框架下的合成数据优于传统大量人工标注的数据,减少了对人工标注的依赖,具备更高的成本效益。MIMG框架跨领域适用,从金融到医学等多个领域展示了其灵活性和适应性。


RAGLAB:用模块化和透明的Retrieval-Augmented Generation(RAG)革命化AI研究


在人工智能领域,RAGLAB作为一个模块化、研究导向的框架,正在革新Retrieval-Augmented Generation(RAG)算法的开发和研究。RAGLAB不仅是AI工具箱中的一部分,更像是一把瑞士军刀,帮助研究人员更清晰地应对RAG算法的复杂性。


RAGLAB旨在解决两个主要问题:一是新型RAG算法缺乏全面、公平的比较,二是现有工具如LlamaIndex和LangChain在高级抽象上的局限性。RAGLAB通过模块化设计让不同RAG算法的集成和比较更加容易,使得研究人员可以专注于新算法的开发,而无需重新构建整个系统。该框架还复现了六种现有的RAG算法,提供了一个完整的生态系统,使得在各种基准上进行公平比较成为可能。


与其他工具相比,RAGLAB的透明性和灵活性尤为突出。它不仅方便研究人员理解和修改现有算法,还鼓励开发新的算法。这种灵活性显著提高了用户体验,研究人员可以根据自己的需求轻松调整框架,减少了实验设置的时间和精力。


RAGLAB的推出将对自然语言处理(NLP)领域以及更广泛的AI行业产生深远影响。它通过模块化和透明的设计,加速了RAG算法的创新,并且提高了研究效率。RAGLAB还鼓励开源社区的合作,推动NLP任务如问答系统、文本生成和对话系统中的技术进步。


CircuitNet:脑灵感神经网络架构,提升多领域任务性能


在人工智能领域,研究人员不断探索更高效、灵活的神经网络架构。最近,一项名为CircuitNet的研究成果备受瞩目。CircuitNet是一种脑灵感神经网络架构,旨在通过模拟大脑神经回路的方式,提升多领域任务的性能。


传统的神经网络在处理多种任务时尽管表现出色,但通常需要大量的数据和计算资源,且在不同领域之间的迁移能力有限。为了解决这些问题,CircuitNet从大脑中的神经元连接方式汲取灵感,设计了灵活适应的动态连接网络。其神经元模拟了大脑中的神经元,能够根据任务需求动态调整连接,同时采用多层次结构以应对复杂数据。


技术上,CircuitNet展现了跨领域的卓越性能。在图像识别中,它的表现与先进模型相媲美;在自然语言处理任务中,CircuitNet能够处理复杂的文本数据;在游戏和控制领域,它展现了快速学习与适应新环境的能力。此外,实验表明CircuitNet在数据和计算效率上具有优势,能够在较少数据和有限资源的情况下保持高性能,并在不同领域之间具备较强的迁移学习能力。


量子隧穿神经网络:AI也能看到视错觉?


在最新发表的《APL机器学习》研究中,研究人员设计了一种基于“量子隧穿”现象的神经网络,能够以与人类相似的方式识别视错觉。该神经网络在处理经典视错觉如内克尔立方体和鲁宾花瓶时表现优异,甚至超过了传统的计算机视觉神经网络。这项研究为AI是否能实现类似人类认知的能力提供了新的思路。


视错觉是一种能够欺骗大脑的现象,我们至今无法完全理解其工作原理。研究人员发现,虽然AI能够识别复杂物体,但对视错觉的理解仍存在难题。通过引入量子物理中的“量子隧穿”效应,这一问题得到了突破。量子隧穿使神经元能够越过看似无法逾越的障碍,从而被激活,这与经典物理的限制有所不同。


在量子隧穿神经网络中,当输入视错觉时,神经网络会在两种解释之间振荡,模拟人类大脑的动态处理过程。例如,当看到内克尔立方体或鲁宾花瓶时,传统神经网络仅会给出一个固定的答案,而量子隧穿网络则能同时保持两种解释,并在其间徘徊。这种结果展示了AI在模仿人类认知方面的潜力。


NVIDIA发布NVEagle:多模态AI模型展现超凡视觉语言能力


NVIDIA再次展示其在人工智能领域的技术实力,推出了全新的多模态AI模型NVEagle。这款模型具备强大的视觉语言处理能力,并提供了三个不同版本,分别为7B、13B和13B-Chat,适应从资源有限的移动设备到大型服务器的不同场景。7B版本适合资源受限的应用,13B则具备更强的处理能力,而13B-Chat版本在此基础上进行了对话场景的微调。


NVEagle的核心亮点在于其卓越的多模态理解和生成能力,能够同时处理图像与文本,并对复杂场景和关系进行上下文感知。这使得NVEagle在多个应用场景中具备广泛的潜力,从智能助手到内容创作,再到医疗影像分析,都能展现出色表现。尤其在视觉问答和图像描述生成任务中,NVEagle的表现超越了多款知名模型,展现出高度的准确性与创造性。


技术方面,NVEagle得益于NVIDIA的Transformer架构、预训练策略及CUDA加速技术,充分利用了NVIDIA GPU的并行计算能力。此外,NVIDIA为开发者提供了丰富的开发工具和资源,包括API支持、模型优化和详细的文档示例,大幅提升开发效率。



谷歌最近宣布将在乌拉圭建设一座价值8.5亿美元的数据中心,标志着其在拉丁美洲的扩张。这一项目不仅为谷歌的全球数据中心网络增添了新的节点,也为云计算和数字化转型提供了强大的基础设施支持。


谷歌在全球范围内拥有广泛的数据中心网络,这些设施是谷歌云服务的核心支柱,支持从Google搜索到YouTube等服务。此次乌拉圭数据中心的建设,进一步增强了谷歌对南美市场的覆盖和支持能力。该项目占地约100公顷,预计将在建设和运营阶段创造约1,000个就业机会,同时带动相关产业的发展。


该数据中心采用先进的绿色技术,包括可再生能源、节水系统和高效冷却系统,确保其运行过程中的碳排放为零。谷歌承诺,这座数据中心将100%依赖可再生能源,以实现可持续发展的目标。


    以上就是本篇文章【追问weekly | 过去两周,AI领域有哪些新突破?】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/quote/10442.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站http://ww.kub2b.com/mobile/,查看更多   
发表评论
0评