NIST宣布新举措,旨在创建可检测AI 生成内容的系统
谷歌、微软和 OpenAI 的领导者加入联邦人工智能安全委员会
白宫斥资 2.85 亿美元用于数字孪生研发
英国在贝尔法斯特启动以行业为重点的数字孪生中心
█ 大模型与基础建设
Oracle推出全新矢量搜索数据库
Prometheus 2挑战GPT-4,引领开源模型评估革命
聊天机器人的新技能:用贝叶斯优化读懂你的心
精简参数,提升灵活性:大型AI模型的参数高效微调新策略
█ 技术与研发
解密Octopus v4:串联各种模型的大联欢
MongoDB助力企业跑赢AI数据马拉松
谷歌推出Gecko:文本嵌入与图像生成的新标准
BiomedRAG:如何在生物医学数据分析中革命性地提升精确度
DeepMind揭秘:如何防止AI说服术带来的危害?
NExT:通过自我训练,AI如何成为编程界的“思考者”
Nvidia与Intrinsic联手:合成数据引领机器人抓取能力革新
NeMo-Aligner:AI训练的革命者,让大模型更懂人心!
多标记预测技术:让大语言模型更智能更高效
Alembic震撼登场:消灭幻觉,靠图神经网络!
Swave Photonics颠覆全息体验,微米技术引领智能眼镜革命
“说话开车”:CAVG技术如何让自动驾驶听话
助机器狗练瑜伽,西北大学科学家研发超人类机器人训练法!
Med-Gemini:AI医疗革命的新星,让诊断更智能
█ 应用与实践
钉钉AI助理:智能化助力企业日常工作流程
Coze:打造智能交互新平台,开启多元化AI Bot应用时代
当AI遇上团队协作:Atlassian Rovo如何重新定义企业知识管理
Salesforce推出Einstein Copilot:革新企业数据分析与客户服务
Amazon Q:企业级智能助手领域的新宠
Twitch 实时新闻直播:打破传统,赋能观众参与
Sprinklr推出全新品牌数字孪生,助力企业客户体验升级
AI与混合现实的完美结合:SIGMA让日常任务轻松易行
█ 交叉与创新
AI驱动的虚拟小镇:未来医疗革命新趋势
LexisNexis推出全新AI法律助手:速度更快,对话更深
Carv引领数据“游戏”革命,让玩家炼金术变货币
Neurable获1300万美元投资,推动大脑接口技术走向日常产品
快速诊断,救命利器!以色列初创公司AISAP推出AI超声波,结果仅需数分钟
*如需定位对应内容,请使用微信的检索功能
(点击右上方三点,找到查找页面内容按钮)
政策法规与新闻
NIST宣布新举措,旨在创建可检测AI 生成内容的系统
美国国家标准与技术研究所(NIST)日前宣布了一项重要举措,旨在针对人工智能生成内容展开新的评估和监管。据悉,该机构将启动名为NIST GenAI的新计划,致力于评估并创建能够识别人工智能创建的文本、图像和视频的系统。
随着NIST在人工智能风险和标准领域的首批出版物草案发布,这一新计划正式启动。NIST GenAI将专注于创建新的AI基准,并试图构建所谓的“内容真实性”检测系统,以解决AI生成的虚假和误导性信息的问题。
根据NIST AI的新网站,该计划首个项目将从文本入手,旨在构建能够准确识别内容是由人类还是AI系统创建的系统。尽管已有工具声称可以检测诸如深度伪造等问题,但各种研究表明它们并不十分可靠。
在研究中,NIST要求任何提交的生成器必须针对给定主题和一组文档生成250字或更少的摘要,而鉴别器则负责检测摘要是由人类还是人工智能创建的。NIST还将自行准备测试数据以确保公平性,并明确表示使用不符合适用法律法规的公开数据进行训练的系统将不会被接受参加研究。
此外,NIST希望尽快采取行动,研究将于5月1日开放注册,截止日期为8月2日,而研究结果将于2025年2月公布。
这项研究的启动背景是人工智能生成的错误信息和虚假信息似乎变得越来越普遍。近期的一项研究发现,自今年年初以来发布的深度伪造数量与去年同期相比增长了超过900%。
除了新计划外,NIST还发布了一系列旨在塑造美国政府AI政策的草案,并提供了其现有安全软件开发框架的配套资源草案,概述了生成式AI应用程序和双重用途基础模型的开发最佳实践。NIST将双重用途基础模型定义为在“广泛数据”上训练并针对“广泛环境”设计的模型,这些模型可能会在任务中表现出高水平的性能,但可能构成严重风险。
NIST今天还发布了其他文件,涉及降低与合成内容相关的风险,以及制定全球AI标准的计划。所有四份文件均开放公众评论,截止日期为6月2日。
美国国家标准与技术研究院院长兼商务部标准与技术部副部长劳里·洛卡西奥(Laurie Locascio)表示,该机构担心生成式人工智能带来的风险与传统软件的风险“截然不同”。他说:“这些指导文件不仅会告知软件创建者这些独特的风险,还会帮助他们找到减轻风险的方法,同时支持创新。”
谷歌、微软和 OpenAI 的领导者加入联邦人工智能安全委员会:政府把握AI未来的关键一步
桑达尔·皮查伊(Sundar Pichai)、萨蒂亚·纳德拉(Satya Nadella)、黄仁勋 (JensunHuang) 和萨姆·奥尔特曼(Sam Altman) 将加入一个由近二十人组成的董事会,该董事会将帮助联邦官员促进人工智能在关键基础设施中的采用,并保护该结构免受风险。
该组织还包括民权名人以及诺斯罗普·格鲁曼公司首席执行官和达美航空首席执行官埃德·巴斯蒂安等基础设施高管。马里兰州州长韦斯·摩尔 (Wes Moore) 和西雅图市长布鲁斯·哈勒尔 (Bruce Harrell) 等公职人员以及亚马逊、AMD、思科和 IBM 的技术高管都是该小组的成员。
拜登总统下令于 2023 年秋季成立该委员会,作为更广泛的人工智能计划的一部分,该计划还呼吁紧急权力来监督该技术。如果公司创建的任何人工智能平台对经济、公共健康或国家安全构成“严重风险”,则必须向政府发出警报。
人工智能委员会应于五月举行第一次会议,并应每季度召开一次会议。
拜登政府已明确表示,希望国会通过控制人工智能的立法,其行政行动最终只是权宜之计。有人担心这项技术可能会导致人们失业、扭曲经济并改变战争的性质。
解决AI芯片瓶颈的灵丹妙药?白宫斥资 2.85 亿美元用于数字孪生研发
拜登白宫宣布了一项新的研发基金,旨在利用数字孪生技术提高芯片制造的效率和资源利用率。这笔2.85亿美元的资金是2022年《芯片和科学法案》的一部分,也是美国政府支持本土半导体生产的一部分。该法案旨在找到新方法来克服半导体制造的挑战,并为美国半导体生产创建框架。政府正在押注数字孪生技术,这项技术可以创建基于软件的虚拟物理对象的复制品,可用于模拟、规划和培训。数字孪生可以帮助制造商在设计、优化和排除新芯片故障之前进行模拟,从而减少成本。基于数字孪生的研究还可以利用人工智能等新兴技术,帮助加速美国新芯片的设计和制造。 CHIPS Manufacturing USA研究所正在征求提案,以促进数字孪生的使用和美国半导体制造的发展。提案应考虑六个目标:召集利益相关者解决共同挑战,提高数字孪生技术水平,降低成本,缩短开发周期,培训下一代劳动力,创建数字孪生市场。 NIST主任表示,数字孪生技术将改变半导体行业,这项投资将释放数字孪生技术的潜力。
英国在贝尔法斯特启动以行业为重点的数字孪生中心
英国政府将投资3760万英镑建立以行业为重点的数字孪生中心,位于贝尔法斯特,初始重点将放在海事、航空航天和国防领域的用例。该中心由贝尔法斯特地区城市协议和独立政府资助机构Digital Catapult共同支持,旨在成为数字孪生应用的卓越中心,加速行业产品开发的方式。合作伙伴包括泰雷兹英国公司、Spirit AeroSystems和Artemis Technologies。中心的目标是消除采用数字孪生的障碍,降低成本并培养劳动力技能。创新局首席执行官表示,这项投资将推动行业对数字孪生的采用,为商业创新提供支持。数字孪生可以提供快速原型设计和更好的决策,降低成本并减少排放。中心承诺到2033年为英国制造业创造230个新工作岗位,并为北爱尔兰当地经济创造6100万英镑的收入。
大模型与基础建设
Oracle推出全新矢量搜索数据库
Oracle公司最新宣布,旗舰数据库管理系统现已以云服务形式推出,全新的Oracle Database 23ai搭载了矢量搜索和300多项其他主要功能。其中,许多功能专注于简化人工智能模型的开发和使用。
这一全新的矢量搜索功能可安全地将文档、图像和其他非结构化数据的搜索与私人业务数据的搜索结合起来,无需复制或移动数据。GoldenGate 23ai的新增功能使用户能够为检索增强生成创建实时数据结构。
开发人员现在还可以利用Javascript对象表示法和SQL读取和写入关系数据,同时构建使用属性图查询来导航数据之间和数据内部连接的应用程序。Raft数据复制功能实现自动故障转移,可在10秒内完成,且不会丢失任何数据。
相关阅读:
https://siliconangle.com/2024/05/02/oracle-expands-vector-support-latest-cloud-database-release/
Prometheus 2挑战GPT-4,引领开源模型评估革命
传统上,人们依赖于像GPT-4这样的专有模型来评估其他语言模型的性能,但这种方式不仅昂贵,而且缺乏透明度。然而,现在有了一款名为Prometheus 2的开源语言模型,它不仅挑战了现有的评估体系,还提出了一种更公平、更可控的评估方法。
由一支国际研究团队开发的Prometheus 2旨在提供一个透明、可控且经济的语言模型评估工具。相比于现有的开源评估模型,Prometheus 2具有几个显著的优势:
1. 高度的人类和GPT-4判断一致性:Prometheus 2在设计时特别注重模仿人类和GPT-4的评判标准,使其评估结果更接近人类的直觉和现有最先进模型的判断。
2. 支持直接评估和成对比较:不同于其他模型只支持单一评估方式,Prometheus 2能够处理直接评估和成对比较两种常见的评估格式,增加了评估的灵活性。
3. 自定义评估标准:Prometheus 2允许用户根据需要定义评估标准,不再局限于通用的评估属性,如有用性或无害性,使得评估更加个性化和目标明确。
Prometheus 2的核心技术基于最新的深度学习算法,结合了两种训练模型:一种专注于直接评估,另一种专注于成对比较。通过线性融合这两种模型的输出,Prometheus 2能够提供精确且一致的评估结果。此外,该模型还利用了大量的执行轨迹数据来优化其判断准确性,确保评估结果能够广泛适用于不同类型的语言模型。
在四个直接评估基准测试中,模型与人类和专有评估者之间的相关性最高,相关系数均超过0.5。在四个成对排序基准测试中,包括HHH Alignment、MT Bench Human Judgment、Auto-J eval和Preference Bench,Prometheus 2的表现优于现有的开源模型,准确率超过85%。Prometheus 2的领域内测试集Preference Bench表明了该模型的稳健性和通用性。
相关阅读:
https://www.marktechpost.com/2024/05/04/prometheus-2-an-open-source-language-model-that-closely-mirrors-human-and-gpt-4-judgements-in-evaluating-other-language-models/;
聊天机器人的新技能:用贝叶斯优化读懂你的心
在数字时代,个性化推荐系统已成为我们日常生活的一部分,然而,如何在与用户的第一次交流中迅速准确地捕捉用户偏好,一直是AI领域的一大挑战。最近,一项名为“贝叶斯优化用于大型语言模型的偏好引导”的研究,为解决这一难题提供了新思路。
这项研究提出了一种结合贝叶斯优化(BO)和大型语言模型(LLMs)的方法,旨在通过自然语言对话快速准确地识别用户的偏好。与传统的偏好引导方法相比,这种方法能够在对话的每一轮中更有效地平衡探索和利用,从而更快地锁定用户最喜欢的项目。
他们开发了一种名为PEBOL(使用贝叶斯优化增强L语言模型进行偏好引出)的新算法,该算法将LLM的语言理解能力与原则性贝叶斯优化框架相结合,以实现高效的偏好引出。以下是其工作原理的高级概述:
1. 建模用户偏好:PEBOL首先假设存在一些隐藏的“效用函数”,该函数根据每个项目的描述确定用户对每个项目的偏好程度。它使用概率分布(具体而言是Beta分布)来建模这些效用的不确定性。
2. 自然语言查询:在每次对话中,PEBOL使用决策理论策略(如汤普森抽样和置信上限)选择一个项目描述。然后,它会提示LLM生成关于该项目的简短、基于方面的查询(例如,“您对爱国主题的电影感兴趣吗?”)。
3. 通过NLI推断偏好:当用户回复(例如“是”或“否”)时,PEBOL不会从表面上理解。相反,它使用自然语言推理模型来预测用户的回复暗示对每个项目描述的偏好(或反对)的可能性。
4. 贝叶斯信念更新:利用这些预测的偏好作为观察结果,PEBOL更新其关于用户对每件物品效用的概率信念。这使得它能够系统地探索不熟悉的偏好,同时利用它已经学到的知识。
5. 重复:该过程重复进行,PEBOL会生成新的查询,重点关注最不确定的项目/方面,最终旨在确定用户最喜欢的项目。
相关阅读:
https://arxiv.org/abs/2405.00981
精简参数,提升灵活性:大型AI模型的参数高效微调新策略
近期的研究提出了一项名为参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)的新策略,旨在让庞大的AI模型更加灵活。该策略的核心思想在于尽可能减少微调过程中需要调整的参数数量,而不影响模型性能。相较于传统的全参数微调方法,这一策略为处理特别庞大的模型带来了新的思路,避免了计算和资源消耗的巨大开销。
PEFT的应用不仅局限于自然语言处理(NLP),还扩展到了计算机视觉(CV),引发了对微调大型视觉模型(如Vision Transformers (ViT) 和扩散模型)以及跨学科视觉语言模型的兴趣。
来自东北大学、加州大学、亚利桑那州立大学和纽约大学的研究人员对PEFT算法进行了全面的研究和评估。除了介绍PEFT算法及其性能评估外,他们还探讨了各种PEFT方法在实际应用中的表现,并讨论了降低与PEFT相关的计算费用的常见策略。
PEFT通过几种不同的技术实现参数的高效微调,包括选择性微调、低秩分解和LoRA衍生技术。这些方法不仅减少了计算资源的需求,同时保持了模型在多种任务上的高性能。
该研究将PEFT算法分为加法、选择性、重新参数化和混合微调等操作,每种操作都有不同的优势和应用场景。这项研究为研究人员提供了对PEFT算法及其系统实施的深入见解,为最新技术进展和实际应用提供了详尽的分析。
相关阅读:
https://www.marktechpost.com/2024/04/30/exploring-parameter-efficient-fine-tuning-strategies-for-large-language-models/;
技术与研发
解密Octopus v4:串联各种模型的大联欢
NexaAI的最新力作——Octopusv4,通过引入创新的“功能性令牌”(functionaltokens),成功整合了多个开源模型,每个模型都针对特定任务进行了优化。从而实现资源共享和能力互补。
Octopus v4展示了功能性令牌的神奇力量。这些令牌不仅能够智能引导用户查询,还能优化数据处理,提高系统性能。利用图结构的灵活性,Octopus v4有效协调多个开源模型的工作,提高了模型间的协作效率,增强了系统的可扩展性和灵活性。Octopus v4以其高度灵活性、精准的任务匹配和优化的查询处理而备受关注。未来,它有望在多模态应用中发挥重要作用,如智能制造、智慧城市和健康医疗等领域。设计允许易于扩展和定制,使其能够快速适应不断变化的技术需求和市场需求,与新兴技术如量子计算、边缘计算的融合也将成为可能。Octopus v4的出现,标志着人工智能技术正朝着更加智能、高效的方向迈进。
相关阅读:
https://github.com/NexaAI/octopus-v4
https://arxiv.org/abs/2404.19296
MongoDB助力企业跑赢AI数据马拉松
MongoDB近年来在人工智能(AI)领域展现出强大的潜力,其文档模型为AI应用提供了高度兼容的数据结构,使数据的存储和检索更加灵活高效。其优势主要体现在以下几个方面:
结构化数据管理:MongoDB的文档模型支持多种数据类型和复杂的数据结构,能够轻松应对AI和机器学习中的数据多样性和结构复杂性问题,为AI应用的数据处理提供了有力支持。
实时数据处理:其分布式架构和强大的查询性能使其能够快速处理和分析大规模数据,尤其在处理流数据和时间序列数据时表现突出,极大地增强了AI应用的响应速度和准确性。
创新功能:MongoDB不断推出生成式AI特性,如Relational Migrator、Compass、Atlas Charts等,通过自然语言处理能力,提升了开发者的工作效率;同时,AI驱动的数据交互使得与数据库的交互更加直观和友好。
应用案例:MongoDB在边缘计算方面的应用尤为引人注目。其能力使得企业能够在数据产生的地点即时处理数据,减少了数据传输的延迟和成本,为自动驾驶车辆和实时监控系统等需要快速响应的应用场景提供了重要支持。