生活消费
上海AI实验室发布大模型训练工具箱XTuner,大幅降低训练成本
2025-01-02 19:01

       近日,上海人工智能实验室(上海AI实验室)发布低成本大模型训练工具箱XTuner,再次降低大模型训练门槛,惠及更多开发者和企业。

       此前,上海AI实验室推出首个面向大模型研发与应用的全链条开源体系,贯穿数据、预训练、微调、部署和评测五大环节。本次发布的XTuner聚焦于微调环节,为各类开源大模型提供了轻量级微调框架,再次巩固全链条开源体系的实用工具属性。

       传统大模型训练方式之下的高昂硬件成本,将不少开发者及企业“挡在门外”。XTuner支持多种层级硬件的适配,开发者最低只需使用8GB消费级显存,即可训练出适用于具体需求场景的“专属大模型”,“真金白银”拉低大模型训练成本,与各界一道共同推动技术进步。

      开源链接:

      https://github.com/InternLM/xtuner


     XTuner支持与书生·浦语(InternLM)、Llama等多款开源大模型的适配,可执行增量预训练、指令微调、工具类指令微调等任务类型。硬件要求上,在Tesla T4、A100等传统数据中心之外,开发者最低使用消费级显卡便可进行训练,实现大模型特定需求能力。

XTuner为各类开源模型提供了多样的微调框架

      除单点功能外,XTuner还具备以下三项“黑科技”,让开发者可以做到真正的“面向数据”工作。

      XTuner 适配了多个热门开源数据集格式:

      开发者可直接使用对应格式的数据集,并支持多种格式数据源的混合使用,目前,更多适配的数据集格式正在持续更新。    

      pip install xtuner    

      # 训练混合了 Alpaca 格式和 Gunacao 格式的数据    

      xtuner train    

      internlm_7b_qlora_alpaca_enzh_oasst1_e3

      除了支持多种数据集格式外,XTuner还针对大语言模型数据的特点,对各种数据集格式做了充分的解耦,相较于其他的微调开源项目,可以在不破坏大语言模型对话模版的情况下,对其进行微调。

      pip install xtuner            

      # 不破坏 Chat 模型对话模版,继续增量指令微调    

      xtuner train internlm_chat_7b_qlora_oasst1_e3


      针对GPU计算特点,在显存算力允许的情况下,XTuner支持将多条短数据拼接至模型最大输入长度,以此最大化GPU计算核心的利用率,显著提升训练速度。例如,在使用oasst1数据集微调Llama2-7B时,数据拼接后的训练时长仅为普通训练的 50%。

      XTuner首次尝试将社区内常用的HuggingFace与OpenMMLab进行结合,兼顾易用性和可配置性。支持使用MMEngine Runner和HuggingFace Trainer两种训练引擎,开发者如有深度定制化需求,可根据使用习惯灵活配置。

      pip install xtuner          

      # 使用 MMEngine Runner 训练          

      xtuner train internlm_7b_qlora_oasst1_e3          

      # 使用 HugingFace Trainer 训练    

      xtuner train internlm_7b_qlora_oasst1_e3_hf

      XTuner内置了增量预训练、单轮&多轮对话指令微调、工具类指令微调的标准化流程,让开发者只需聚焦于数据本身。

      同时,XTuner集成了QLoRA、DeepSpeed 和 FSDP 等技术,提供各种尺寸模型在各种规格硬件下的训练解决方案,通过XTuner一键式启动训练,仅需8GB显存即可微调 7B 模型。

      pip install 'xtuner[deepspeed]'    

      # 8G 显存微调 InternLM-7B    

      xtuner train    

      internlm_7b_qlora_oasst1_512_e3 --deepspeed deepspeed_zero2

      基于此,开发者可以专注于数据,其他环节放心交给XTuner,将更多精力投入于更核心工作。

      通过XTuner,开发者可以给大模型添加插件,补足大模型欠缺的能力。

      目前,XTuner在HuggingFace Hub上提供了丰富的大模型插件,欢迎开发者下载体验。

      Intern-Colorist 专属调色师

      通过在少量颜色注释数据集上对 InternLM-7B 进行指令微调训练,XTuner成功解锁了其调色能力。最终得到的模型甚至可以像“乙方”一样反复修订。

      pip install xtuner          

      xtuner chat internlm/internlm-7b --    

      adapter xtuner/internlm-7b-qlora-    

      colorist --prompt-template colorist

       Llama-online 更可靠及时的AI搜索引擎

       借助XTuner及插件开源数据集,XTuner研究团队还解锁了InternLM、Llama 等开源模型的隐藏能力,使其可以联网搜索、调用工具,获得更可靠的回复。

      pip install xtuner    

      xtuner chat meta-llama/Llama-2-7b-hf --adapter xtuner/Llama-2-7b-qlora-moss-003-sft --bot-name Llama2 --prompt-

      template moss_sft --with-plugins search --command-stop-word "<eoc>" --answer-stop-word "<eom>" --no-streamer

      更多模型插件,欢迎下载体验:https://huggingface.co/xtuner


       X意味着能力无限拓展的可能。XTuner开发团队希望赋予其更多趣味属性,与开源社区一起“玩”转大模型,开发多种集趣味与实用性于一身的应用。欢迎广大开发者在 XTuner 社区讨论,共同进行有趣开发。

       XTuner讨论区:
       https://github.com/InternLM/xtuner/discussions

       围绕大模型研发与应用,上海AI实验室发布了贯穿数据、预训练、微调、部署和评测五大环节的全链条工具体系,并提供免费商用,欢迎开发者参与体验,共推行业进步。

       InternLM书生·浦语大模型,包含面向实用场景的70亿参数基础模型与对话模型 (InternLM-7B)。
       https://github.com/InternLM/InternLM

       LMDeploy面向大模型部署的推理工具链,支持十亿到千亿参数语言模型的高效推理。推理性能领先开源社区。
       https://github.com/InternLM/lmdeploy

       OpenCompass面向大模型评测的一站式、全方位评测平台,包含超过 40 个评测集、30 万评测题目。通过全自动分布式评测,保障开源模型性能可高效复现。
       https://github.com/open-compass/opencompass

    以上就是本篇文章【上海AI实验室发布大模型训练工具箱XTuner,大幅降低训练成本】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/news/19069.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 http://ww.kub2b.com/mobile/ , 查看更多   
最新文章
智能机器人与未来科技展新一批展商重磅来袭!
前言4月25-26日。为进一步赋能人形机器人产业高质量发展,加速其在更多领域实现应用落地,由中国机器人网精心筹备的“2025中国人
*ST信通股票连续3个交易日涨幅超12%
雷达财经 文|冯秀语 编|李亦辉4月15日,亿阳信通股份有限公司(证券代码:600289,证券简称:)发布公告,提示公司股票交易风险
小米电脑开不了机是怎么回事小米手机开不了机怎么回事「小米电脑开不了机是怎么回事」
就像有的值友说的,大妈原创拆机的多了,解毒的内容没以前多了。那up就来厚一发脸皮,解毒解毒,顺便也聊一聊个人的笔记本选购原
胡代库雷耶夫:加强跨境合作,推动亚太地区数据安全可持续发展
  光明网讯(记者 张璋)4月14日,以“数智融合引领未来——携手构建网络空间命运共同体”为主题的2025年世界互联网大会亚太峰
“敦煌五乐神”在贵阳奏响!谭盾携贵阳交响乐团共谱中西乐章
4月11日,作曲家兼指挥家谭盾执棒贵阳交响乐团,携手敦煌古乐团以敦煌五乐神为主题,将奚琴、尺八、筚篥、唐笙、五弦琵琶五件敦
白酒A股本周5家上涨 回购股份和股东增持酒企将增加
2025年4月11日,本周的交易盘结束。数据显示,20只白酒A股5家上涨。、、分别以1.51%、1.30%、0.65%,列周涨幅前三。业内人士指出
火勇大战库里3分,追梦整活弄巧成拙
在过去三场拿到125分,投进23记三分之后,迎来了一场彻底被封锁的比赛。火勇大战绝对是你不能错过的对决,新仇旧怨堆积在一起,
杀毒清理大师 2.6.6手机管家清理大师「杀毒清理大师 2.6.6」
杀毒清理大师安卓版是一款专业的手机清理工具,杀毒清理大师安卓版是可以一键清理用户手机中的垃圾和病毒的手机管家,杀毒清理大
连涨5天,后市怎么看?
4月14日,A股三大指数午盘集体收涨,市场呈现普涨格局。盘面上仅少数板块回调,市场赚钱效应显著扩散。随着美国关税政策边际缓和
霍挂洗白徐总背锅,唐三亲临大陆见霍雨浩,江楠楠后门被删
导语:近期绝世唐门出现一些重磅剧情,其中包括大家关心的明都大爆炸和问情谷内容,唐三竟然也亲自会见了霍雨浩。关注云漫菌,看

loading