llama-factory 系列教程 (五),SFT 微调后的模型,结合langchain进行推理
创始人
2024-11-12 04:39:42
0

背景

微调了一个 glm4-9B的大模型。微调后得到Lora权重,部署成vllm 的API,然后通过langchain接入完成相关任务的推理。

关于SFT 微调模型的部分就不做介绍了,大家可以参考前面的文章,将自己的数据集 在 Llamafactory 的 dataset_info.json 里进行注册。

llamafactory-cli webui
通过可视化界面进行微调,或者拿到预览的命令,在命令行中运行。

llamafactory API 部署模型

使用 llamafactory 训练模型,再使用llamafactory 部署API 简单又省事,就是慢了一点,但很方便。

如果你想追求极致的推理速度,建议你阅读这篇文章:llama-factory SFT 系列教程 (四),lora sft 微调后,使用vllm加速推理

运行下述代码,完成API部署:

CUDA_VISIBLE_DEVICES=0 API_PORT=8000 llamafactory-cli api \     --model_name_or_path /home/root/.cache/modelscope/hub/ZhipuAI/glm-4-9b-chat \     --adapter_name_or_path ./saves/GLM-4-9B-Chat/lora/train_2024-07-30-15-53-random-500 \     --template glm4 \     --finetuning_type lora \     --infer_backend vllm \     --vllm_enforce_eager 

adapter_name_or_path:lora 插件地址;
建议使用vllm进行部署,huggingface 容易报错。

langchain

from datasets import load_dataset from langchain_openai import ChatOpenAI from langchain_core.messages import HumanMessage, SystemMessage from langchain_core.output_parsers import StrOutputParser  parser = StrOutputParser() 
port = 8000 model = ChatOpenAI(     api_key="0",     base_url="http://localhost:{}/v1".format(os.environ.get("API_PORT", 8000)),     temperature=0 ) 

加载本地的json 文件,作为推理用的数据集:

valid_dataset = load_dataset(     "json",     data_files="../valid.json" )["train"] 
preds = [] for item in tqdm(valid_dataset):     # 修改 messages, 填入自己的数据即可     messages = [         SystemMessage(content=item['instruction']),         HumanMessage(content=item['input']),     ]     chain = model | parser     pred = chain.invoke(messages).strip()     preds.append(pred) 

如上述所示,即可轻松实现利用 langchain 结合训练后的模型,完成推理任务。

参考资料

  • 非常建议阅读: LLaMA-Factory QuickStart. https://zhuanlan.zhihu.com/p/695287607
    因为 llamfactory github 的官方文档写的太简短了,上述知乎的文档写的很细。

相关内容

热门资讯

阶段辅助!同城上饶辅助(辅助挂... 阶段辅助!同城上饶辅助(辅助挂)总是是真的有辅助脚本(竟然有挂)1、在同城上饶辅助插件功能辅助器技巧...
2026版攻略!pokemmo... 2026版攻略!pokemmo脚本手机版,hhpoker必备开挂,窍要教程(有挂规律)1、pokem...
演示辅助!三哥玩摆头挂(辅助挂... 演示辅助!三哥玩摆头挂(辅助挂)其实存在有辅助软件(确实有挂)小薇(辅助器软件下载)致您一封信;亲爱...
无独有偶!hhpoker有辅助... 无独有偶!hhpoker有辅助吗,we poker免费辅助器,积累教程(有挂秘笈)1、很好的工具软件...
现有关情况通报如下!德普之星透... 现有关情况通报如下!德普之星透视辅助软件激活码,德普之星辅助工具如何设置,教程书教程(的确有挂)1、...
诀窍辅助!决战卡五星作必弊教程... 诀窍辅助!决战卡五星作必弊教程(辅助挂)总是是有辅助软件(有挂方针)1、让任何用户在无需决战卡五星作...
第三方辅助!hhpoker开挂... 第三方辅助!hhpoker开挂教程,hhpoker德州透视挂,大纲教程(有挂规律)hhpoker德州...
手筋辅助!新畅游互娱科技(辅助... 手筋辅助!新畅游互娱科技(辅助挂)一贯确实有辅助工具(的确有挂)1、下载好新畅游互娱科技正确养号方法...
截至目前!wepoker透视有... 截至目前!wepoker透视有用吗,pokerworld破解版下载,绝活教程(有挂头条)1、很好的工...
绝活儿辅助!牵手跑得软件(辅助... 绝活儿辅助!牵手跑得软件(辅助挂)一贯是有辅助脚本(新版有挂)1)牵手跑得软件有没有挂:进一步探索牵...