不太理想的Fine-tunes

Ws2年前 (2023-04-24)分什么类3130

之前了解到openai可以针对GPT3.0进行再训练时，就已经迫不及待的试验了一把，但是效果不尽人意，我都准备放弃它了。

需求点，是准备让它充当客服，喂了一部分客服QA。但是各种微调之后给的结果仅是补充文字，离3.5相差十万八千里。看最终效果图：

WX20230424-104723@2x.png

max_token 这是太大，他会说一通不相关的废话。设置短了，回答又不完整。

记录下大致步骤吧，详细流程也可以参考openai的文档

使用openai cli工具转换问答资料。xlsx格式我就不赘述了，如果格式不对，tool工具会友善的提示你的。
```
openai tools fine_tunes.prepare_data -f 客服话术.xlsx
```
生成完了就是类似这个样子，文件格式 jsonl
接着就可以开始训练了。我使用的是它的最大的模型达芬奇002，一共4个模型可拿来训练。越大的模型费用越高，有多高，看看第一张截图便知 😭
```
openai api fine_tunes.create -t 客服话术_prepared.jsonl -m text-davinci-002
```
开始训练后，openai会返回训练任务ID，后续可以根据这个ID，跟踪训练任务状态。
```
openai api fine_tunes.status -i ft-DjHI8zfOeOUJgEnVVsFTHGYT
```
其实整个训练任务就此结束了，后续调用或者更多参数设置可以查看文档。

这个效果根本无法达到线上要求。需要找更好的办法才行。

标签: openai

返回列表

上一篇：Debian 10 开发一个go语言接口

下一篇：mpvue vant 做个简单的核销小程序

相关文章

UNTITLED

随便发发，域名服务器闲着也是闲着，偶尔也有干货互联网从业20年，总归有点儿东西...

摩友福音！通知转语音

摩友福音！通知转语音

因为穷，一直摩托车通勤，开了这么多年摩托车，其他什么都好，但是有个小困扰，行驶过程中会耽误一些重要的回复，虽然大多数人的消息可以滞后再回复，但是咱还没有到那么高的级别，什么事情都可以不紧不慢的处理。就...

微信群聊机器人介入AI

微信群聊机器人介入AI

16年那时候我们的工作群就加入了机器人，那时候用的是web版的接口，后来微信封锁了，又改称了目前的PC端软件hook方式。只是最近把我们机器人拉入了客户群，充当客服，给他们解答订单进度问题。客户领导感...

视频+背景音，批量生成 python

去年项目中，有个需要根据用户姓名性别，播放不同欢迎语的视频需求。原计划通过webaudio实时在客户端生成的，总是最终还是放弃了，最终采用比较死板的方式，提前根据姓氏字典批量生成。直接展示代码了，当然...

comfyUI 节点安装失败，艰苦填坑36小时

comfyUI 节点安装失败，艰苦填坑36小时

填坑背景介绍：公司设计师的windows系统使用的comfyUI的一键安装包，各种牛鼻的ai图片是真不错。然后，自己在家里的ubuntu24系统上也弄了一套，可惜，卡在了各种节点的安装上，把公司的工作...

换种思路训练gpt3.5

换种思路训练gpt3.5

问题一我用的是aws的免费服务器，centos，版本比较老旧，想在python3基础上运行openai，可惜怎么都装不了，openai提供的方法，使用pyenv来装，顺利解决。curl ht...

发表评论