不太理想的Fine-tunes

Ws1年前分什么类1409

b1763ecd87edaa9a1c9914f452476b.jpg之前了解到openai可以针对GPT3.0进行再训练时,就已经迫不及待的试验了一把,但是效果不尽人意,我都准备放弃它了。

需求点,是准备让它充当客服,喂了一部分客服QA。但是各种微调之后给的结果仅是补充文字,离3.5相差十万八千里。看最终效果图:

WX20230424-104723@2x.png

max_token 这是太大,他会说一通不相关的废话。设置短了,回答又不完整。


记录下大致步骤吧,详细流程也可以参考openai的文档

  1. 使用openai cli工具转换问答资料。xlsx格式我就不赘述了,如果格式不对,tool工具会友善的提示你的。

    openai tools fine_tunes.prepare_data -f 客服话术.xlsx

    生成完了就是类似这个样子,文件格式 jsonl

    WX20230424-111330@2x.png

  2. 接着就可以开始训练了。我使用的是它的最大的模型达芬奇002,一共4个模型可拿来训练。越大的模型费用越高,有多高,看看第一张截图便知 😭

    openai api fine_tunes.create -t 客服话术_prepared.jsonl -m text-davinci-002

    开始训练后,openai会返回训练任务ID,后续可以根据这个ID,跟踪训练任务状态。

    openai api fine_tunes.status -i ft-DjHI8zfOeOUJgEnVVsFTHGYT
  3. 其实整个训练任务就此结束了,后续调用或者更多参数设置可以查看文档。


这个效果根本无法达到线上要求。需要找更好的办法才行。



标签: openai

相关文章

摩友福音!通知转语音

摩友福音!通知转语音

因为穷,一直摩托车通勤,开了这么多年摩托车,其他什么都好,但是有个小困扰,行驶过程中会耽误一些重要的回复,虽然大多数人的消息可以滞后再回复,但是咱还没有到那么高的级别,什么事情都可以不紧不慢的处理。就...

mpvue vant 做个简单的核销小程序

我们公司业务一般偏营销,小程序的属性在营销这块没有那么明显,所以很少会有小程序的业务,这次也是帮朋友的忙,用mpvue+vant做了个简单的应用。应用不复杂,但是大部分的功能也都用到了,比如生成/扫描...

换种思路训练gpt3.5

换种思路训练gpt3.5

问题一我用的是aws的免费服务器,centos,版本比较老旧,想在python3基础上运行openai,可惜怎么都装不了,openai提供的方法,使用pyenv来装,顺利解决。curl ht...

视频+背景音,批量生成 python

去年项目中,有个需要根据用户姓名性别,播放不同欢迎语的视频需求。原计划通过webaudio实时在客户端生成的,总是最终还是放弃了,最终采用比较死板的方式,提前根据姓氏字典批量生成。直接展示代码了,当然...

UNTITLED

随便发发,域名 服务器 闲着也是闲着,偶尔也有干货互联网从业20年,总归有点儿东西...

predis 配合 supervisord 做消息队列

不是完整的代码,了解大概用。我的测试服务器比较老。centos 6.5yum install supervisord  // 直接安装安装解释后,配置...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。