不太理想的Fine-tunes

Ws3年前分什么类3786

b1763ecd87edaa9a1c9914f452476b.jpg之前了解到openai可以针对GPT3.0进行再训练时,就已经迫不及待的试验了一把,但是效果不尽人意,我都准备放弃它了。

需求点,是准备让它充当客服,喂了一部分客服QA。但是各种微调之后给的结果仅是补充文字,离3.5相差十万八千里。看最终效果图:

WX20230424-104723@2x.png

max_token 这是太大,他会说一通不相关的废话。设置短了,回答又不完整。


记录下大致步骤吧,详细流程也可以参考openai的文档

  1. 使用openai cli工具转换问答资料。xlsx格式我就不赘述了,如果格式不对,tool工具会友善的提示你的。

    openai tools fine_tunes.prepare_data -f 客服话术.xlsx

    生成完了就是类似这个样子,文件格式 jsonl

    WX20230424-111330@2x.png

  2. 接着就可以开始训练了。我使用的是它的最大的模型达芬奇002,一共4个模型可拿来训练。越大的模型费用越高,有多高,看看第一张截图便知 😭

    openai api fine_tunes.create -t 客服话术_prepared.jsonl -m text-davinci-002

    开始训练后,openai会返回训练任务ID,后续可以根据这个ID,跟踪训练任务状态。

    openai api fine_tunes.status -i ft-DjHI8zfOeOUJgEnVVsFTHGYT
  3. 其实整个训练任务就此结束了,后续调用或者更多参数设置可以查看文档。


这个效果根本无法达到线上要求。需要找更好的办法才行。



标签: openai

相关文章

Codex、Claude、DeepSeek:三款AI编程工具的自动化之战

Codex、Claude、DeepSeek:三款AI编程工具的自动化之战

2026年,AI编程已经从"帮你补全一行代码"进化到了"帮你干完整个项目"。 OpenAI 的 Codex CLI、Anthropic 的 Claude Code、以及来自中国的 DeepSeek,...

视频+背景音,批量生成 python

去年项目中,有个需要根据用户姓名性别,播放不同欢迎语的视频需求。原计划通过webaudio实时在客户端生成的,总是最终还是放弃了,最终采用比较死板的方式,提前根据姓氏字典批量生成。直接展示代码了,当然...

comfyUI 节点安装失败,艰苦填坑36小时

comfyUI 节点安装失败,艰苦填坑36小时

填坑背景介绍:公司设计师的windows系统使用的comfyUI的一键安装包,各种牛鼻的ai图片是真不错。然后,自己在家里的ubuntu24系统上也弄了一套,可惜,卡在了各种节点的安装上,把公司的工作...

AI救命还是AI要命?同一周,21亿砸向AI药物发现,少年却因ChatGPT的建议身亡

AI救命还是AI要命?同一周,21亿砸向AI药物发现,少年却因ChatGPT的建议身亡

这周的两条医疗AI新闻,放在一起看格外刺眼。 一条是诺贝尔奖得主、Google DeepMind CEO Demis Hassabis宣布:其AI药物发现公司Isomorphic Labs获得21亿...

OpenAI 史上最大重组、Anthropic 攻破 Apple M5、腾讯 Ardot 公测:AI 日报 5/16

OpenAI 史上最大重组、Anthropic 攻破 Apple M5、腾讯 Ardot 公测:AI 日报 5/16

突发!OpenAI 大规模重组,Brockman 夺权挂帅 OpenAI 宣布进行史上最大规模重组,将 ChatGPT、Codex 和 API 三大核心产品线合并为统一组织。联合创始人兼总裁 G...

mpvue vant 做个简单的核销小程序

我们公司业务一般偏营销,小程序的属性在营销这块没有那么明显,所以很少会有小程序的业务,这次也是帮朋友的忙,用mpvue+vant做了个简单的应用。应用不复杂,但是大部分的功能也都用到了,比如生成/扫描...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。