不太理想的Fine-tunes

Ws3年前分什么类3783

b1763ecd87edaa9a1c9914f452476b.jpg之前了解到openai可以针对GPT3.0进行再训练时,就已经迫不及待的试验了一把,但是效果不尽人意,我都准备放弃它了。

需求点,是准备让它充当客服,喂了一部分客服QA。但是各种微调之后给的结果仅是补充文字,离3.5相差十万八千里。看最终效果图:

WX20230424-104723@2x.png

max_token 这是太大,他会说一通不相关的废话。设置短了,回答又不完整。


记录下大致步骤吧,详细流程也可以参考openai的文档

  1. 使用openai cli工具转换问答资料。xlsx格式我就不赘述了,如果格式不对,tool工具会友善的提示你的。

    openai tools fine_tunes.prepare_data -f 客服话术.xlsx

    生成完了就是类似这个样子,文件格式 jsonl

    WX20230424-111330@2x.png

  2. 接着就可以开始训练了。我使用的是它的最大的模型达芬奇002,一共4个模型可拿来训练。越大的模型费用越高,有多高,看看第一张截图便知 😭

    openai api fine_tunes.create -t 客服话术_prepared.jsonl -m text-davinci-002

    开始训练后,openai会返回训练任务ID,后续可以根据这个ID,跟踪训练任务状态。

    openai api fine_tunes.status -i ft-DjHI8zfOeOUJgEnVVsFTHGYT
  3. 其实整个训练任务就此结束了,后续调用或者更多参数设置可以查看文档。


这个效果根本无法达到线上要求。需要找更好的办法才行。



标签: openai

相关文章

AI周报2026-02

AI 模型 Claude(Anthropic) 核心结论:Claude 模型可在数秒内分析财务报表并生成投资备忘录。 补充完善:演示显示模型处理完整财务报表并快速输出结构化投资备忘录,突出高度自...

换种思路训练gpt3.5

换种思路训练gpt3.5

问题一我用的是aws的免费服务器,centos,版本比较老旧,想在python3基础上运行openai,可惜怎么都装不了,openai提供的方法,使用pyenv来装,顺利解决。curl ht...

2026年5月,AI军备竞赛进入核爆级:DeepSeek 70亿、Anthropic万亿、SpaceXAI

2026年5月,AI军备竞赛进入核爆级:DeepSeek 70亿、Anthropic万亿、SpaceXAI

2026年5月的第一周,AI圈的每一则新闻都在刷新纪录。 DeepSeek以500亿美元估值融资70亿美元,创下中国AI史上最大单轮融资。Anthropic被曝计划今夏融资数百亿美元,估值剑指万亿。...

mpvue vant 做个简单的核销小程序

我们公司业务一般偏营销,小程序的属性在营销这块没有那么明显,所以很少会有小程序的业务,这次也是帮朋友的忙,用mpvue+vant做了个简单的应用。应用不复杂,但是大部分的功能也都用到了,比如生成/扫描...

OpenAI 史上最大重组、Anthropic 攻破 Apple M5、腾讯 Ardot 公测:AI 日报 5/16

OpenAI 史上最大重组、Anthropic 攻破 Apple M5、腾讯 Ardot 公测:AI 日报 5/16

突发!OpenAI 大规模重组,Brockman 夺权挂帅 OpenAI 宣布进行史上最大规模重组,将 ChatGPT、Codex 和 API 三大核心产品线合并为统一组织。联合创始人兼总裁 G...

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

2026年5月11日,AI圈的新闻开始呈现出一种全新的气质——AI不再只是被人类使用的工具,它开始自己赚钱、自己看病、自己打造教育内容了。 Cerebras IPO:20倍超额认购,AI芯片的资...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。