不太理想的Fine-tunes

Ws3年前分什么类3738

b1763ecd87edaa9a1c9914f452476b.jpg之前了解到openai可以针对GPT3.0进行再训练时,就已经迫不及待的试验了一把,但是效果不尽人意,我都准备放弃它了。

需求点,是准备让它充当客服,喂了一部分客服QA。但是各种微调之后给的结果仅是补充文字,离3.5相差十万八千里。看最终效果图:

WX20230424-104723@2x.png

max_token 这是太大,他会说一通不相关的废话。设置短了,回答又不完整。


记录下大致步骤吧,详细流程也可以参考openai的文档

  1. 使用openai cli工具转换问答资料。xlsx格式我就不赘述了,如果格式不对,tool工具会友善的提示你的。

    openai tools fine_tunes.prepare_data -f 客服话术.xlsx

    生成完了就是类似这个样子,文件格式 jsonl

    WX20230424-111330@2x.png

  2. 接着就可以开始训练了。我使用的是它的最大的模型达芬奇002,一共4个模型可拿来训练。越大的模型费用越高,有多高,看看第一张截图便知 😭

    openai api fine_tunes.create -t 客服话术_prepared.jsonl -m text-davinci-002

    开始训练后,openai会返回训练任务ID,后续可以根据这个ID,跟踪训练任务状态。

    openai api fine_tunes.status -i ft-DjHI8zfOeOUJgEnVVsFTHGYT
  3. 其实整个训练任务就此结束了,后续调用或者更多参数设置可以查看文档。


这个效果根本无法达到线上要求。需要找更好的办法才行。



标签: openai

相关文章

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

2026年5月11日,AI圈的新闻开始呈现出一种全新的气质——AI不再只是被人类使用的工具,它开始自己赚钱、自己看病、自己打造教育内容了。 Cerebras IPO:20倍超额认购,AI芯片的资...

AI救命还是AI要命?同一周,21亿砸向AI药物发现,少年却因ChatGPT的建议身亡

AI救命还是AI要命?同一周,21亿砸向AI药物发现,少年却因ChatGPT的建议身亡

这周的两条医疗AI新闻,放在一起看格外刺眼。 一条是诺贝尔奖得主、Google DeepMind CEO Demis Hassabis宣布:其AI药物发现公司Isomorphic Labs获得21亿...

中国电影不是在竞争中输掉的,是在自我重复中慢慢耗死的

中国电影不是在竞争中输掉的,是在自我重复中慢慢耗死的

2019年,中国电影票房达到642亿的历史峰值。所有人都以为这只是起点。 2019年,中国电影票房达到642亿的历史峰值,全球第二大电影市场意气风发。所有人都以为这只是起点。 2021年,472亿...

Codex、Claude、DeepSeek:三款AI编程工具的自动化之战

Codex、Claude、DeepSeek:三款AI编程工具的自动化之战

2026年,AI编程已经从"帮你补全一行代码"进化到了"帮你干完整个项目"。 OpenAI 的 Codex CLI、Anthropic 的 Claude Code、以及来自中国的 DeepSeek,...

AI周报2026-02

AI 模型 Claude(Anthropic) 核心结论:Claude 模型可在数秒内分析财务报表并生成投资备忘录。 补充完善:演示显示模型处理完整财务报表并快速输出结构化投资备忘录,突出高度自...

微信群聊机器人介入AI

微信群聊机器人介入AI

16年那时候我们的工作群就加入了机器人,那时候用的是web版的接口,后来微信封锁了,又改称了目前的PC端软件hook方式。只是最近把我们机器人拉入了客户群,充当客服,给他们解答订单进度问题。客户领导感...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。