换种思路训练gpt3.5

Ws3年前分什么类15724
  • 问题一

我用的是aws的免费服务器,centos,版本比较老旧,想在python3基础上运行openai,可惜怎么都装不了,openai提供的方法,使用pyenv来装,顺利解决。

curl https://pyenv.run | bash

然后配置下环境 ~/.bashrc 

export PATH="$HOME/.pyenv/bin:$PATH"
eval "$(pyenv init -)"
eval "$(pyenv virtualenv-init -)"

最后source ~/.bashrc 

开始安装python

pyenv install 3.9.0

如果系统存在更高的python版本,需要设置成你想要的版本号

pyenv global 3.9.0

也还有可能出现这个错误 The `python3' command exists in these Python versions:3.9.0

这个情况下,需要指定shell版本

pyenv shell 3.9.0


  • 问题二

urllib3的库只支持openssl 1.1.1+,奈何系统已经升级了最新版本的openssl,urllib还是报错,只能降级urllib3了

pip3 install urllib3==1.26.6


  • 问题三

openai的关联库sklearn,已安装的情况下,一直报错 ModuleNotFoundError: No module named 'sklearn'

解决方法:

pip install scikit-learn


问题都解决了,那开始进入正题,如何换思路呢?

前面这篇POST已经提到过了,finetunes不理想,我个人已经放弃训练这个3.0版本了,3.5有角色功能,system assistant  user,我直接从system角色入手,提前将匹配的答案存入system。实操是有明显效果的,只是会消耗更多的token。


开始,首先思路有了,怎么才能轻松地把匹配的答案找到呢,我们还是使用openai的工具:embeddings_utils,我们先将原县喂给finetunes的资料丢给embeddings,然后get_embedding出最佳答案,最后存入system,发送给api。效果挺好,就是费钱。

相关文章

Anthropic CEO 惊人预言:GDP 暴涨 10%、软件免费、程序员消失

Anthropic CEO 惊人预言:GDP 暴涨 10%、软件免费、程序员消失

Anthropic CEO Dario Amodei 在《华尔街日报》采访中发表了一系列关于 AI 对未来经济与就业格局的惊人预测。这些观点正在硅谷引发激烈讨论——不是因为它们太科幻,而是因为它们...

predis 配合 supervisord 做消息队列

不是完整的代码,了解大概用。我的测试服务器比较老。centos 6.5yum install supervisord  // 直接安装安装解释后,配置...

2026年5月 AI 行业 10 大关键动态:从网络攻击工业化到中美冷战升级

2026年5月 AI 行业 10 大关键动态:从网络攻击工业化到中美冷战升级

2026年5月,AI 行业正经历一场深刻的结构性转变。从网络攻击的工业化升级,到中美 AI 冷战加剧,再到 AI 替代高技能岗位的加速——以下 10 条关键动态勾勒出了当前行业所处的真实阶段。...

AI周报2026-02

AI 模型 Claude(Anthropic) 核心结论:Claude 模型可在数秒内分析财务报表并生成投资备忘录。 补充完善:演示显示模型处理完整财务报表并快速输出结构化投资备忘录,突出高度自...

视频+背景音,批量生成 python

去年项目中,有个需要根据用户姓名性别,播放不同欢迎语的视频需求。原计划通过webaudio实时在客户端生成的,总是最终还是放弃了,最终采用比较死板的方式,提前根据姓氏字典批量生成。直接展示代码了,当然...

微信群聊机器人介入AI

微信群聊机器人介入AI

16年那时候我们的工作群就加入了机器人,那时候用的是web版的接口,后来微信封锁了,又改称了目前的PC端软件hook方式。只是最近把我们机器人拉入了客户群,充当客服,给他们解答订单进度问题。客户领导感...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。