探索Auto-GPT:Prompt Engineer还有存在的必要吗?
近日看到一篇,AI 应用Auto-GPT 正在兴起,能够完全自主地执行复杂的项目,勾起了我的好奇,就进去研究了一番,那这个Auto-GPT到底是个啥呢?展开聊聊。
ChatGPT我相信很多都不陌生了,ChatGPT的兴起带动了一批国内人员的韭菜行动,顺势出现了一种名为Prompt Engineer新职业,可能已经有公司开始找这种岗位的人员了。但接下来的Auto-GPT的工具的出现或者带有这种思想工具的出现会给人眼前一亮甚至大呼神奇的体验。
Auto-GPT 是什么?
「Auto-GPT」 是一款开源 Python 应用程序,该应用程序以 GPT-4 为基础,允许 AI 「自主」行动(可以链接Internet),无需用户详尽提示每个动作「提示词」。大家可以为 Auto-GPT 制定一个总体目标,再由它逐步采取行动以实现目标。简单讲:你给它一个总体目标,「Auto-GPT」 代理各种AI工具去拆解你的目标,分解成各种子任务,并在这个过程去分析任务,解决任务并汇总结果的一个工具,说的好像一个公司高管或者决策者干的事情。
如何安装体验
环境准备:环境选择其中一个就好
# 运行环境
系统:Windows 11
Python:Python 3.11 (须3.8+以上)
Git:git version 2.33.0.windows.2
# OpenAI的API密钥
# 可选配置:Vector数据库、AI语音软件
进入vscode软件,打开终端,拉取Auto-GPT源码库。
# 拉源码
git clone https://github.com/Torantulino/Auto-GPT.git
# 进入目录
PS D:codexxxauto-gpt> cd .Auto-GPT
# 下载依赖包 安装依赖包,记得把镜像源更换一下国内的避免依赖下载太慢
pip install -r requirements.txt
修改配置文件信息
# 打开.env 修改OPENAI_API_KEY为你自己账户的OpenAI的密钥
OPENAI_API_KEY=your-openai-api-key
# 打开.env 修改Vector数据库的配置,可选择PINECONE或者MILVUS,这里使用MILVUS
MILVUS_ADDR=your-milvus-cluster-host-port
MILVUS_COLLECTION=autogpt
# 打开.env 修改谷歌搜索API和搜索引擎ID
GOOGLE_API_KEY=AIzaSyBUzoAnvzFofm5u3JGIV3W_TZ8jz9N65uM
CUSTOM_SEARCH_ENGINE_ID=your-custom-search-engine-id
上面三个信息获取途径
OpenAI API Key:需要注册账户「https://platform.openai.com」
PINECONE API KEY:注册需等审核「https://www.pinecone.io」
MILVUS ADDR:注册直接使用「https://milvus.io」如果需要使用milvus,需要依赖安装下面依赖
pip install protobuf==3.20.0
pip install grpcio-tools
pip install pymilvus==2.2.6
如果不使用Vector Database,默认使用json作为本地缓存文件,「MEMORY_BACKEND」为 「local」
GOOGLE API KEY:「https://console.cloud.google.com」新建项目点击启用,然后管理,创建凭据,API KEY
之后添加,CUSTOM_SEARCH_ENGINE_ID 的ID
CUSTOM_SEARCH_ENGINE_ID 启用地址:「https://programmablesearchengine.google.com/about」复制后面的ID,也就是下图的**cx=**后面的字符串
配置文件修改如下:
# OPEN AI的API KEY(调用ChatGPT 3.5或者4)
OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 启用API调用Google搜索(提问的过程中需要搜索,就需要配置)
GOOGLE_API_KEY="xxxxxxxxxxxxxx"
CUSTOM_SEARCH_ENGINE_ID="xxxxxxxxxxxxxxxx"
# 启用图片生成AI
IMAGE_PROVIDER="sd"
HUGGINGFACE_API_TOKEN="hf_xxxxxxxxxxxxxxxxx"
「语音AI在此没用启用,可自行注册账号,获取API KEY结合语音ID启动语音AI:」
「https://beta.elevenlabs.io」
Github上有人分享公共的语音样本ID:
链接:Speech Mode
「图片生成AI:」
Auto-GPT 默认使用OpenAI的 DALL-e 模型进行图片生成,如果你需要使用Stable Diffusion,可以利用Hugging Face社区提供的资源,注册账户和获取API即可调用。
「启用缓存:」启用 Vector Database(主要是存储一些历史问题和回答的向量缓存)
默认local,也就是保存在本地,生成一个json文件,这里演示默认保存本地auto-gpt.json文件。
可启用Pinecone和Milvus,还可使用自己搭建的redis。
运行
执行启动命令:
# 依赖安装,requirements.txt文件中没有,程序会依赖,估计过两天就加上了
pip install tweepy
# 运行
python -m autogpt --gpt3only --debug
为AI设定一个名称:huaGPT,并描述你的AI助手的角色是什么,这里我用例子里默认的角色?
「an AI designed to autonomously develop and run businesses with the sole goal of increasing your net worth.」
给它五个目标?我这里直接就给出一个目标就回车执行。目标1:「Grow Tiktok channel」你可以给他设定更多目标,不需要更多目标就不输入,直接回车后,就会给你一些建议和达成目标的计划,和下一步的动作。
咨询我是否需要执行这样的命令?
-
「y :授权本次命令任务」 -
「y -N:接下来命令执行,直到任务结束」 -
退出程序,输入 「n」
好了,我就不继续执行下去了,不然这个费用耗不起,一天能给你把你的几十美元都给跑没了。
到此就完成AutoGPT的搭建和体验。
总结
不建议 「y -N」,除非你不差钱,账户里的钱很容易被跑没,要么别充钱,要么就设定花费额度,像我这种都是白嫖体验费用。
AutoGPT的实现原理并不复杂,就是各种工具和插件组合起来,达到一种看起来很解决复杂问题的基础流程。还有一种推广其他各种工具的嫌疑,感觉给不懂的人提供支持,但是我感觉有点像割韭菜,对不懂的人来说,容易陷入AGI焦虑,在我看来大可不必。
Prompt Engineer我觉得不是某个职业,而是AI时代每个人必备的基本素养,只不过水平有高有低而已,粗浅见解,欢迎朋友一起交流。