从 ChatGPT 到 Auto-GPT:探索自主 AI 的下一次演进,自动为 AI 产品写一个网页 | 包含安装操作过程
如果你对 GPT-4 的新功能感到惊叹,那么准备再次被 Auto-GPT 惊艳到!Auto-GPT 是一种新的应用程序,它允许 AI 自主行动,可以“自我提示”,它正在彻底改变我们对这项技术的看法。
什么是 Auto-GPT?
Auto-GPT 是一个开源 Python 应用程序,以 GPT-4 为基础,允许人工智能“自主”行动,无需用户提示每个动作。允许我们定义特定角色(例如,“图书市场分析师”)和一系列目标(例如,“研究 2022 年最成功的科幻小说”、“总结它们”、“将摘要保存到文件”等),并让 GPT-4 自动创建和执行实现目标所需的所有必要任务。这包括:
通过搜索引擎进行研究
浏览网站
爬取数据
本地存储文件
使用长期记忆
生成具有特殊角色的机器人来完成子任务
(不用担心,如果我们无法访问 GPT-4,我们也可以使用 GPT-3.5 API 运行它)
ChatGPT 和 Auto-GPT 有什么区别?
与 ChatGPT 不同,Auto-GPT 是一个开源的 Python 应用程序,我们可以在计算机上本地安装运行。由名为 Significant Gravitas 的开发人员于 2023 年 3 月 30 日发布在 GitHub 上。https://github.com/Significant-Gravitas/Auto-GPT
Auto-GPT 是一种实验性的开源尝试,旨在使 GPT-4 完全自主。Auto-GPT 将 LLM 的想法链接在一起,以自主实现我们设定的任何目标。使用 Auto-GPT,我们不仅可以执行生成文本等操作,还可以搜索互联网并收集信息、与文件交互等。
最重要的是,Auto-GPT 使用 GPT-4 来自动执行如果我们使用 ChatGPT 需要来回提示的任务。这意味着 Auto-GPT 可以在几乎没有人工干预的情况下执行任务,并且能够自我提示。
这里是 如何安装 Auto-GPT 的步骤:
环境准备
首先,我们需要知道如何运行终端命令,安装环境。然后去做这些事情:
Git 设置
下载 Python 3.8 或更高版本
获取 OpenAI Api 密钥
克隆代码仓库:
对于此步骤,我们需要安装 Git,或者我们可以通过单击此 GitHub 仓库顶部的按钮来下载 zip 文件 ☝️
git clone https://github.com/Significant-Gravitas/Auto-GPT.git
WARNING: You are running on master branch - this is not a supported branch.
注意:确保选择“stable”分支!“master”分支可能经常处于中断状态。
git checkout stable
或者,您可以在此处下载源代码的 ZIP 文件。在右上角,单击“Code”,然后单击“下载 Zip”。
导航到项目目录:
(将其输入 CMD 窗口,将 CMD 窗口导航到我们刚刚下载的存储库)
cd Auto-GPT
安装所需的依赖项:
(同样,将其输入 CMD 窗口)
pip install -r requirements.txt
将 .env.template 复制并重命名为 .env 并填写 OPENAI_API_KEY 。
如果打算使用语音模式,请同时填写 ELEVEN_LABS_API_KEY 。
PINECONE_API_KEY=your-pinecone-api-key
PINECONE_ENV=your-pinecone-region
OPENAI_API_KEY=your-openai-api-key
ELEVENLABS_API_KEY=your-elevenlabs-api-key
ELEVENLABS_VOICE_1_ID=your-voice-id
ELEVENLABS_VOICE_2_ID=your-voice-id
SMART_LLM_MODEL=gpt-4
FAST_LLM_MODEL=gpt-3.5-turbo
GOOGLE_API_KEY=
CUSTOM_SEARCH_ENGINE_ID=
USE_AZURE=False
OPENAI_AZURE_API_BASE=your-base-url-for-azure
OPENAI_AZURE_API_VERSION=api-version-for-azure
OPENAI_AZURE_DEPLOYMENT_ID=deployment-id-for-azure
IMAGE_PROVIDER=dalle
HUGGINGFACE_API_TOKEN=
USE_MAC_OS_TTS=False
从以下位置获取 OpenAI API 密钥:https://platform.openai.com/account/api-keys
可参考本文:如何使用 Python 调用 ChatGPT API 实现上下文连续对话 | OpenAI API 密钥获取方法
从以下位置获取 ElevenLabs API 密钥:https://elevenlabs.io 我们可以使用网站上的“个人资料”选项卡查看 xi-api-key。
运行 Auto-GPT
手动模式:
已准备好将 Auto-GPT 用于测试运行。在项目文件夹(“Auto-GPT”)中输入
python -m autogpt
如果没有 GPT-4 API 或不想使用它,请改为仅 GPT-3.5 模式运行以下命令。
python -m autogpt --gpt3only
系统将询问的第一件事是是否要继续使用我们创建的最后一个 AI 代理。如果我们想尝试一下,请输入“y”,或者输入“n”创建一个新内容。
一旦我们决定创建一个新的,请为其命名并描述其角色。
接下来,我们会给它一堆目标(最多五个)。
从这一刻起,Auto-GPT 将执行其操作,并偶尔要求我们授权其后续步骤。
我们可以选择同意"y",同意在不需要许可的情况下运行多个命令"y -N" (N=可自行运行命令的数量),或输入"n"退出。
如果我们输入其他内容,Auto-GPT 会将其视为人工反馈并对其进行评估。
要退出程序,请输入 Ctrl+C 。
如果我们想让它完全自主,我们可以使用连续模式,或者我们可以坐在那里自己批准每个动作。
连续模式:
安装 Auto-GPT 后,使用起来非常简单。它会要求我们为其提供任务目标。
python -m autogpt --gpt3only --continuous
输入你要让 Auto-GPT 做的事情
ZelinAI 是一个可以基于现有数据训练特定数据成为定制化模型的AI工具,还可以将模型打包为AI应用。针对C端客户可以零基础做自己的AI应用。针对企业客户解决他们无法根据自己的数据训练大模型的痛点。请帮我为 ZelinAI 设计一个静态官网, 使用ReactJS和TailwindCSS构建,富有科技感, 添加标题“由Auto-GPT制作“。
Auto-GPT 会为本次任务设置名字,角色,目标
已创建 ZelinAIGPT,具体如下:
名称:ZelinAIGPT
角色:一种AI驱动的网站构建器,使企业和个人能够使用自己的数据创建定制AI应用程序和模型。ZelinAI解决了企业客户在使用自己的数据训练大型模型时的痛点,并赋予C端客户使用零编码经验创建自己的AI应用程序的能力。
目标:
提供用户友好的界面,使客户能够轻松创建和定制自己的 AI 应用程序和模型。
提供一系列预建模板和模型,供客户作为自己项目的起点。
确保平台可扩展并能处理大量数据和复杂模型。
提供全面的文档和支持,以帮助客户充分利用平台。
根据客户反馈和AI技术的新趋势不断改进平台。
Auto-GPT 是如何工作的?
Auto-GPT 的一个迷人之处在于它分解 AI 步骤的方式,这就是 GPT 出色的文本生成能力用武之地。
每一轮步骤拆解 GPT 都会按以下几项任务依次进行:
想法 / THOUGHTS
推理 /REASONING
计划 /PLAN
批评 /CRITICISM
下一步操作 /NEXT ACTION: COMMAND
系统 /SYSTEM
Auto-GPT 其中一轮思考步骤:
想法:现在我已经创建了一个新文件来存储所有的代码,我应该开始着手设计用户友好的界面。一种方法是创建一个简单的网页,允许用户输入他们的数据并选择要创建的AI模型类型。我可以使用HTML、CSS和JavaScript创建网页,然后使用Python处理后端处理。
推理:创建网页是为顾客提供用户友好的界面的常见方法。它使他们可以轻松地输入他们的数据并选择要创建的AI模型类型。使用HTML、CSS和JavaScript将允许我创建一个视觉上吸引人且互动性强的网页,而使用Python进行后端处理将允许我处理数据和模型创建。
计划:
使用HTML、CSS和JavaScript创建简单的网页
使用Python进行后端处理
批评:我需要确保网页易于使用和理解,适合不同技术水平的客户。我还需要确保后端处理高效,并且能够处理大量数据和复杂模型。
下一步操作:COMMAND = write_to_file ARGUMENTS = {'filename': 'E:\Auto-GPT\autogpt\auto_gpt_workspace\zelinai_code.py', 'text': '# ZelinAIGPT - AI 动力网站构建器\n\n#
目标1:提供用户友好的界面,让客户轻松创建和定制自己的AI应用程序和模型。\n\n#
目标2:提供一系列预构建的模板和模型,客户可以将其用作自己项目的起点。\n\n#
目标3:确保平台可扩展,并且能够处理大量数据和复杂模型。\n\n#
目标4:提供全面的文档和支持,帮助客户充分利用平台。\n\n#
目标5:根据客户反馈和人工智能技术的新趋势不断改进平台。\n\n\n#
使用HTML、CSS和JavaScript创建简单的网页\n# 使用Python进行后端处理\n\n'}
系统:命令 write_to_file 返回:文件已成功写入。
Auto-GPT 称它们为“思想”、“推理”和“批评”——准确地告诉你人工智能在做什么以及为什么。在上面的 ZelinAIGPT 示例中,它的第一个想法如下:“我可以使用HTML、CSS和JavaScript创建网页,然后使用Python处理后端处理” 那么,推理就是“创建网页是为顾客提供用户友好的界面的常见方法。它使他们可以轻松地输入他们的数据并选择要创建的AI模型类型。”
接下来 Auto-GPT 会持续思考,一遍又一遍重复上面的过程,整个过程全自动操作。
写出了 README.md
和 APP.js
文件
写出了 APP.css
和 index.html
文件
模拟服务器执行
Command execute_python_file returned: Error: Error while fetching server API version: (2, 'CreateFile', '系统找不到指定的文件。')
到这里系统陷入循环超过 2-3 分钟,通常意味着它卡住了,强制退出,然后重新开始。
检查结果
要检查 Auto-GPT 的结果,我们可以在文件 /logs/activity.log
中查看其日志文件,也可以检查它在 /auto_gpt_workspace
中创建的文件。
系统写的 HTML 页面是英文版本,我改为了中文并进行简单调整,复制进来一张 ZelinAI 的 Logo,让我们看看效果!
这就是一次让 Auto-GPT 启动并运行,文章开始视频记录了整个过程。
但它并不完美,会遇到很多次问题,由于 Auto-GPT 推出不久,还在不断更新,因此设定正确的任务目标将是完成任务和失败任务之间的区别。
根据经验: 先从简单任务开始,测试输出,然后调整目标。跟开盲盒类似,通常会有很多来回。虽然不完美,但仍然令人惊叹。
因为我用的是 GPT3.5,效果方面也会不尽人意,要充分发挥 Auto-GPT 的潜力,最好是用 GPT4 API。
使用 Auto-GPT 做一些很酷的事情
示例 1:让 Auto-GPT 成为你的实习生,全天候为你工作
Karan Doshi 使用 Auto-GPT 在业务环境中创建了一个实习生,该实习生从自己设计 SQL 查询的数据库中查找预订,选择新预订,并每六小时执行一次特定操作,例如向那些“新鲜的热门线索”发送消息:
以前,你必须花钱请人来创建或执行自动化。现在,Auto-GPT 免费为你完成!这是 Karan 分享他作为个人实习生使用 Auto-GPT 的想法的推文:
示例 2:让 Auto-GPT 成为你的人工智能研究人员
Auto-GPT 是一种人工智能工具,你可以将其用作你自己的个人研究助手。终于拥有自己的研究助理听起来是不是很美好?
它可以执行一些简单的任务,例如创建关于研究主题的播客、为你的下一次演示做准备、为研究论文积累统计数据和事实、为你提供一些营销理念和产品角度。
如果你是一名研究人员,为什么不使用它来收集数据并让它生成可用于你的第一篇调查论文的简短摘要?
仅供教育目的,有人使用Auto-GPT进行科学研究吗?(例如,关于一个问题的审查论文)
我想象到Auto-GPT可以帮我找到与主要问题相关的研究论文,甚至通过逻辑组织它们。我尝试了Auto-GPT,但似乎它不能使用谷歌搜索API找到太多有用的信息。
是否有适合Auto-GPT的专门的研究搜索引擎API?我认为,有了摘要、期刊名、年份和作者列表的输出就足以完成这个工作。
真的很想看看其他研究人员如何使用Auto-GPT!谢谢!
你甚至可以使用 Auto-GPT 在网络上研究商业创意,在 Twitter 上寻找服务不足的细分市场,或者寻找当前“热门”的投资创意。
为什么它有效? AutoGP 与矢量数据库和内存存储解决方案相集成,使其能够保留上下文并做出明智的决策。当你将项目分配给 Auto-GPT 时,它会执行任务以满足项目要求。这种生成文本和执行基于 Web 的操作的能力允许你使用 Auto-GPT 自动执行研究任务,例如数据收集、分析和报告编写。这使它成为希望节省时间和精力同时仍能完成高质量工作的研究人员的强大工具。
与ChatGPT不同,Auto-GPT可以访问来自互联网的实时数据。世界是你的海洋!在 Twitter 上发现了这个 ResearchGPT 测试:
示例 3:让 Auto-GPT 在 3 分钟内建立你自己的网站
许多早期采用者报告说,Auto-GPT 可以自行创建令人印象深刻的网站!
Auto-GPT 可用于通过生成内容和设计网站布局来创建网站。凭借其生成文本和执行基于 Web 的操作的能力,Auto-GPT 可以立即为你创建一个正常运行的网站。只需提供一个提示,例如“为我的企业创建一个网站”,以及一些根据你的需求定制的后续提示,Auto-GPT 将识别目标受众,制定营销策略,甚至设计网站布局。这是一位用户报告 Auto-GPT 如何在 3 分钟内创建 React 网站:
他给了它以下指令,并将其称为 “FullStackGPT,一种自主人工智能,旨在使用 ReactJS 和 TailwindCSS 构建网站” :
是的,这是一个简单的网站,可以在没有 Auto-GPT 的情况下快速创建。但这只需要几分钟的时间来创建。我认为大多数人都低估了 Auto-GPT 可以做的事情,如果你给它更多的时间,比如一两个星期,解决一个问题并尝试不同的事情,失败,学习和调整。
Auto-GPT 可以帮助你在一天之内建立并运行一个网站,而你正在喝咖啡等待它完成。
示例 4:Auto-GPT Discord 机器人
你可以使用 Auto-GPT 在 Discord 上创建自动回复和聊天机器人。Auto-GPT 可以针对 Discord 频道中的特定提示创建自定义响应。例如,这对于客户支持或创建一个有趣的聊天机器人对话启动器很有用,它可以写一些有趣的话题,例如来自 Twitter 的话题。
现在,如果你像我一样会问:Auto-GPT 与普通 GPT Discord 机器人之间有什么区别?Auto-GPT 和普通 GPT Discord 机器人之间的主要区别在于,Auto-GPT 可以执行许多任务,而不仅仅是生成文本。它可以访问互联网!!例如,你可以让 Auto-GPT 研究有趣的主题(例如,在 Twitter 或 Reddit 上)并将这些主题重新发布到 Discord 上以保持社区参与。
虽然普通的 GPT Discord 机器人仅限于对特定提示生成基于文本的响应,但 Auto-GPT 还可以执行基于 Web 的操作,例如数据收集、分析和报告编写。
另一个区别是 Auto-GPT 与矢量数据库和内存存储解决方案集成,使其能够保留上下文并做出明智的决策。没有 Auto-GPT,你的 Discord 机器人将无能为力!
结论
Auto-GPT 代表了自主 AI 技术的下一个飞跃,它利用 OpenAI 的 GPT-4 语言模型的力量在各个领域执行广泛的任务而无需人工干预。在 AI 不断发展的漩涡中,很容易被持续涌现的新模型、新特性和新应用所吸引。每一次的迭代都承诺着比上一个更加强大和具有变革性,想要跟上这种快节奏的创新可能会让人感到不知所措。
然而,保持冷静并不让 AI 的风暴让你感到压力是至关重要的。请记住,这些技术的飞跃旨在提升我们的生活水平,使我们能够更好地实现目标,而不是引发焦虑。
通过保持平衡的视角、及时了解信息,将 AI 视为进步的工具而不是压力来源,我们可以更好地适应这个不断变化的领域并利用这些开创性的技术的潜力。
参考链接:
往期推荐:
Al是大势所趋,其实元峰已经进了好多个「AI付费社群」,包括一些小报童。
目前来看,All in去做这件事,且确实做起来的,关键是「性价比」还不错的星球只推荐一个,那就是 ChatGPT&AI破局俱乐部。这个社区是360前技术总监、曾经的连续创业者 findyi(易洋) 创建的。
最牛逼的是,执行力和动作非常快,洋哥迅速从360辞职成立了一家公司,并组成6人全职团队,All in AI 创业,超级给力!
40多天时间,我们已经2万会员了,目前是全国第一大AI学习&实践社群。
性价比没得说,我们目前已经涨价368元,正式运营会涨到999元,这里有全国最多的AI极客、全国最多的行业大佬,以及最好的课程内容。
我现在申请了一个69优惠券给到大家,早就是优势!
加入星球的伙伴,请及时私信元峰,领取这份整理好的AIGC、ChatGPT相关资料包:AIGC和ChatGPT最全知识库分享,资料通通都打包好了,想赚点小钱,请点开本文
(如果优惠券失效,请扫码私信元峰,备注说明来意)