本周最火AutoGPT!GitHub3.6万+标星,解决复杂任务全程无需人类插手
金磊 丰色 发自 凹非寺
量子位 | 公众号 QbitAI
本周AI圈”最红炸子鸡“诞生——AutoGPT。
不仅如此,这款软件系统的横空出世,一举将AI进程推向了新高度——
自主人工智能。
顾名思义,它所具备的能力主打的就是一个“自主”,完全不用人类插手的那种!
例如一位网友就要求AutoGPT开发一个网站,结果不到3分钟,AI自己就用React和Tailwind CSS“唰唰唰”地搞定了。
AI自己上网、自己使用第三方工具、自己思考、自己操作你的电脑。
这一套打法,算得上是把“行动→观察结果→思考→决定下一步行动”这条路子给打通并循环了起来。
就连前特斯拉AI总监Andrej Karpathy对此都评价道:
AutoGPT是提示工程的下一个前沿。
而且不只是AutoGPT,最近还陆陆续续地衍生出了各种自主人工智能工具,例如AgentGPT、BabyAGI等等。
然后网友们对面此景也坐不住了,惊叹于AI发展的日新月异:
这俩月,一睁眼就出新东西,太累了。
无需人类插手的AutoGPT们
那么这个当红的AutoGPT,和之前ChatGPT那波AI又有何区别?
微博博主“木遥”便下场亲测了一下。
△图源:微博博主“木遥”他测试所用的题目是“给我解释LangChain怎么用”(LangChain是大型语言模型的一种应用框架)。
这个问题若是交给传统的GPT,由于LangChain这个概念太新,AI就会出现不知道怎么回答的情况。
若是交给“GPT+插件”这个组合来回答,那结果就会有点像Bing或者Bard。
但AutoGPT上手就不一样了,来欣赏一下它的执行过程:
首先试着直接去LangChain官网爬信息。
被官网拒绝了,可能因为有屏蔽。
发现失败了之后想了想,说要不Google一下?
Google出了很多结果。
读了半天这些结果,说「现在我们已经搜集了不少有用的信息了,接下来让我们安装它玩一下」
然后就开始动手在我的电脑上安装LangChain……
而博主“木遥”在这整个过程中所做的事情就是“坐在屏幕前看着这一切自动在我眼前发生”……
△图源:微博博主“木遥”然后这位博主不禁发出了感慨:
我要是有它这个行动力,三个PhD都念完了。
有类似自主能力的AI,还有最近同样火爆的AgentGPT。
也是只需要给个任务,剩下的都交给它来完成:
用100美元的资金创建一个新的创业公司。
AgentGPT在接到这项任务之后,便开始了他的展示:
思考中……
添加任务:研究需要最少资金的低成本商业模式。
添加任务:确定潜在的目标市场及其需求。
添加任务:开发一个精简的MVP(最小可行产品),并在目标市场进行测试以验证需求。
思考中……
然后AgentGPT先是输出执行“研究需要最少资金的低成本商业模式”的结果:
根据我的研究,一些需要最少资金的低成本商业模式包括:
1、Dropshipping:通过Dropshipping,你可以在网上销售产品而无需持有库存。您只需通过第三方供应商完成订单,第三方供应商将产品直接运送给您的客户。你可以从50美元开始支付网站托管和域名注册费。
2、 社交媒体营销:如果你有社交媒体营销的天赋,你可以通过帮助企业接触他们的目标受众来创办自己的代理公司。你所需要的只是一台电脑,互联网连接,以及一些社交媒体营销的经验和技能,而你的起价只有50美元或更少。
3、活动策划:如果你对组织活动有热情,你可以开始自己的活动策划业务。你可以从策划一些小活动开始,比如生日派对、婚礼等等。你可以从100美元开始,创建一个简单的网站,名片,并通过社交媒体营销自己。
4、自由写作:如果你有写作天赋,你可以开始自己的自由写作事业。你可以通过在线平台,如Upwork、Fiver和其他求职网站找到客户。只需50美元,你就可以创建一个投资组合网站,并通过社交媒体营销自己。
这些只是一些低成本的商业模式,你只需要100美元的资金就可以考虑。选择一个符合你的技能和兴趣的商业模式是很重要的。
到这还没有完,AgentGPT会继续开始它的工作:
思考中……
添加任务:针对每种已确定的低成本商业模式,对潜在的产品或服务想法进行头脑风暴。
添加任务:评估每个想法的潜在盈利能力和可扩展性。
添加任务:选择最有希望的想法,并开发精益MVP,用于目标市场的测试。
而后便是继续地再思考、执行。
再如BabyAGI,也只需给个目标和任务迭代次数,AI“唰唰唰”地便自己搞了起来:
而且已经有博主开始把AutoGPT当做自己的生产力工具了——做视频!
不少网友在看到AI们的如此表现之后,表示整个人都通透了:
怎么玩?
这么强的工具,真的不想亲自玩一下?
操作一点也不麻烦。
首先,准备好OpenAI API和PINECONE API的密钥(后者是专为AI长期内存开发的一个数据库,使用前者则会消耗你OpenAI帐户中的余额,免费版本送18美元)。
Python要求3.8版本及以上。
如果你需要语音输出,你也可以准备一个ElevenLabs API的。
Ps. 获取地址都放在文末链接中了。
接下来, 打开你的CLI工具下载AutoGPT项目:
git clone https://github.com/Torantulino/Auto-GPT.git
然后:
cd ‘Auto-GPT’
pip install -r requirements.txt
接着找到AutoGPT的根文件夹,将“.env.template”重命名为“.env”并打开。
再将密钥都替换为你准备好的那些。
最后,在终端运行:
python scripts/main.py
如果要使用语音模式,运行:
python scripts/main.py —speak
如果不能访问GPT-4,开启“gpt3only”模式:
python scripts/main.py —gpt3only
现在,你就可以开始搞你自己的AutoGPT项目了。
记住在AuroGPT的每个操作之后,输入“NEXT COMMAND”授权程序继续。
尽管项目也提供了不用这么麻烦的“连续模式”,最开始运行时用这个命令:
python scripts/main.py —continuous
但作者强烈不推荐!!因为它可能会导致你的AI一直运行下去或执行你正常根本不会授权的操作。
如果你非要试试,风险自负……
以及默认情况下,AutoGPT用DALL-e生成图像,要换Stable Diffusion的话,需要一个HuggingFace API的令牌。
本质是“套娃”
简单介绍一下AutoGPT的原理。
AutoGPT由于扩大了自己的应用范围,包括执行文件操作、网页浏览和数据检索等,有别于我们之前见过的所有AI(GitHub上已揽获3.6万+标星)。
如Mila研究所前AI研究员@Lior分析:
AutoGPT相当于给了基于GPT的模型一个内存和一个主体(body)。
具体来说:
AutoGPT的架构基于GPT-4和GPT-3.5,靠API连接;
AutoGPT可以进行自主迭代,即通过自我批判性审查来改进输出、在先前工作的基础上进行构建,并为了获得更准确的结果集成prompt历史记录;
AutoGPT具有内存管理,集成了Pinecone数据库,因此它可进行长期内存存储,保存上下文并基于此进行决策改进。
而在推特博主Jay Hack看来,AutoGPT等类似工具的出现,其实证明了智能的本质是“套娃”这件事儿。
因为不论是AutoGPT还是BabyAGI,它们都是用LLM来递归地调用自己。
这在AI领域最近可谓是个大趋势:
专业一点的话来说,这叫模型堆叠,即模型“一路向下”,去套用别的模型来拆解并解决任务。
用咱大白话来说,这就是“套娃”。
除了AutoGPT、BabyAGI这些,还有ViperGPT、SayCan和ToolKit等最新工具,以及前面微软发布的VisualGPT和HugginGPT,都差不多是这个思想。
再往前一些,初代DALL·E其实就是CLIP套VAE。
有意思的是,Jay Hack指出,有着“人工智能元老”之称的马文·明斯基早在1986年就把人类智能描述成有许多相互作用子系统的组织。
最后,Jay Hack也表示,正是因为“套娃”这种操作,我们的AI现在才得以拿下更为复杂的任务。而这,也就离通用人工智能更近一步。
确实,有不少网友都赞同:
AutoGPT可能就是AI领域中的下一大趋势。
面对如此强大的“套娃”工具们,一些人则开始哀嚎了:
参考链接:
[1]https://twitter.com/AlphaSignalAI/status/1645847165066006529
[2]https://twitter.com/karpathy/status/1642598890573819905
[3]https://weibo.com/1644684112/MBK3WCt8o
[4]https://twitter.com/DataChaz/status/1645152577258962944
密钥获取地址:
https: //platform.openai.com/account/api-keys
https://www.pinecone.io/
https://elevenlabs.io
— 完 —
量子位智库「中国AIGC产业全景报告」
开放下载!
行业首份AIGC产业全景报告已经开放下载!
三大类玩家、四种商业模式、万亿规模市场、最值得关注的50家企业,还有具体的赛道部署机会和行业变革机遇,都将在报告内一一分析呈现。更多产业洞察,不容错过。
公众号后台回复 “ AIGC ” 即可下载完整报告~
点这里
推荐帖子
- 定时插座程序用KEIL检查没错且能生成HEX文件但是无法仿真
- 程序求助!!!!!如题定时插座程序用KEIL检查没错且能生成HEX文件但是无法仿真KEIL检查没错只是说明语句没有语法错误自然能能生成HEX文件而不能仿真,在与用什么仿真和怎么仿真,,,与仿真软件设置有关你是说软件仿真不能进行吗?qwqwqw2088发表于2016-5-2208:41KEIL检查没错只是说明语句没有语法错误自然能能生成HEX文件而不能仿真,在与用什么仿真和怎么仿真,... 放入protuse里面没有反应 是的!!放入protuse
- 洛Rin 51单片机
- 请教两个问题
- 1、Ndis库没有向nids微端口驱动的接口函数(如初始化函数等)下发irp,那代码中的irp是从哪里来的?ndis微端口驱动自己组建的吗?2、如何看到ndis微端口驱动中irp中包含的是什么板侧的指令?如断链指令请教两个问题
- lockwe 嵌入式系统
- ST最新传感器驱动
- github被收购以后是真不好用,以前STMemsStandardCdrivers里的传感驱动是在一个项目里的,当时在外网还可以直接打包下载,自从把各传感器都变成子模块后下载全部驱动就非常不方便。使用clone--recursivehttps://github.com/STMicroelectronics/STMems_Standard_C_drivers.git会经常出现Failedtoclone'xxx/driver'.Retryscheduled的错
- littleshrimp MEMS传感器
- 不知道quartus这个是什么问题,我也是蒙了!
- 本帖最后由jinghong21于2015-11-1719:05编辑 第一件事:现在在用单片机和FPGA写一个程序,之间用串口通信,FPGA有一个CS管脚,我用来作为接收使能的。结果程序好了,不过编译起来特别特别慢,我也是无语了,而且FPGA资源基本上已经占满了,根本没什么东西,不知道是怎么回事。没办法,把CS片选的管教去掉,只是不添加引脚,让代码不起作用,代码里面依旧还是做了判断,结果编译起来特别快,而且根本不占用资源。不知道是为什么会这个?第二件事:后来我就想,那就不要CS片
- jinghong21 Altera SoC
- 不公开datasheet的芯片
- datasheet不公开的芯片一直都有,分成2类。一类是一些比较高档的芯片,处于绝对垄断地位的厂商才有。比如以前搞运动相机用小日子的索尼IMX283sensor,必须签各种协议、承诺达到xx用量才能拿得到资料。还有一类是山寨抄袭的芯片,这种芯片是把市面上成熟的芯片拿来分析版图和提取电路网表,然后拿去流片生产,然后拿去卖。这种芯片肯定是不敢公开datasheet的,不然就完全露馅了,所以这种芯片只能再网上只能找到一页的很简略的格式都不规范的简介,甚至简介都没有,只提供一个联系
- Nubility 综合技术交流
- 【2024 DigiKey创意大赛】基于树莓派的幸福晚年辅助宝
- 一、项目简介1、设计名称基于树莓派的幸福晚年辅助宝2、项目照片3、项目用到的板卡1)、RaspberryPi5处理器:2.4GHz4核64位Cortex-A76内存:4GBLPDDR4X-4267通讯接口:Wi-Fi6(802.11ac)支持2.4GHz和5GHz频段Bluetooth5.2支持低功耗蓝牙连接1个2.5Gbps1000MEthernet2个U
- sumoon_yao DigiKey得捷技术专区