在 React 中部署并验证游戏的功能和资源配置是否正确
然后,Devin就会开始按照他设计的清单编写代码,然后部署服务……
Devin部署后端服务器的流程
一切工作终于完成后,一个点击玩游戏的链接呈现在我们面前。
2. 独立发现并修复bug
不仅开发和部署可以一次性完成,Devin的调试能力也是一流的。
开发人员给了 Devin 一个 GitHub 链接,让他熟悉该项目,然后准备数据进行测试。
然后,Devin会一步步编写测试程序,准备好相关数据,然后运行。
结果,在开发者发布的完整项目中,Devin居然发现了连开发者本人都没有发现的漏洞。
发现漏洞后,Devin会回溯错误报告的位置和相应的数据,然后分析原因并提供解决方案。
经过最终调试,程序中的Bug被成功修复app软件,测试完美通过。
3. 训练和微调你自己的人工智能模型
除了这些通用的程序或项目之外,作为全能的人工智能助手,德文还有能力帮助人类训练和微调其他人工智能。
对于一些常见的模型(比如例子中的Llama),用户只需要在宣传中提及模型的名称,Devin就会直接知道要训练哪个模型。
在这个例子中,微调的具体方法(QLoRA)以GitHub链接的形式输入到Devin。
接到指令后,德文仍然像正常程序一样规划并执行。所需的环境和依赖项以及模型本身将自动下载并安装。
这些准备工作完成后,微调工作将有序进行,并且可以实时监控状态。
4.修复开源库
Devin的能力不仅在于开发者自己的项目,还在于开源社区。
例如,我们只需要把GitHub项目的issue链接扔给Devin,它就会立即完成所有需要的配置,自动收集上下文信息,然后开始解决问题。
当然,开源项目的功能请求是没有问题的。该过程与解决问题相同。您自己配置它,收集上下文,然后开始编码。
5.成熟的生产库也可以做出贡献
还没完,Devin还可以给我们展示成熟的制作库。
据官方介绍,sympy Python代数系统存在对数计算错误,经Devin成功解决:
配置环境、重现bug、自己编码修复、测试,一气呵成。
这是图书馆
6、不熟悉的技术,现学现卖
终于,当遇到自己不会的技能时,德文可以直接学习并快速付诸实践。
将您的新技术文章的链接直接扔给 Devin:
嗨德文!我在这篇博客文章(附有网址)中发现可以生成带有隐藏文本的图像。文章中提到了一个脚本。你能配置它并实际为我生成一些图片吗?
诗。只需使用 ControlNet 即可完成此操作。
Devin收到请求后,首先询问了更详细的要求,然后开始阅读博客文章,并像往常一样规划出行动计划。
一旦您制定了详细的行动计划,就可以在几分钟内立即进行编码和调试。
同样,如果你在这里遇到错误也不要惊慌,Devin 也能够直接修复它们。
完成工具的搭建后,Devin并没有麻烦人类自己去配置和使用,而是一气呵成,最终生成了我们想要的带有隐藏文本的图像:
可以说,表现还是相当惊人的。
在具体测试中,德文的成绩同样令人印象深刻。
在评估Devin的表现时,团队没有使用常见的Humaneval,而是使用更具挑战性的SWE-bench。
该数据集由 GitHub 中的实际问题组成,Devin 在没有任何帮助的情况下达到了 13.86% 的最高解决率。
同样在无协助的条件下,GPT-4的问题解决率为零。之前的最佳水平是1.96%,有了辅助之后只有4.8%。
公司每人IOI金牌一枚
如此突破性的新成就背后是一家鲜为人知的初创公司。
但这个“鲜为人知的名声”背后,其实是一个由10位编程天才组成的团队,拥有10枚IOI金牌……每人一枚。
Devin 背后的公司名为 Cognition AI,总部位于纽约和旧金山。它定位为专注于推理的应用人工智能实验室。
这家一直秘密运作的公司在两个月前正式成立。
目前,团队只有10人,但总共获得了10枚IOI金牌。 Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro 等创始成员均曾从事人工智能前沿工作。
据悉,Cognition AI由Scott Wu、Stevenhao和WaldenYan创立。
联合创始人兼首席执行官吴斯科特。根据我们目前查到的信息app软件,Scott Wu就读于哈佛大学,是Lunchclub的联合创始人兼CTO。
连续三年荣获IOI金奖:
联合创始人兼首席技术官 Stevenhao 毕业于麻省理工学院计算机科学专业,曾就职于 Scale AI、Jane Street、DE Shaw 和 Quora。
也是前 IOI 金牌得主:
联合创始人兼首席产品官 Walden 在哈佛大学学习计算机科学和经济学。他还从事 MIT PRIMES 密码学和机器学习方面的计算机科学研究。他还入围了沃顿商学院高中投资竞赛的北美决赛。
2020年第32届IOI金牌获得者:
根据 X 推文的转发,其中一位创始成员被曝光。
Neal Wu 也有哈佛教育经历,曾在 tryramp 和 GoogleBrain 工作过。
整个团队的长期目标是通过解决推理问题来解锁广泛学科的新可能性,而“代码只是开始”。
然而,对于 Devin 来说,他们还没有透露他们是如何实现这一壮举的,包括他们是使用自己的专有模型还是第三方模型。
此外,Cognition AI现已获得由硅谷投资大亨Peter Thiel的Founders Fund领投的2100万美元A轮融资。
众所周知,彼得·蒂尔因发现此类突破性创新项目而闻名,哈佛背景的企业家与他的关系更为密切。
他在之前的早期投资中也有类似的背景,最著名的是扎克伯格和 Facebook。
“自动化软件工程类似于自动驾驶”
当Devin出现的时候,很多工程师都震惊了:软件工程师……要失业了? ? ?
不过,仍有人乐观:人工智能终于将我们从繁重的编程任务中解放出来。
前特斯拉人工智能总监卡帕西给出了保证。
自动化软件工程目前看起来与自动驾驶类似。
具体体现在开发过程中:首先人类手动编写代码,然后GitHub Copilot自动完成几行,然后ChatGPT编写代码块,现在Devin出现。
接下来,他认为自动化软件工程将演变成协调开发人员协同编写代码所需的众多工具:终端、浏览器、代码编辑器等以及负责监督的人类,逐渐转向更高级别的工作。
结合卡帕西对自动驾驶的经验和理解,他所表达的更多是一个渐进式的推进,即会有一段人机协同驾驶的时期,然后经过数据和迭代反馈,就可以实现完全自动驾驶。 。
自动化软件也类似,首先是低代码,然后是零代码,最后根本不需要人写代码。
Perplexity AI CEO给予了高度肯定:这应该是任何Agent的首次演示。
它似乎跨越了人类水平的门槛并且工作可靠。它还告诉我们通过结合 LLM 和树搜索算法可以实现什么。
扑克AI之父、前FAIR(meta)研究科学家、现OpenAI成员Noam Brown转发Kai Mic:
2024 年对于人工智能来说是激动人心的一年。
那么,程序员准备好解放了吗?
参考链接:
[1]
[2]
[3]
[4]
[5]