家人们,今早起来 x 上一个帖子引起了奶茶的注意:
什么?奶茶以为自己没睡醒,揉了揉眼睛一看,没看错的话,这不就是AI结束了比赛吗。。。。
原文链接:
https://www.reddit.com/r/leetcode/comments/1ex7a1k/i_automated_leetcode_using_claudes_35_sonnet_api/?rdt=48556
奶茶的脑海里出现了两个想法:
-
面试官休想再用难题拦我了,BAT我来了!
-
按照面试中对程序员能力的要求来看,四舍五入一下,AI 是不是又能替代我们一部分技能了呢?
事情是这样的:
一位技术大佬(哦不,在我心里是巨佬)通过使用 Selenium 和 BeautifulSoup 进行网页抓取,然后使用 Claude 的 3.5 Sonnet API 和 Python 实现了 LeetCode解题的自动化。
这个脚本在 24 小时内自主完成了 633 道题目,其中包括 217 道简单题、359 道中等题和 57 道困难题,总共花费了 9 美元,成功率达到了 86%。
在解题过程中Claude 实际上不断分析了失败的测试结果,并根据测试结果和当前尝试的代码重新尝试解决问题,从而使它能够成功完成问题。
完整的流程,大佬在原推上发了录屏~
这个比赛杀死器虽然还没有正式开源(其实从视频截图中能看到脚本代码),但是在网上已经引起了热烈的讨论和搓手期待:
▲蒂姆S2024是发布视频的大佬
哈哈哈哈,无人难过可还行:
也有“务实”的网友已经开始深谋远虑,避免面试时使用被发现的工具也已经就位:
大佬也陈述了自己为什么选择了 Claude 的 3.5 Sonnet:
我也尝试过 google/openai,但它们很烂Claude 在遵循与响应结构/响应规则相关的提示方面最为自律。我强迫它给我一些只包含代码的响应,以及一些我想要嵌套 Json 的响应,等等。OpenAl的模型和 Google 的 Gemini 都是垃圾,经常会偷偷地添加一些解释,然后将其复制粘贴到代码编辑器中(不好)。但是,既然OpenAl已经将结构化的 JSON 响应添加到他们的 4-o Mini 中,我会重新考虑使用他们的模型。
LeetCode,这个程序员的“试炼场”,如今也迎来了 AI 的挑战。AI 已经可以自动刷题了,这不禁让人思考:我们程序员的未来在哪里?现在AI的发展已经可以达到9美元 24 小时内刷到86%了,但这仅仅是个开始。。。
奶茶预计招聘流程很快就必须发生彻底改变,以对抗这样的工具以及来自人工智能的大规模应用。
大家怎么看呢~欢迎评论区和我们一起讨论~