看来OpenAI在代码大模型上正在下大棋啊。

Semafor从知情人士获悉,OpenAI过去六个月在拉丁美洲和东欧等地区招募了大约 1,000 名远程外包员工,其中约 60% 负责“数据标记”,另外 40% 是程序员,他们为 OpenAI 的模型创建数据以学习软件开发任务。 OpenAI 将自然语言翻译成代码的 Codex 产品已于 2021 年 8 月推出。

“一家决心提供世界一流的人工智能技术,让世界变得更美好、更高效的知名公司正在寻找 Python 开发人员,”外包公司发布的一份西班牙文 OpenAI 职位描述这样写道。

此前,OpenAI 使用从 GitHub 上抓取的代码训练其模型。现在,OpenAI 似乎正在构建一个数据集,其中不仅包括代码行,还包括代码行背后用自然语言表达的人类解释。

南美的一位软件开发人员完成了 OpenAI 的五小时无偿编程测试,他告诉 Semafor,自己被要求处理一系列由两部分组成的作业。先是一个编程问题,要求用书面英语解释如何解决。然后,要求提供具体解答。如果他发现了bug,OpenAI 会要求他详细说明问题是什么以及应该如何纠正,而不是简单地修复。

“他们很可能想为这个模型提供一种非常具体的训练数据,由人类提供按步骤的思考过程,”这位开发人员说,他要求保持匿名以避免影响可能的工作机会。他尚未被 OpenAI 聘用或拒绝。

OpenAI 的CEO Sam Altman 最近在Twitter上赞叹公司的“人才密度”,正式员工已经达到375人。

这个数字显然不包括外包员工。但在 OpenAI 已发表的研究中,该公司一再指出外包劳动力在构建其技术中的重要性。 “最后,我们要感谢所有外包员工提供了训练模型所必需的数据,”OpenAI 的一组研究人员去年在一篇论文中写道。

Semofor的编辑Reed Albergotti在文章后面说:

数百名程序员齐心协力“教”模型如何编写基本代码,ChatGPT 背后的技术可能会朝着一种新的软件开发方向发展,就像重型设备对建筑行业一样对软件行业具有变革性。

OpenAI 的 Codex 技术已经在微软的 GitHub 中用于支持一项名为“Copilot”的功能,该功能本质上是为程序员自动完成代码行。

基于 OpenAI 的合同程序员所做的工作,Copilot 将变得更像自动驾驶,消除一些编写代码所涉及的死记硬背的工作,并最终完全消除一些编程工作。

硅谷高管们已经在设想各种产品,让具有极少或没有编程经验的有创造力的人,通过简单地向 AI 算法描述他们的想法,就能构建从网站到视频游戏的一切。

Semafor的主编Ben Smith(他也是刚刚因为与OpenAI合作而股票大涨的BuzzFeed之前的主编)转发了这篇文章并评论:

媒体同学喜欢危言耸听吸引流量。那AI研究者怎么看呢?很巧,特斯拉 AI 前负责人 Andrej Karpathy 前几天也在Twitter说了本质上类似的话:

英语现在是最热门的新编程语言了。The hottest new programming language is English

这条推前一天,他转发了一篇文章,文中一位程序员不到一个小时,就凭借文字让ChatGPT开发了一个类似Siri的智能语音助手。(详情可以访问:https://matemarschalko.medium.com/chatgpt-in-an-ios-shortcut-worlds-smartest-homekit-voice-assistant-9a33b780007a )他评论道:

这太棒了——你可以用……英语编写你自己的个性化助手。
这种最热门的编程语言也比其他任何语言都早几百年。现在你可以使用基于文本的通用计算机来执行它。

接下来,编程这项技能会像下围棋一样被计算机彻底颠覆,还是像实现完全自动驾驶一样困难重重,大家怎么看?欢迎评论。