全球开发者数量激增,GenAI 项目呈爆炸式增长趋势,推动编程语言的应用格局也发生了巨大变化,最新的 GitHub Octoverse 报告来了!
Python 首次超越 JavaScript,成为 GitHub 平台最顶级编程语言
不同于流传“AI 即将取代程序员”的种种言论,GitHub 在最新发布的 2024 年度 Octoverse 开源状态报告中指出,随着 AI 的迅速发展,越来越多的开发者将 AI 模型构建到应用程序中,并大量参与到 GitHub 上的 AI 项目中。
截至目前,GitHub 上有 5.18 亿个项目,同比增长 25%,2024 年期间的项目贡献量达 52 亿次。
此外,GitHub 上托管的公共 AI 项目几乎比去年增加了一倍,达到了 137000 个,超过一百万的开源维护者、学生和教师正在使用免费的 GitHub Copilot 工具。
在这一趋势下,一个出乎众人意料的调查结果出现了——Python 取代 JavaScript 成为 GitHub 上最受欢迎的语言,终结了 JavaScript 长达十年的霸主之位。这也是自 2019 年 Python 首次超越 Java 稳居第二以来,又一次发生大规模的变化。
Python 软件基金会执行董事 Deb Nicholson 表示:“我们的目标是让 Python 成为一个出色的工具,帮助不断壮大的开发者社区构建他们所设想的世界。我们非常高兴地了解到 Python 在 GitHub 上的受欢迎程度持续上升,尤其是随着 Jupyter Notebooks、数据分析、AI 和开源技术的使用增加。”
GitHub 特别指出 Python 在该平台上流行的两个关键因素——不止生成式 AI 的兴起这一层原因,还有数据科学的加持。
GitHub 补充道:“Python 在机器学习、数据科学、科学计算、业余爱好者和家庭自动化等领域有着广泛的应用。Python 使用率的上升与来自 STEM 领域的大量人群加入开源社区(而非传统的软件开发者社区)有关。”
值得注意的是,JavaScript 依然在 GitHub 代码推送活动中占据第一位。更多开发者仍然更频繁地使用 JavaScript 推送代码,但在 GitHub 上所有贡献类型的总体活跃度上,Python 排在了第一位。
虽然 Python 的贡献者数量在代码推送和其他活跃度方面的增长速度都超过了 JavaScript,但并未超过 JavaScript 和 TypeScript 的总和。与其说是 JavaScript 被 Python 超越是因为其社区发展放缓,不如说是越来越多的新提交转向了 TypeScript 语言。TypeScript 是 JavaScript 的超集,且与 JavaScript 共享 npm 生态系统,使得 JavaScript 开发者可以轻松逐步采用。
时下,TypeScript 正在蚕食 JavaScript 的地位。从 2014 年到 2019 年呈指数级增长后,TypeScript 去年超越 Java,成为 GitHub 上排名前三的编程语言。它的持续增长也显示了其作为编程语言、类型检查器和编译器一体化工具的实用性。
当然,受益于机器学习兴起的不仅仅是 Python。Jupyter Notebooks 的使用率在过去一年中飙升了 92%,自 2022 年以来飙升了 170%。
GitHub 在发布报告中称,“开发人员的概念以及开发人员的工作范围正在发生变化。Python、HCL 和 Jupyter Notebooks 等的兴起表明,开发人员的概念已不仅限于软件开发人员,还包括运营或 IT 开发人员、机器学习研究人员和数据科学家等角色。”
GenAI 的现状
过去一年里,人工智能正在帮助鼓励全球范围内的编码,使来自更多国家的人们能够更轻松地进行编码。
报告称:“一些非英语人口大国的崛起值得关注,因为与此同时,生成式人工智能工具也在不断涌现,这些工具越来越多地使开发人员能够用自然语言编写代码。”
开发者们从此前关注 AI 前沿技术探索转而更关注 AI 的落地,这对行业来说是个好消息。GitHub 指出,通过吸引更加多元化的开发者社区,这最终将推动长期创新。
就目前而言,AI 模型正在成为开发者技术栈的一部分。GitHub 表示,生成式 AI 的创新在 GitHub 上逐渐进入公共代码库,显示出开发者越来越多地在开源环境中进行构建。随着开发者发现越来越多的 AI 用例,生成式 AI 模型在软件开发中的角色已从帮助开发者编写代码,转变为构建应用程序的新基石。
然而,开发者对性能良好、计算成本低的小型模型的需求日益增长,主要源于在智能手机中嵌入 AI 模型的需求。值得注意的是,2024 年开发者数量增长最快的开源 AI 项目是 ollama/ollama,这表明本地运行的大型语言模型(LLM)的实验在增加。随着模型变得更小、计算要求更低,GitHub 预计会有更多开发者在应用中使用这些模型。
GitHub 上的开发者正在努力降低 AI 实验的门槛。排名前 10 的公共生成式 AI 项目致力于改善对 AI 模型的访问,从而使实验变得更容易。
据 GitHub 统计,开发者在 AI 开发工作也出现了一些新趋势同样值得关注:
小型模型的兴起。在过去的一年里,GitHub 上的开发者开始使用 Meta 的 LLaMA 模型,这表明人们对小型开源模型的兴趣日益增加。
针对专业用途的 AI 工具开发。比如,通过项目 binary-husky/gpt_academic,可以看到开发者越来越关注开发专门用于学术研究等特定场景的 AI 工具。
对 AI 代理自动化的持续关注。AutoGPT 相关项目的持续活跃表明,自动化仍然是探索的重点领域,开发者正在致力于增强 AI 代理的能力。
更多报告内容详见:https://github.blog/news-insights/octoverse/octoverse-2024/