1、背景概述
当前软件供给侧主要存在技术门槛高、人才缺口大、研发成本高等三大挑战,其中人才缺口已成为突出的问题。
根据赛迪研究院数据显示,近三年我国软件从业人员增速总体在5%左右,相比于软件业务收入15%的增速有较大差距,我国软件领域人才缺口呈现不断拉大的趋势。据《关键软件人才需求预测报告》预测,到2025年,软件行业从业人员总数将达到890万人,新增人才缺口约为192万人。
根据猎聘大数据研究院数据显示,我国软件从业人员中本科生及以上占比超过80%,本科以下基础技能型人才占比不足20%,现有人才结构与产业实际需求错配问题突出,基础技能型人才培养数量急需扩充。
传统的编程方式在处理复杂和重复的任务时可能会变得低效,而Copilot等智能编码助手可以通过学习和理解开发者的习惯和代码库,自动化地完成部分任务,从而提升生产力。随着AI技术的日益成熟,如自然语言处理和机器学习等,使得这类助手的使用更加广泛和实用。
2、业界现状
2.1概览
共计调研9家提供智能编码助手的厂商,列表如下:
序号 | 产品 | 地域 | 所属公司 | 发布时间 | 简介 |
---|---|---|---|---|---|
1 | 通义灵码 | 国内 | 阿里 | 2023年10月31日 | 提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、异常报错排查等能力 |
2 | Comate | 国内 | 百度 | 2023年6月6日 | 基于文心大模型,生成更符合实际研发场景的优质代码。 |
3 | iFlyCode | 国内 | 科大讯飞 | 2022年8月15日 | 在程序员编程过程中沉浸式交互生产代码建议 |
4 | CodeGeeX | 国内 | 北京智谱华章科技有限公司(简称“智谱AI”)、清华大学 | 2023年8月 | 实现代码的生成与补全、自动添加注视、代码翻译以及智能问答 |
5 | CodeWave | 国内 | 网易杭州研究院 | 2023年4月25日 | 以智能大模型和全栈低代码为核心,实现从“智能生成”到“可视化拖拽调整” |
6 | GitHub Copilot | 海外 | OpenAI、Microsoft微软 | 2021年6月29日 | 基于 GitHub 及其他网站的源代码,可根据上文提示为程序员自动编写下文代码。 |
7 | Code Whisper | 海外 | AWS 亚马逊 | 2022年6月 | 动根据现有的代码和注释生成建议 |
8 | InCoder | 海外 | MetaAI | 2022年4月 | 属于先进编程大模型,Python和JavaScript占据大部分 |
9 | CodeGen | 海外 | Salesforce | 2023年5月3日 | 帮助开发人员生成源代码 |
2.2分析维度
1)基于的大模型:如chatGPT、NL2SQL等
2)支持编码语言类型:如java、python、javascript等
3)支持的IDE环境:如VSCode、JetBrains系列:IntelliJ IDEA、Clion、PyCharm、WebStorm等
4)使用方式:是否开源,是否收费?
5)面向场景:如需求、编码、测试、部署等;
6)应用情况:在市场的推广情况?提效多少?
2.3 详细分析
1) 通义灵码(阿里)
官方网站:tongyi.aliyun.com/lingma?spm=…
通义灵码,是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云 SDK/OpenAPI 的使用场景调优,助力开发者高效、流畅的编码。
通义灵码基于的大模型:通义千问(通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均开源、免费、可商用)。
支持编码语言类型:支持 Java、Python、Go、C#、C/C++、JavaScript、TypeScript、PHP、Ruby、Rust、Scala、Kotlin 等主流编程语言。
支持的IDE环境:
兼容 Visual Studio Code、JetBrains IDEs 等主流编程工具。
通义灵码是开源的,在公测和试用期免费。
面向场景:
1) 代码智能生成
经过海量优秀开源代码数据训练,可根据当前代码文件及跨文件的上下文,为你生成行级/函数级代码、单元测试、代码注释等。沉浸式编码心流,秒级生成速度,让开发者更专注在技术设计,高质高效地完成编码工作。
2) 研发智能问答
基于海量研发文档、产品文档、通用研发知识、阿里云的云服务文档和 SDK/OpenAPI 文档等进行问答训练,解决研发问题。
通义灵码的市场推广情况暂未可知。
Comate是一款由百度智能云推出的代码助手,它基于文心大模型的理解和推理能力,可以实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,从而全面提升开发者的研发效率。
2) Comate(百度)
借助文心大模型的理解、推理能力,“Comate”可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。开发者可以通过插件等形式,在主流开发软件中使用“Comate”代码助手。
Comate是基于文心大模型的代码助手。
Comate目前已经覆盖了30余种编程语言,尤其在 C/C++、Python、Java、Go、PHP、JavaScript 等多个主流语言表现出色。
此外,Comate还支持程序员最常使用的主流IDE,开发者可以通过插件等形式,在不同软件中使用Comate。同时,结合飞桨深度学习框架与文心大模型,Comate可确保推理单次请求300ms左右,以极快的响应速度保障用户使用体验。
Comate是开源的,具体是否收费需要查看其官方网站或联系服务提供商。
在Comate辅助编写的代码中,近50%的建议代码被开发者采纳,目前在百度内部已经广泛应用到各类产品开发中。
3) iFlyCode(科大讯飞)
官方网站:iflycode.xfyun.cn
iFlyCode基于的大模型:暂未可知。
支持编码语言类型:iFlyCode支持多种编码语言:包括Python、JavaScript、C++、Java等。
支持的IDE环境:iFlyCode可以与多种IDE环境集成,提供VS Code、IntelliJ IDEA、CLion、PyCharm、WebStorm等IDE插件。
iFlyCode提供了免费的试用版,但面向企业的具体收费情况需要联系客服了解。
iFlyCode主要面向编程开发场景,包括需求分析、编码、测试和部署等阶段。通过智能推荐代码片段、自动补全代码等功能,提高开发者的编码效率和质量。
应用情况:关于iFlyCode在市场的推广情况,官网显示如下,尚无具体信息。
案例 :****
官网提供的基于iFlyCode的实践案例
【案例1】iFlyCode助力国产化迁移改造(windows迁移至Linux系统)
【案例2】iFlyCode完成一个类似ElementUi的Message消息提示的组件
4) CodeGeeX(智谱AI)
官方网站:codegeex.cn/
CodeGeeX基于 ChatGLM2-6B 基座语言模型。
CodeGeeX支持的编码语言类型包括Python、Java、C++/C、JavaScript、Go等数十种常见编程语言。
CodeGeeX支持多种主流IDE,如VS Code、IntelliJ IDEA、PyCharm、Vim等。
CodeGeeX是一个开源项目,对个人用户完全免费,面向企业提供CodeGeeX私有化部署服务(收费)。
CodeGeeX面向场景包括需求分析、编码、测试和部署等。
CodeGeeX的市场推广情况暂未可知。
5) CodeWave(网易)
CodeWave是一款智能低代码开发平台,它基于网易自研的大规模参数和深度学习能力的智能模型底座。这款平台让开发者可以通过自然语言描述需求,并结合可视化拖拽的方式快速搭建应用,极大地提升了应用开发的效率。
CodeWave主要面向企业级应用,支持多种编码语言类型,包括Java、Python、JavaScript等。此外,它也支持多种IDE环境,如VSCode、JetBrains系列(包括IntelliJ IDEA、Clion、PyCharm、WebStorm等)。
CodeWave用于需求分析、编码、测试等环节,还可以结合AI技术进行智能设计、智能D2C、智能业务分析BA、智能资产运营等功能,为企业的数字化转型提供了新的可能性。在网易,代码编程、代码生成、NL2SQL等垂直领域模型的应用探索已经取得初步成果,其中智能代码平台的工程师用户突破了3900名,覆盖了网易云音乐、互娱、雷火、智企、有道、严选等21个部门。
6) GitHub Copilot(OpenAI)
GitHub Copilot是一款由GitHub开发的AI辅助编程工具,其运作基于经过GitHub存储库中公开可用代码的庞大数据集训练的高级机器学习模型。这种模型能够分析上下文并实时提供相关代码建议。用户还可以通过编写自然语言注释来描述要让代码执行的操作,以便接收建议。此外,Copilot还能将注释转换为代码、创建单元测试和SQL查询等。
GitHub Copilot 支持十几种语言,包括 Python、JavaScript、TypeScript、Ruby 和 Go 等主流语言。
在多种IDE环境中都能使用,包括Visual Studio Code、JetBrains系列(如IntelliJ IDEA、PyCharm等)。
GitHub Copilot提供给用户1个月试用期。如果选择每月计费周期,则每个月将按10美元计费。如果选择每年计费周期,则每年将按100 美元计费。
据最新数据,GitHub Copilot发布还不到两年就已经为超过一百万的开发者编写了46%的代码,并且提高了55%的编码速度。
7) Code Whisper(亚马逊)
Code Whisper基于的大模型:Code Whisper是一个由OpenAI开发的AI代码补全工具,基于GPT-4(生成预训练Transformer 4)模型。
支持编码语言类型:Code Whisper支持多种编程语言,包括Java、Python、JavaScript等。
支持的IDE环境:Code Whisper目前主要支持VS Code编辑器,未来可能会扩展到更多的IDE和代码编辑器。
Code Whisper是一个商业产品,目前尚未开源。用户需要购买订阅才能使用该工具。
面向场景:Code Whisper主要用于提高开发者在编写代码时的生产力,包括需求分析、编码、测试、部署等场景。
应用情况:Code Whisper在市场中推广情况良好,根据一些初步的数据,Code Whisper可以帮助开发者节省约30%的时间来完成编码任务。。
8) InCoder(MetaAI)
InCoder是MetaAI在2022年4月发布的一个编程大模型。模型训练数据仅包含来自在线来源(如GitHub、GitLab和StackOverflow)的开放许可代码(Apache 2.0、MIT、BSD-2和BSD-3许可),其中重点是Python和JavaScript,但总共包括28种语言 - 总共约200GB的数据(经过去重、过滤和去污染处理)。
公开的模型预训练结果共2个版本,一个是67亿参数一个是13亿参数。
尽管InCoder的训练数据都是开放许可代码数据,但是MetaAI的InCoder模型确实开源的不可商用。
在支持编码语言类型方面,InCoder适用于多种编程语言,包括但不限于Java、Python和JavaScript等主流编程语言。
在支持的IDE环境方面,InCoder主要应用于文本编辑器,如VSCode、JetBrains系列:IntelliJ IDEA、Clion、PyCharm、WebStorm等。
9)CodeGen(Salesforce)
CodeGen是一款基于大规模预训练数据进行编程任务的生成模型。
CodeGen基于CodeGen-Mono模型。
在支持编码语言类型方面,CodeGen应该可以处理多种编程语言,包括Java、Python和JavaScript等主流编程语言。此外,还提供了对C++、Go等多种编程语言的支持。
对于支持的IDE环境,CodeGen主要应用于文本编辑器,如VSCode、JetBrains系列:IntelliJ IDEA、Clion、PyCharm、WebStorm等。
CodeGen是开源,Saleforce在2023年5月开源了第二代CodeGen:CodeGen2。
3、分析总结
智能编码助手是一种基于人工智能技术的软件开发工具,它通过分析代码库和开发者的编程习惯,提供实时的代码建议和自动补全功能。本次通过对智能编码助手的行业调研,总结其优点如下:
1)提高开发效率:智能编码助手的最大优势之一是能够显著提高开发团队的效率。通过自动化生成代码片段和提供智能建议,开发者可以更快地编写高质量的代码,减少重复性工作和错误。这对于大型项目和复杂的编码任务尤为重要。
2)个性化定制:Copilot可以根据每个开发者的偏好和风格进行个性化定制。它学习并适应开发者的编码习惯,提供与其风格相符的代码建议。这种个性化定制的功能可以提高开发者的工作效率,并提供更符合其期望的编码体验。
3)促进协作和知识共享:Copilot可以帮助团队成员之间更好地协作和共享知识。通过分析整个代码库,它可以为团队成员提供相关的代码建议和参考,帮助他们理解其他成员的代码逻辑和设计思路。这有助于加强团队合作和知识传递,提高整体的开发质量。
与此同时,智能编程助手也存在潜在的挑战和风险:例如,过度依赖自动化工具可能导致开发者失去对基础知识和技能的理解。此外,由于依赖于代码库和开发者的数据,数据隐私和安全也是一个重要的考虑因素。