ChatGpt的发展历程中,除了大模型的演进,也涌现了大量垂直小模型,面向垂直行业“淘金”似乎成为了更多科技公司的共同选择。
以软件开发行业为例,在降本、增效、提速的目标下,大量“小模型”开始涌现,在这些助力软件开发行业高质量发展的“小模型”中,不乏值得我们回顾的优秀案例。
01ChatGPT对软件开发的影响有多大?
事实上,ChatGPT不仅带动了互联网、IT、云计算等科技公司新概念的发展,当前的聊天机器人市场也带动了软件开发行业的增长。实践表明,程序员并不是简单地敲代码,需要花费80%的时间进行调试、修改和沟通协调,以同步客户需求信息。因此,ChatGPT的出现将帮助程序员解决一些简单的代码编写任务,减少编写代码的时间,提高软件开发效率。目前,国内一些公司如软件开发公司福祉世软件等已从中受益,并在全面接入ChatGPT后成功在科创板上市。
据知情人士透露,软件公司Freshworks首席执行官Girish Mathrubootham对《财富》杂志表示:“软件开发以前需要8到10周的时间,但现在员工使用ChatGPT编写代码,不到一周就可以完成。”
在理解ChatGPT背后的逻辑之前,我们需要先了解什么是大型语言模型(LLM)。大型语言模型(LLM)已经被业界明确定义,通过深度学习算法进行训练,利用大量语料数据学习文本的概率分布和语法结构,生成与语料相似的高质量新文本,通过不断的训练,可以提高生成文本的质量。目前大型语言模型(LLM)可以应用于问答、文本识别、文本分类、文本生成、代码生成等场景。但是大型语言模型(LLM)目前无法识别非真实的语料数据,这也促使业界成立相关数据标准公司,以保证语料数据的正确使用。
大型语言模型 (LLM) 通常在包含大量数据的大型数据集上进行训练。因此,ChatGPT 对软件开发具有以下好处:
首先,ChatGPT 可以加速开发者训练自然语言处理模型的过程。通过预训练生成的语言模型可以提高模型的准确率和性能。例如在命名实体识别任务中,ChatGPT 通过学习命名实体的语义和结构特征来生成高质量的数据集,从而提高模型的准确率和效率。此外,ChatGPT 还可以作为各种自然语言处理任务的预训练语言模型。
其次,ChatGPT 还可以用于软件开发过程中的自动生成代码,它可以通过学习代码的语义和结构来生成高质量的程序代码。比如当我们输入“从一个数组中选取前 n 个最大的元素”时,ChatGPT 就可以生成相应的代码来实现这个功能。
第三,ChatGPT 可以实现代码智能补全,在编写程序时,它可以为下一个可能的单词或语句提供提示,让程序员可以更快地编写代码。通过代码上下文,ChatGPT 可以预测下一个可能的关键字或语句软件系统模型,让程序员在编码过程中更加高效。
第四,ChatGPT还可以用于对话式编程。在这种编程模式下,程序员可以用自然语言与ChatGPT进行交互,告诉它要实现的功能和需求。通过分析和理解自然语言的含义,ChatGPT会自动将其转化为程序代码,实现所需的功能。
TensorFlow 2.0 是开发者中最受欢迎的机器学习库之一。它包含 Keras API,这是一种对话式编程 API,可让编写神经网络模型更加方便和简单。Keras API 可以使用 ChatGPT 进行自然语言处理,并提供交互式编程模式。
…
考虑到对软件开发行业的经济影响,令人震惊的是,ChatGPT背后的巨头公司投入了大量的资源。从目前的情况来看,基于大型语言模型(LLM)的ChatGPT的初步开发可能只能由少数全球科技巨头主导。
不管ChatGPT是如何训练的,所有参与者都有一个共同的诉求,就是希望有更多的企业购买并使用这个工具,这关系到参与者的前期投入和研究回报。
那么,谁来为ChatGPT的新产品买单呢?这是一个值得深入探讨的问题。
02 从巨头到垂直行业应用,模型越小,未来机会就越多!
不过在针对具体行业开发 ChatGPT 方面,主要参与者很可能并非像微软、谷歌等在 ChatGPT 上投入巨资的科技巨头,毕竟他们更热衷于大规模模型训练,比如搜索引擎等重大应用。当然,在国内,百度、腾讯、阿里巴巴、字节跳动、京东、360、科大讯飞等知名科技公司也相继参与了 ChatGPT 的研发。不过这些科技公司更专注于在现有业务系统中加入 ChatGPT 功能,在垂直行业布局的参与度还比较低。
可以看出,在ChatGPT垂直行业的发展中,具有强大集成能力的软件开发商仍然发挥着主要作用。
进一步分析发现,将ChatGPT应用到具体的行业中,可以帮助其实现更好的商业化。有人可能会质疑:ChatGPT为什么要向垂直行业领域发展,并逐步推出小模型呢?这种从大模型到小模型的转变,有以下几个效果,对ChatGPT在行业中的普及有非常积极的影响。
首先,它带来了新的就业机会。因为开发ChatGPT所涉及的代码编写需要专业人员的技术支持。他们负责调试和修改ChatGPT的代码,并根据客户需求进行个性化设置。这个过程为程序员创造了新的就业机会。
第二是节省软件代码编写的时间。前面提到,程序员其实只花 20% 左右的时间在编写代码上,剩下的 80% 的时间都花在调试、修改、沟通、协调、同步客户需求信息上。因此,使用 ChatGPT 可以帮助程序员处理一些简单的代码编写任务,减少编写代码所需的时间,提高软件开发的效率。
第三是让软件开发更加有逻辑性。ChatGPT的优势在于强大的逻辑推理能力,这是计算能力和虚拟训练的结合,它能发掘训练数据统计中蕴含的规律,让写出来的代码更有逻辑性。
第四,更容易将ChatGPT与垂直行业需求结合起来,发挥出行业应用价值。可以根据不同行业的需求,构建独立的、逻辑清晰、数据准确的行业语料库,提升ChatGPT的训练效果。通过更精准的训练,ChatGPT也能更快应用于各个行业。小型的垂直行业模型和专业领域数据集,可以缩小企业训练的范围和强度,降低整体的训练成本,推动ChatGPT进入企业市场。到那个阶段,ChatGPT将能够实现商业化发展,引发各个行业的竞争,形成产业化的ChatGPT市场。
显然,无论是在少数大型企业,还是在更多的垂直行业,未来 ChatGPT 相关模型应该会更小,以符合行业发展的客观规律。但业内专家认为,任何行业的发展都需要经历三个阶段,从“make it work”到“make it perform”再到“make it cheap”。目前 ChatGPT 处于“make it perform”的可用性阶段,未来必将走向更易用、更实惠的阶段,让 ChatGPT 真正融入各个垂直行业,普及到更广泛的用户。
需要强调从“能用到好用再到用得起”的发展规律,因为只有真正实现 ChatGPT 的“廉价化”,打造符合行业应用需求、价格为大多数人都能承受的专业聊天机器人,才能引发大规模普及,真正实现聊天机器人的商业化。这个过程会从最初“调侃”ChatGPT 的热度,逐渐转变为其落地行业应用,展现出前所未有的行业价值,让更多立志在 ChatGPT 淘金热中取得成功的企业得以实现目标。
03FuncGPT AI生成器让ChatGPT走进软件开发行业的千家万户
ChatGPT 的自动代码生成技术虽然在代码编写领域得到了广泛的应用,但仍然面临一些挑战,其中最重要的挑战就是语言模型的准确性。然而,对编程语言的理解还存在一定的瓶颈,因此如果用户输入的文本描述不准确、不规范,生成的代码可能达不到预期;如果缺乏企业最佳实践,生成的代码可能对我没什么用;生成的功能代码不符合行业标准,可读性不强,没有参考价值等等。
深谙行业know-how的垂直细分小模型的出现,改变了上述局面。近日,飞算科技发布了一款AIGF产品——FuncGPT AI生成器,希望通过大模型技术,彻底解决全栈全自动开发模式中手动编写函数的痛点。据了解,作为飞算SoFlu软件机器人的一部分软件系统模型,慧函数支持全类型函数的创建。AIGF通过采用代码编写和大规模机器联合训练的最佳实践,赋能软件开发,实现函数的自然语言生成,秒级全自动开发。更重要的是,SoFlu中慧函数的使用,在生成后即可直接应用,进一步保证了软件开发整体的效率和安全性。
FuncGPT AI生成器有五大特点:
l 自然语言:可以通过自然语言生成函数,降低软件开发的门槛。
l 秒级功能开发:秒级自动化功能开发,秒级完成,效率提升千倍。
l 一站式功能开发及应用:功能生成后可直接应用,保证效率和安全。
l 质量可靠:生成的函数代码符合业界标准、可读性好、满足最优解。
l 灵活生成:可根据开发者的具体需求生成,并支持调整和修改。
飞算科技首席科学家陈定伟表示:“慧函数采用大模型技术,专业团队花了两年时间训练模型,它生成的函数代码符合业界标准,可读性好,满足最优解。”
可以预见,HuiFunction的支持将进一步增强SoFlu软件机器人的自动化进程,提高软件开发效率。同时相信AIGF等功能和技术的支持将使SoFlu软件机器人在软件工程降本增效的道路上走得更快、更远。