发布信息

良好的团队合作是任何成功的人工智能项目的关键

作者:软荐小编      2024-10-18 21:02:44     102

良好的团队合作是任何成功的人工智能项目的关键,但将数据科学家和软件工程师整合成一支有效的力量并不是一件容易的事。

据 Gartner 预测,到 2025 年底,由于数据质量差、成本上升和缺乏商业价值等因素,30% 的人工智能项目将被放弃。数据科学家也很悲观,预计他们的项目中只有 22% 能够完成部署。

关于通过提供更好的人工智能来扭转这些糟糕数字的争论大部分都集中在技术上,但很少有人关注改善那些首先负责生产人工智能的科学家和工程师之间的关系。

这令人惊讶,因为尽管两者对人工智能都至关重要,但它们的工作实践并不完全一致——事实上,它们可能完全不兼容。如果无法解决这些差异,可能会阻碍项目交付,危及数据安全,并有可能破坏生产中的机器学习模型。

数据科学家和软件工程师需要更好的工作关系——但这是什么样的以及我们如何实现它?

DevOps 忘记了数据科学人员

随着云的蓬勃发展,业界的大部分注意力都集中在将开发人员和运营人员聚集在一起,以使软件交付和生命周期管理更加可预测并提高构建质量。

在此期间,数据科学家一直在雷达下飞行。他们被征召进入企业 IT 部门从事人工智能项目,但他们正在加入一个尚未为他们做好准备的环境。

我是什么意思?数据科学家的职责广泛,采用研究驱动的方法通过数据操作和分析来解决业务和领域级的挑战。他们在软件交付生命周期之外运行,使用特殊的工具和测试平台,使用开发人员使用的语言子集构建模型。

软件工程虽然是一门创造性和解决问题的学科,但采用了不同的方法。工程师以交付为中心,按优先顺序处理工作,并在冲刺中交付结果以实现特定目标。基于共享工作流程构建的工具链经过集成和自动化,可实现基于团队的协作和沟通。

这些差异在四个值得注意的领域产生了摩擦:

过程。数据科学家的较长周期并不完全适合流程和优先级驱动的敏捷流程。在两天内完成五项任务还是每隔几个小时发布一个新版本?这些目标与数据科学的本质背道而驰,如果不适应这一点,很快就会导致人工智能上的数据科学和软件工程失去同步。部署。自动交付是敏捷的一个关键原则,它消除了大型复杂的基于云的环境中手动交付的问题,并有助于确保正常运行时间。

但 15-30 分钟的部署目标对于当今大型且数据密集的法学硕士来说是行不通的。一到两个小时的部署更像是这样——但这对于服务离线来说是不可接受的时间长度。推动它,你就会破坏模型。生命周期。数据科学家使用自己的工具和构建流程生成机器学习模型代码,这些代码位于共享存储库之外,由工程团队检查和理解。它可以在质量保证的雷达下飞行。

这是通往黑盒人工智能的快速通道,工程师无法解释代码来识别和修复问题,也无法在下游进行有意义的更新和生命周期管理。数据安全。任何团队中的数据科学家很有可能会根据商业敏感数据或识别个人(例如客户或患者)的数据来训练他们的模型。如果在进入 DevOps 管道或生产环境之前没有对其进行处理,那么信息很可能会泄漏。没有正确或错误的答案

我们需要找到一条协作路径——我们可以通过营造良好的工作环境来实现这一点,该工作环境将两个学科联系起来以交付产品。这意味着数据科学家将软件工程的步伐内化,而后者则采用灵活的方式来适应科学家的需求。

以下是我将其付诸实践的三大建议:

建立共同目标。这将有助于团队同步。例如,项目目标是交付聊天机器人等成品吗?或者目标是功能更新,所有用户同时收到更新?有了共同目标,就可以设定和调整项目和团队的优先级。对于数据科学家来说,这意味着寻找方法来加速他们工作的各个方面,以实现工程冲刺,例如采用编码的最佳实践。对于数据科学家来说,这是一种采用更加以产品为导向的思维方式进行交付的软方法,但这也意味着软件工程师可以开始将研究积压纳入交付时间表。

创建共享工作流程以提供透明的代码和强大的人工智能。加入人工智能项目团队拼图的不同部分:确保研究模型的数据科学家连接到后端生产系统和前端,而软件工程师则专注于确保一切正常。这意味着根据既定的最佳实践使用共享工具,遵循通用源代码控制、版本控制和质量保证等程序。任命一名项目负责人,可以在需要时介入产品工程和交付管理。

此人应该具有构建产品的经验并了解产品生命周期的基础知识,以便他们能够识别问题并为团队提供答案。他们应该拥有做出战术决策的技能和经验,例如确定软件冲刺的范围。最终,他们应该是一个项目多语言者——能够理解科学家和工程师,充当翻译并领导两者。

数据科学家和软件开发人员的运作方式不同,但他们对项目成功有着共同的兴趣——利用这一点就是诀窍。如果数据科学家能够与软件工程中的敏捷驱动交付保持一致,并且软件工程师能够适应数据挖掘同事的步伐,那么这对所有相关人员来说都是一场胜利。团队之间完善的协作系统将提高代码质量,意味着更快的发布,并最终交付能够完成部署并开始满足业务需求的人工智能系统。

您可能还喜欢……

生成式人工智能开发需要不同的测试方法

更好产品的秘诀是什么?让工程师驱动愿景

相关内容 查看全部