开源数据科学和机器语言的人工智能平台权威指南

探索顶级开源工具和跨行业用例。采取战略行动,授权从业者和团队,构建、部署和维护安全的人工智能解决方案。

审查和维护人员:
约瑟夫·柯拉西,高级经理,技术账户管理和解决方案架构,Anaconda
克里斯·斯蒂杜哈尔,产品管理总监(企业),Anaconda
纳内特·乔治,产品营销经理,Anaconda

不可否认,人工智能正在迅速改变我们所知道的生活。领先的科技公司正在大力投资,谷歌首席执行官桑达尔·皮查伊将人工智能的影响比作电和火。用人工智能来改进产品和服务的组织正在看到其投资的显著财务回报。我们才刚开始看到人工智能前景的端倪。

然而,对于许多组织来说,利用人工智能实现商业价值仍然是一个难以把控的目标。工具是不断变化的,完全不同的用例分散在整个企业中,将有用的人工智能安排到生产中是非常复杂的。一些数据科学和工程团队想要应用机器学习和深度学习来解决业务问题,他们需要面对一系列难以理解的平台、库和软件。

评估和决定如何应用最新的工具和技术来开发、部署和维护高性能模型,需要人员之间的跨职能努力,技术上的战略投资,以及过程的不断重新校准。

我们创建本指南是为了方便参考人工智能平台、常见用例以及人工智能平台评估中的考虑因素。如果您觉得有帮助,请收藏此页,并与同事分享。

目录

介绍

在本指南中,我们将介绍开源数据科学和机器学习的人工智能平台。

人工智能平台, 数据科学, 开源:

我们从基础开始。

按行业分类的人工智能用例:

服务和产品开发是常见的。

人工智能平台需要具备的7大能力:

人工智能成功与否,取决于组织大规模构建机器学习模型,并对模型进行快速部署的能力。

向人工智能平台提供商提问:

与潜在的人工智能平台供应商交谈时,可参考这份问题清单。

Anaconda的策略:

为Python提供安全、集中的解决方案

介绍

在本指南中,我们将介绍用于开源数据科学和机器学习的人工智能平台。

我们将衡量并考虑人工智能平台的利弊,这可以帮助您开发和部署数据科学和机器学习算法、模型和系统。我们将探讨企业组织中的常见用例,以及在您大规模利用人工智能过程中,可以使用的一些开源工具。最后,我们将分享人工智能平台的最佳实践,包括向潜在技术提供商提出的问题。

人工智能平台,数据科学,开源

让我们从基础知识开始,为那些正在学习人工智能平台、机器学习和深度学习的人提供信息,同时为我们奠定基础,指导我们在本指南中思考工具和技术。

什么是人工智能平台?

人工智能(AI)平台是一套集成技术,让人们能够开发、测试、部署和刷新机器学习(ML)和深度学习模型。人工智能将各种工具和技术相结合,使机器能够比人类更快、更准确地分析数据、做出预测并采取行动。

企业人工智能平台能让组织大规模构建和维护人工智能应用程序。人工智能平台可以:

  1. 集中数据分析和数据科学协作
  2. 精简机器学习开发和生产工作流程,有时也称为机器学习运维或MLOps
  3. 促进数据科学和工程团队的合作
  4. 将开发人工智能系统过程中的部分任务自动化
  5. 监测生产中的人工智能模型和系统

如何使用人工智能平台?

为数据科学和工程从业人员准备人工智能平台的方法有很多。您的方法将基于组织的财力,团队的计算,数据处理基础设施,以及团队的专业知识。一般来说,在为团队创建协同建构、部署人工智能的环境时,您有三种选择:

选择1:购买端到端人工智能平台

在端到端人工智能平台市场上,有几家大企业占据主导地位。谷歌云平台(GCP)、微软 Azure 和亚马逊网络服务(AWS)都是这一领域的领导者,它们为想要在运营中使用人工智能的企业提供端到端解决方案和工具,如AWS Sagemaker。这个选择可能比较昂贵,让您只能使用某些工具或技术。因此,仔细评估人工智能平台提供的具体价值非常重要。

每个平台都有自己的优缺点,因此选择平台非常重要,这一平台要适用于您的特定用例,并能与您整个组织的其他技术紧密结合。

好处

您可以快速上手使用工具,为企业提供支持。工具和软件会经常更新,从而提高可靠性,完善性能,增强安全性。

挑战

工具可能没有根据您的特定用例进行配置,这就需要在开始时安排更多的工程支持。随着项目的发展和资源的重新调整,您之前选择的工具可能无法支持新的需求。

选择2:构建您自己的人工智能平台

许多企业机构都选择构建自己的人工智能平台。这一选择往往取决于项目负责人是否希望企业构建并拥有人工智能技术堆栈中的元素。

这就是改革者 Uber 和 Netflix 所做的事情;它们通过将开源工具、专有模型和云基础设施或计算资源的企业提供商组合在一起,建立了自己的机器学习运维和人工智能平台。这些公司利用数据科学、开源工具和专有算法颠覆传统行业,为人工智能的成功树立了标杆。

好处

这种方法可以让您和您的团队更好地控制工作流程、开发过程和部署策略。随着时间推移,业务需求会发生变化,而这种方法能让您做出快速反应。

挑战

在起始阶段,您将花更多的时间和费用来开发自己的平台和支持功能。系统维护需要持续开支。

选择3:开源软件

开源软件是构建、部署和维护人工智能应用的最佳选择。它允许您为特定用例选择最佳工具,并充分利用从业人员的力量和创新,他们为开源工具、库和框架做出了贡献。

Anaconda是数据科学家的热门选择,因为它允许科学家构建环境,在其中导入和访问可用于数据科学的最佳开源工具。Anaconda是Python的原生应用程序,拥有3000万用户,这些用户为开源数据科学软件的创新、安全和技术做出了贡献。

Anaconda可以成为人工智能平台不可或缺的一部分,它专门面向看到开源机会价值的数据科学和Python用户。IT管理员喜欢 Anaconda,因为他们可以用它来集中和保护数据科学团队的工作,这些团队负责开发和生产机器学习模型和系统。微软和Snowflake已将Anaconda加入到它们的数据科学和机器学习产品中,轻松加快数据科学探索和生产部署。

这种方法可让您的从业人员获得适用于您的使用案例的最佳工具。用户可以访问资源库、项目和代码,从而加快开发速度。借助开源生态系统中的群众力量,开源工具和软件包中的安全漏洞可以更早地识别和验证。

挑战

您需要一种开源思维,这需要深度合作。您还需要一支有才华的团队,对亟待解决的问题有清晰的认识,并获得持续培训和提高技能的机会。

开源在数据科学和机器学习中的优势

使用开源工具和库,您可以以最小的投入快速创建强大的人工智能解决方案。使用开源软件有很多好处,包括可以与他人合作,为开源社区做出贡献,以及根据软件许可证的不同,以最少的限制分发软件。

Python是数据科学和人工智能领域最受欢迎的开源软件工具。它是一种通用语言,可用于数据科学、人工智能、机器学习和深度学习。Python之所以用途广泛,是因为它拥有一个活跃强大的开放科学生态系统,其中有一个庞大的开发者社区,他们创建了各种库和工具,使Python更易于使用。R是另一种专门用于统计分析和数据可视化的语言。它也广泛应用于机器学习和深度学习。

任何人都可以使用这些工具,无需支付许可证费用。这就让更多人可以使用这些工具,包括可能无法负担专有商业工具费用的学生和研究人员。

数据科学和机器学习使用开源软件的好处包括:

  • 准入门槛低:只需低成本或无成本,就能获得现有的最佳工具
  • 可靠性、安全性、速度:社区的力量
  • 获取开源工具和人才:使用工具的社区
  • 数据库与数字科学和机器学习模型
  • 数据科学和机器学习的开源教育

为什么人工智能解决方案数量众多?

最近,人工智能迅速发展。稳定扩散和ChatGPT等生成式人工智能的进步就是证明,这在很大程度上归功于一种名为深度学习的机器学习形式。例如,自动驾驶汽车和智能助理的发展,就是深度学习模型显著改进的结果。

深度学习基本上是一个老概念的新说法:神经网络是对数字阵列进行数学运算的集合。但深度学习技术生成的模型要比传统神经网络复杂或 “深入 ”得多,涉及的数据量也大得多。

过去几年里,大量数据和深度神经网络的开源进展,与高效的硬件和计算或处理速度结合,在图像分类、语音转录和自动驾驶等多个领域取得了突破性。这些进步带来了巨大的经济影响。

试图部署模型的数据科学家发现自己身兼数职:数据科学家、软件开发人员、IT管理员和安全官员。他们努力构建和包装模型、为模型提供服务和路由流量,处理负载平衡,确保安全地完成所有工作。然而,要利用人工智能实现商业价值,就必须部署模型。而模型的部署和管理难以完成,更不用说自动化了。

开源社区刚刚开始创建工具,以应对模型开发、培训和部署方面的挑战。这项工作大部分是由大公司的研究人员,以及Uber和Netflix等创业公司的团队完成的。

首先,Uber 的数据科学家只能在笔记本电脑上训练模型,这限制了他们的能力,来将模型训练扩展到构建强大模型所需的数据量和计算周期。该团队没有存储模型版本的流程,这意味着数据科学家要浪费宝贵的时间来重新搭建同事的工作。因此,Uber建立了自己的机器学习运维(MLOps)平台——Michelangelo,并将继续改善。

虽然 Uber和其他公司已将机器学习应用于产品创新,但他们并没有标准流程,来将模型部署到生产中,这严重限制了工作的潜在商业价值。Uber的团队表明,他们没有既定方法,去将模型部署到生产中——大多数情况下,相关工程团队必须创建一个针对项目的专属服务容器。

为了聚焦建立更好的模型,谷歌、Uber、Facebook 和其他领军科技公司的数据科学家,都建立了自己的人工智能平台。这些平台将支持性基础设施自动化,即大规模构建、训练和部署人工智能所需的 “粘合代码”。

人工智能在不同行业中的用途

探索这些先进技术在当今工业中应用的具体实例。

根据麦肯锡发布的《2022年人工智能现状:五年回顾》,人工智能的应用不断扩展,投资不断增加,应用人工智能的组织正在收获可观的回报。常见的人工智能用例包括服务和产品开发,其他人工智能功能也在不断增加。

在麦肯锡的2022年人工智能现状调查中,来自各个地区、行业、组织和专业的1,492 名受访者参与了调查。其中有一半(744名受访者)所在的组织使用了人工智能,这些受访者提供了他们使用人工智能的详细情况。数据根据各国对全球 GDP 的贡献加权计算。

此外,虽然人工智能对您的组织来说是一个巨大的机遇,但请记住,它对您的竞争对手来说也如此--包括目前与您没有竞争关系,但以后会有的组织。这些组织通过应用人工智能来发展。信息很明确:企业现在必须采用人工智能,否则就会落后其他公司。

国际数据公司(IDC)预测,到2026年,全球人工智能市场规模将增至9000亿美元。国际数据公司的报告预测,年复合增长率为18.6%。深度学习在图像分类、语音识别、手写转录和文本语音转换等领域取得了惊人的突破。

让我们举几个具体的例子,看看这些先进技术在当今产业中的应用。

银行业

多年来,银行一直通过改变与客户的互动方式,尤其是远程业务办理,来利用人工智能创造商业价值。对一些消费者来说,使用移动银行应用是他们与人工智能的首次互动:消费者拍摄支票正反两面的照片,将资金存入自己的账户,而银行利用计算机视觉技术检测移动支票存款中的支票欺诈。

麦肯锡 2021 年 5 月的研究估计,在降低成本,减少错误,为银行机构创造新机遇方面,人工智能技术每年可为全球银行业创造高达1万亿美元的附加价值。

以下是人工智能在银行业的常见用例:

  • 欺诈检测: 机器学习最常见的应用是欺诈检测。欺诈检测算法可在数秒内从数千条交易记录中解析出多个数据点,如持卡人的身份数据、领卡地点、交易时间、交易地点和交易金额。

    运行欺诈检测模型的前提,是数据集存储了多个准确标记的欺诈范本,以便对模型进行适当训练。一旦模型检测到交易数据异常,就可以对通知系统进行编程,从而在模型识别出可疑交易时,向欺诈检测服务发出警报。

    欺诈检测是异常检测算法的一种。这些算法也可用于公司其他领域的数据集,以达到不同的目的,如网络入侵检测。这就是为什么有些公司认为,投资企业数据科学平台比购买开箱即用的模型或直接的分析解决方案更有价值。
  • 信用评分: 银行也通过人工智能建立准确的信用评分。通过实施信用评分算法,金融机构可以不依赖美国三大信用报告公司的通用评分。许多贷款机构看到了开发定制化信用评分模型的好处,即利用机构自身的客户活动数据,而不是美国三大信用报告机构的通用评分,来更好地预测新信贷额度的风险或机会。这样,他们可以减少贷款核销带来的拖欠成本、延迟的利息收入,以及收取逾期付款的服务费用。客户可实时重新评估。机器学习(预测)算法用于根据新数据更新评分,确保所使用的是最新信息。该算法依赖过去的贷款数据,因此无论贷款好坏,都有足够的数据对其进行有效训练。
  • 信用风险分析:这些预测算法还可用于宏观层面的风险评估和市场走势预测。金融机构使用信用风险分析模型来确定潜在借款人的违约概率。这些模型可提供借款人在任何特定时间的信用风险水平。如果贷款人未能提前发现信用风险,就会面临违约和资金损失。放款人依靠信用风险分析模型提供的验证信息,做出关键的放款决策,决定是否向借款人发放贷款,以及应收取的贷款额度。

银行业其他常见的人工智能用例包括:

  • 账户风险分析
  • 信用额度调整审批
  • 客户分类
  • 个性化出价
  • 战略定价模型

电子商务

亚马逊是最早向消费者引进电子商务人工智能的公司之一,但在当时看来,它更像是一种魔法,来自一家新的在线图书销售商。2003年,亚马逊研究团队发表了一篇论文,介绍了他们使用一种名为 “协同过滤”的推荐系统来预测客户的偏好,这种算法最初利用其他购物者的偏好来预测客户的喜好。

亚马逊的人工智能团队了解到,分析产品购买记录比分析客户更能获得好的推荐。这是一项开创性的工作,从那时起,电商公司大幅扩展了人工智能的使用。

电子商务中的常见人工智能用例包括:

  • 产品推荐:预测分析为先进的推荐系统提供了动力,这些系统通过分析网站和应用访问者的历史购买记录来推荐更多产品。运行这些系统的模型以相似用户的选择为基准,这些用户使用同类产品或提供类似的客户评价。
  • 产品运输模型:预测性分析的使用形式还包括预测式发货模型。它们能预测客户最可能购买的产品和模式,确保这些产品在最近的仓库备货。
  • 价格优化:电子商务还利用人工智能进行价格优化,为热门商品提供折扣,为冷门商品赚取利润。欺诈检测是另一个领域,通过使用算法来检测欺诈卖家或欺诈性购买。
电商中其他常见的人工智能用例包括:
  • A/B测试
  • 聊天机器人和虚拟助手
  • 流失预测
  • 客户重定向
  • 需求预测
  • 动态定价
  • 欺诈检测
  • 一线工人的调度和任用
  • 图像处理
  • 个性化
  • 路由优化
  • 销售流程改进
  • 网站搜索引擎

能源

能源管理组织正以越来越快的速度使用人工智能;根据2022年8月发布的调研与市场研究报告,预计从2022年到2030年,全球能源的人工智能市场将增长21%。能源人工智能用例随着全球能源生产和消费的增长而增加,组织通过人工智能来提高能源效率和电网稳定性,改善智能能源解决方案。

能源领域常见的人工智能用例包括:

  • 异常检测
  • 需求预测
  • 数字孪生(模拟)
  • 高效储能
  • 前端工程设计(FEED)自动化
  • 库存管理
  • 物流优化
  • 市场定价
  • 新材料发现
  • 预测性维护
  • 产品优化
  • 安全
  • 智能电网和微电网
  • 存储效率
  • 用途预测

金融

金融机构一直通过机器学习来获得洞察力,更快做出关键决策,将机构与公开市场交易的大量手动任务自动化。

交易员看好人工智能。摩根大通公司2023年2月发布的一项调查中,交易员们分享了他们的看法,即未来几年,人工智能和机器学习会对金融市场产生最大影响。在835名受访者中,有一半以上是机构和专业交易员,他们预计人工智能将在未来三年内对交易产生重大影响。这一比例高于2022年的25%左右。

金融领域常见的人工智能用例包括:

  • 高级分析: 对冲基金在机器学习和其他先进分析技术上投入了大量资金,因为它们不断寻找新的信息来源,以做出更好的交易决策。强大的定量模型是对冲业务的核心支柱,因此我们不需要感到奇怪,基金是深度学习的早期采用者。

鉴于大量的资金面临风险,对冲基金越来越多地转向“替代数据”,以生成市场趋势的领先指标。例如,它们可以将卫星图像输入到GPU加速神经网络中,该网络将进行全面估算,包括港口的船只数量,田地里种植的作物数量。通过使用深度学习技术来生成更高质量的输入,它们可以改进现有定量模型的输出。

  • 合约处理:自然语言处理(NLP)在金融行业中用于处理合约。通过应用自然语言处理模型来读取和解析契约,这样可以显著减少冗余劳动时间。例如,摩根大通开发了一个文本挖掘解决方案,他们称之为COIN(智能合约)。COIN通过解析文档中的某些单词和短语来帮助分析商业贷款合同,每年为公司节省36万小时。
  • 客户沟通:将自然语言处理模型应用于客户沟通,包括社交媒体、电话记录和客户服务聊天平台上的沟通,使金融机构能够对客户反馈进行分类,并评估情绪,从而更好地了解客户。人工智能提供了分析评论的能力,这些评论表明意图,识别模式,从而建议需要改进的领域,或者标记问题,防止其影响大量客户。
金融领域其他常见的人工智能用例包括:
  • 收益率分析
  • 投资组合管理
  • 市场贸易风险
  • 市场价格模拟

政府

与私营部门的组织相比,公共机构有一个优势:拥有大量准确的数据,并有责任利用这些数据为公民提供更好的服务。政府机构在应用人工智能时面临的主要挑战,是保持数据安全。有些数据受法律保护,例如个人健康和财务信息。各国必须确保基础设施和军事数据的安全,避免大规模部署人工智能解决方案可能带来的风险。

Market Connections与科学应用国际公司(SAIC)在2023年1月发布了一份报告,内容涉及对商业和IT领导者的调查。报告表明,软件开发过程中的多云策略和安全性以及人工智能都是当今政府面临的挑战。

政府部门常见的人工智能使用案例包括:

  • 紧急响应: 综合多种数据源的能力,使地方政府和当局在应急方面具有重大优势。实时分析有助于在有压力的情况下支持即时决策。控制多个通信渠道,使用识别潜在威胁的智能工具,以及发送警报的能力,使地方当局有机会向公民发出警告,并建议他们采取进一步行动。
政府部门的其他常见用例包括:
  • 高危人员支持
  • 财务利益管理
  • 气候分析
  • 犯罪侦查
  • 数字化转型
  • 经济分析
  • 设备监控
  • 欺诈检测
  • 健康预测
  • 军事支援
  • 人员准备
  • 安全威胁
  • 服务现代化
  • 贸易监控
  • 武器创新

医疗保健

医疗保健是一个高度规范的服务领域,人工智能的引入使医疗保健发生了改变。人工智能可以比人类更快、更准确地识别医疗问题。人工智能辅助技术帮助人们完善诊断性、描述性、规范性和预测性分析,从而预测个人的诊断结果。

哈佛大学和麦肯锡的研究人员在2023年1月的一篇论文中表示,使用人工智能可能会节省5%至10%的成本,每年可节省2000亿至3600亿美元。这些估算考虑了现有技术的人工智能用例,这些用例在未来五年内可以使用。

医疗保健中常见的人工智能用例包括:

  • 疾病检测和诊断:视觉数据处理帮助放射科医生更快地读取图像,进行诊断,例如肿瘤检测。近年来,放射科医生的工作量显著增加。一些研究发现,放射科医生平均每3-4秒就必须解读一张图像,从而满足患者需求。

    研究人员已经开发出深度学习算法,来训练先前得到的放射图像,从而识别肺、乳房、大脑和其他部位的早期肿瘤。经过训练,算法可以识别放射成像数据中的复杂模式。

    休斯顿卫理公会研究所开发的一种早期乳腺癌检测工具能够解读乳房x光检查,准确率高达99%,进而减少了活检的需要。该工具提供诊断信息的速度比人类快30倍。这将带来更完善的病人护理,并帮助放射科医生更好地完成他们的工作。

    人工智能也用于皮肤癌的诊断。一些研究人员使用卷积神经网络(CNN),开发了用于皮肤癌检测的机器学习模型,并借助TensorFlow、scikit-learn、Keras和其他开源工具,使检测准确率达到87-95%。相比之下,皮肤科医生检测黑色素瘤的准确率为65%至85%。除了皮肤癌诊断,研究人员还利用卷积神经网络开发其他工具,用于诊断肺结核、心脏病、阿尔茨海默病和其他疾病。
医疗保健中的其他常见用例包括:
  • 护理服务
  • 慢性病照护管理
  • 临床决策支持
  • 数据管理
  • 数字病理学
  • 疾病预测
  • 疾病研究与治疗
  • 药物研发
  • 应急调度优化
  • 遗传医学
  • 医疗公平改善
  • 医学图像分析
  • 患者的自我护理和健康
  • 远程医疗功能

保险

保险业在应用量化方面历史悠久;然而,这一受到严格监管、厌恶风险的领域并没有像相关的银行业和金融业那样,去关注数据科学和机器学习。但保险公司已经摆脱杂乱无章的方法,并转向技术,将系统逐个转换,变为由业务和部门主管引领的计划。这些主管与首席信息官(CIO)和首席技术官(CTO)合作。

德勤金融服务中心在其《2023年保险行业展望》中,敦促保险机构将技术战略和投资重点放在保险公司的区分上,具体方面包括客户细分、产品支持和增值服务。

保险行业常见的人工智能用例包括:

  • 承销风险评估: 屋顶的状况对于准确对保险定价至关重要。传统意义上,许多保险公司依靠房主报告的屋顶年龄来评估屋顶状况,这种方法显然容易出错。但通过深度学习,保险公司可以利用屋顶的照片来创建深度学习模型,获得更准确的屋顶质量评估。这帮助保险公司降低了家庭保险风险。
  • 理赔调整 保险公司通过图像分类技术,提高保险理算员的工作速度和准确度。深度学习模型可以获取车辆里程表的照片,并确定正确的读数,而不是依靠保险理算员来读取事故车辆的里程表。

同样,需要注意的是,这些公司并没有抛弃现有的模式,转而采用全新的方法。相反,他们正在利用新的人工智能技术来改进模型的输入。

保险行业其他常见的人工智能用例包括:
  • 个性化优惠
  • 战略定价模型
  • 客户细分
  • 资产分析

制造业

多年来,制造业的领导者一直在应用机器学习来优化安全性、产品质量和大规模交货。将人工智能应用于制造业的机会似乎数不胜数,因为制造业严重依赖硬件和软件来交付产品。

边缘人工智能依赖于现场的传感器,将数据传递给组织和分析数据的平台。这是制造业的一个常见用例,它也被称为IoT或物联网。行业专家称赞的另一种方法称为自适应人工智能,这种人工智能是应对云端和边缘数据挑战的关键。

制造业中的顶级人工智能用例集中在预测模型上,目的是预测与供应链、维护、物流和库存等领域相关的关键因素。人工智能可以带来巨大的好处,对制造商来说,这意味着更低的成本、更快的交货速度和更高的质量。

制造业中常见的人工智能用例包括:

  • 质量控制:图像识别和异常检测是一种机器学习算法,可以快速检测并消除故障部件,防止它们加入汽车制造工作流程。在每个组件离开装配线时,零件制造商可以捕捉其图像,并通过机器学习模型自动运行这些图像,以识别缺陷。

    高度精确的异常检测算法可以检测小到一毫米的问题。预测性分析可以用来评估缺陷部件是否可以返工或需要报废。在这一点上,消除或重新加工有缺陷的部件,比发现并在以后修理它们的成本要低得多。它在生产过程中避免了成本更高的问题,并降低了成本高昂的召回风险。它还有助于确保客户的安全、满意度和保留率。
  • 供应链优化:在整个供应链中,分析模型用于确定不同营销策略、销售价格、位置和许多其他数据点的需求水平。最终,这种预测性分析决定了不同设施所需的库存水平。数据科学家不断测试不同的场景,以确保理想的库存水平,提高品牌声誉,同时最大限度地减少不必要的储存成本。

    优化模型有助于指导库存准确从制造商送到配送中心,最终到客户的店面。机器学习正在帮助零部件和汽车制造商及其物流合作伙伴以更高效、更盈利的方式运营,同时改进客户体验和品牌声誉。
制造业中其他常见的人工智能用例包括:
  • 数字孪生(模拟)
  • 边缘人工智能
  • 能源管理
  • 生成式设计
  • 库存管理
  • 即时物流
  • 市场分析
  • 预测性维护
  • 预期收益
  • 价格预测
  • 过程优化
  • 生产优化
  • 质量保证
  • 机器人技术
  • 根本原因分析

零售业

过去几年,零售业受到了打击,新冠肺炎疫情迫使零售商关门,适应无接触购物、服务和配送。那些能够迅速适应的公司将零售业推向了新高度,实现以客户为中心。对许多品牌来说,这加强了它们与客户的关系。

大型零售商塔吉特和沃尔玛推出了路边取货和在线购买-到店取货(BOPIS)服务。一些零售商,如劳氏家居装饰公司,在大流行病迫使其关门时,很快推出了这些功能,以满足客户需求。之后,俄罗斯对乌克兰发动了战争,随之而来的供应链挑战限制了零售商的库存能力,影响了大小零售商的承受能力。

人工智能为零售商提供了宝贵的机遇,包括更深入地了解客户,获得吸引最有价值的客户这一专属能力。

零售业常见的人工智能用例包括:

  • 定制服务:价值数十亿美元的护肤品牌玉兰油于 2016 年推出了一款名为“皮肤顾问 ”的应用,该应用使用神经网络,帮助销售转化率翻了一番。潜在客户只要提交一张照片,模型就会返回量身定做的皮肤评估,并建议客户购买治疗产品。

    虽然这看起来像是一个新奇的产品,但它却产生了显著的经济影响。应用该技术后,顾客的平均购物篮系数(一次性购买的商品数量)增加了 40%,转化率翻了一番。通过人工智能,玉兰油提供了个性化的购物体验,鼓励顾客购买更多的产品。
零售业中其他常见的人工智能用例包括:
  • 客户细分
  • 需求预测
  • 配送调度和路线优化
  • 库存优化
  • 绘制货架图
  • 产品推荐
  • 供应链优化
  • 员工调度和管理

人工智能平台应具备的7项功能

人工智能的成功依赖企业大规模构建机器学习模型,并快速部署的能力。这些是人工智能平台需要具备的关键功能,这样才能确保您能更快地将更多模型部署到生产中。

1.自动化

在数据科学的整个生命周期中,自动化是规模和速度的关键动力源。一旦团队确定了成功的流程、技术或框架,就可以将其自动化,并根据输出和结果的准确性对自动化进行必要的重新校准。

开发和部署模型的复杂性可能会阻碍迭代。但是,如果实际情况发生变化,或在现实生活中存在部署模型、采取行动的条件,团队就必须继续重新审视和更新模型。

人工智能平台应该能战略性地应用自动化,使您的团队更容易加速已验证模型的自动化,并保持稳定的性能。将最新、最好的工具用于数据科学和机器学习环境中应该很容易。

2. 信息技术启用和治理

利用开源工具的强大功能进行机器学习,包括保持对整个机器学习管道的控制。IT管理员必须能够根据职位或角色来提供账户,并跟踪用户,使从业人员更容易共享和协作项目。IT组织需要全面控制其开源供应链,有能力跟踪整个项目流程。无论是软件包,源代码还是日志的部署,都需要跟进。

这种方法能让数据科学家控制模型的脉络,并实现成功模型的再现性。它允许IT管理员证明从业人员正在使用经批准的软件包,能够访问所需的计算资源,并且符合企业IT和安全政策或法规。

寻找一个能让IT管理员控制和管理软件供应链的人工智能平台,为他们提供所需的工具,来管理用户访问权限,提供审计的详细内容。

3.规模

在机器学习的模型训练和生产中,规模的重要性毋庸置疑。仅在笔记本电脑上利用数据子集构建和训练模型是不够的。数据科学家必须扩大模型训练的规模,才能建立强大的模型。这意味着他们需要集中化的工作流程,使他们能够设计和建立分析体系和机器学习模型,与其他从业人员协作,并跟踪他们的实验和迭代。

对于IT和安全团队来说,规模化需要正确的工具,以便将这些模型安全地部署到生产中,并有信心快速识别和降低安全风险。

有了图像处理器和张量处理器,这种规模的模型训练目前在经济上是可行的。但是,部署这些大规模的计算能力需要大量的基础设施来提供支持。因此,当今的挑战不是到哪里去寻找计算能力,而是如何管理支持计算能力的环境。

寻找一个可以随心所欲进行部署的在线或离线人工智能平台,并能在您扩展人工智能应用时满足您所在组织的要求、用例和吞吐量。

4.安全

对于首席安全信息官(CISO)和IT管理员来说,确保开源软件供应链的安全至关重要。数据科学家通常使用开源软件包来开发和测试机器学习模型,分析其结果的准确性、可扩展性和许多其他因素。在此过程中,他们通常会将软件包直接下载到笔记本电脑上运行。

这种情况使IT管理员处于不利地位,因为公共资源会带来额外的风险,必须不断监控和降低风险。

寻找一个人工智能平台,该平台的维护者和作者都是工具和技术方面的专家。您的团队将运用这些工具和技术,来将机器学习模型从构建阶段提升到高性能生产部署阶段。优质的人工智能平台应拥有良好的记录,成功在开源软件包和工具中监控通用漏洞披露,使用自动化和手动管理,整合来自开源社区的漏洞和反馈。

5.支持

支持往往是企业买家最不希望看到的功能之一。它对于任何人工智能平台都是关键要素。特别是当团队使用开源软件时,他们需要可靠的错误报告和跟踪,吸引培训资源,并获取持续的支持。

寻找一个能够提供团队所需支持的人工智能平台,从基础的支持到学习资源,再到您需要时的及时支持。对于构建和维护人工智能平台的组织,要优先考虑企业支持,并有能力大规模提供支持。即使是在高度受监管的行业也是如此。这些行业面临重大处罚,因为它们在使用应用型人工智能时,会产生数据泄露或负面影响。

最好的人工智能平台会为您提供一个可供支持的优先关系矩阵,例如下面的示例。

6.开源工具

优质的人工智能平台应进行整合,将支持使用数据科学和机器学习的开源软件相结合。要寻找能够轻松访问Jupyter Notebook、Keras、Matplotlib、Scikit-learn和TensorFlow等工具的人工智能平台。

有些平台允许您在使用这些工具时集中管理工作流,这意味着您的数据科学和机器学习从业人员可以协作、共享数据和比较模型,而您的IT管理员可以提供账户、管理访问并确保安全。

寻找能让您轻松访问开源工具和资源库的人工智能平台。确保他们根据版本、软件包和日期跟踪这些平台上的通用漏洞披露。最好的人工智能平台由组织和团队进行构建和维护,这些组织团队通过贡献研究、资源和人才扎根于开源社区,增加了人才和研究的多样性,提高了数据科学和机器学习从业人员可用的创新技术数量。

7.开源贡献

寻找一个人工智能平台,它与开源社区及贡献者保持紧密联系。最好的人工智能平台将与开源社区密切联系,通过团队和生态系统来管理漏洞,从而支持创新和安全系统的稳定。一些组织运行您所选择的人工智能平台,如果开源软件的作者受雇于这样的组织,那就更好了。

请记住,企业可以通过多种方式为开源社区做出贡献。通过在产品中结合或访问关键工具,一些组织可以投资开源软件。其他组织则通过分享最佳实践内容来为开源做出贡献,这些内容易于被数据科学和机器学习从业人员获取。

一些组织聘请开发者关系(DevRel)团队,团队由开源数据科学、软件开发和机器学习方面的专家组成,并在整个生态系统中开展内容上的合作,以帮助教育社区。

向人工智能平台提供商提出的问题
向潜在的技术提供商询问有关IT启用和管理、安全性、开源等方面的问题。
自动化

1.将开源协调工具融入人工智能平台需要哪些条件?

IT启用和管理

2.描述用于跟踪数据来源和监控数据质量的系统。是否有管理数据目录、元数据和其他人工产品的工具?

3.如何确保数据安全,以符合欧盟的GDPR(《通用数据保护条例》)、美国的CCPA(《加州消费者隐私法案》)和其他隐私法规?

规模

4.我们的数据科学家将如何创建实验和模型训练的环境?请描述步骤。

5.利用贵公司的平台建立在线预测系统有多简单、高效?

6.贵公司提供哪些硬件支持?硬件成本是多少?

安全

7.该平台的访问控制是怎样的?请描述管理员提供账户或停用访问权限的步骤。

8.平台如何追踪日志、监控和警报?请描述IT管理员使用这些功能的流程。

9. 贵公司团队对影响平台用户的通用漏洞披露(CVEs)监控程度有多深?

支持

10. 用户注册需要花费多少精力?

11. 是否持续提供培训?用户从哪里获得培训?多长时间在培训资源库添加一次材料 ?

12.请描述Anaconda如何支持团队处理影响客户或用户的紧急技术问题。您如何确定故障及其影响的优先级?

开源工具

13.IT管理员如何使用贵公司的平台为数据科学家和工程师提供开源工具,如Jupyter Notebook、MLflow、Scikit-learn或TensorFlow?

14.贵平台如何确保数据科学家使用的软件包的安全?

开源贡献

15.贵公司是否为开源社区做出贡献?请描述贵公司如何参与开源生态系统。

Anaconda:安全、集中的Python解决方案
有了Anaconda,您的数据科学家就可以专注于利用数据进行科学研究,而不是受累于开发运营、软件工程和IT任务。一个平台就能提供连接、共享和部署项目所需的所有工具。

Anaconda平台可以轻松将您所在组织的人工智能管道自动化,并适用于笔记本电脑,训练集群和生产集群。从使用笔记本的单个从业者到成千上万的机器,无论大小,Anaconda都能支持您的组织。Anaconda将未分类的繁重任务自动化,防止粘合代码阻止人们组织快速、大规模的训练和部署模型。

有了Anaconda,您的数据科学家可以专注于利用数据进行科学研究,而不是受困于开发运营、软件工程和IT任务。一个平台就能提供他们连接、共享和部署项目所需的所有工具。

从IT的角度来看,Anaconda可提供自动化人工智能管道。Anaconda的云原生架构使扩展变得简单。安全人员可以确信,所有数据科学资产,包括软件包、项目和部署,都通过适当的自动配置访问控制得到了安全管理。

常见问题
什么是人工智能平台?

人工智能平台是一种软件解决方案,它可以帮助企业开发和部署人工智能驱动的应用。它通常包括一套面向数据科学家、开发人员和企业用户的工具和服务,以及一个用于部署人工智能模型的运行环境。

一些人工智能平台非常流行,包括谷歌云平台(GCP)、亚马逊网络服务(AWS)、IBM Watson、微软Azure和Anaconda。这些平台提供不同的功能和服务。因此选择一个最能满足企业需求的平台非常重要。

如何构建人工智能平台?

这个问题没有统一的答案。构建人工智能平台的最佳方法取决于项目的具体目标和要求。不过,有一些通用技巧可以帮助您开展工作。

首先,必须清楚了解您希望人工智能平台实现什么目标。您希望它完成哪些具体任务或目标?一旦对目标有了充分了解,您就可以开始研究哪些人工智能技术最符合您的需求。

考虑如何部署和使用人工智能平台也很重要。是在本地部署还是在云端部署?是由内部团队使用还是提供给外部客户?这些因素都将影响平台的架构和所使用的技术。

最后,不要忘了考虑构建和维护人工智能平台的成本。参考项目的规模和复杂程度,这可能是一笔不小的开支。请务必做好相应的预算,并记住平台的早期版本可能并不完美,因此在继续开发的过程中,不要害怕迭代和实验。

什么是对话式人工智能平台?

对话式人工智能平台是一种软件应用程序,它能让用户自然地与人工智能代理互动,并以对话作为主要界面。对话式人工智能平台的目标,是通过提供比传统文本或图形界面更友好的用户界面,让人们更容易访问和使用人工智能服务。

对话式人工智能平台通常提供一系列工具和服务,让开发人员能够构建、训练和部署聊天机器人或虚拟助理。这些平台通常会与现有的消息应用程序(如Facebook Messenger或Slack)进行一定程度的整合。此外,许多对话式人工智能平台还提供应用程序编程接口,允许开发者将聊天机器人或虚拟助理整合到其他应用程序或服务中。

大多数对话式人工智能平台都以机器学习技术为基础,这使得聊天机器人或虚拟助理可以不断通过经验提高性能。流行的对话式人工智能平台包括Amazon Lex、Google Dialogflow、IBM Watson Assistant和Microsoft Bot Framework。

什么是谷歌人工智能平台?

谷歌的人工智能平台是一套全面的工具和服务,它使开发人员能够构建、训练和部署机器学习模型。它包括硬件和软件组件,以及各种云端服务。

什么是最好的人工智能平台?

一些流行的人工智能平台包括谷歌云平台(GCP)、亚马逊网络服务(AWS)、IBM Watson和微软Azure。一些组织想要利用开源社区的创新性、安全性和支持,它们会选择Anaconda。Anaconda允许它们使用Python构建和部署解决方案。这些平台各自提供不同的功能和服务,因此选择一个最能满足企业需求的平台非常重要。

什么是微软人工智能平台?

微软的人工智能平台是一套全面的工具和服务,可帮助开发人员构建智能应用程序。它包括Azure机器学习,该服务允许开发人员构建、训练和部署机器学习模型。

如何使用人工智能平台?

人工智能平台可用于构建各种应用,包括聊天机器人、虚拟助理、推荐引擎、预测性维护系统和欺诈检测解决方案。其中许多应用都受到机器学习算法的支持,这些算法可以从数据中学习,并不断改进。

释放创新潜能

想象有这样一个世界,数据科学团队可以快速迭代机器学习模型,定期将项目大规模推向生产,并具有完全的再现性。这会对您的业务产生什么影响?

Anaconda让数据科学和机器学习从业人员只需点击一下,就能将他们创建的任何内容部署到类生产环境中,从而构建世界一流的机器学习和人工智能。了解为什么Anaconda是世界上最受欢迎的平台,从而更快地开发和部署安全的Python解决方案。

   |    备案号:京ICP备09015132号-1047