- 微信
- 复制链接
  
  复制链接到剪贴板

ai专家一席谈：复用算法、模型、案例，ai gallery带你快速上手应用开发-4008云顶国际网站

华为云社区精选发表于 2021/09/26 10:25:55 2021/09/26

【摘要】华为云社区邀请到了ai gallery的负责人严博，听他谈一谈ai gallery的设计初衷、经典案例以及未来规划。

你见过哪些有趣又实用的ai开发案例呢？

比如让静态照片上的人物开口唱歌，动漫角色也可以哦；再比如通过识别各类野生动物并分析种群结构，进而实施保护；又或者智能检测口罩佩戴的规范性，助力疫情防护……

这些场景化的ai案例，都可以在上找到对应的模型，通过不断训练，你也可以实现。ai gallery上拥有算法、模型、数据、notebook等丰富而优质的ai资产， 开发者可以直接复用这些资产，解决ai应用开发的难题。

纵观ai应用的整个开发流程，从数据采集、标注，到算法模型的构建，每个环节都会产生许多可以复用的ai资产，而ai gallery的目的就是充分发挥这些资产的效用，提高ai开发效率。

那么，它是如何汇聚这些ai资产，又是如何让资产效用最大化地帮助到开发者高效的进行ai开发呢？

华为云社区邀请到了ai gallery的负责人严博士，听他谈一谈ai gallery的设计初衷、经典案例以及未来规划。

人工智能是人类在不断探索和发展一个领域，因为事先没有定义好有哪些阶段，所以很难回答我们当前处在哪个阶段。但是有一个很明显的感知，人工智能发展比10年之前有显著的进步，大量应用也越来越多。

这个契机是2012年以深度学习为代表的一类算法得到突破。 在此之前，大家更关注的是算法，大家都是在用数据降维和一些分类器的方案去做机器学习相关的ai开发，训练的数据体量也很小。

在2012年的契机点上，有了算力的加持，再通过算法和大量的数据迭代，我们看到ai开发模型的精度有了量级的提升。随着这个量级提升之后，它能够在更多的行业和领域去应用ai技术来提高生产力。

但是，当前这个阶段人工智能还不能像人类那样，可以通过少量数据的学习获得逻辑推演能力。人工智能本质上还是通过大量的数据进行拟合和迭代，让它能够“记住”数据再去做一些推理，但它并不具备逻辑推演能力。不过，相比过去10年，ai最终的准确率已经有了提升，它的应用领域也进一步拓展。

往后展望，我们还会在算力上有进一步的突破，再加上整个算法和数据的加持，最终能训练出精度更高，甚至是像人类那样能够获得逻辑推演能力的ai。

一般是三个流程。

第一个环节是数据准备， 需要采集数据，对数据进行清洗，转换的工作。每一个环节都有自己的挑战。以数据为例，采集阶段会有政策法律上的限制，数据孤岛很难被打破。另外还要对数据进行有效的标注，这需要大量的人力才能完成，经济成本较高。

第二个阶段是建模， 基于准备好的数据，选择合适的算法，开发相关的模型。要考虑训练出来的模型的应用场景。比如ai应用是放在移动端上的，还是放在云端服务器上，这两者对推理的时延、准确率的要求都是不同的。因此ai开发的建模过程，要综合理解ai应用的场景，再去选择合适的算法工艺架构。它和只追求精度或者推理速度的学术领域不一样，我们需综合考虑，所以挑战比较高。

第三个阶段是基于模型来进行具体的ai应用的开发， 它围绕具体的应用场景，配合开发一些it系统、软件、ui交互等。比如算法工程师负责建模开发，到了应用开发阶段可能是由应用工程师承担，它的角色是变换的。作为应用开发工程师，收到的是已经开发完的模型，但这个模型推理的时延和精度可能都达不到理想状态。这个时候就要通过压缩，蒸馏的技术进一步优化它。如果精度达不到，还得考虑最终这个应用是否能够通过一些巧妙设计来规避这些问题。

现在很多开发流程都是平台化的，ai开发的每个阶段都会产生一些数字资产：算法、模型、数据集，可能还有一些处理的函数、方法之类的。我们希望有一个地方能够把这些东西都沉淀和积累下来，以方便后续的开发者复用之前的一些成果，这也是我们设计ai gallery的初衷。

当越来越多的开发者分享各种场景下的ai资产，ai gallery可以包含全场景各种精度的实验，这时其他开发者也能根据最终的开发场景直接拿来即用这些资产。

打个比方，ai开发的三个阶段可能是由不同角色介入的，如果应用工程师想介入到ai开发中，但又缺少相应的数据和算法工程师该怎么办？ai gallery里就有训练好的模型，应用工程师拿来即用就可以了。从这个角度来看，它可以提高整体的开发效率。

如果是选数据的话，一般是基于它的行业和领域场景，看有没有合适的数据，这个是跟领域和行业强相关的。当前我们提供了数据的分享的机制，有很多开发者已经共享了开源标准场景的数据集，来供大家在modelarts上快速地验证自己的想法。

算法方面，开发者首要考量的是算法最后产生的模型是不是自己想要的，以及算法在训练时的输入数据格式，训练所需的开销、运行算法的环境等等。

模型方面，先要明确应用开发是部署在云上、边缘侧，还是端侧，这对于最后的应用场景很重要。其次是推理的时延，诸如医疗场景的数据会很大，它的推理就是异步的，但有些场景要求的是实时推理，可能对推理响应的时间要求很高。最后是精度，要评估应用场景对精度的敏感度。

综上，在ai开发的每一个阶段，都有很多需要考虑的指标、量纲。我们要做的就是把这些量纲和指标准化出来，能够让发布ai资产的开发者填写这些指标，方便使用的人去浏览、筛选和检索，快速找到他想要的东西。

对于视觉领域的一些经典算法如yolo、resnet50，官方已经做了大量的适配，但这些算法其实没有沉淀到这个领域和行业里面的。因此我们基于内部的一些项目，也去做了一些ai的实践案例。比如说水表读数，安全帽检测等等。这些案例可能是使用同一个具体的算法，但是应用在不同的领域和行业场景。

后续会让我们的伙伴、高校的老师、开发者一起来分享他们的案例，这样，其他的开发者也能通过阅读这些案例快速的复现，加速整个端到端的开发。

在此也为大家推荐一些ai gallery上的经典案例：

、、、、。

像工业安全帽检测、水表读数，都是基于华为在行业内的一些项目沉淀出来的案例。这些案例生产的模型可以达到工业级的要求，它可以直接部署使用。唯一的区别是数据，当前我们只提供一个样例的数据，如果大家能够采集到更多更好的数据，训练出来的模型精度也会非常不错。

对于isv伙伴来说，ai gallery是和华为云云市场打通的，因此他们可以上架云市场，商业售卖资产模型，直接获得商业利益。

对于开发者来说，当前更多的是个人成就和荣誉的提升。后续我们也在积极的引入个人开发者计划，让普通的个人开发者去参与到整个项目之中，真正地进入到实战环节，既能获得实践的锻炼，也能够得到经济上的回报。

一是资产和案例的积累。 当前已经有很多开发者在ai gallery上贡献主流的开源数据集，其他人直接验证算法时可以拿来即用。在算法和模型方面，官方也已经把很多常用算法做了预集成。高校也在将一些经典论文的算法发布到ai gallery分享。

二是分享机制。 开发者可以把算法和模型分享到ai gallery，然后我们正在尝试采取一些激励的机制，让他们更有动力分享。

三是针对端到端的案例场景，我们上线了案例库。 当前案例虽然还不是很多，但后续华为官方以及isv、伙伴、个人开发者会陆续将开发和交付的项目案例总结发布进来，让广大开发者通过学习这些案例来加速应用开发过程。

第一个方向是加速行业和企业的ai应用落地。 首先就是通过资产沉淀提高ai开发效率。其次是我们正在做项目的需求广场，以及开发者的认证机制，通过减少开发环节的链路，让更多的开发者和伙伴通过ai gallery开发和交付ai项目，最终帮助行业和企业解决问题，加速应用的落地。

另一个方向主要是面向学习教育的场景。 现在我们基于大量的算力和数据去做迭代式的训练和开发，但很多高校的硬件可能跟不上，需要在云上进行教学实践。所以面向教育行业，面向个人开发者学习的场景，我们也打算做一些事情，包括教学课程，论文解读等等。

最终我们希望把这两条线打通，既能提供教学培训、学习的一站式4008云顶国际网站的解决方案，也能够让开发者把学习到的知识通过真实的交付场景实践出来。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

ai专家一席谈：复用算法、模型、案例，ai gallery带你快速上手应用开发-4008云顶国际网站

全部回复

设置昵称

关于作者

推荐阅读

相关产品