摘要
帮你速读文章内容
百融云创获得“机器学习模型代码生成”国家发明专利,通过代码生成模型,提高机器学习模型构建和部署效率,减少人工参与,缩短开发部署周期,已应用于ORCA-GPT平台,提升建模效率及性能。
摘要由平台通过智能技术生成
有用
发明专利解密|机器学习模型代码生成,让建模尽显丝滑###

  百融云创获得了一项名为“一种机器学习模型代码的生成方法及装置 ”的国家发明专利,这一突破性成果,对于提高机器学习模型的构建和部署效率,提供了崭新的解决路径。

  机器学习模型的本质是从数据分布中映射出一个决策函数,是对现实世界中数据和规律的描述和抽象化过程。在当今这个时代,机器学习模型显示出前所未有的价值。它就像是工业时代的发动机一样,伴随着轰鸣声拉动着社会向前狂奔。随着整个社会的数字化、智能化的推进,机器学习模型会越来越多,同时也会越来越复杂。

  然而构建、训练、测试以及最终部署机器学习模型通常是一个繁琐乏味的过程。机器学习模型要通过代码实现,在实际工程环境中,有三大共性问题始终让人头疼。

  一是来自于开发环节。代码开发工作通常需要业务问题专家、数据科学家、算法专家等人员高度手工参与,不仅开发门槛高,且开发效率较低。

  第二个来自部署环节。在实际工程环境,“难以部署”是机器学习模型失败的重要原因之一。有时,开发和生产中使用的技术,以及系统环境的差异,会导致机器学习模型无法从开发环境精确地部署到生产环境。在部署模型时还需要人工二次调整修改代码,从而导致机器学习模型的部署周期较长。而且,随着模型变得越来越复杂,部署的困境只会越来越难。

  第三个问题来自推理性能方面,预测推理能力是机器学习模型解决问题的灵魂。在部署过程中,大量工程师的参与,会使得不同团队间存在知识或目标的差异,导致模型在构建和部署实施的转换过程中产生分离,进而导致模型推理性能的下降。

  针对以上的问题,百融云创的发明专利,创造性地提出了依靠代码生成模型,匹配系统环境和任务问题,自动化生成机器学习模型代码的解决方案,开辟了一条机器学习建模自动化的新路径。

  这项发明专利的技术逻辑是这样的。结合系统环境的调整样本,通过迁移学习和强化学习技术,调教代码生成模型。然后将调整后的代码生成模型作为目标代码生成模型,并通过提示学习技术确定与待开发模型匹配的提示文本,对待开发模型对应的任务问题文本和所确定的提示文本进行拼接处理,形成目标样本。最后基于目标样本,利用目标代码生成模型,生成用于训练待开发模型的代码。

  这能够减少人工对机器学习模型代码开发的参与度,提高机器学习模型的开发效率。另外,由于通过迁移学习技术、强化学习和提示学习技术,让代码生成模型学习到系统环境常用的框架、API等标准用法,使得生成的代码能够天然匹配系统环境。这样,在部署机器学习模型时减少或杜绝二次调整和修改工作,大幅缩短部署的周期。

  通常情况下,模型的开发和部署是在不同语言环境下进行。模型开发一般使用python语言,而部署系统通常为java或C++等语言。该发明专利能实现跨语言或环境的模型训练与自动化部署。从开发训练到复现部署,传统模式下可能需要2-4周的时间,通过代码生成模型这个“翻译软件”,最快只需要几秒钟即可完成。

  值得一提的是,该发明专利的技术成果,已经应用到百融云创机器学习平台ORCA-GPT,ORCA-GPT的功能涵盖了从需求分析到算法开发、特征工程、模型训练、测试与优化、再到部署的全生命周期。开发者不仅能够以自然语言的方式生成代码,还能加速模型开发和部署的整个作业流程。在该专利的助力下,ORCA-GPT能够显著减少模型开发过程中的人工干预和重复劳动,提高开发效率,同时还能大幅降低技术门槛。

  目前,在百融云创内部ORCA-GPT已经得到了深度应用,在数据分析岗位上将建模时间缩短到30%,机器学习模型推理性能(TPS)平均提升300%以上,复杂模型提升700%,模型测试与部署时间缩短50%以上。

举报/反馈

同花顺财经

262万获赞 45.4万粉丝
每天更新优质内容,欢迎大家关注
财经领域创作者
关注
0
0
收藏
分享