概述

项目概述

本项目要求通过MindSpore中高阶工具TinyMS支持的CycleGAN网络实现风格迁移。并提出以下目标要求:

  • 使用TinyMS搭建的CycleGAN网络
  • 使用自己的数据做迁移学习,可基于TinyMs提供的预训练模型进行训练,也可以自行训练
  • 有明确的应用场景和实际意义

项目背景

图像风格迁移主要指将A图像的内容特征和B图像的风格特征二者融合,最终生成一张既保留A图像内容又含有B图像目标风格的C图像的一类任务,其中可用于迁移的风格是多种多样的,例如:艺术家风格、漫画风格等。在图像风格迁移任务中会遇到这样的问题:艺术风格并没有一个标准的统一的定义,品类繁杂,比如印象派、后印象派、中国风等,所以无法用确切的数学函数模型去描述。但是有研究发现,在艺术风格较为强烈的图像中,其纹理表述和艺术风格表述近似相等,因此可以通过提取纹理特征来近似提取图像中的风格特征。但是在深度学习出现以前,需要人工去分析图像的风格,并依靠手动建立数学或者统计模型来表述图像的纹理特征。然而图像风格一旦发生变化就需要重新建模,耗时耗力,这极大地限制了这些传统图像风格迁移模型的适用范围。

随着深度学习的发展,深度神经网络能以最优的方式自动地提取图像中有效特征的表达,在图像特征提取任务上展现了出色的能力。并且采取深度学习的方式可以避免手工建模的耗时耗力。得益于此,图像风格迁移在近年来获得了极大的发展,目前在社交软件、电影制作、游戏美术设计等各个领域都得到了一定程度的应用。

风格迁移效果演示

另一方面,AI技术近年来迅速发展,华为技术有限公司也是提出自主研发的新一代全场景AI计算框架MindSpore。该框架具有易开发、高效执行、全场景覆盖三大特点,是源于全产业的最佳实践,为AI算法工程师以及数据工程师提供了强大的模型训练推理能力和在多场景下灵活部署能力,对数据科学和人工智能领域发展具有巨大的推动作用。此外,基于开源深度学习框架MindSpore开发的深度学习开发工具TinyMS为用户提供了从数据准备到模型部署的全流程的极简易用的高阶API封装,并通过易于扩展的模块化设计提供了覆盖多种业务场景的能力,为深度学习初学者、科研人员以及深度学习企业开发人员提供了便捷高效的开发工具包。

在本次命题中,我们便使用了TinyMS开发包中提供的CycleGAN网络模型,快速提供了风格迁移任务解决方案。

Mindspore与TinyMS

基于以上背景,我们本次命题期望实现的最终功能是,使用TinyMS搭建的CycleGAN网络,并基于开源图像数据训练一个城市风格迁移模型,模型接收用户输入的一张城市图像(一段城市视频),然后按照用户选择的风格来生成风格迁移后的富有特色的城市图像(视频)。

产品介绍

目前项目团队面向个体用户的社交需求,拟推出图像风格大师网页端、图像风格大师移动端与图像风格大师桌面端等多类型客户端社交应用软件。满足个体用户在社交中图像艺术风格滤镜、直播视频艺术背景替换等功能。

面向团体用户的多方面个性化需求,本项目目前根据产品市场需求进行定位开发,拟推出游戏场景自动化风格建模软件平台、边缘端图像去雾算法平台以及建筑风格辅助设计平台,提供多学科多场景风格迁移定制解决方案。

商业模式

本团队作为风格迁移商业化开发应用的先行者,依托电子科技大学计算机视觉与机器智能实验室与华为昇腾AI全栈平台,基于生成对抗网络实现风格迁移技术,针对个体与团体用户的多学科多行业应用需求,根据需求技术指标进行技术迁移开发生成软件服务平台,由销售运营团队实现对客户的持续对接,实现长期运营。

主要业务分为两部分。一部分是图像风格大师社交多端软件平台。为个体用户提供社交风格迁移服务。该业务通过团队公司运营与出租代理商服务,对用户采用会员制收费、计次收费与计时收费结合方式实现盈利。第二部分是个性化风格迁移定制服务。该部分通过针对团体用户个性化差异公司团队实现定制化软件开发,并以收取定制开发费以及有偿更新迭代服务实现盈利。

项目效益

带动就业

破晓科技成立公司伊始,直接提供行政管理、科技研发等各类就业岗位30多个。预计五年内新增岗位200多个。公司产业应用范围较广,初定有四个不同的应用领域,因此对于各领域产业的就业人数都有极大的间接带动作用,预计在五年内带动本地及相关合作就业人数2000以上。我们以AI助力产学研发展,不断带动就业增长。

引领教育

本项目团队培养了一批优秀的硕士、本科生。其中指导老师团队经验丰富,有过多项专利作为项目的技术支撑,核心团队中两名研究生在校成绩优异,通过该项目对自身科研能力、技术能力以及;多名本科生在校成绩优异,有着参与科研项目的经历,获得优秀奖学金等荣誉。对于本次项目,本团队拟申请多项专利及软件著作权。

项目团队注重产学研一体化。在校期间就积极鼓励学生参与各种竞赛,综合素质得到极大提升。本项目团队由两名研究生和六名本科生组成,通过该项目,既提升了研究生的领导力和专业能力,也使得本科生有了更好的机会接触到高新技术。团队做到了多学科交叉融合创新,“A+双一流学科”+“多领域产品创新”极大提升了团队整体的创新创业思维能力。本次创业大赛做到了“赛”“创”结合,对接相关企业,利用行业资源,实现高质量高效率孵化创新,持续推动实际AI产品落地,促进社会健康发展。

通过积极参与此次创业大赛,培养和提升了团队成员创新精神、创业意识和创新创业能力,充分体现了团队成员所学专业知识和技能在项目和相关创新创业活动中的转化与应用。


项目需求

市场环境分析

当前,应用市场中已经存在诸如Prisma等应用图像风格迁移技术的APP,用户可以上传图像到这些APP来生成特定艺术风格滤镜的图像,然后进一步在社交平台上分享。但是这些软件都需要开通会员才能随意使用这些风格模板,并且风格迁移之后的图像除了用于社交分享目前还难以有其他的用途。

Prisma风格迁移效果

但是总体来说,图像风格迁移在其他的艺术创作和社会生产等市场的应用并不充分。因此,利用城市风格迁移模型生成不同风格的城市图像,在社交平台、艺术创作和社会生产等市场具有很大的应用潜力去挖掘。

市场需求分析

游戏制作

在一款游戏的开发中,场景美术资源的设计与制作是重要且繁琐的,特别是城市场景的设计。如果将我们的城市风格迁移模型应用到游戏中的城市场景设计工作中,一定可以节约美术成本,节省开发周期。比如:在某款游戏的城市场景设计中,制作组希望城市总体呈现一个类似真实生活场景的风格,那么在原画设计中就可以利用我们的城市风格迁移模型,并让模型在真实城市场景数据集和游戏城市场景数据集上进行训练。那么制作组就可以很轻松地得到具有真实场景风格的游戏城市场景设计图,并用于后续的场景贴图或者场景3D建模。

此外,如果玩家在游玩过程中不喜欢某款游戏的城市风格,还可以启用内置在游戏中的城市风格迁移模型,在游戏中对城市场景的风格进行切换,比如中世界风格、漫画风格等等。总之,我们的城市风格迁移模型在游戏场景的设计中具有很大潜在市场。

利用风格迁移技术,将绝地求生的场景风格迁移到堡垒之夜的场景中

社交互动

利用在真实城市场景和古风、卡通、艺术家等不同风格图像上训练的城市风格迁移模型,用户可以很轻松的获取带有不同风格的城市图像,然后在社交平台上分享。此外,当用户在城市中拍摄视频或者开直播时,配合高精度的人体检测技术,用户可以选择不同的风格来对背景中的城市场景进行单独迁移,增加其直播的趣味性和观看性。考虑到当下抖音等短视频直播平台的火爆,我们的城市风格迁移模型的潜在市场是很大的。

直播背景风格迁移效果图

社会保障

基于CycleGAN的风格迁移算法在图像去噪上有着不错的表现,这当然也可以应用到城市场景中。当前各大城市的街道上遍布摄像头,但是这些摄像头的分辨率有高有低,甚至部分位置的摄像头受到损坏导致监控图像中噪音很多,还可能受到雨雾天气的影响而导致监控图像模糊不清。那么这个时候就可以利用我们的城市风格迁移模型,将低分辨率的城市监控图像转换成高分辨率的、将带噪音风格的城市监控图像转换为噪音少甚至不带噪音的,这可以为保障城市治安做出巨大贡献。

通过图像风格迁移对场景去雾的效果图

建筑规划

CycleGAN在从草图生成含有丰富细节的对应真实图像的任务上具有不错的表现,因此我们希望可以将其扩展到建筑物设计草图的转换上。在城市建筑规划设计中,从设计图纸到真实的建筑物是一个漫长的过程。施工方可以利用我们的城市风格迁移模型,在图纸照片和已经建好建筑物图像数据集上进行训练,那么就可以把图纸上的建筑物草图转换成具有真实场景风格的城市建筑物,可以更好地指导建设的进行,这在城市的建设中具有很重要的意义。

利用风格迁移技术将草图转换成真实风格图像

政策分析

我国高度重视人工智能技术进步与行业发展,人工智能已上升为国家战略。当前,新一代人工智能正在全球范围内蓬勃兴起,它既是推进经济发展的新型引擎,又是引领未来社会的战略产业。为了在新一轮国际科技竞争中掌握主导权,我国加快人工智能行业布局与规划,先后出台了《新一代人工智能发展规划》《促进新一代人工智能产业发展三年行动计划(2018-2020年)》《关于促进人工智能和实体经济深度融合的指导意见》《关于“双一流”建设高校促进学科融合加快人工智能领域研究生培养的若干意见》等重要文件,进一步促进我国人工智能行业发展。

为加强人工智能领域标准化顶层设计,推动人工智能技术研发和标准制定,促进产业健康可持续发展,国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部五部门已于2020年8月印发《国家新一代人工智能标准体系建设指南》,指南提出国家新一代人工智能标准体系总体要求、建设思路、建设内容等。人工智能标准体系结构主要包括“A基础共性”“B支撑技术与产品”“C基础软硬件平台”“D关键通用技术”“E关键领域技术”“F产品与服务”“G行业应用”“H安全/伦理”等八个部分。《国家新一代人工智能标准体系建设指南》指出:2021年,明确人工智能标准化顶层设计,研究标准体系建设和标准研制的总体规则,明确标准之间的关系,指导人工智能标准化工作的有序开展,完成关键通用技术、关键领域技术、伦理等20项以上重点标准的预研工作。标准化工作对人工智能及其产业发展具有基础性、支撑性、引领性的作用,既是推动人工智能行业创新发展的关键抓手,也是产业竞争的制高点。当前,我国出台了诸多人工智能相关的国家标准和行业标准,涵盖了云计算、人脸识别、指纹识别、智能语音、工业机器人等领域。

在如此需求背景下,使用MindSpore中TinyMS完成CycleGAN网络的训练实现风格迁移不仅具有实际价值,更具有积极意义。