用户名:

密码:

验证码:

当前位置:新媒动态 > 明星时尚 > 时尚前沿 >

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

2018-07-11 13:01 记者观察网 点击次数 :

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

2018-07-07 20:41 来源:雷锋网 阿里巴巴 /淘宝 /人工智能

原标题:阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

雷锋网 AI 科技评论按:《圣经 ·旧约·创世记》第 11 章记载,人类希望能联手共建通往天堂的巴别塔,但因为各种族语言不通,计划因此失败。而在时尚领域,人工智能同样面临巴别塔难题,专业人士、机器智能和普通消费者之间存在信息阻滞和沟通不畅。

客观科学和主观时尚,这两个概念看似互相矛盾,实际上从某种程度上也反映着传统行业与全新技术的鸿沟。如何用机器能理解的逻辑语言,清楚地定义、规范和传递一个行业、尤其是时尚行业的 benchmark? 在阿里巴巴「图像和美」团队和香港理工大学纺织及服装学系的这次深度合作中,我们或许能找到答案。

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

7 月 4 日至 6 日,由阿里巴巴「图像和美」团队联合香港理工大学纺织及服装学系、英国纺织协会联合举办的「人工智能与时尚纺织大会」学术会议在香港理工大学举行,同期包括学术主题演讲、2018 FashionAI 全球挑战赛决赛答辩会及线下 FashionAI 概念店体验活动等多项内容。这一事件在雷锋网学术频道 AI 科技评论旗下数据库项目「AI 影响因子」中有相应加分。

2018 FashionAI 全球挑战赛自今年 3 月发起,共吸引全球 42 个国家和地区的 5272 支队伍共 6594 名选手参与,争夺 134 万的人民币奖金池。

7 月 5 日答辩会当天,来自西安交通大学、马里兰大学、北京邮电大学、中科院深圳先进技术研究院、唯品会等高校及企业的 10 支队伍进行了现场展示及答辩环节。

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

FashionAI 全球挑战赛英雄榜

最终,早稻田大学博士研究生李玮特的单人团队 bilibili 摘得关键点赛道的冠军奖项;来自西安交通大学的禾思众成团队在服饰属性赛道获得冠军。

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

服饰关键点定位赛道冠军——bilibili

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

服饰标签属性识别赛道冠军——禾思众成

针对本次比赛,中科院计算所研究员、中科院智能信息处理实验室常务副主任山世光博士作为 FashionAI 全球挑战赛的决赛评委代表向雷锋网 AI 科技评论表示,本次 FashionAI 受到众多高校及研究机构的关注,除了阿里天池平台本身的影响力以及诱人的奖金激励外,AI 对于时尚行业的渗透,本身也是一个在学术界逐步受到重视的问题。「随着人工智能特别是计算机视觉的进步,AI 未来会在零售、电商等应用中得到更多的体现。」

根据赛制介绍 [1],FashionAI 全球挑战赛的两大赛道分别为服饰关键点赛道及服饰属性赛道,前者专注于女装的服饰关键点定位。基于服装设计知识,赛事组委会定义了一套服饰的关键点,并梳理了在女装 6 大专业类别(上衣、外套、裤子、半身裙、连身裙、连身裤)下的具体定义,要求参赛者设计算法进行定位预测;而后者基于数据集所构建的女装标签知识体系,要求选手在属性维度和属性值两个层面对单主体(单人模特或单件平铺)服饰商品进行局部属性识别。

这两大赛道的设置,反映的是认知时尚的两大基础问题。据阿里巴巴副总裁、淘宝事业部技术总经理兼阿里巴巴大文娱优酷高级副总裁兼 CTO 庄卓然的介绍,阿里巴巴于今年年初和香港理工大学一起开始投入到该领域的建设,一同梳理服饰领域的知识和规则,并将成果制作成这个严谨、实用、符合商业场景的服饰数据集,与 FashionAI 全球挑战赛同期发布。

这个业界首个同时满足服饰专业性和机器学习要求的大规模高质量数据集 [2],包括服饰关键点定位、服饰基础属性识别等任务。据介绍,前者的关键点定义源自服装设计原理,目前覆盖女装 5 大类部件,共 41 个细分类目,24 种关键点,总计 10 万张标注图片;后者通过对基础属性的专业整理,构建了一个层次化的标签分类体系,目前覆盖女装 5 大类部件,41 个细分类目,8 个维度 54 个标签,总计 25.7 万标注图片。数据集中使用的所有图像数据全部来源于电商真实场景,从各个季节、类目等维度的上亿的服装数据中采样得到,从而保证了数据的多样性。

阿里 FashionAI 数据集:用知识重建构造「时尚+AI」的巴别塔

服饰,特别是女装,是淘宝上最大的商品类目。2017 年双十一当天,服饰领域的成交占比超过 30%,阿里巴巴深知用户在服饰时尚领域巨大的消费能力,也密切关注互联网和技术在其中能创造的商业价值。

阿里巴巴资深算法专家雷音(贾梦雷)所带领的阿里巴巴「图像和美」团队从 10 年前就开始在淘宝做图像的检测和搜索,彼时主要针对的是商家图片版权保护、虚假广告宣传等。

正如庄卓然所言,「识别」只是计算机视觉的一部分。如果要进一步做到感知和交互,进一步拉通消费和生产,只靠技术是远远不够的。雷音也深刻地意识到淘宝今天所面临的困境,是消费者和平台、和商家无法用达成共识的语言沟通商品需求的问题。「单单连衣裙类目就有 2000 万件商品,产品数量非常庞大,但还是有很多用户抱怨找不到自己想要的商品,」雷音介绍道,阿里巴巴在时尚角度的数据重组依然有很大的提升空间,这样才能让消费者很好地表达自己的需求,并通过这些表达接触到对应的数据。

数据重组是 FashionAI 的重要组成部分。只有让机器能理解人类所表达的内容,把数据进行有效的分类,才能让消费者熟悉穿搭行业的认知,进行更有效的需求表达。

在一个主观的世界里去做客观的事情并不容易,而首当其冲的便是要让机器懂得时尚界的语言。

「让机器理解衣服,核心是制作服饰图像数据集。[3] 」 雷音认为,将从业者的知识转化为机器可以理解的逻辑语言,首先要从数据集入手,用足够的数据让机器明白各种服饰的区别和特性。



(此文不代表本网站观点,仅代表作者言论,由此文引发的各种争议,本网站声明免责,也不承担连带责任。)

(责任编辑:主编)
文章人气:
(请您在发表言论时自觉遵守互联网相关政策法律法规,文明上网,健康言论。)
用户名:
验证码:
首页 | 新闻资讯 | 财经股票 | 科技新闻 | 汽车资讯 | 娱乐八卦 | 体育新闻 | 房产楼市 | 旅游资讯 | 健康养生 | 明星时尚 | 主持人主 |