中国人工智能•多媒体信息识别技术竞赛 激发人工智能领域技术创新源动力
中国人工智能•多媒体信息识别技术竞赛
指导专家委员会委员 毕马宁
“中国人工智能•多媒体信息识别技术竞赛”是我国首个全国范围人工智能领域大型竞赛。竞赛活动由中央网信办、工信部和公安部指导,厦门市政府主办,中国安防协会、中国人工智能学会、中科院信息工程研究所、中国信息通信研究院、公安部第一研究所、公安部第三研究所等单位共同承办。竞赛以“跨界融合、创新发展”为主题,以打造国内最具权威性和具有国际水准的人工智能领域竞赛赛事为目标,本着“公平、公正、公开”的原则,面向国内高校、科研机构、企业和创业团队无偿提供竞赛环境和测试平台。
竞赛设置图像、音频和视频3类、15个竞赛项目,包括:同源图像检索、相似图像检索、手写文本光学字符识别(OCR)、印刷文本光学字符识别(OCR)、人脸识别、特定物品识别、地标识别、旗帜识别、Logo识别、声纹识别、语种相关关键词识别、变种同源音频检索、变种同源视频检索、群体行为识别、特定行为识别。竞赛项目涵盖了当前人工智能多媒体信息识别领域的主流应用方向。
一、竞赛背景与意义
人工智能技术近年来得到了快速的发展,特别是2006年提出的深度学习技术以及2012年取得重大突破性进展的卷积神经网络技术已经广泛应用于制造、安防、物流、金融、医疗、大数据、语音识别、智慧城市等社会领域,可以毫不夸张地说,人工智能正在塑造多个行业的转型升级方向,是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。党和国家高度重视并大力发展人工智能,党的十九大报告指出要“推动互联网、大数据、人工智能和实体经济深度融合”;2018年9月,习总书记在世界人工智能大会的贺信中提到“中国正致力于实现高质量发展,人工智能发展应用将有力提高经济社会发展智能化水平,有效增强公共服务和城市管理能力”;今年3月,习总书记主持召开中央全面深化改革委员会第七次会议,会议指出,“促进人工智能和实体经济深度融合,要把握新一代人工智能发展的特点,坚持以市场需求为导向,以产业应用为目标,深化改革创新,优化制度环境,激发企业创新活力和内生动力,结合不同行业、不同区域特点,探索创新成果应用转化的路径和方法,构建数据驱动、人机协同、跨界融合、共创分享的智能经济形态”。

因此,现阶段迫切需要一套客观反映主流人工智能技术对各类信息识别能力的指标体系,一套科学、权威的国家级人工智能测评标准体系。为引领人工智能技术发展,有关管理部门应当打造一个具有权威性的国家级人工智能技术测评平台,提升技术的应用价值和发展指向性。从国际上看,由美国国家标准与技术研究院(NIST)举办的一系列人工智能领域信息识别测评竞赛是目前该领域国际上规模和影响力最大的竞赛,吸引了来自世界各地的一流科研单位和企业参加。我国完全可以借鉴NIST的模式,通过开放的数据集、持续提供公开服务的测试平台、多维度的评价指标,举办国家级的人工智能多媒体测评技术能力竞赛,打造引领中国人工智能技术发展方向的开放平台,广泛吸引社会各界参与,发掘领域内优秀企业团队,并通过不断优化完善测评指标与标准,使之成为具有国际影响力和权威性的人工智能技术测评平台。
这一构想得到了中央网信办、工信部、公安部的认可与大力支持,以及厦门市人民政府、业界技术专家学者、中国安防协会、中国人工智能学会、中科院信工所、中国信通院、公安部一所、公安部三所的支持,“中国人工智能•多媒体信息识别技术竞赛”应运而生了。
二、竞赛特色
此次竞赛方式,前期广泛征求了业内有关专家、企业和科研单位的意见,以“公开、公平、公正”为原则,力求体现前瞻性和技术引领性,兼顾了学术性和实用性。
在竞赛数据方面,竞赛组委会为了保证公平公正,对标国内外相关赛事,首先收集大量互联网公开数据,实现样本数据的广泛性和多样性;再依据竞赛项目设置从中选择难易程度不同的数据进行分类和标注处理,构建竞赛数据集,并依据相关技术标准进行验证,以保证数据质量满足竞赛要求。目前可供竞赛使用的数据样本已达到千万级的规模,符合互联网大数据的实际应用场景。
竞赛形式上,所有参赛项目全部在线上进行,竞赛组委会选择了具有相关线上环境搭建经验的云计算服务平台,采用在线沙箱模式,以构建公平、安全、可信赖的互联网竞赛环境,并采取了安全防护、权限控制和在线监测等技术手段,确保为每支参赛队伍提供完全一致、隔离独立的参赛环境。在保证竞赛数据集不下载、不泄露的前提下,让每支参赛队自主灵活地实现竞赛数据处理和结果记录。
竞赛结果将采用灵活的发布形式。参赛队伍完成竞赛活动后,需按照格式要求提交比赛结果,并明确比赛结果对应的Docker镜像及运行参数,确保比赛结果可复现。竞赛组委会对竞赛结果进行审查、复核。鉴于此次竞赛旨在推荐、发现一批优秀的技术与团队,重点关注人工智能信息识别技术的应用价值,参赛队伍成绩展示将以多维度、多指标的形式呈现,不区分名次,同时,参赛者可自由选择是否公布其报名参加的某个项目的成绩。
三、竞赛赛程
竞赛官方网站已于3月20日正式上线,创业团队、大专院校、科研院所、企事业单位均可组成参赛队伍,通过竞赛官方网站报名注册,报名截止至4月15日。竞赛组委会将为确认具有参赛资格的队伍,开设竞赛相关账户,提供样例数据、模型等的下载。截至目前,已经有奇虎360、科大讯飞、网易、上海依图、平安科技、厦门美柚、京东等知名企业,有中科院自动化所、复旦大学、中国科学院大学、北京航天航空大学、中科院信工所、中国传媒大学、北京邮电大学等140余家单位、团队报名参赛。
竞赛组委会将于4月20日发布赛程安排;4月25日开始进入竞赛阶段。依托云计算服务平台的运算能力,在本次TB级测试数据集的场景下,竞赛平台同时支持80支队伍在线比赛。竞赛项目将分批次依次进行,每一竞赛项目比赛包括参赛队伍在线调试比赛环境、运行比赛数据和提交比赛结果,时长约为8天时间。赛程预计持续到6月底。
此次竞赛作为我国首个国家级的人工智能领域的多媒体信息识别技术竞赛,其内容、形式、测评标准体系、成果转化等多项工作将广泛听取社会各界的意见建议,持续优化完善,不断创新提升。竞赛项目结束后,建议竞赛平台按照“平时为训练场,赛时为竞技场”的思路持续向社会和领域提供服务,旨在成为永久性的人工智能技术测评平台。另外,通过此次竞赛脱颖而出的优秀技术和成果,应当作为国家有关管理部门服务行业发展、提升政策指向性等工作的重要参考依据。