安徽大学图书馆

第三届“慧源共享”全国高校开放数据创新研究大赛安徽分赛区赛制说明

发布时间：2021-05-07 15:10:32

一、关于大赛

为推动和促进教育科研领域数据资源的汇聚流通和共享开放，鼓励高校师生利用新技术对开放数据进行创新研究与应用，聚合各行业力量培养和提升大学生的数据素养，在上海市教育委员会、上海市经济和信息化委员会的指导与支持下，复旦大学图书馆、上海市教育委员会信息中心和上海市科研领域大数据联合创新实验室联合长三角地区多家高校和企业，面向全国高校师生举办第三届“慧源共享”高校开放数据创新研究大赛系列活动。大赛同步启动四个分赛区、两个分赛道竞赛，以充分发挥地区优势和专业特色，多维度、全方位促进大赛目标实现。

系列活动拟于2021年4月至12月开展：

“数据悦读”学术训练营：训练营面向全国高校师生，邀请不同行业、不同领域的数据科学家，在域内重点高校举行巡回数据专题讲座，并进行在线直播，形成系列课程。

数据竞赛：

• 核心赛道-大赛提供来自政府、高校、企业的高价值数据集。参赛团队可自定选题或参照选题指南开展研究，以研究论文+论文海报+研究数据（以上为必交内容）+数据应用（选交内容）的形式参与竞赛。

• 本次大赛共分两个赛道：

分赛道1【金融知识分赛道】、分赛道2【数据应用分赛道】

成果孵化：通过出版大赛优秀论文集、推荐发表优秀获奖论文、推荐出版优秀数据、支持优秀成果落地转化、推荐实习等途径，为参赛团队提供更多机会和支持。

二、安徽分赛区规则

1、赛道规则

• 安徽分赛区的参赛团队，可同时报名多个赛道；

• 安徽分赛区的参赛团队，可同时参加全国和本省分赛区的奖项评选（参赛团队根据队长身份所在高校，确定其所属分赛区）。

2、参赛对象

安徽省区域内高校、研究生院（所）在校师生。具体要求如下：

• 参赛团队可由3-7人组成。

• 若团队由学生组成，则可有1位指导老师（指导老师不计入团队人数）。

• 每位选手只能参加1支队伍。

• 每位指导老师可以指导多支队伍，但所指导队伍参赛内容不能相同。

3、参赛形式及作品要求

1）总体要求

• 参赛团队可完全基于大赛提供的数据，也可使用大赛数据结合自有数据，完成竞赛作品。

• 参赛团队题目自拟，开展定题研究，鼓励围绕城市数字化转型等热点问题。

• 参赛作品应为未经发表的原创作品，具有一定的创新性和独特性，最终提交作品需包括以下内容：

Ø 参赛作品要求清楚注明团队信息；

Ø 入围决赛的团队，须参加专家答辩（线上或线下形式，视疫情防控要求而定）。

Ø 所有参赛相关的提交材料均不予退还。主办方有权将参赛作品及相关信息用于制作纸质、音频、视频等形式的宣传品和出版物（传播途径包括互联网），以及举办展览展示活动（展览展示途径包括互联网）等。

2）论文作品要求

• 竞赛论文应基于数据进行研究，根据具体的研究主题，阐述研究意义、研究问题、数据分析、研究结论和应用成果等内容。

• 论文字数5000-12000字。

• 论文格式应遵循“慧源共享”上海高校开放数据创新研究大赛-论文模板的要求。

3）海报作品要求

• 海报内容应与研究论文相一致，每个作品限1页海报。

• 海报中包括论文题目、研究问题、研究思路与方法、研究结论等必要信息。

• 大赛提供海报模板，在基于模板制作海报时，除与文章有关的内容可按规范制作外，其他大赛活动图标文字均不得变动。

• 海报不宜太多文字，应遵循文字和图表相结合的原则，列出关键图，合理排版，整个海报的文字图表覆盖率要求在90%以上，结尾不要留有大片空白。

• 海报大小为90cm（竖向高度）*60cm（横向宽度），分辨率为150dpi。

4）应用作品要求

• 应用作品包括移动应用、网站和可视化作品，不限形式，微信小程序、微站（移动Web应用）或iOS、Android等平台上的App、网站、利用第三方工具制作的可视化作品等等均可。

• 如提交应用，应同时提交作品说明文档，涵盖如下部分：

Ø 整体介绍：介绍作品的概况，准确描述作品的立意和应用场景，针对受众群体的问题和需求，综合运用数据集和各类数据技术，提供相应的解决方案或有价值的分析结论。

Ø 数据使用：说明所使用的大赛数据集和自带数据，数据的融合运用方式和挖掘利用程度。

Ø 作品自评：说明作品的创新性、交互性、美观性、采纳的技术、凸显的价值和意义等。

5）数据要求

参赛选手可完全基于大赛数据或结合大赛数据和自有数据完成竞赛作品，最终提交作品中应清楚列举研究中所使用到的大赛数据和自有数据（如有使用），并说明不同数据如何进行关联整合。

参赛团队参加比赛使用的数据须满足如下任一条件：

条件1：完全基于主办方提供的大赛数据完成参赛作品。

大赛数据样本数据在活动官网（http://data.huiyuan.sh.edu.cn/data/dv/HuiyuanSharingDataCompetition2020）公开。大赛报名结束后，参赛团队可根据需要申请获取相关数据集。组委会及数据所有者将根据具体情况对数据使用者进行身份验证、签订数据使用协议等。参赛选手须同意仅以比赛为目的持有和使用数据，本次比赛数据仅限已报名选手下载或在线使用，不得向外传播；若私自传播（包括但不限于传输、复制、发布、再分发等在内的任何传播形式）数据，组委会有权追诉法律责任，并按照市场价格追究赔偿。

条件2：结合主办方提供的数据和自行采集的有一定原创性的研究数据（简称：自有数据）。

自有数据是指具有一定的原创性，以研究为目的，由使用者自行采集整理的数据。数据原则上要求经过清洗、脱敏、抽取、转化等预处理步骤。举例说明，以下类型数据可视为具备一定原创性：①为研究微博用户行为而依法收集的微博博文数据；②为研究科研人员数据共享意识，自行设计问卷并收集的调查问卷数据。

大赛使用数据应按要求经过整理后提交至慧源上海教育科研数据平台（www.huiyuan.sh.edu.cn）。除数据集外，还应提供数据文档，说明数据的来源、采集和处理方法、数据格式及使用等。在成果提交时，应同时提交所使用的数据；在成果评审时，管理员将对数据进行审核，并公开发布。

提交的数据不应侵犯他人或其他实体的专利权、商标权、商业秘密权、著作权、公开权或其他权利的内容；不应包含非法、威胁、辱骂、骚扰、诽谤、中伤、欺骗、欺诈、侵犯他人隐私、侵权、淫秽、攻击或亵渎性质的内容；不应包含非授权广告、推送广告、垃圾或批量电子邮件（俗称“垃圾邮件”）；不应包含软件病毒或任何其他计算机代码、文件或有意破坏、损害、限制或干扰任何软件、硬件或通讯设备正常功能的程序，或者意图破坏或非授权访问慧源上海教育科研数据平台或其他第三方系统、数据或其他信息的程序。

注：作品必须完全基于或部分基于比赛提供数据；仅使用自有数据将视作违规，取消后续参赛资格。

三、安徽分赛区组织方式

1、安徽分赛区组织模式

为更好地凸显地域特色，全方位、多维度推动教育科研数据资源的汇聚流通和共享开放，提升高校师生的数据素养，本届大赛以“主题契合、形式多样、节奏统一、宣推共享、比赛自治”为基本原则，设定安徽、浙江、江苏、山东四个分赛区，安徽分赛区赛事名称为“集数成智赋能未来”。安徽分赛区的参赛团队，可同时参加全国和本省分赛区的奖项评选（所属赛区以报名时队长所在高校归属为准），安徽分赛区设置一、二、三等奖及优秀奖，提供获奖证书，不设奖品。

2、安徽分赛区与全国赛区的关系

1）安徽分赛区是全国赛区在具体地域的延伸，遵循全国赛区总体要求和规则。

2）安徽分赛区报名、数据申请、作品提交，须在全国赛区主平台完成。

3）在不违背全国赛区规则的基础上，安徽分赛区在赛区内具备一定活动自主性，接受全国赛区组委会监督。

四、安徽分赛区赛事日程

时间	赛程阶段
2021年4月23日-6月18日	学术训练营
2021年4月23日-6月18日	竞赛报名时间
2021年10月上旬	作品提交
2021年11~12月	公布结果、颁奖典礼

五、数据集开放

本次大赛所有数据集，按照数据提供方要求均采用申请获取的模式。参赛队伍可在大赛官网下载样本数据。在报名通道关闭后，成功报名的团队可根据研究需要确定需要下载的数据集，并按要求提交数据申请，待审批通过后，方可签订《数据使用协议》并获取数据。

六、安徽赛区奖项设置及评审办法

1、奖项设置

奖项	数量	奖励方式
一等奖	1组	提供获奖证书
二等奖	2组
三等奖	3组
优秀奖	5组
优秀指导老师	6名（安徽分赛区参赛作品一、二、三等奖的指导老师）

2、评审办法

安徽分赛区参赛作品不单独组织本赛区内参赛作品的评审，所有参赛作品奖项评审

遵从全国大赛评审办法，参赛作品的获奖名次依据全国大赛复审结果排序，直接颁发分赛区奖项。

七、安徽分赛区组织机构

指导单位：上海市教育委员会、上海市经济和信息化委员会、复旦大学图书馆

主办单位：安徽省高等学校图书情报工作委员会

承办单位：安徽大学图书馆万方数据

数据支持单位：中国科学技术大学图书馆、合肥工业大学图书馆、安徽大学图书馆、安徽师范大学图书馆、安徽工业大学图书馆