随着人工智能技术的飞速发展,智能体作为人工智能领域的重要研究方向,正深刻改变着我们的生活与工作方式。为激发广大高校师生的创新思维,促进智能体技术的学术交流与实践应用,2025首届“万方数据杯”AI智能体大赛于6月18日正式启动,现公开征集参赛队伍,诚邀您踊跃报名!
一、大赛背景与目的
本次大赛旨在为参赛者搭建一个实践创新与学术交流的平台,鼓励参赛者将拥有的知识与智能体技术相结合,探索智能体在高校数字化转型、智能教学、知识服务等不同场景下的创新应用,培养具有创新能力和实践精神的高素质人才。
二、参赛对象
本次大赛面向全国高校开放,不设报名门槛。高校在校教师及本、硕、博学生均可根据自身情况报名任一赛道参赛,可选择以个人或团队形式报名。
三、报名时间
报名起止时间:2025年6月18日-2025年7月20日
四、参赛要求
1. 赛道设置:
赛道一:研学效率工具
围绕科技文献的智能化知识组织与应用,以及基于文献和专利的科技查新场景,创建大模型智能体。
场景参考:
l 慧用文献:高产作者研究体系树溯源,领域知识体系自动构建,产业资源链自动构建等。
l 慧找专家:考研找硕士导师、博士导师,跨学科合作中找合作伙伴等。
l 科技查新:科技查新报告,学术论文创新性评估,技术领域实时动态监测,学科交叉点识别等。
……
赛道二:智能学术出版
围绕学术出版过程中的组稿、约稿、评审、排版等关键环节,创建大模型智能体。
场景参考:
l 智能组稿:学术出版中某个征稿专题的智能组稿,稿件智能遴选等。
l 专家推荐:期刊论文评审中审稿专家推荐,学位论文盲审中评审专家推荐等。
l 智能排版:文字排版、图片处理、图表布局等,支持期刊论文、学位论文、政府公文等智能排版。
……
赛道三:数据治理场景
围绕科技文献深度加工利用场景,创建一个或多个智能体套件,开展文献结构解析、多模态要素解构与细粒度语义标注,推动数据治理范式创新。
场景参考:
l 科技文献版面分析:创建版面分析器、OCR识别器、文本抽取器等,支持从复杂文档中提取结构化文本,进行视觉布局分析和定位。
l 多模态要素解构:自动抽取公式、图片、表格等要素,实现知识要素的结构化解析。
l 细粒度语义标注:语义标注和上下文解释服务。将科技文献转化为结构化知识表示,为模型训练和知识挖掘提供标准JSON 格式数据集。
……
赛道四:科研管理场景
围绕高??蒲械ノ坏目蒲泄芾沓【靶枨?,创建实用性智能体,提升科研管理过程各环节的工作效率与水平。
场景参考:
l 科研成果类:成果认领、多源数据对齐、创新点提取
l 科研评价类:论文创新性评价、成果相关性分析、专家匹配度分析、技术成熟度分析
l 科研诚信类:论文智能检测、引文核查、论文工厂检测、伦理审查、知识测评
l 科研监管类:小同行专家、数据溯源、论文质量评审
……
赛道五:产业协同场景
针对企业、高校等组织机构创新协同过程中的信息不对称、对接效率低等问题,开发智能体系统,匹配企业需求与高校科研成果,推动技术成果转化,促进产学研合作。
场景参考:
l 企业技术需求与科研成果的精准匹配,自动分析企业技术需求和高校/科研机构的科研成果(论文、专利、项目报告),计算匹配度并推荐最优方案。
l 专家与人才的智能推荐,即根据企业技术需求,推荐合适的科研专家(高校教授、产业研究员)或技术团队(实验室、初创公司)。
l 技术商业化潜力评估,预测某项科研成果的产业化可能性,辅助企业或投资机构决策。
l 其他更多匹配算法创新、结合某一行业的专用知识库建设、特色数据如产学研行为数据的挖掘洞察等。
2. 开放数据:
(1)专家库
机器学习领域的专家,含研究方向、成果、合作记录、影响力指标、指导学位论文等情况,5000条专家信息。
(2)科技论文集
机器学习领域的元数据10000条,包括题名、作者、作者单位、发表时间、刊名、关键词、摘要、分类号等字段;
(3)科技期刊论文全文
提供50篇JPG格式科技期刊论文,50篇PDF格式科技期刊论文。
(4)专利数据集
专利文献元数据10000条(机器学习领域),包括专利题名、发明人、专利权人、申请时间、发表时间、摘要、权力要求等字段。
(5)论文格式模板
提供20个核心刊模板,10个学位论文模板。
注:
大赛期间,可提供万方科技文献数据辅助大赛各赛道开发,有元数据及全文API接口形式和智能体开发平台的插件形式,具体需求可参赛时联系。
如需使用外部数据,须说明数据来源、获取方式、使用方式等。
3. 开放技术:
参赛者可使用万方提供的智能体平台(agents.wfdata.com.cn)托管智能体,该平台提供了5个内置插件供参赛者使用,分别为:
(1)搜索插件
使用本插件可以使用query参数搜索文章,具体内容可以参考:
[https://gitee.com/wfrd/apidoc/blob/master/search/%E6%A3%80%E7%B4%A2%E6%8E%A5%E5%8F%A3.md]
(2)文摘获取插件
使用本插件可以根据ID获取文章的摘要信息,具体字段内容可以参考:
[https://gitee.com/wfrd/apidoc/blob/master/search/%E6%A3%80%E7%B4%A2%E6%8E%A5%E5%8F%A3.md#%E8%B5%84%E6%BA%90%E7%B1%BB%E5%9E%8B]
(3)全文pdf获取插件
使用本插件可以根据文章ID获取全文Pdf文件
(4)版面分析插件
使用本插件可以将PDF解析成格式化内容,使用者可以给予格式化内容进行内容解析,包括重新排版,内容抽取等
(5)pdf转markdown插件
使用本插件可以抽取PDF内容为MARKDOWN格式
4. 原创性要求:参赛作品必须为原创,不得抄袭、剽窃他人成果,评审阶段会对所有参赛作品使用万方文察进行AIGC检测及相似性检测,若发现存在知识产权纠纷,将取消参赛资格。
五、赛程安排
1. 报名阶段:6月18日-7月20日,参赛队伍通过大赛官方网站(待正式发布时公布)提交报名信息
2. 开发阶段:7月21日-9月21日。XX时间,参赛者/团队通过大赛官方平台(待正式发布时公布)进行开发设计,完成作品后,在开发平台于截止日期之前自主提交作品等待评审。
3. 评审阶段:9月22日-10月20日。专业评审组对所有参赛作品进行评审,最终评审出各奖项获奖者/团队,评审结果将在大赛官方网站公布。
六、奖项设置
每个赛道分别设置一、二、三等奖,此外还将设置全赛道总冠军奖,具体奖励如下:
1. 全赛道总冠军奖1名:奖金20000元/队,提供获奖证书,并提供优先与企业合作孵化机会。
2. 一等奖5名:奖金10000元/队,提供获奖证书,优秀作品将优先推荐与企业合作孵化机会。
3. 二等奖15名:奖金5000元/队,提供获奖证书。
4. 三等奖30名:奖金2000元/队,提供获奖证书。
除上述奖项外,参赛还有机会获取惊喜奖项,详情以统一发布信息为准。
七、授权
参赛者须在提交作品前,明确授予组委会非独占性、永久性、全球范围内的使用授权。组委会有权将作品应用于大赛宣传、成果展示、学术交流等相关活动,涵盖线上线下展览、媒体报道、作品集出版等场景,无需另行支付费用。同时,组委会将严格保障参赛者的署名权,在使用作品时规范标注作者信息。未经参赛者书面许可,组委会不得将作品用于商业盈利性目的(赛事合作中已明确约定的情况除外)。参赛者需确保提交作品为原创,不存在抄袭、剽窃等侵权行为,若因作品版权问题引发纠纷,参赛者须自行承担全部法律责任,大赛组委会不承担任何连带责任。
北京万方数据股份有限公司
2025年6月17日