阿里云天池大赛官网,海量活动,巨额现金奖励等你拿
什么是阿里云天池?
阿里云天池平台是中国最大的 AI开发者社区,面向社会开放高质量数据(阿里数据及第三方数据)和计算资源,让参与者有机会运用其设计的算法解决各类社会或业务问题。如今,该社区已经承载了电商、金融、工业、医疗等上百种场景的赛事,合作或服务了百余家机构。
阿里云天池大赛: https://tianchi.aliyun.com/competition/activeList
2023年首届大赛官网和报名地址:https://tianchi.aliyun.com/specials/promotion/2023StorageServiceCompetition
最新阿里云天池大赛活动
天池是阿里云旗下大数据平台,围绕云生态挖掘输送优秀人才。旨在打造“数据众智、众创”平台,欢迎来自世界各地的技术人员来天池参与百万奖金的天池大赛,进行真实业务场景演练,与全球AI人才比拼,挑战世界排名。您还可以在天池创建属于您的天池实验室,享受免费计算资源,探索不同行业真实场景数据,共同探索数据众创新模式。
作为阿里云旗下算法竞赛平台,天池自成立以来已横跨电商、交通、物流、医疗、工业、农业、自然科学等10多个行业,举办过超500场顶尖赛事,其中包括100多场学术赛事,赛题涉及数据挖掘、机器学习、自然语言处理、计算机视觉、图神经网络、自动驾驶、数据可视化等热门方向。在阿里云天池举办的各类顶会赛事中,一方面开发者可以享受平台开放的高质量真实场景数据;另一方面基于真实场景数据设计的各类优秀解决方案对技术的实际应用和落地起到了积极的推动作用。
本期为大家精选了上半年天池开展的学术科研赛,希望这些丰富的赛题能给大家的日常工作带来启发,也欢迎大家拨冗参赛,夺取荣誉。
赛题推荐
大模型可谓是当下最热门的技术话题了,首先我们介绍3场和大模型相关的比赛:
大赛一:CCKS2023-PromptCBLUE中文医疗大模型评测挑战赛
背景:以ChatGPT、GPT-4等为代表的大语言模型(Large Language Model, LLM)掀起了新一轮自然语言处理领域的研究浪潮,展现出了类通用人工智能(AGI)的能力,受到业界广泛关注。在LLM大行其道的背景下,几乎所有的NLP任务都转化为了基于提示的语言生成任务。然而,在中文医学NLP社区中,尚未有一个统一任务形式的评测基准。
为推动LLM在医疗领域的发展和落地,华东师范大学王晓玲教授团队联合天池团队推出PromptCBLUE评测基准, 将CBLUE评测基准进行二次开发,将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务,形成首个中文医疗场景的LLM评测基准。PromptCBLUE将作为CCKS-2023的评测任务之一,依托于天池大赛平台进行评测。
https://tianchi.aliyun.com/competition/entrance/532085/introduction
https://tianchi.aliyun.com/competition/entrance/532084/introduction
大赛二:CCKS2023-开放环境下知识图谱构建与补全评测挑战赛
背景:知识图谱是一种结构化的数据表示形式,它以图形的方式展示实体及其之间的关系。而大型语言模型,如GPT系列模型,通过在大量文本数据上进行预训练,能够捕捉到丰富的语义和句法信息。知识图谱可以为大型语言模型提供结构化的知识,有助于改善模型的推理能力和生成质量。通过将知识图谱中的信息融入大型语言模型中,可以使模型在处理复杂任务时更具智能和准确性。今年,面向更有挑战的开放环境下知识图谱构建和补全场景,围绕基于大模型的知识抽取与推理关键技术,浙江大学联合OpenKG开放知识图谱社区及PaperWeekly在CCKS2023组织评测并包括两个子任务:指令驱动的自适应知识图谱构建、归纳式知识图谱关系推理。本次评测将依托天池平台(https://tianchi.aliyun.com/)展开,并鼓励评测选手使用大模型(如ChatGPT等),我们将持续维护和新增更多的评测任务,请有意向的参赛队伍请关注平台上的竞赛列表。
https://tianchi.aliyun.com/competition/entrance/532080/introduction
https://tianchi.aliyun.com/competition/entrance/532081/introduction
背景:命名实体识别(Name Entity Recognition)任务旨在自动识别出文本中人名、地名、机构名等事件基本构成要素的重要实体。古籍文献的命名实体识别是正确分析处理古汉语文本的基础步骤,也是深度挖掘、组织人文知识的重要前提。由北京大学人工智能研究院和北京大学数字人文研究中心基于“二十四史”,设计了涵盖人名、书名、官职名等多项的实体知识体系,建构了覆盖多个朝代的历时、跨领域的数据资源,完善古籍命名实体识别任务的建立,以此推动技术的突破和发展,助力古籍资源的智能开发与利用。选手可以充分利用自有模型或开源模型进行古籍挖掘。
报名时间:2023.04.01-2023.06.01
https://tianchi.aliyun.com/dataset/151499
https://tianchi.aliyun.com/dataset/151111
大赛四:CCL2023-汉语框架语义解析评测挑战赛
背景:框架语义解析(Frame Semantic Parsing,FSP)是自然语言处理领域中的一项重要任务,其目标是从句子中提取框架语义结构,实现对句子中涉及到的事件或情境的深层理解。FSP在阅读理解、文本摘要、关系抽取等下游任务有着重要意义。
CFN1.0(Chinese FrameNet, CFN) 数据集是由山西大学联合北京大学、南京大学以汉语真实语料为依据构建的框架语义资源,数据由框架知识及标注例句组成,包含了近700个语义框架及20000条标注例句,并于第二十二届中国计算语言学大会(The 22nd China National Conference on Computational Linguistics, CCL 2023) 大会开展了学术评测评测任务。本次比赛共包含3个子赛题:
-
子任务1: 框架识别(Frame Identification),识别句子中给定目标词激活的框架。
-
子任务2: 论元范围识别(Argument Identification),识别句子中给定目标词所支配论元的边界范围。
-
子任务3: 论元角色识别(Role Identification),预测子任务2所识别论元的语义角色标签。
https://tianchi.aliyun.com/competition/entrance/532083/introduction
大赛五:CAAI-BDSC2023 社交图谱链接预测挑战赛
背景:社会网络是由社会个体成员之间因为互动而形成的相对稳定的社会结构,成员之间的互动和联系进一步影响人们的社会行为,电子商务平台大范围的普及和使用,不仅满足人们丰富多样的消费需求,也承载着社会成员基于商品消费产生的互动链接,形成基于电商平台的在线社交网络,电商场景社交知识图谱的构建有助于深入理解在线社交网络的结构特性与演化机理,为用户社交属性识别和互动规律发现提供有效方式。电商平台活动和场景形式丰富多样,用户表现出不同的社交行为偏好,且伴随活动场景、互动对象、互动方式、互动时间的不同而不断发生变化,动态性高,不确定性强,这些都给社交知识图谱的构建和应用带来巨大挑战。
本赛道基于阿里电子商务平台用户互动数据展开社交图谱链接预测任务,本次评测包括两个子任务:社交图谱小样本场景链接预测,社交图谱动态链接预测,任务评测依托阿里云天池平台展开。
https://tianchi.aliyun.com/competition/entrance/532073/introduction
https://tianchi.aliyun.com/competition/entrance/532074/introduction
大赛六:CVPR2023 – AliProducts Challenge: Large-scale Cross-Modal Product Retrieval Challenge
背景:The growing customer demand for E-commerce is becoming more and more diversified, growing the need for methods that not only require a single modality such as product images, but also call for the usage of textual captions that describe said images. Bridging the gap between visual representation and high-level semantic concepts remains an open research topic for obtaining users’ search intentions. This challenge is based on the AliProducts3 dataset that is designed to bridge this gap. This realistic large-scale and multimodal dataset consists of ~5M image-caption pairs of ~100K fine-grained products. Challenge participants must find the top-K product candidates to match a query such as “blue men’s turtleneck sweater”. This challenge is a natural continuation of our previous AliProducts2 challenge which had more than 800 competing teams.
https://tianchi.aliyun.com/competition/entrance/532077/introduction
希望选手们积极参赛,也欢迎有办赛需求的高校、科研单位联手天池平台,一起打造技术影响力。