近日,第十七届全国知识图谱与语义计算大会(CCKS2023)举办的AI挑战赛落下帷幕。本次竞赛分为A和B两个赛道,分别针对不同类型的上百种金融事件进行事件检测,比赛吸引了来自中科院、清华大学等著名高校和知名企业的近400支队伍参赛。经过为期一个月的激烈角逐,华润数科人工智能实验室表现出色,在本次竞赛A和B两个赛道分别荣获冠军和季军。
本次AI竞赛聚焦金融领域主体事件检测,主体事件检测是语言文本分析和金融领域智能应用的重要任务之一,如在金融风控领域往往会对公司主体进行风险事件的检测。竞赛基于句子粒度的上下文进行公司事件检测,事件包含事件类型和主体要素(即公司主体),句子中可能存在多个事件,多个公司主体且每个公司都可能存在多个事件类型标签,并且各类型标注样本分布不均匀,部分类型样本量较少,给模型训练效果带来很大挑战。
在比赛中,华润数科人工智能实验室团队根据任务特点,采用pipleline管道式流程,设计了事件分类和主体识别两大类算法。首先,采用UTC、LM-MTC等模型实现事件分类;在接下来的主体识别中,通过二分类预测,序列标注、模型融合等方法得到有关事件主体的知识;再将输入文本和预测的事件类型以及事件主体等知识拼接在提示语句中,输入到自主优化LLM(大规模语言模型),利用大模型更强大的上下文语义理解能力,得到最后结果。
通过以上模型设计和训练策略,华润数科在竞赛中取得了优异成绩,充分展示了在自然语言处理领域的深厚积累和持续创新能力。未来,华润数科将在人工智能领域持续进行创新和探索,以更先进的技术服务更多用户,助力广大行业的数字化转型发展。