Hi!下午好!欢迎访问互联网
当前位置:主页 > 软件

搜狗搜索联合中国中文信息学会共同发起CI

时间:2018-10-17 17:08:30| 来源:| 编辑:笔名| 点击:0次

搜狗搜索联合中国中文信息学会,共同发起“CIPS-SOGOU问答比赛”

日前,由搜狗搜索联合中国中文信息学会(CIPS)共同举办的CIPS-SOGOU问答比赛正式启动报名。作为国内首档基于大规模真实用户问答数据集的问答评测任务,此次大赛的举办,不仅能为参赛者提供挑战及展示能力的舞台,还将促进学术界及业界在智能问答领域的研究发展,推动智能问答系统更加广泛地面向公众提供信息服务。

此次问答比赛分为事实型问答和非事实型问答两项子任务。按照赛制,参赛者需要根据给定的问题设计算法,从候选篇章中抽取合适的词语、短语或句子,作为问题的标准答案,能够实现正确、完整、简洁地回答问题。每个问题对应给出10个候选答案篇章,每个篇章约50 - 500个汉字。

在评测指标方面,事实型问答子任务将采用Accuracy和Precision-Recall(F1)指标对预测答案进行评价,其中Accuracy计算预测答案和标准答案是否精确匹配,F1计算预测答案相对标准答案的词级重合度,以两者平均值作为最终指标。非事实型问答子任务采用ROUGE和BLEU指标对预测答案进行综合评价。

据悉,此次比赛的事实型问答子任务,将从9月1日起开始提交报名,有兴趣参赛的高校生、业内研究人员等

搜狗搜索联合中国中文信息学会共同发起CI

,可通过搜狗实验室官提交报名信息。非事实型问答子任务,则将在12月中旬开始接受提交报名,并陆续公布比赛数据集和Leaderboard。在2018年CIPS的学术年会上,将会对两项子任务中胜出的团队进行颁奖。

值得一提的是,作为联合主办方的搜狗搜索,将向大赛提供来自搜索引擎的大规模真实用户问答数据集。其中,6万个问题(事实型问题3万、非事实型问题3万),代表了最真实广泛的民信息需求;60万对应问题的候选篇章,来自搜索引擎返回的若干互联页面;而经过对页面进行人工分析标注,搜狗搜索构建了针对问题的标准答案,最终形成大规模、极具价值的问答数据集。

据了解,目前在智能问答研究领域,可用的大规模公开数据集,尤其是反映真实用户问答需求的中文数据集非常稀缺。业界和学术界受限于技术、数据等因素,当前的研究主要针对事实型问答领域,而在与用户搜索场景息息相关的开放域智能问答领域则一直无法取得突破性进展。搜狗搜索此次公开的大规模数据集,不仅能促进CIPS-SOGOU问答比赛的正常开展,还能将给整个智能问答行业的研究发展提供宝贵的数据支撑,从而推动智能问答系统更加广泛地面向公众提供信息服务。

事实上,凭借在人工智能领域的持续投入及搜索引擎的数据优势,搜狗搜索目前在智能问答领域已处于行业领先地位。搜狗搜索此前已上线的立知智能问答系统,就是搜狗研发的面向未来的搜索技术。该系统能够理解用户搜索意图和问题,直接为用户提供想要的答案。目前立知智能问答系统不仅能精准回答事实性问题,在分析类问题、观点类问题、数字类问题、隐式问题等方面,都能直接返回精确答案,背后应用了语义分析、问题理解、信息抽取、知识图谱、信息检索、深度学习等众多人工智能技术。

作为智能问答领域的引领者,搜狗搜索在切实推进产品落地、为用户带来优质搜索体验的同时,也注重向行业开放问答能力,不断推动业界及学术界的研究发展。今年4月份,搜狗搜索曾联合CCIR 2017(2017全国信息检索学术会议)成功举办了国内首次大规模真实用户问答数据集上的问答评测任务首届面向智能问答的篇章排序评测比赛,并公开了来自用户真实搜索需求的5万个问题以及从搜狗搜索全检索结果提供的50万条候选篇章,极大促进了智能问答技术的发展和应用。

相比面向智能问答的篇章排序评测比赛,此次CIPS-SOGOU问答比赛的赛制、公开数据集等都将进行全新升级,将会在更大程度上促进智能问答领域的学术交流和研究水平。对此次问答评测比赛感兴趣的高校生或业内从业者,均可报名参加。