|
在智能問(wèn)答方面練就了一身技術(shù)本領(lǐng),找不到實(shí)戰(zhàn)的舞臺(tái)?想與國(guó)內(nèi)頂級(jí)技術(shù)牛人同場(chǎng)競(jìng)技,領(lǐng)略最前沿的研究成果?怎樣能獲得更廣泛更真實(shí)的數(shù)據(jù)集,讓技術(shù)研究更上一層樓?日前,搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì)(CIPS)共同舉辦的“CIPS-SOGOU問(wèn)答比賽”正式啟動(dòng)報(bào)名啦,你的這些愿望都有望得以實(shí)現(xiàn)! 作為國(guó)內(nèi)首檔基于大規(guī)模真實(shí)用戶問(wèn)答數(shù)據(jù)集的問(wèn)答評(píng)測(cè)任務(wù),“CIPS-SOGOU問(wèn)答比賽”將為國(guó)內(nèi)的高校生、業(yè)內(nèi)從業(yè)者等,搭建一個(gè)可供挑戰(zhàn)及展示能力的公開(kāi)平臺(tái)。此次問(wèn)答比賽分為事實(shí)型問(wèn)答和非事實(shí)型問(wèn)答兩項(xiàng)子任務(wù),參賽者需要根據(jù)給定的問(wèn)題設(shè)計(jì)算法,從候選篇章中抽取合適的詞語(yǔ)、短語(yǔ)或句子,作為問(wèn)題的標(biāo)準(zhǔn)答案,能夠?qū)崿F(xiàn)正確、完整、簡(jiǎn)潔地回答問(wèn)題。每個(gè)問(wèn)題對(duì)應(yīng)給出10個(gè)候選答案篇章,每個(gè)篇章約50 - 500個(gè)漢字。
在評(píng)測(cè)指標(biāo)方面,事實(shí)型問(wèn)答子任務(wù)將采用Accuracy和Precision-Recall(F1)指標(biāo)對(duì)預(yù)測(cè)答案進(jìn)行評(píng)價(jià),其中Accuracy計(jì)算預(yù)測(cè)答案和標(biāo)準(zhǔn)答案是否精確匹配,而F1計(jì)算預(yù)測(cè)答案相對(duì)標(biāo)準(zhǔn)答案的詞級(jí)重合度,以兩者平均值作為最終指標(biāo);非事實(shí)型問(wèn)答子任務(wù)采用ROUGE和BLEU指標(biāo)對(duì)預(yù)測(cè)答案進(jìn)行綜合評(píng)價(jià)。
此次比賽的事實(shí)型問(wèn)答子任務(wù),于9月1日起開(kāi)始提交報(bào)名,有興趣參賽的高校精英、業(yè)內(nèi)牛人均可通過(guò)“搜狗實(shí)驗(yàn)室”官網(wǎng)報(bào)名參與!而非事實(shí)型問(wèn)答子任務(wù),則將在12月中旬開(kāi)啟報(bào)名,隨后會(huì)陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學(xué)術(shù)年會(huì)上,將會(huì)對(duì)兩項(xiàng)子任務(wù)中勝出的團(tuán)隊(duì)進(jìn)行頒獎(jiǎng)。
圖片10.png (253.3 KB, 下載次數(shù): 1)
下載附件
2017-9-5 11:38 上傳
值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來(lái)自搜索引擎的大規(guī)模真實(shí)用戶問(wèn)答數(shù)據(jù)集。其中,6萬(wàn)個(gè)問(wèn)題(事實(shí)型問(wèn)題3萬(wàn)、非事實(shí)型問(wèn)題3萬(wàn)),代表了最真實(shí)廣泛的網(wǎng)民信息需求;60萬(wàn)對(duì)應(yīng)問(wèn)題的候選篇章,來(lái)自搜索引擎返回的若干互聯(lián)網(wǎng)頁(yè)面。
搜狗搜索公開(kāi)的大規(guī)模數(shù)據(jù)集,不僅能給參賽選手帶來(lái)技術(shù)研究和實(shí)踐的便利,還將促進(jìn)整個(gè)智能問(wèn)答行業(yè)向前發(fā)展,推動(dòng)智能問(wèn)答系統(tǒng)更加廣泛的面向公眾提供信息服務(wù)。眾所周知,數(shù)據(jù)是智能問(wèn)答科研的最寶貴資產(chǎn),尤其是反映真實(shí)用戶問(wèn)答需求的中文數(shù)據(jù)集非常稀缺。在這方面,學(xué)術(shù)界和創(chuàng)業(yè)團(tuán)隊(duì)所能獲得的數(shù)據(jù)資源通常遠(yuǎn)少于產(chǎn)業(yè)界的企業(yè)。
今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國(guó)信息檢索學(xué)術(shù)會(huì)議)舉辦的國(guó)內(nèi)首次大規(guī)模真實(shí)用戶問(wèn)答數(shù)據(jù)集上的問(wèn)答評(píng)測(cè)任務(wù)——“面向智能問(wèn)答的篇章排序”評(píng)測(cè)比賽中,已經(jīng)公開(kāi)了來(lái)自用戶真實(shí)搜索需求的5萬(wàn)個(gè)問(wèn)題以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬(wàn)條候選篇章,極大促進(jìn)了智能問(wèn)答技術(shù)的發(fā)展和應(yīng)用。
相比“面向智能問(wèn)答的篇章排序”評(píng)測(cè)比賽,此次“CIPS-SOGOU問(wèn)答比賽”的賽制、公開(kāi)數(shù)據(jù)集等都進(jìn)行了全新升級(jí),將給參賽選手帶來(lái)更大的挑戰(zhàn)和展示舞臺(tái)。報(bào)名即將啟動(dòng),智能問(wèn)答領(lǐng)域的高手和牛人們,還在等什么,快快報(bào)名參加吧! |