摘要:關(guān)于公司公司是一個全球性的自然語言理解公司,成立于年。該公司的目標(biāo)是創(chuàng)造出智能的機器,與人類攜手共進,一同推動人類智慧的發(fā)展。
MALUUBA是一家深度學(xué)習(xí)公司,位于加拿大魁北克省蒙特利爾市,致力于從事促進機器人像人類一樣思考、推理和交流的事業(yè)。該公司今天宣布即將公開發(fā)行兩個復(fù)雜的自然語言理解數(shù)據(jù)集。在資源的可利用化過程中,MALUUBA公司旨在進一步推動和促進人工智能領(lǐng)域的研究,以取得突破性創(chuàng)新成果。
Maluuba公司的新數(shù)據(jù)集是自然產(chǎn)生的,而不是人工生成的,它探索了人類在讀寫和對話方面的基本能力。這些數(shù)據(jù)集具有一定的復(fù)雜性,目前已經(jīng)應(yīng)用于開發(fā)機器的閱讀理解能力、面向目標(biāo)的對話系統(tǒng)和對話接口領(lǐng)域的研究。
“我們相信,語言的理解能力是人工智能最基本的能力。” Maluuba公司的合伙人兼首席技術(shù)官卡希爾·蘇勒曼(KaheerSuleman)表示,“我們由衷地希望,Maluuba公司的數(shù)據(jù)集能夠推動人工智能和自然語言領(lǐng)域的發(fā)展,希望全世界能一起實現(xiàn)我們的目標(biāo)——機器與人類直接交流?!?/p>
Maluuba公司研發(fā)的第一個數(shù)據(jù)集是NewsQA,主要用于訓(xùn)練可以回答復(fù)雜問題的算法,它需要具備人類級別的理解能力和推理技巧。利用來自DeepMind問答數(shù)據(jù)集中的CNN文章,Maluuba公司準(zhǔn)備了一個基于眾包的機器閱讀語料庫,包含120000個問答對。集合方法論的基礎(chǔ)是不完全信息和好奇心理。這些問題需要通過推理才能總結(jié)出答案,比如綜合法、推理法和模糊處理法,這與那些只專注于量而處理簡單問題的數(shù)據(jù)集不同。最終,只有穩(wěn)定的數(shù)據(jù)集才能進一步推動自然語言研究的進步。
蒙特利爾大學(xué)計算機科學(xué)和運籌學(xué)學(xué)院(DIRO)的助理教授亞倫·考維爾(AaronCourville)博士表示:“開發(fā)此數(shù)據(jù)集的過程中,我們付出很多努力,這些努力將推動機器閱讀理解的發(fā)展?!?/p>
Maluuba公司的第二個數(shù)據(jù)集是Frames,它包含19986個問答對,可以用來訓(xùn)練自然會話過程中的深度學(xué)習(xí)算法。以上眾多基于文本的對話記錄,來源于兩個人之間的模擬對話,這兩個人一個是度假咨詢者,另一個是旅行社代理。其中,從一個話題過度到另一個話題的過程輕松而流暢,比如航班、日期、住宿以及其它等問題能在對話中自然出現(xiàn)。對于其它的對話數(shù)據(jù)集,我們一般假設(shè)該對話沒有記憶性,只考慮并記錄每步對話中一組用戶的約束條件。與第一個數(shù)據(jù)集NewsQA不同,F(xiàn)rames數(shù)據(jù)集需要開發(fā)全新的狀態(tài)跟蹤模型。
“這個新的數(shù)據(jù)集非常重要,它讓標(biāo)準(zhǔn)對話任務(wù)所涉及的領(lǐng)域得到了擴展,例如,比較和探索不同用戶的選擇。”赫瑞-瓦特大學(xué)數(shù)學(xué)與計算機科學(xué)學(xué)院(MACS)的教授奧利弗·萊蒙(Oliver Lemon)博士表示,“搭建支持這些任務(wù)的會話系統(tǒng)是一個極具吸引力的挑戰(zhàn)過程,F(xiàn)rames數(shù)據(jù)集將會幫助實現(xiàn)這一過程?!?/p>
“對于人工智能研究員來說,諸如Maluuba公司開發(fā)的Frames數(shù)據(jù)集等相關(guān)內(nèi)容,將會在面向目標(biāo)的對話研究中發(fā)揮至關(guān)重要的作用?!焙杖?瓦特大學(xué)數(shù)學(xué)與計算機科學(xué)學(xué)院(MACS)的副教授韋雷娜·里斯(Verena Rieser)博士表示,“在MACS交互實驗室,我們正在開展口語對話和響應(yīng)生成方面的學(xué)術(shù)研究,而Frames數(shù)據(jù)集將對我們的研究十分有幫助。”
研究社群可以訪問 https://datasets.maluuba.com 來獲取Maluuba公司的數(shù)據(jù)集。
關(guān)于Maluuba公司
Maluuba 公司是一個全球性的自然語言理解公司,成立于2011年。該公司的目標(biāo)是創(chuàng)造出智能的機器,與人類攜手共進,一同推動人類智慧的發(fā)展。2016年,Maluuba公司在蒙特利爾開設(shè)了一個研究實驗室, 致力于解決創(chuàng)新產(chǎn)品在語言理解方面面臨的基本問題,這將進一步推動人工智能系統(tǒng)的發(fā)展。
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/4446.html
摘要:年的深度學(xué)習(xí)研討會,壓軸大戲是關(guān)于深度學(xué)習(xí)未來的討論。他認為,有潛力成為深度學(xué)習(xí)的下一個重點。認為這樣的人工智能恐懼和奇點的討論是一個巨大的牽引。 2015年ICML的深度學(xué)習(xí)研討會,壓軸大戲是關(guān)于深度學(xué)習(xí)未來的討論?;谄胶饪紤],組織方分別邀請了來自工業(yè)界和學(xué)術(shù)界的六位專家開展這次圓桌討論。組織者之一Kyunghyun Cho(Bengio的博士后)在飛機上憑記憶寫下本文總結(jié)了討論的內(nèi)容,...
摘要:排名第二位的是微軟,同比大增第三是,增幅為以的增長速度位居第四,這是在增速方面唯一位於落後於亞馬遜網(wǎng)絡(luò)服務(wù)的主要服務(wù)提供商。這些最新發(fā)布的數(shù)據(jù)與近期發(fā)布的預(yù)測數(shù)據(jù)相一致,表明云計算和軟體即服務(wù)全球收入將在年突破億美元大關(guān)。據(jù)國外媒體報道,Canalys在2017年第二季度業(yè)績報告中指出,云計算基礎(chǔ)設(shè)施市場同比增長47%,達140億美元。分析顯示,總體來說,四大云服務(wù)提供商占整個云基礎(chǔ)設(shè)施服務(wù)...
摘要:月日,各項競賽的排名將決定最終的成績排名。選手通過訓(xùn)練模型,對虛擬股票走勢進行預(yù)測。冠軍將獲得萬元人民幣的獎勵。 showImg(https://segmentfault.com/img/bVUzA7?w=477&h=317); 2017年9月4日,AI challenger全球AI挑戰(zhàn)賽正式開賽,來自世界各地的AI高手,將展開為期三個多月的比拼,獲勝團隊將分享總額超過200萬人民幣的...
閱讀 2065·2021-11-22 09:34
閱讀 1256·2021-10-09 09:44
閱讀 3096·2021-09-29 09:35
閱讀 3686·2021-09-14 18:01
閱讀 1563·2021-08-16 10:49
閱讀 1170·2019-08-29 14:11
閱讀 908·2019-08-29 12:47
閱讀 3136·2019-08-26 13:47