0
2017年高考今天就結束了,跟往年一樣的是作文題目出來以后引發網友吐槽和創作、交警組織送考車隊、以及幫迷路和丟失準考證的考生及時赴考。不一樣的也有,那就是來自清華大學蘇州研究院的高考機器人AI-MATHS和來自教育機構“學霸君”的智慧教育機器人Aidam,它們都通過數學試卷和人類一絕高下。
考試結果是,AI-MATHS在2017文科數學北京卷獲得105分,在2017文科數學全國卷II獲得100分;Aidam在2017文科數學全國卷獲得134分,不過它需要人工為機器人輸入題目,審題難度大大降低了。
下面雷鋒網 AI 科技評論就來聊一聊他們兩位都是什么情況。


2015年,科技部公布了國家高新技術研究發展計劃(863計劃)信息技術領域2015年第一批項目,科大訊飛股份有限公司牽頭的“基于大數據的類人智能關鍵技術與系統”項目獲得立項支持,安排863計劃專項經費概算超5000萬元,“高考機器人”就是項目中的重要研究目標之一。科大訊飛作為牽頭單位,聯合清華大學、中科院自動化所、北京大學、北京理工大學、中科院軟件所、南京大學、電子科技大學、哈爾濱工業大學等超過30家科研院校和企業共同負責項目的研發與實施,科大訊飛執行總裁胡郁任項目的首席科學家。整個項目分成了許多不同的子項目,比如有專門做語文的、做數學的,科大訊飛除了牽頭之外還要提供一些底層的平臺技術給大家分享,還要設計測試方法和測試平臺對每個子項目成果進行評估。
據雷鋒網 AI 科技評論了解,今年應試數學的成都AI-MATHS團隊就是國家863類人答題項目組成員,主要負責攻關數學學科。 “AI-MATHS”之父林輝是清華大學蘇研院大數據處理中心主任,同時也是該中心智慧教育事業部從2013年開始技術孵化的成都準星云學科技有限公司CEO。除了這次應試數學的AI-MATHS機器人,準星云學還研發了準星智能評測機器人(即準星智能評測系統),能對學生答案正誤、錯誤知識點、錯誤原因進行智能判定。準星云學還亮相2016年“十二五”科技創新成就展并獲得榮譽證書。

AI-MATHS誕生于2014年,于去年5月宣布參加高考,今年2月以較高分通過中期評測。林輝介紹,AI-MATHS是通過綜合邏輯推理平臺來解題,而非學習儲存題庫。“它可以學習小學到高中的7000多個考點,運算量可達2的800次方。”
“AI這次是系統階段性成功公開測試,由于此次活動無法與高考同時同臺進行,所以命名為模擬高考,但最關鍵的是整個過程是嚴格按照斷網、斷庫、自然語言理解、綜合復雜推理等嚴格流程進行的公開透明測試。”林輝介紹,近1年多來,AI在復雜邏輯推理、直覺觀察推理、計算機算法、深度學習上都進行了深入攻關,“AI是通過綜合邏輯推理平臺來解題,而非學習儲存題庫,因此在完全掐斷題庫、斷網、無人干涉、僅有12臺服務器、1.2萬道題的小樣本訓練量的諸多限制下,在今年2月時取得了93分的成績。”

昨日傍晚6點,離2017年全國高考數學科目的考試結束只有1個小時,AI在位于成都高新區天府新谷一個關閉外部網絡的房間內,通過內部服務器的計算,在2小時內作答兩份高考數學試題,之后由教師批改答卷。
經過共2小時的解題、等待、評分后,AI-MATHS此次模擬高考成績為:2017年高考文科數學北京卷獲得105分,用時22分鐘;2017年高考文科數學全國卷II獲得100分,用時10分鐘。2份考卷對比2月中期評測的基礎上均有大幅提升。相比試前林輝110的目標,差距已經很小了;而這個答題速度則是人類根本無法比擬的。
值得一提的是,這款機器人目前仍有一些漏洞需要不斷改進,比如,AI-MATHS欠缺對常識的理解能力,這導致AI-MATHS不能理解一些題目,在解答題中有0分答案的出現。這次挑戰的結果將運用到該公司對AI-MATHS的技術驗證和準星產品迭代中。“此后AI-MATHS將接受大樣本訓練、測驗彈性擴展能力,乃至于遷移到其他領域的學習能力。”林輝說。

昨晚在北京,教育機構“學霸君”請到6名去年的理科狀元來和他們的智能教育機器人Aidam進行同臺對決,共同解答今年高考文科數學試題。
六名高考狀元在高考數學結束拿到試題后,立即開始答題,答題時間是五十五分鐘。人機雙方分別完成了包括客觀題和主觀題在內的整張試卷,并按照評分標準得出最終成績。經過數學特級老師、奧賽教練韓兆勇的評審,Aidam的分數最終公布:134 分。三組高考狀元陪他一起進行測試,狀元一組得分119分。狀元二組得分140分。狀元三組得分146分。
三組高考狀元平均分135分,Aidam與平均分只差一分,但是離最好成績還有一段距離。另外據雷鋒網 AI 科技評論了解,現場是人工為機器人Aidam輸入題目的,這將會導致難度大大降低,因為直接跳過了審題、提取信息這一解題過程中非常重要、也很有難度的一步。所以Aidam的通用性比AI-MATHS要差一些,離我們理想中嚴格斷網、斷庫、自然語言理解的答題機器人也要更遠一點。
不過學霸君的思路強調大題庫(已經有超過7000萬的巨大題庫),通過海量的題庫,用戶行為數據,以及 Ai 自我博弈,從海量題目中找到適合共通的知識組件和解題模式。
相比高考狀元們花了將近一個小時才完成考試,Aidam僅僅在10分鐘內就完成了所有的答題。學霸君創始人張凱磊坦言自己很緊張,“就像送自己的女兒參加高考”。他表示,為了展示,Aidam昨天答題放慢六倍速度,平時每道題完成時間應該在七至十五秒。

Aidam解題全程展示
Aidam放慢的原因是不僅需要把題目做對,還需要給大家展示他是如何做到的。根據要求,Aidam會通過禮堂前部的大屏幕來展示:左邊是一個由無數藍色光點組成的大腦,每算一道題,藍色大腦里就會跳出若干以紅色、黃色、藍色節點構建的知識鏈。每個節點旁邊有一行白色的字,標注著這道題涉及了哪些知識。
參加了昨晚對決的2016年河北省理科狀元孟祥熙現就讀于北京大學光華管理學院,他受訪時表示,“人機大戰贏了很開心,但是機器人技術很先進,想知道自己解題錯在哪里”。
“想知道自己解題錯在哪里”正是學霸君想要幫學生達到的重要目標之一。
學霸君是一家以技術為驅動的創業公司,自成立之初就一直致力于人工智能服務教育領域的探索,目標是通過機器理解為老師和學生在薄弱知識點的學習提供豐富的支持。學霸君潛心研究的智能教育機器人就是機器理解技術的一種典型應用,也是人工智能領域的重要挑戰。學霸君推出的同名手機app就在為學生和老師提供著解題、答疑相關服務。
作為863“高考機器人”項目的“領頭羊”,科大訊飛認為,研發“高考機器人”的主要目標并不是PK掉人類考生,而是為了更好地服務人類,利用相關技術成果可以在教育全過程中起到非常大的幫助,技術和算法的突破后,同樣的成果可以用在醫療、用在客服、用在越來越多的領域。
“像在客服系統、還有一些車載的人機交互系統里,都需要我們預先對一些行業知識的理解,同時基于這個理解的結果能夠做一些決策判斷、一些相關問題的回復。”科大訊飛輪值總裁吳曉如介紹說,“現在,我們已有一些中間技術應用到一些行業里面了,比如說教育領域中作文的自動閱卷;還有機器翻譯這塊,我們已經推出了相關的口語對口語的翻譯系統。所以,雖然現在我們還沒有向社會公布我們這個系統在高考中的最后得分,我們在不同的行業里面已經形成了一些應用。”
根據吳曉如介紹,在研究中除了答題,訊飛的高考機器人還有閱卷的功能。應用在大學的普通話等級測試時,他們請了一組最權威的專家留下了很多測試樣本,以這些測試樣本作為機器學習的對象,然后建立模型來測試。最后的結果是,一組21個人的平均分,機器和專家的絲毫不差;分數排序的相關性也很高。以后作文閱卷也可能交給機器。
在科大訊飛研究院院長胡國平看來,高考機器人戰略也將是中國人工智能實現“彎道超車”的一個助推器,同時,巨大的應用市場、高水平的人力資源將確保中國在人工智能發揮實效上前途無限。“我們的高考機器人從開始的時候就已經很清楚,我們的目標就是高考,而且是中國的高考。實際上,和東京大學自主命題的考試一樣,難度是非常大的。我們一開始就是奔著這個真正有難度的任務去努力的,所以換個角度來說,中國在整個人工智能領域特別在內容智能領域持續領先的可能性會更大。”胡國平對整個高考機器人項目表示了信心。
AI科技評論招業界記者啦!
在這里,你可以密切關注海外會議的大牛演講;可以采訪國內巨頭實驗室的技術專家;對人工智能的動態了如指掌;更能深入剖析AI前沿的技術與未來!
如果你:
*對人工智能有一定的興趣或了解
* 求知欲強,具備強大的學習能力
* 有AI業界報道或者媒體經驗優先
簡歷投遞:
lizongren@leiphone.com
相關文章:
機器人參加2017年數學高考得105分,最快答題時間不用1s
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。