高考結束!這種折磨人的事,絕對是中國特色。
學生們絞盡腦汁,身心受虐,其實也不僅僅是學生,老師們也頭痛——孩子們寫出來,就得有人判??!記得當年楊姐上學的時候,被選中閱卷的老師也是一肚子不開森,因為他們也相當于被關了N多天的“監獄”……不過以后會出現一種奇葩的狀況:機器人閱卷!
其實業內早有消息:科大訊飛牽頭搞的一個國家項目——國產高考機器人,要在2020年考上重點大學,甚至清華、北大!(楊姐獨家消息,最近已經開始測試了)!而去年訊飛就已經搞出了閱卷機器人!
艾瑪,這是要把人類排除在考試之外顛覆國子監的意思么?話說,以后要是高考這事機器人都能給辦了,咱們每個考生都買個機器人,不,還是“租”個機器人替考吧,一輩子就用一次,使用頻率過低還是租得劃算,而且這玩意估計也跟APP似的升級很快……這不是一門很好的生意么……嘿嘿嘿,做夢吧!
首先要給大家拎拎清楚:這個考試機器人其實并不是為了考試——我個人的理解,之所以要做考試機器人,其實是為了訓練系統達到人工智能的一個新的階段。而做閱卷機器人,則是一個到了更加實用的目的:減輕閱卷老師們的負擔!
先搞出來的閱卷機器人,其實是國家863的大項目“類人智能”中包含的一個技術——“機器閱卷技術”,不過牽頭負責人都是科大訊飛的輪值總裁胡郁,憑借在人工智能領域的突出貢獻,他剛剛在全國科技創新大會上獲得了“中國優秀青年科技人才獎”,全國只有十個人哦。
為了搞明白,俺又騷擾了這位博導,胡郁告訴楊姐,此前安徽省合肥市和安慶市的會考中,英文和中文的考試已經全部使用了整套感知智能和認知智能技術進行自動評分,而且效果非常好,以后這門技術將會被全面推廣到包括文科和理科的所有課程。
好吧,那么以后億萬考生的人生命運就交給機器了?這玩意靠譜么?什么原理???
“矛”與“盾”
給大家分享一下我從胡郁那里得到的信息。
首先講講高考機器人,這個項目官方的名字是“基于大數據的類人智能關鍵技術與系統”,是由國家科技部批復的重點項目,科大訊飛作為項目牽頭單位,訊飛的副總裁兼研究院院長胡郁也是這個項目的首席科學家,與清華大學、中科院自動化所、北京大學、北京理工大學、中科院軟件所三四十家單位共同負責研發與實施。
這里牽扯到一個問題,為什么要讓機器人參加高考呢?
我自己理解,評判一個人智商的標準就是讓你參加考試,雖然這個方法很多人都在批判,但是沒有其它更好的辦法。所以,這是人工智能水平的一個標志,根據大數據來研究相關類腦計算關鍵技術和類人答題系統——大家想想,如果一個機器人能夠參加高考并考取大學,是不是在一定程度上說明其智力水平跟大學生差不多了?
另外,國外也是這么做的啊——美國華盛頓圖靈中心在研究如何讓機器人通過美國高中生物測試。日本國立情報研究所在研發能夠考上東京大學的高考機器人
當然,高考機器人現在還在實驗階段,但是“閱卷機器人”則已經可以上崗了!
這種閱卷機器人用的是另一種技術:“機器智能閱卷技術”,去年年底就已經在安慶、合肥、湖南等地成功試點應用,且經過對人機評分結果的分析,計算機在評分一致率、平均分差、相關度以及與仲裁分更接近的比例等指標方面都已達到或超過人工評分水平……
今年高考不知道會不會用這種閱卷機器人……嘿嘿嘿
這意味著,高考閱卷老師可以下崗了么——絕不是!怎么可能呢,機器閱卷并不能取代老師審美,而是輔助。
例如目前的高考閱卷,有三道環節,假設每道環節都需要兩個老師,一份試卷就需要6個。那機器學會了閱卷之后,就可以在一個環節減少老師的工作量;再例如原來需要兩個老師閱卷的,現在就可以采用1個老師+1個機器的方式;或者是有一個環節用機器,人類最終復審。
這樣總體下來,會為閱卷減輕了很多工作量。在某方面說,也是更公平,更客觀。因為機器是不會疲勞且完全統一標準,而人類還有可能因為疲勞出現誤判——聽著是不是有點像無人汽車反而比人類開車更安全的邏輯?因為人類司機還有打盹、疲勞等等導致車禍發生的因素,而無人駕駛汽車卻沒有這些因素。
機器輔助人類,就是用高考老師閱卷的標準來讓機器可以輔助老師,減少一定的人力。如果真的是特別優秀的文章,依然可以脫穎而出。這個技術我記得是哈工大訊飛聯合實驗室研發的!
好,為什么在人工智能領域里,這個很重要呢——這牽扯到了機器閱卷和答題的原理問題。
機器會不會胡判?
一個非常非常讓我擔心的問題是,機器能判得準么?誤判了咋辦?機器能像人一樣思考么?機器能“讀懂”感情么?
根據胡郁的解釋是,其實所有的考卷就兩部分:客觀題和主觀題??陀^題用答題卡+掃描儀的方式來解決,那效果簡直就是:多快好省——閱卷量多,閱讀速度快,判卷效果好準確,還省人力。而主觀題,其實機器也能干。
其實,美國的MBA、托??荚囍性缇蛻米詣优南到y:什么E-rater系統等等。但是,不管是E-rater還是國內的一些研究,大部分針對的都是第二語言作文,即非母語作文。
非母語作文的特點是,學生的錯誤大多是一些基礎性的拼寫、語法方面的初級錯誤,這些錯誤是比較容易確立一個規則并讓機器執行和批閱。而要想機器閱卷技術真正普及并為閱卷工作帶來便利,無法回避的一個難關就是:批閱學生用母語寫的作文。
與第二語言作文不同,中學生母語作文中基本很少犯語言基礎性錯誤,需要在更高層次,比如作文的文采、篇章的銜接、作文立意等方面做出評判。那么面對這些主觀性很強的文本,應該從哪些維度去評判,又如何去量化這些維度呢?
胡郁表示,其實,人工智能解決這個問題的思路很簡單:學習人類!??!
老師判作文咋整?肯定有幾個標準對吧——同理,想讓機器批閱作文,最重要的也是讓機器學到這套標準,然后按標準批閱。比如說,字跡工整程度、詞匯豐富性、句子通順度、文采、篇章結構、立意等多個層次。再比如,判斷一篇作文是否離題,首先需要根據題目內容提取關鍵詞,并根據主題進行擴展,同時提取作文的關鍵詞,計算作文的關鍵詞和題目的關鍵詞的相似度。而把握一篇文章的立意,就要通過“人工神經網絡”來實現……
這個技術有個自己的名字:訊飛作文評分系統!關鍵的地方在與,不僅僅是評分,還可以自動生成“評語”——覺不覺得人工智能有點牛得讓人覺得“瘆得慌”?嘿嘿嘿
但是吧,我覺得這個系統現在還差一個部分,就是“情感維度”——有的時候一篇文章能夠用事實來感動人,而不是華麗的辭藻等等……所以,我覺得,人工智能永遠只能是咱們人類的輔助……
迷茫和空間
首先說個問題,關于人工智能,幾天前任正非任總在全國科技創新大會上的公開講話中提到:“華為現在的水平尚停留在工程數學、物理算法等工程科學的創新層面,尚未真正進入基礎理論研究。隨著逐步逼近香農定理、摩爾定律的極限,而對大流量、低時延的理論還未創造出來,華為已感到前途茫茫,找不到方向。華為已前進在迷航中?!?br /> 對于未來,任正非的預判是,未來二、三十年人類社會將演變成智能社會,深度和廣度還想象不到。但對于現狀,任正非直指華為目前“很迷?!?,攻入無人區后,逐漸陷入了無人領航、無既定規則、無人跟隨的困境——盡管他認為打破困境的方法是堅持科技創新,追求重大創新,同時內生與外引相結合。
胡郁認為,任正非任總的這種“迷?!逼鋵嵤怯斜尘暗?,他不是單純在講人工智能。華為是在通訊工程系統,在他的那個行業領域里,法則就是香農定理、摩爾定律這樣的硬指標。而當這些定理、定律理論基礎沒有發展的時候,實體就很難突破。加上華為本來的水平就已經很高了……其實任總還是比較謙虛的。
在胡郁看來,目前中國的人工智能研究還處于跟隨的位置,但是在跟隨戰略中又有自己的特色。
事實上,中國在人工智能領域能做的事還很多——理論尚有巨大的空間尚未實踐完畢,且中國在移動互聯網時代已經走在了世界的前列,包括大數據等方面,中國已經有了很長一段時間的積累。
這會是中國在人工智能方面超越先進國家的開始么——或許吧,無論如何,要做人工智能就要首先識別對方的語言吧,中國那么多方言,老外是一時半會絕對學部會滴……
對不對?