论高考题,AI离中国考生还差几操场

2017-06-08 09:40· 钛媒体  李程程 
   
出人意料的是,这一次AI并没有全面碾压人类。阅卷结果显示,三组高考状元分别得分为146分,140分,119分,而Aidam为134分,总分为150分。

  当 Alpha Go 又一次出招,三连胜中国围棋天才柯洁之后,或许人们担心的可能是,人工智能下一步又要在哪个领域干掉人类。

  不过,在考试这件事儿上,经过了大量“学习”的机器人,也还是没能超越人类。不得不说,中国学霸实在威武。

  昨天是2017年全国高考第一天,在当天的数学考试结束之后,一场人机高考大战的对决在北京上演了:在线教育公司“学霸君”自主研发的智能教育机器人“Aidam”首次公开亮相,通过现场直播的方式,与六名高考状元同台竞技今年全国卷文科数学试题,完成包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。

  不过,出人意料的是,这一次AI并没有全面碾压人类。阅卷结果显示,三组高考状元分别得分为146分,140分,119分,而Aidam为134分,总分为150分。

  在成都,“国家队”的成绩表现也不是很理想。由国家863计划 “超脑计划”牵头研制的“高考机器人”,成都准星云学科技有限公司研发设计的数学高考机器人AI-MATHS,在断网断题库的环境下,用时22分钟完成当天北京卷文科数学高考试题。

  经过现场批阅,成绩为105分(总分150分)。之后,AI-MATHS再次挑战解答全国二卷数学卷,用时10分钟,考了100分(总分150分)。

  AI-MATHS是由国家863计划 “超脑计划”牵头研制的“高考机器人”, 该“类人智能”项目于2015年7月21日由国家科技部正式启动。

  在学霸君人机大战考试结束后的对话环节中,小组得分为119的2015年新疆理科状元多力岗表示,对Aidam的成绩有点意外,称“这个比赛结果和我们的预期还是有一定的差距,我们在比赛之后分析了一下,自己在一些细节或者在一些计算方面出了一些问题”。

  当然,从接近的分数来看,这次Aidam虽然没有完胜,然而其在10分钟解题,获得了134分的成绩,也足够超越一大批考生。

  学霸君首席科学家陈锐锋在考试比赛的现场解释说,Aidam解题主要分为三大步骤:

第一,把试卷题目变成机器可以理解的形式语言。

第二,在用形式语言完整描述了一系列环境之后,计算机就会在知识网络里启动搜索,确认题目触发了哪些知识点,然后进行一系列的推理,找出最佳解题路径。

第三,把解题的过程和答案,从形式语言转化为自然语言,完成解题过程。

  而要实现这些,基础是庞大的数据库和人工智能领域多年技术的积累。从学霸君官方披露的数据来看,截至2017年5月,“学霸君”App已经积累超过7000万学生用户,累计已经解决问题100亿道,答疑命中率为93%。

  那么,为何PK高考状元选择的是数学学科?

  学霸君创始人兼CEO张凯磊说,“一千个人有一千个哈姆雷特,但是世界上只有一个勾股定理”。

  数学、物理等理科类科目是强逻辑链路的,考点基本稳定,容易判定对错。同时,数学试卷中包括简单的选择题,也有复杂的需要解题过程的大题,非常适合测试AI。

  对于机器人来说,形式化语言是自动解题的一大挑战,而目前数学学科最大的难点在于应用题的解题上,期间涉及到一些社会常识和文字性表述等。

  在业内人士看来,让机器人参加高考,并不是项目的根本目标,只是其对于人类智能的一种模拟、扩展和延伸。目前来说,高考是一种衡量人的知识水平、理解能力、推理能力等相关智力水平的测试工具,其包含了对题目的理解、知识表现、逻辑推理等方式获得知识。

  在接受钛媒体等多家媒体采访时,张凯磊表示,“实现个性化学习,大幅度提升学习效率和成果是学霸君研发智能教育机器人的初衷”。

  张凯磊告诉钛媒体,中学期间大概有3529个考点、平均每个做3-4道题就够了,写1万道题目可以做完,但目前绝大部分学生面对的练习题有3万—4万,其中3/4的题目是不需要写的,75%的宝贵时间都被浪费掉了。

  学霸君构建于深度神经网络的句法和语义分析器,在海量题库中不断强化和扩充训练。在K12中,有大部分的数学应用题,需要知识图谱和常识才能解决,学霸君构建的是一个真实题目海洋的模拟器,逐步提升其对于真实世界的接近程度。

  基于人工智能的专家系统成就了精准推理。学霸君推进图像识别、自然语言理解、深度学习等人工智能领域的研究,并整合成为智能教育机器人。其在现有教育环境下,使机器判卷、个性化指导、个性化作业、教案改进等变成可能。

  尽管如此,陈锐锋认为,即便是刷题,AI也并不能代替老师。因为,任何时候机器人都没有办法代替老师讲解。比如说,这道题为什么对,为什么错,解题思路为什么这么想不对,为什么那样想又是对的。但是,AI可以告诉老师说,这个学生的哪些知识点有问题,应该花更多时间在哪些知识点训练,而不是浪费在其他已经掌握的知识上。

  值得注意的是,无论是作业帮、猿辅导还是阿凡题,目前市面上大部分工具属性偏强的题库类在线教育产品,一直都没找到盈利爆发点。张凯磊也向钛媒体透露,目前学霸君暂未实现盈利,但是已经开始实现了规模化收入。

  据钛媒体记者了解,“国家队” 还将在2019年和2020年参加高考。 作为“十二五”863计划信息技术领域“基于大数据的类人智能关键技术与系统”项目的牵头单位,科大讯飞方面表示,语文、地理、历史高考机器人将于2019、2020年参加高考进行最后的成果测试。

【本文为合作媒体授权投资界转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表投资界立场,转载请联系原作者及原出处获得授权。有任何疑问都请联系(editor@zero2ipo.com.cn)】

最新资讯

    TOPS
    • 日排行/
    • 周排行/
    • 原创

    MORE+融资事件

    • 2018年06月22日
      鲜喵
      鲜喵
      战略投资 1000万人民币 融资
    • 2018年06月22日
      锐纳达
      锐纳达
      天使 金额未透露 融资
    • 2018年06月22日
      迅鳐科技
      迅鳐科技
      A轮 金额未透露 融资
    • 2018年06月22日
      洋玩易福柜
      洋玩易福柜
      天使 金额未透露 融资