DeeCamp2019

DeeCamp人工智能训练营学习总结

今年暑假,有幸能够参加DeeCamp2019人工智能训练营,在这里度过了充实的四周课程学习和项目研发的经历。

训练营内容

第一周主要以讲座为主,DeeCamp请来了许多重量级的AI领域的大咖和教授,包括李开复、周志华、吴恩达等等,也算满足了我在这一领域的“追星梦”,唯一遗憾的是吴恩达远在美国,不能来到现场给我们当面授课hh

接下来三周的实践课是我认为本次夏令营最值得的地方。我们组成了一个十一人的“神经纠错大队”,完成英语流利说公司给予的课题“英语造句练习语法互动反馈教学”。课题具体内容如下:

在现有的英语教学中,针对主观类题型如何给出有效的反馈是一大重点和难点。现有英文语法纠错系统虽然能够自动检测和纠正语法错误,并给出修改建议,但往往并不能帮助学生真正理解语法错误发生的原因,避免再次犯错。例如,针对主谓不一致错误,现有的语法纠错系统往往可以给出错误原因,但是学生可能并不明白主谓一致的基本概念和特例。在线下教学中,教师可以通过询问学生如此写作的原因及目的、对主谓不一致的理解、以及对名词单复数形式的判断等相关知识点的互动问答来了解学生出错的原因并施以反馈,帮助学生自主改正错误、掌握语法知识。如何使AI具有相似能力是本课题关注的方向。本课题希望聚焦在英语造句主观场景中,使用综合使用神经网络翻译和其他深度学习方法检测语法错误,通过与学生的人机互动来辅助定位学生语法错误的具体原因,并通过有针对性的教学来帮助学生实现对语法知识点的掌握。

作为一个需要上线的产品,我们将产品功能分为小流、小利和小说三个模块,分别负责语法纠错、人机互动以及针对性教学的功能。具体实现上,我们分为前端、后端以及算法。前端我基本没有参与,后端由我比较熟悉的Flask+MySQL的架构开发,算法则在组里几个深度学习大佬的带领下共同完成。语法纠错功能的流程图如下:

语法纠错模型我们采用$F_{0.5}$作为评价指标,其公式如下。
$$F_{0.5} = (1 + 0.5^2)\frac {PR}{0.5^2P + R}$$

具体模型我们采用目前论文中最好的CopyNet,即将语法纠错看作是一种特殊的翻译机制。它在传统的神经网络翻译的transformer的基础上增加了一个Copy系数($\alpha_{copy}$),用以保证纠正后的句子绝大多数内容与原句相同。具体模型如下:

为了体现交互性,我们还制作了一个简单的QA Bot。当发送中文消息时,机器人可以与我们进行简单的中文聊天,并用tf-idf提取中文关键词在网上爬取相关资料。当发送英文消息时,机器人会对发送的句子进行语法检错,若有错误还会将错误类型记录下来,并在之后运用贝叶斯算法根据用户每种错误类型的频度来随机出题。最终的演示demo如下:




总结

这次DeeCamp训练营是我第一次团队协作完成一款功能较为完整的产品,很感谢能有这次机会,在这里我收获了很多知识,也结识了许多巨佬,期待今后能够再度相遇!

一些杂图



文章目录
  1. 1. 训练营内容
  2. 2. 总结
  3. 3. 一些杂图