选课类别:计划 | 教学类型:理论课 |
课程类别:本科计划内课程 | 开课单位:信息科学技术学院 |
课程层次:专业核心 | 学分:2.0 |
课程内容主要是 NLP 里面最基础的知识,包括语法,语义,信息抽取,机器翻译等等。主要都是基于统计的传统方法,机器学习的方法讲的不多。
上课主要讲PPT,但 PPT 内容特别多,而且重点不太明确,导致最后复习的时候有点难受。
期末考试半开卷,今年主要考了 good-turing 平滑,HMM 的三个问题以及如何应用于 POS 标注,使用 CKY 构建语法树,PPMI,使用朴素贝叶斯+拉普拉斯平滑判断词属于哪个意思(注意拉普拉斯平滑各个参数的含义 ),tf-idf 的含义,如何衡量两个词语的相似程度以及 RNN 结构。
还是得说这种没有作业,没有实践的课学完了很容易有一种啥也没会的感觉,当然如果大四水学分的话可能还不错。
下面是我和 lzt 同学一起整理的期末考试用的 A4 纸,有一些要点可能没有整理到,也有可能包含一些错误,仅供参考。
没有作业,只有一篇综述的课程
感谢 @Fancy 学长/姐的A4纸
2022年秋季学期期末试题回忆版:(大体是比较全的,可能漏一些小问)
1. 生成所有列车号的FSA(字母开头+1到4位数字,第一个数字非0)
2.Teacher和Player的最小编辑距离
3.将上下文无关文法转换为CNF格式再用CYK算法算所有语法树
4.PPMI公式,相较于传统计数的优势;简述LSA计算过程;画skipgram网络结构并写出每层节点数
5.朴素贝叶斯算句子情感倾向(正/负)
6.HMM和马尔可夫链的区别,在POS中转移概率和输出概率的具体含义(结合单词和词性)
7.命名实体识别中准确率和召回率的定义;简述机器翻译中encoder-decoder结构以及相对传统方法的优势
8.困惑度的公式;打乱测试集单词顺序会导致困惑度升高还是降低及理由
个人成绩:从未听课,综述东拼西凑,最后复习了三天,总评85~90
给分比例应该是综述3期末7
课程评价:全英文ppt看得我头昏眼花,复习过程痛不欲生,除去复习过程此课算是挺清闲的,个人建议对nlp方向感兴趣(缺学分)的大四学生选,nlp领域深度学习大行其道的背景下本课程讲述的大量传统方法不可谓不拓宽视野
选课建议:
本来也就是开在大四的课程,各位AI班的同学和感兴趣的同学大四选就行了,大三选属实浪费时间。
课程内容和考试内容楼上已经说过了,不再赘述
只有一次点名(而且提前一周通知)和一次论文阅读报告作业需要提交,对大四水学分的同学十分友好
期末考试半开卷,建议打印PPT上所有计算相关的部分(n-gram语言模型、HMM、朴素贝叶斯、PPMI...etc),都很有可能出题,但是这课只开了两年应该找不到往年卷
老师上课讲的还是很不错的,最后一节课也请了产业界的师兄来做报告,但是没有任何的实验/作业导致课程更加接近科普性质,不能指望学到任何实际的NLP
给分是点名10%+报告20%+期末70%,显然没有调分,据助教消息今年一个4.3都没给(还卡我94),对大三同学的GPA非常不友好,不建议在大四之前提前选这门课(或者像我一样当自由选修来上)
上课水,老师照着ppt念,ppt内容多,下面没几个人在听的。主要是把 NLP 的各个细分领域过了一遍,科普介绍性质,感觉离实际应用有点远。没有作业和实验学不到什么真东西。
期中一次3000字+的文献调研报告,期末考试考全部ppt内容。平时点了两次名,点名之前会在群里通知。给分3:7,目测没怎么调。
总之这课留着大四水挺好的,看上去不容易给挂。大三上有被拖绩点风险,毕竟期末占比大,考试内容没有划任何重点,偶然性很强。我平时分拿满,期末复习的挺细的感觉考的也不错,最后莫名奇妙只有3.7。
出分再补充。
首先是基于前人文档修订后的小抄,添加了聊天机器人的章节和部分修改。
50469c02497f04b1874043b4063003b656d2a0bb.docx
考试只能说,确实和pksq说的一样,都是计算题,而且就那几种计算,几乎一模一样。感觉整理的小抄没什么用,还不如只印计算部分和tf-idf之类的pksq提到的知识点。
上课前面去过,后面太困了就没怎么去过了,感觉实际上去了也只是看PPT。
这个课有一个缺点是选的人太少了,20个人*0.4也就只有8个人能上优秀。
以及据我所知优秀线下给分不太好(听说了几个1.x?),优秀线上不清楚,自己考试大部分题目都写出来了,但也只是勉勉强强3.7 。
想了解下传统NLP还是可以的
考试内容基本都在ppt上,现在看每年考点也都差不多,调分貌似是一点不调,严格37开,只有一个论文和期末考试,平常没有作业,老师讲课中规中矩吧(我没怎么听过),还有就是ppt是英文的有点烦,不怎么在意gpa水学分的话倒是个不错的选择
考完赶紧来划考试范围啦,大体和学长说的没差,第一题动态规划求football和global的编辑距离,然后问hmm的概率类别(没太懂),训练hmm,硬件条件都相同,训练结果会不会不一样。朴素贝叶斯让你给UNoriginal with no fun来分类,而且用加1法。问了如何评价机器翻译,有人为标准和客观标准。还问ibo什么意思,类别数2n+1.
另外谈一下课程,课程不太好的就是用英文ppt,无论上课还是复习都看得晕乎乎。总之课程没什么问题,作为大四课,压力比较低,考试难度也一般吧,毕竟是半开卷。最后感谢学长的a4,帮了大忙!!
这门课如前面几位同学所说,讲授的是NLP领域的基础知识和传统方法(至少我上的时候是这样)。想了解BERT等前沿工作的同学可能会有所失望了233。
课程有一部分参考了Speech and Language Peocessing的内容(https://web.stanford.edu/~jurafsky/slp3/),重在介绍多个NLP领域的方法和思想。个人感觉学习这方面的知识还是很有必要的,就像做CV要了解SIFT一样,做NLP了解tf-idf方面的知识和思想也很重要。
老师语速比较快,但是讲得很清晰,看得出来对相关知识非常熟练。另外看得出来老师很注重反馈的,比如上一届有同学写希望有更多实践,我们这届就有大作业了。老师根据同学的情况提供了编程作业和论文调研两种类型供选择。都是一些很经典的工作(当然年代有些久远)。自己实现一遍编程作业还是能有很多收获的。另外建议老师之后也可以多加一些前沿内容。
我大四选的这门课,最后过了一遍PPT有87,感觉给分还行。对于之后准备做NLP的同学,强烈推荐。