文本表征学习（宋彦）

写任何大学的课程点评上 iCourses.com

你可以在 iCourses.com 网站写任何大学的课程点评了

文本表征学习（宋彦） 2025春 2024春 2023春课程号：EE151301
2025春 2024春 2023春课程号：EE151301

7.8(6人评价)

课程难度：中等
作业多少：中等
给分好坏：一般
收获大小：一般

选课类别：素能拓展	教学类型：理论课
课程类别：素能拓展课程	开课单位：电子工程与信息科学系
课程层次：自由选修	学分：2.0

课程主页：暂无（如果你知道，劳烦告诉我们！）

AI 总结 AI 总结为根据点评内容自动生成，仅供参考

教学水平与课程内容

宋彦老师的《文本表征学习》课程被学生高度评价，其教学内容丰富，涵盖从基础的N-gram到各种先进的模型如word2vec、doc2vec、BERT和Transformer等。课程不仅讲解了许多最近的前沿模型，包括GPT，还鼓励学生讨论并复现顶会论文的源码，提供了独到的见解。有人指出，宋老师对于各类模型的讲解非常深刻，特别是Transformer部分，对即将进行神经网络开发的学生来说非常有帮助。不过也有学生提到，没有机器学习基础的学生可能会感到课程难度较高，建议有深度学习基础的同学选修。

课堂氛围与互动

学生普遍认为课堂氛围非常活跃，宋老师非常热情，乐于和学生互动，回答问题，对学生提出的NLP问题进行深入讨论。宋老师的教学风格生动，当讲到兴奋处会使用一些有趣的肢体语言，这也在一定程度上增强了课堂的趣味性。

实验与作业

课程实验设计合理且硬核，实验任务包括调库、撰写报告和训练复现论文等，对于编程和查资料能力要求较高。虽然实验任务不轻，但有学生表示实验能复现NLP发展的多个阶段，并且不至于过分困难，建议使用jupyter notebook与miniconda。大作业主要是基于预训练模型进行情感分类探究，涉及到使用GPT的API，考验学生对课程的理解。

考试与给分

课程不设考试，主要通过实验和大作业评估学生的学习成果。然而，给分较为严格，可能会让努力跟随课程的部分学生收获较低的绩点，有学生在水平不够的情况下遭遇了低分，因此建议有较好基础的同学选修。此外，有学生反映大作业要求较高，调研与复现工作较为复杂，分数可能不尽如人意。

总结

总体而言，宋彦老师的《文本表征学习》课程非常适合对NLP感兴趣并且有一定机器学习基础的同学。课程内容丰富、实验设计合理、课堂互动活跃，能让学生学到许多前沿的NLP知识和技术，属于一种获取高质量知识的课。注意，课程给分严格，选课需谨慎。

点评写点评

本课程有 1 位用户曾删除过点评。

排序学期

评分评分 6条点评

npz7yyk 2023春

课程难度：中等
作业多少：很多
给分好坏：一般
收获大小：很多

难度：中等
作业：很多
给分：一般
收获：很多

需要指出的是这上方的四个三选一评价是暂时的，但是分数估计是 fix 了，因为：

第一次上课后的感受：这门课可以满足你对 NLP 的一切幻想。

锐评一下：科大很多主要课程相比工业学术界，差距都非常大，也就是说，在讲解非常古老的方法（但是作为打基础来说是必要的），比较缺少学术前沿的哪怕导论课程。但是这门课会讲很多 SOTA，包括最近的 GPT，老师也提到会介绍其结构与训练方法。

还有就是老师非常热情，课堂氛围异常活跃，本人积累已久的很多NLP问题都得以和老师讨论。

趁着现在还没有锁定选课，希望看见的友友多多尝试这门课程。

现在本课程进行到了实验二。本人愈发对本课程 respect++，原因主要有：

1. 课堂氛围非常好。你有任何问题都可以和老师当面沟通；

2. 课堂目标明确。本课程可以从这个角度来欣赏：依托 NLP 为载体，讲解了很多很多模型为什么这么建，这么训的 intuition，这种纯 idea 级别的持续灌输是我在其它 USTC 课程里很少见到的；

3. 实验硬核但是不过分。实验设计还是比较合理的，但是又真的可以沿着前辈的路径把 NLP 的那么几个时代过一遍。

老师对于所有模型的认识（宋老师总是用“物理意义”来说，憨憨的哈哈哈），真的非常深刻，尤其是 transformer，讲的非常好。我想这个课的这一部分内容是对所有神经网络开发者都十分有用的，非常适合大二准备开始搓网络的人来听。

现在本课程结课了。我只能说这门课在本学期给我灌输了最多的思想，真的是给我灌输了很多很高级的东西。从简单的大模型的使用建议，到大模型的工作与发展。所学内容真的终身受益。郭继承曾经说：“世界上还有用话语讲不清的东西，那只有两个字：闭嘴！”。我想这些东西实在是我无法用文字具象的了（太棒啦，我逐渐理解了一切……bushi）

BTW. 宋老师讲兴奋了总是会举起双手摆出两个耶然后学兔耳朵似的弯曲食指与中指（很抱歉我的语言难以准确描述），哈哈哈哈

最后是本人的实验报告（在课程对应 DDL 后公布），方便未来的同学对于本课程的实验有所了解。

大作业是基于预训练模型的情感分类探究。因为是组队完成，有非本人的工作，所以没有在此上传。

2023年3月10日 13:42 （最后修改于 2023年6月15日 09:14） 9 5 复制链接

南山南：蹲一个 2023年4月15日 16:01

元素女皇：向乐乐学习 2023年4月16日 12:39

Breaking_Dawn：向乐乐学习 2023年4月16日 13:38

undefined_baka：这个手势真的不是表示双引号吗（ 2023年6月15日 13:48

红领巾：精彩！ 2023年7月1日 13:24

立即登录，说说你的看法

幽 2024春

课程难度：中等
作业多少：中等
给分好坏：一般
收获大小：一般

难度：中等
作业：中等
给分：一般
收获：一般

基本没去上课，实验任务不重，适合水学分（在不考虑绩点的情况下）

可能有用的资源：

平滑：

Good-Turing Smoothing

word2vec：

CS224n 2019 Winter Lecture Notes 1（直接跳到word2vec章节即可，其中Hierarchical Softmax讲得比较乱，可参考下面的文章）

Hierarchical Softmax 理解

更先进的表征：

度量学习/对比学习入门: 论文阅读笔记-Deep Metric Learning: A Survey

如何提高LLMs的文本表征(Text Embedding)能力?这个答主有不少有价值的文章

变分自编码器（六）：从几何视角来理解VAE的尝试

MTEB榜单

高维空间：

高维空间（High-Dimensional Space）及其特性

Introduction to High-Dimensional Statistics

踩坑记录：高维特征的距离度量损失失效问题

高维度数据能否使用kmeans? - CKLSniper的回答 - 知乎

高维数据如何较好的聚类？ - 心似风往的回答 - 知乎

2024年7月9日 08:11 （最后修改于 2024年7月12日 05:57） 3 0 复制链接

YURIYZX 2023春

课程难度：中等
作业多少：中等
给分好坏：一般
收获大小：很多

难度：中等
作业：中等
给分：一般
收获：很多

选修时完全没有任何机器学习基础，前两节课时说明会过一遍基础知识，但是很快就进入了CNN,RNN,LSTM,BERT,Transformer...推荐有深度学习基础的来试试，没有基础的可能会像我一样上课大部分时间处于懵逼状态。

这门课的节奏很快，内容极其丰富。

1. 从N-gram到各种模型（word2vec,doc2vec,BERT...）几乎都有实验，甚至还在课堂上讨论了某些论文源码的实现逻辑。

2. 上课内容覆盖多篇顶会论文，有独到的见解

3. 老师上课非常热情，可以看出真心想和学生分享知识，语速快到甚至结巴（笑）

4. 上课互动比较多，不过这学期基本是yyk学长一枝独秀了

实验主要是调库和报告两部分，对编程和查资料能力要求很高，大量使用python，推荐使用ipynb(jupyter notebook)以及miniconda(Anaconda太大了，不推荐)。需要训练复现论文，尽管是调库，但仍然需要做大量工作，比如tensorflow不同版本不兼容，以及某些上古实现使用python2(别碰py2,会变得不幸)。可能自己从头实现更简单一点?

大作业（论文）可以用GPT的API实现，可以整很多花活，比较考验对课程的理解。

2023年9月8日 09:01 2 4 复制链接

天气等到你：你好可以请问一下就是这门课的老师给分好吗 2024年1月9日 07:46

YURIYZX：回复＠茶没有喝光早变酸: 你好，大作业花了两天用latex写，全勤，实验都按时交了，本人3.7，算是正常给分吧，主要是取决于你的同学卷不卷。 2024年1月9日 08:34

天气等到你：回复＠YURIYZX: 感谢你的回复。想再次请教你一下，这门课的考核方式主要是什么，是闭卷考试呢还是大作业。可以方便知道你那个学期的大作业是什么吗。感谢！ 2024年1月11日 09:13

YURIYZX：回复＠茶没有喝光早变酸: 小组完成一个选题论文作为大作业，没有闭卷考试 2024年1月12日 07:47

立即登录，说说你的看法

匿名用户 2024春

课程难度：困难
作业多少：很多
给分好坏：杀手
收获大小：很多

难度：困难
作业：很多
给分：杀手
收获：很多

老师讲的很好，但是我水平不够被打低分了，早知道不选课了。。。这门课没有保底，水平不够别选了，不然就会像我一样努力跟了一学期然后收获一个2.7。。。

2024年7月8日 13:14 （最后修改于 2024年7月8日 13:15） 1 0 复制链接

匿名用户 2024春

课程难度：中等
作业多少：中等
给分好坏：杀手
收获大小：一般

难度：中等
作业：中等
给分：杀手
收获：一般

如果不考虑给分，是门好课。

2024年7月19日 01:34 （最后修改于 2024年7月19日 01:36） 0 0 复制链接

匿名用户 2024春

课程难度：中等
作业多少：中等
给分好坏：杀手
收获大小：一般

难度：中等
作业：中等
给分：杀手
收获：一般

这门课不考试，主要是想让你们学点东西，有效实验过少，未能体现
向两位被坑的学弟表示歉意，调研若干大模型，预训练上微调、比较预训练和训练好的若干大模型，+latex，点名也到了，2.3
真的不知道其他组的童鞋是什么神仙大作业

2024年7月8日 14:58 （最后修改于 2024年7月9日 14:32） 0 0 复制链接

宋彦

教师主页：暂无

其他老师的「文本表征学习」课

宋彦老师的其他课

机器学习及其安全应用 10.0 (1) 2023春

“科学与社会”研讨课 2025春 2024秋...

▲