| 选课类别:核心通识 | 教学类型:理论课 |
| 课程类别:核心通识 | 开课单位:科技传播系 |
| 课程层次:通修 | 学分:2.0 |
袁家宏老师的《语言科学》课程深受学生欢迎,多数评价表明老师在语言学方面造诣颇深,且授课认真负责。课程涵盖广泛,包括语音学、音韵学、语法学、计算语言学和历时语言学等,虽然内容丰富,但部分同学认为其安排过于紧凑,仅以入门形式一带而过。然而,课程对于那些对语言学及其交叉应用感兴趣的同学来说,提供了一个全面的入门。
考试采用论文和课堂表现的形式,分别占总成绩的80%和20%,并设置了10%的加分作业。课程不设严格考勤,仅通过两次小测点名。学生普遍反映作业形式多样且有趣,如元音发声模型实践和音高感知测试。尽管加分作业和课堂学术交流可能对低年级或相关背景不足的学生构成挑战,但对于认真实施加分作业的同学,老师非常慷慨,有学生表示即使未能完全跟上,也能获得高分。
课程对各个方面的内容仅作简介,适合作为通识类课程,为其他专业学生提供了解语言学的机会。但由于课程中有很多学术交流,对部分同学可能较为挑战,部分学生因班内学术活跃程度和个人时间安排选择退课或旁听。对于时间充裕、对语言学抱有兴趣的学生来说,这门课是一扇进入语言学世界的大门。
课程学术氛围浓厚,老师与学生之间频繁交流,课堂充满互动。课程也因其开放态度吸引了很多学有专攻的同学参与,部分同学因惧怕“炸鱼大佬”选择旁听,形成了课程难易程度上的多样体验。
《语言科学》是一门面向对语言学感兴趣的学生的理想课程,给予了一次深入接触各种语言学概念和研究的机会。对于有兴趣涉足语言学领域的同学,尤其是低年级学生,这门课或能激发潜在的研究兴趣并提供充足的学术启发。
看到评课社区这么热闹,加上我自己也选了这门课,也跟着袁老师做了不短时间计算语言学和历史语言学的研究了(先叠个甲,这个不代表老师观点,老师也不知道,估计袁老师还不知道评课社区是啥),还是挺感慨的。虽然我还在赶论文投稿,中午抽空也来写点东西,来聊一聊我对这门课程的看法,也希望给更多人一些启发。
先聊聊课程的设置。众所周知,科大本科其是没有太多适合本科生的人文社科课程,这其实是非常可惜而且不太正常的一件事情。不过近几年也有努力改善的趋势,例如像梁永安老师的课程,以及中国纸墨笔砚等,能够在大学生活中选修一些这样的课程对我而言非常宝贵。但这些课程更侧重于“通修”,而据我所知像语言学这类更专业的课程是很难开起来的,因为科大并没有这样的老师。袁老师是前年才来到科大语言交叉中心的,其实稍微翻看一下老师之前的学习与工作经历,包括老师的上课表现,应该能够看出袁老师是相当相当正统的语言学方向的研究者。能够有这样一个机会去上这门课我觉得首先应该感到珍惜。而且袁老师对这门课准备的很用心,而且毕竟是一门专业课但是面向科技大学的同学,袁老师之前开组会时候经常问我,即从一个本科生的视角,给出课程、作业的一些建议,从而让尽可能让大家多了解语言学的基本知识并减轻负担,而且从最后的开课地点放在五教而不是高新,就能看出是希望让更多专业以及低年级的同学来了解语言学的。
再来聊一聊语言学本身,首先我自己并非语言专业、也没有参加过语言学社,甚至英语都不太好,或许更符合科大同学的认知。其实开课查询的介绍很好说明了这一点,由于课程才开始,大家或许会有一些对语言学认识的误区,认为会很多外语、特别是小语种就是语言学家的标配,但其实不是这样的。语言学内部的研究方向经历了多轮演变、也分成了不同的子方向,我们目前课程还在介绍基础知识,后面一些语言演化、社会语言学、NLP、LLM才是现在大家在泛语言框架下研究更多的话题。
顺着这个角度,我们来讨论一下语言学,这或许对大家的研究都有帮助。语言学家希望去了解语言,其实有至少以下三个视角
1. 语言本身有什么规律性,特别是不同的语言有没有一些一致性?
2. 人是怎么说出语言的,人是怎么感受语言的,人是怎么学习语言的?语言是如何产生并且演化的呢?
3. 我们应该怎么使用语言,例如我们可以自动的翻译语言吗?可以解析语言的情感因素吗?可以自动产生语言来解决我们的实际问题吗?
可以看到学会很多外语并不能直接回答其中的任何一个问题,换言之,是在应用语言而非研究语言。第一个问题,对应句法、词法等研究方向,这在任何一个大学的语言学系都有老师在研究,杰出代表便是乔姆斯基,然而这个方向对我而言更像是相当纯粹的数学理论构建,如果没有相当的知识背景与智力水平作为铺垫,其实不太适合在正式场合随意发表自己的观点; 第二个问题,目前我们可以通过结合医学、社会学等学科,例如观察神经元的传递与活动来一窥语言的如何被感知,这个方向相当的火,是一个很好的研究方向,这意味着对人类的进一步了解,Nature,Science,PNAS 在这方面有很多的研究,例如近期哈佛医学院这篇"Single-neuronal elements of speech production in humans"(附在下面),我读完觉得很有意思。而对于语言演化,以往的研究是通过考古学、语言学记录和人类学活动来综合考虑,但这种研究范式由于人类处理数据的制约已经停滞了很久。一个比较有意思、而且比较有前景的方式是通过计算的方式来构建演化,例如复旦大学的这篇Nature(国内首篇语言学nature),用贝叶斯方式构建汉藏语系起源,"Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic age", 我之前和袁老师多次讨论过汉藏语系的语言演化,我们这边也有一些初步的结果。
对于第三个问题,正好借此来聊一聊NLP, Speech, LLM, AI4Science, Science4AI这件事。其实 AI这个概念并非凭空产生的,而是在不断的追问与求索下逐渐发展起来的。一个非常重要、引领了现今LLM大潮的便是来自 Linguistic上的贡献——一种自动的回答第三个问题的方式。语言本身不仅是严密组织的,而且是一种简单的拓扑顺序(只有前后概念)的连接(相比于image, speech, graph…),这意味着文字很适用于无监督的训练,提取有意义的表示——某种层次上意味着智慧,当然近期也有不少用图、Video来构建某种程度“智能”的work。另一个证据是,NLP、Speech现今的杰出研究者,很大一部分本身就是语言学家。他们在研究中对于第三个问题的追问,发现可以用计算的方式来进行回答,例如Jurafsky(袁老师的博后老师),我相信稍微了解过一点NLP的都不太可能不知道他,稍微多说一点,Dan的这本NLP和Speech的入门书写的真的非常棒,而且才出最新版(Link在末尾)。袁老师本科时候辅修了CS,包括在Upenn任教和在百度时候,以及论文发表,做的也都是用Machine Learning来构建一个automatic system,例如ASR,这其实是Science分支推动了AI,仔细了解会是一段相当波澜壮阔的故事,或许不亚于一百年前的物理学。
转回现实,我们现在越来越能看到AI4Science的趋势。而且不像大家认知的只有大数据、高算力才能够解决。袁老师昨天在课程讲了声调的转写,而我们的一篇投稿论文也与此相关,即给出了一套自动声调转写与归类的方案,而且只需要很少的训练数据(对于濒危语言区)和训练成本,这其实就是一个直接的反映。包括正在进行的一些语言感知和演化的工作,都是可以用AI来完成。特别是现在LLM已经有了相当的记忆与推理能力,用一些in-context learning的trick,包括搭一些RAG的系统,可以很好的解决诸多问题。
但一个更与我们有关的问题是——我们如何尝试做AI研究、Science研究以及AI4Science研究呢?这其实是我一直在尝试的事情,我自己是少统+辅修传播,做AI+现在带一些Computational Linguistic的研究。AI、Science研究的概念相对清晰、有明确的范式和边界,找到一个nice的老师(虽然这个很难),你只要做好某一块即可,你需要花费一个博士周期的时间来学会怎么讲故事、做实验、写文章、体验被审稿人狂喷,往往能成为一个领域的专家。AI4Science的一个大的问题是,知识的不对齐与边界的不清晰,因为一个人往往只能懂AI或者懂Science,你得确保用合适的模型(AI)解决别人真正关心的问题(Science),例如Alphafold,因此从某种程度上来说这更依赖于资源。而Science已有的数据往往是利好人而非模型的,例如在语言演化中,你会有很多研究观点、诗歌记录、语言信号、文字信息,异质且不均衡。但另一个好处是,只要你能找到一个稍微合适的切入口,例如借助大量诗歌的押韵来构建表征,往往能够得到传统Science领域得不到的结果,有比较大的影响力。在我的研究过程中,我往往是先根据我的了解构建出一个模型,然后和袁老师讨论得到了一些Science以及技术上的建议,如此迭代。另一方面,其他学科带来的思考,例如机器的责任性、安全性、可控性,也为AI来带来了新的研究话题,这其实对应我以往的一些研究,显而易见这方面越来越重要,不过目前貌似还是一个蓝海。
最后,科大有相当一部分同学未来希望去做研究、甚至把其作为自己的职业,我觉得最重要的事情应该是在本科期间了解什么是科研、不断求索中找到自己喜欢的研究方向(往往是交叉的) 并enjoy it, 而不是 “waste time being meaningless.”(强烈建议去看看这篇科研入门blog)
最后的最后,希望这门课能给我们带来一些有意义的思考。We can only see a short distance ahead, but we can see plenty there that needs to be done.
一些有用的Link
http://catalog.ustc.edu.cn/query/lesson?eqid=d6a402ac00016aa20000000464267556#showcourse
https://www.nature.com/articles/s41586-023-06982-w
https://pubmed.ncbi.nlm.nih.gov/31019300/
https://web.stanford.edu/~jurafsky/slp3/
https://www.thesavvyscientist.com/tips-for-new-phd-students/
先留坑,课是好课。
班里有位小语种社团的e人学姐,e到严重影响听课体验。鼠鼠想重拳出击了。
老师讲的很好很用心,对语言学感兴趣的大佬欢迎来。
像我这种时间少,水平低的彩笔,建议慎入,本身这门课的加分小作业并不少,而且炸鱼大佬疑似也挺多的,课上不少大佬同学和老师频频进行学术交流。像我这种又懒又菜的废物只能含泪收下3.0力,悲
听了两节课了,部分同学给我的观感实在是不佳,最后还是退课了。老师挺有学问的,五星是给老师的
666666666666

上完第一节课记录一下下,期待后面的课(搓手)
到第10周介绍了语音,音系,词法,句法,语义和语用。中间还有个有趣的元音模型展示,以及老师和他课题组的学生介绍他们的工作并且当场招人hh
感觉课上好多大佬啊呜呜
出分后更新:
很有意义的通识课。算是一个关于语言学的导论性质的课吧(因此比较轻松),也介绍了一些研究工作,是其他专业学生了解语言学的好机会。内容对我(先前对语言学毫无了解)来说是很新奇有趣的。(可惜我已经是被套牢的大三老东西了,很遗憾没有在低年级的时候多了解其他专业)
几乎不花费时间,大概上课,写期末小论文就没别的了。这学期还有两次选做的加分作业,第一次作业要做实物模型,第二次作业十几分钟就能做完。也不太需要复习之类的。
关于给分,我只做了第二次加分作业,最后看大家介绍小论文的视频时感觉也不如许多大佬们(当然鄙人想了个似乎有创新性的题, 也用了不少时间来做(大概4~5天)),喜提A,非常满意了。
课程内容:
总评构成:
一些可能有用的东西:
这门课还是非常有趣硬核的,兼具广度和深度,启发思考又能引导探索,对于本科生属于科技与人文模块的核心通识。最后给分也挺不错。在这里给大家推荐一款游戏:《巴别塔圣歌》,十小时左右掌握五种虚构语言。在诗话与神话退场的时代里,我们仍然享有先祖留给我们的遗产。你称其为文字也好,符号也好,语言也好——当它被发明出来的时候,其本身就承载着一种单纯的愿望:为了记录,为了计算,亦或是为了沟通。我们不知道会被风吹向哪一端,但尝试从不该停止。
之前对语言学方面感兴趣,看到评价也挺不错,于是就冲了这门课~老师在语言科学方面的造诣还是很高的,经常大力推荐所在的语言科学交叉研究中心,感兴趣的同学可以访问一下官网语言科学交叉研究中心
btw,这门课的安排实在是有点过于过于蜻蜓点水了。这门课包含如下几块的内容:语音学、语系学、音韵学、语法学、计算语言学、历时语言学等等,导致即使这是一门导论类的课程,每一块的知识也都有点过于简略过于一笔带过了。感觉是把好几门专业课塞在一门只有16周,每周两个课时的课程里,实在是走马观花了。
课上几乎没有考勤,整个学期就进行了两次相当于点名的小测。总评分为80%的论文和20%的课堂表现,以及10%的加分,分别为5分的元音发声模型实践和5分的音高感知测试,认真完成就能拿满。
整个大学上过最喜欢的通识课之一。
成功让我对小语种感兴趣到对语言学本身感兴趣,各个方向都有了一个入门级的简单了解。然后感觉这边的科研也挺有意思的,虽然可能没有机会参与了。
因为害怕被炸鱼大佬橄榄所以选择旁听。
第一节课已经让我印象十分深刻!老师的课堂活泼生动有趣,而且充满互动。
这课我跟定了!
详细评课待学期结束再来细补。