语言科学(袁家宏) 2024春  课程号:HS163901
2024春  课程号:HS163901
10.0(6人评价)
10.0(6人评价)
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
选课类别:通识 教学类型:理论课
课程类别:核心通识 开课单位:科技传播系
课程层次:通修   学分:2.0
课程主页:暂无(如果你知道,劳烦告诉我们!)
排序 学期

评分 评分 6条点评

  • 课程难度:简单
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:简单
  • 作业:中等
  • 给分:超好
  • 收获:很多

       看到评课社区这么热闹,加上我自己也选了这门课,也跟着袁老师做了不短时间计算语言学和历史语言学的研究了(先叠个甲,这个不代表老师观点,老师也不知道,估计袁老师还不知道评课社区是啥),还是挺感慨的。虽然我还在赶论文投稿,中午抽空也来写点东西,来聊一聊我对这门课程的看法,也希望给更多人一些启发。

        先聊聊课程的设置。众所周知,科大本科其是没有太多适合本科生的人文社科课程,这其实是非常可惜而且不太正常的一件事情。不过近几年也有努力改善的趋势,例如像梁永安老师的课程,以及中国纸墨笔砚等,能够在大学生活中选修一些这样的课程对我而言非常宝贵。但这些课程更侧重于“通修”,而据我所知像语言学这类更专业的课程是很难开起来的,因为科大并没有这样的老师。袁老师是前年才来到科大语言交叉中心的,其实稍微翻看一下老师之前的学习与工作经历,包括老师的上课表现,应该能够看出袁老师是相当相当正统的语言学方向的研究者。能够有这样一个机会去上这门课我觉得首先应该感到珍惜。而且袁老师对这门课准备的很用心,而且毕竟是一门专业课但是面向科技大学的同学,袁老师之前开组会时候经常问我,即从一个本科生的视角,给出课程、作业的一些建议,从而让尽可能让大家多了解语言学的基本知识并减轻负担,而且从最后的开课地点放在五教而不是高新,就能看出是希望让更多专业以及低年级的同学来了解语言学的。

        再来聊一聊语言学本身,首先我自己并非语言专业、也没有参加过语言学社,甚至英语都不太好,或许更符合科大同学的认知。其实开课查询的介绍很好说明了这一点,由于课程才开始,大家或许会有一些对语言学认识的误区,认为会很多外语、特别是小语种就是语言学家的标配,但其实不是这样的。语言学内部的研究方向经历了多轮演变、也分成了不同的子方向,我们目前课程还在介绍基础知识,后面一些语言演化、社会语言学、NLP、LLM才是现在大家在泛语言框架下研究更多的话题。

       顺着这个角度,我们来讨论一下语言学,这或许对大家的研究都有帮助。语言学家希望去了解语言,其实有至少以下三个视角  

1. 语言本身有什么规律性,特别是不同的语言有没有一些一致性?

2. 人是怎么说出语言的,人是怎么感受语言的,人是怎么学习语言的?语言是如何产生并且演化的呢?

 3.  我们应该怎么使用语言,例如我们可以自动的翻译语言吗?可以解析语言的情感因素吗?可以自动产生语言来解决我们的实际问题吗?

       可以看到学会很多外语并不能直接回答其中的任何一个问题,换言之,是在应用语言而非研究语言。第一个问题,对应句法、词法等研究方向,这在任何一个大学的语言学系都有老师在研究,杰出代表便是乔姆斯基,然而这个方向对我而言更像是相当纯粹的数学理论构建,如果没有相当的知识背景与智力水平作为铺垫,其实不太适合在正式场合随意发表自己的观点; 第二个问题,目前我们可以通过结合医学、社会学等学科,例如观察神经元的传递与活动来一窥语言的如何被感知,这个方向相当的火,是一个很好的研究方向,这意味着对人类的进一步了解,Nature,Science,PNAS 在这方面有很多的研究,例如近期哈佛医学院这篇"Single-neuronal elements of speech production in humans"(附在下面),我读完觉得很有意思。而对于语言演化,以往的研究是通过考古学、语言学记录和人类学活动来综合考虑,但这种研究范式由于人类处理数据的制约已经停滞了很久。一个比较有意思、而且比较有前景的方式是通过计算的方式来构建演化,例如复旦大学的这篇Nature(国内首篇语言学nature),用贝叶斯方式构建汉藏语系起源,"Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic age", 我之前和袁老师多次讨论过汉藏语系的语言演化,我们这边也有一些初步的结果。

        对于第三个问题,正好借此来聊一聊NLP, Speech, LLM, AI4Science, Science4AI这件事。其实 AI这个概念并非凭空产生的,而是在不断的追问与求索下逐渐发展起来的。一个非常重要、引领了现今LLM大潮的便是来自 Linguistic上的贡献——一种自动的回答第三个问题的方式。语言本身不仅是严密组织的,而且是一种简单的拓扑顺序(只有前后概念)的连接(相比于image, speech, graph…),这意味着文字很适用于无监督的训练,提取有意义的表示——某种层次上意味着智慧,当然近期也有不少用图、Video来构建某种程度“智能”的work。另一个证据是,NLP、Speech现今的杰出研究者,很大一部分本身就是语言学家。他们在研究中对于第三个问题的追问,发现可以用计算的方式来进行回答,例如Jurafsky(袁老师的博后老师),我相信稍微了解过一点NLP的都不太可能不知道他,稍微多说一点,Dan的这本NLP和Speech的入门书写的真的非常棒,而且才出最新版(Link在末尾)。袁老师本科时候辅修了CS,包括在Upenn任教和在百度时候,以及论文发表,做的也都是用Machine Learning来构建一个automatic system,例如ASR,这其实是Science分支推动了AI,仔细了解会是一段相当波澜壮阔的故事,或许不亚于一百年前的物理学。

        转回现实,我们现在越来越能看到AI4Science的趋势。而且不像大家认知的只有大数据、高算力才能够解决。袁老师昨天在课程讲了声调的转写,而我们的一篇投稿论文也与此相关,即给出了一套自动声调转写与归类的方案,而且只需要很少的训练数据(对于濒危语言区)和训练成本,这其实就是一个直接的反映。包括正在进行的一些语言感知和演化的工作,都是可以用AI来完成。特别是现在LLM已经有了相当的记忆与推理能力,用一些in-context learning的trick,包括搭一些RAG的系统,可以很好的解决诸多问题。

       但一个更与我们有关的问题是——我们如何尝试做AI研究、Science研究以及AI4Science研究呢?这其实是我一直在尝试的事情,我自己是少统+辅修传播,做AI+现在带一些Computational Linguistic的研究。AI、Science研究的概念相对清晰、有明确的范式和边界,找到一个nice的老师(虽然这个很难),你只要做好某一块即可,你需要花费一个博士周期的时间来学会怎么讲故事、做实验、写文章、体验被审稿人狂喷,往往能成为一个领域的专家。AI4Science的一个大的问题是,知识的不对齐与边界的不清晰,因为一个人往往只能懂AI或者懂Science,你得确保用合适的模型(AI)解决别人真正关心的问题(Science),例如Alphafold,因此从某种程度上来说这更依赖于资源。而Science已有的数据往往是利好人而非模型的,例如在语言演化中,你会有很多研究观点、诗歌记录、语言信号、文字信息,异质且不均衡。但另一个好处是,只要你能找到一个稍微合适的切入口,例如借助大量诗歌的押韵来构建表征,往往能够得到传统Science领域得不到的结果,有比较大的影响力。在我的研究过程中,我往往是先根据我的了解构建出一个模型,然后和袁老师讨论得到了一些Science以及技术上的建议,如此迭代。另一方面,其他学科带来的思考,例如机器的责任性、安全性、可控性,也为AI来带来了新的研究话题,这其实对应我以往的一些研究,显而易见这方面越来越重要,不过目前貌似还是一个蓝海。

       最后,科大有相当一部分同学未来希望去做研究、甚至把其作为自己的职业,我觉得最重要的事情应该是在本科期间了解什么是科研、不断求索中找到自己喜欢的研究方向(往往是交叉的) 并enjoy it,  而不是 “waste time being meaningless.”(强烈建议去看看这篇科研入门blog)

        最后的最后,希望这门课能给我们带来一些有意义的思考。We can only see a short distance ahead, but we can see plenty there that needs to be done.

   

 

一些有用的Link

http://catalog.ustc.edu.cn/query/lesson?eqid=d6a402ac00016aa20000000464267556#showcourse

https://www.nature.com/articles/s41586-023-06982-w

https://pubmed.ncbi.nlm.nih.gov/31019300/

https://web.stanford.edu/~jurafsky/slp3/

https://www.thesavvyscientist.com/tips-for-new-phd-students/

23 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

先留坑,课是好课。

班里有位小语种社团的e人学姐,e到严重影响听课体验。鼠鼠想重拳出击了。

5 1 复制链接
jωC疑似有点太城市化了直接怼回去就行了,这b很怂的,之前在群里面犯🗡️的时候我就是这么干的
立即登录,说说你的看法
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

老师的课本身是很有意思的。

但是,第一次去的时候上课体验受到了严重影响,遂退课。老师总是会被打断,然后语言学大佬讲了一大堆也没听清,导致我接收到的信息断断续续的,属实没想到会遇到这种情况,而且也觉得太不礼貌。

面对这么一门少有的课却因为这种情况退掉了,只能长叹一声了。。。

(最后修改于 2 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:很多

看到前面有人说某语言学社学姐的问题,来补充几句。

不反对你们社团来这里团建炸鱼刷绩,但是某位学姐可不可以不要太逆天,这里是六七十人的课堂不是讨论班,难道你不觉得上课随意打断老师这种行为很不礼貌吗?对同学们的听感也不好。

不知道怎么才能让她意识到这一点。

补充:看来不止我一个人饱受折磨,大家可以联名上书或发封邮件向老师反应一下(或许有用)

(最后修改于 2 1 复制链接
傻逼阿斯伯格
立即登录,说说你的看法
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:一般

听了两节课了,部分同学给我的观感实在是不佳,最后还是退课了。老师挺有学问的,五星是给老师的

1 0 复制链接

袁家宏

教师主页: 戳这里

其他老师的「语言科学」课

袁家宏老师的其他课

语音分析 10.0 (1) 2023秋 2023春