选课类别:计划 | 教学类型:理论课 |
课程类别:本科计划内课程 | 开课单位:统计与金融系 |
课程层次:专业选修 | 学分:2.0 |
因为这是第一年开给本科生的属性数据分析的课程,所以基本没有什么人评价,我就来稍微介绍下这门课的基本情况吧
课程大概是分为以下内容:
列联表
广义线性模型
Logistic模型
多类别Logistic模型
列联表的对数线性模型
配对数据的模型
关联、聚簇响应的建模
广义线性混合模型
可以看出还是有不少新内容的,这门课也基本算是我这学期在管院学的课程中学到新的常用统计名词最多的课了吧(但是仔细一想好像后半学期一直在上各种花式的Logistic模型,好像也没有多少新名词)
张洪老师的讲课也优缺点十分鲜明:
优点
老师的PPT写的非常详细,上课也基本就按PPT上,对于复习非常友好;
内容也基本没什么难度,都是上过初等概率论就能计算的,对于这学期有很多事情无心上课的同学比较舒适;
考试题基本中规中矩,没什么难度(由于没有往届题目大家在答疑课上疯狂问助教玄学问题把助教也弄的很崩溃hhh好在最后都没考)
缺点
老师上课声线非常之平淡,连上三节课真的让人困意朦胧;
接上一条,因为老师的声音毫无起伏你没办法知道老师突然从分析例子转移到了一个十分重要的概念或者定理上,经常一走神就跟不上老师(真的,老师讲什么都一个调调,完全不知道那块是重点)
接上一条,老师后半学期还有十分迷惑的习惯:课堂小测。想象一下你在走神跟不上老师,然后决定放弃这堂课回去自己看,结果老师突然随堂小测检验一下这节课你学得怎么样是怎样的绝望场景(不过老师好像喜欢作业和小测都通过BB系统提交,大概是网上没有纸质好看吧助教基本都放弃仔细看,直接给个满分就完事了,所以小测最后也没有怎么影响总评)
最后说一下张老师本人的特点吧:十分严谨细致
具体指期末开卷考试允许带课本,于是老师在群里跟大家说只能带正版课本,课本尺寸大小要达到标准,也不允许页面边距空白过大,不许用修正带涂掉课本上的字或者携带纸张等等迷惑的规定也不知道有啥用
其次反映在老师每节课都签到,某节课还突然在大家猝不及防地时候拍张照片声称回去后会核对照片上的人数和签到人数是否一致(可惜老师也不认识同学,谁没来也不知道2333)
我本人之前旁听过张老师开的高等数理统计,那门课老师甚至规定每个同学每节课必需记笔记,下课会要求上传笔记检查,好在这门课没有干这种事情,不然我可能第一节课就退了
以及这门课虽然只有2学分,但经常有上机作业,任务量我个人感觉甚至跟3..5学分的多元差不多
可能也是因为作业多吧这门课老师说总评按平时:期末=4:6来算
结果老师直接期末出了60分满分的卷子,摆明自己不调分的态度(想象下自己期末试卷扣多少总评就会扣多少的刺激场景)
但是这门课还是值得一上的,其中介绍的很多内容还是挺有用的
好吧,昨天刚刚做完大作业,就发现zgy大佬已经把大部分内容都说完了……所以我只做一点补充吧。
这门课感觉就是学了一堆模型,举了一堆例子,然后知道了很多奇奇怪怪的R函数。课本应该是从英文版翻译过来的,但是感觉删掉了好多公式和推导,留下来的部分就是一堆文字说(口)明(糊),以至于从课本几乎完全看不出这些模型的理论背景,一个学期下来几乎只会用软件拟合模型,然后解释。但其实我觉得这门课程的理论是非常重要非常值得学的,而且期末也会考(我曾经不止一次跟老师说一定要重点讲一下各种模型的似然函数和条件似然函数,结果这些东西出现在了期末考试题里……
总的来说,广义线性模型的核心思想就是用线性模型表示概率函数的参数,然后用优化算法求系数的极大似然估计。比如对于正态分布,我们可以把均值用线性函数替换:μ=α+βx,则似然函数的自变量变成α和β,求α和β的极大似然估计就转化为一个二元函数的优化问题,常用的求解方法是Newton-Raphson算法和Fisher Scoring算法,具体细节凸优化应该会讲,就不赘述。所以这门课的关注点应该放在如何正确写出(条件)似然函数上面。指数族的似然函数在数理统计里面都有讲过,但实际问题中经常会碰到冗余参数过多的情形。为了使似然函数只含有感兴趣的参数,可以对冗余参数的充分统计量取条件,这个条件似然函数就与冗余参数无关了(期末考试考了这个)。我个人感觉如果能把条件似然学明白,那这门课应该就没有什么困难了。
最后推荐一本参考书——《Categorical Data Analysis》英文第三版,很多老师上课略过的或者教材上没写的理论推导都能在这上面找到,如果对模型不理解的可以翻一下这本书。
占坑首评,由于考试还没结束,忙完再回来改。由于这学期第一次给本科生开这门课,因此个人觉得还是有必要给后人排一下雷(高情商:18级永远都是第一个吃螃蟹的人。 低情商:我们又被当小白鼠。)
比较幸运的是老师并没有在考试和给分上为难我们,考试没有什么偏怪难的题,也给满了40%优秀率,算是仁至义尽了。比例是作业40+期末60(老师说由于期末占比60%所以就只出60分的卷子,有点迷,然后卷面扣的分就直接扣到总评里面),作业认真写应该都给满,即使迟交或者有些题不会也没扣很多,所以作业分拿满并不难。
先说以下这门课的考核方式:期末考试:60%,平时作业:30%,签到和小测:5%,课堂提问:5%
感觉统计人还是有必要来上一下这门课的,毕竟Logistic回归相关知识在以往统计课程中基本没有进行非常细致的研究,我估计大多数人应该也是停留在只是知道模型的形式。
今年课程内容对比以往应该是有所缩减,主要内容为:
(1)属性数据简要介绍与三大统计推断方法
(2)列联表
(3)广义线性模型、
(4)Logistic回归模型
(5)配对数据的模型
老师没有严格按照课本上的内容去讲解,不仅仅局限于统计方法本身,而是更加注重推导与分析的过程,甚至后者所用的时间更多。PPT十分详细,非常适合巩固与复习,一学期下来还是可以学到不少的统计思想(所以完全 没有必要买书,我买的书一学期都没翻,巨亏)。
作为一门两个学分的课,作业是较多的,既有推导又有编程,有几次编程作业所花的时间还是比较多的,一些推导的题目也很有难度。强烈建议大家在前几节课就掌握含冗余参数情况下求三大检验统计量的方法,后面有几次作业基本都会用,但是像得分统计量的情形老师是最后一节课才会讲,之前因为这样一直被卡,花费了不少时间。
不得不说,张洪老师真的是一位好老师,可能是我本科阶段见过的最为认真负责的老师了,对待教学也十分认真,有次去咨询老师一件事,他真的非常热心的给我解答了好久,真的十分感动~~,彻底被张老师圈粉了。
这门课助教中规中矩吧,总体来说比较负责,回答问题也很及时,就是作业的解答很明显就是Copy同学的,而且还有不少的错误,特别是第二次作业,有一题的答案有点口胡。
考试内容较为简单,小题质量不错,比较能反映对概念的理解(我就基本被薄纱了),大题难度小且基本,总体来说,大概是课程难度\(\approx\)作业难度>>考试难度。最后从分布来看确实有点爆炸,基本大家成绩都集中在80-90。
最后说一下关于提问的事,不知道之前这门课有没有,这学期老师要求必须进行提问,具体要求如下:
我刚开始还以为老师是鼓励大家多提问,最后应该不至于扣分吧,这波确实是决策失误,希望之后大家可以引以为戒,我其实有过几次提问,甚至都没找助教记录。今天出总评后挺多人应该被扣了,有人在群里问和助教提问可不可以加分,老师说可以,我应该是找助教问了非常多次问题,当时还挺开心,感觉不会被扣了,结果询问助教后发现自己问助教那么多次,结果根本一点没加,虽然老师问题的初心是好的,但是为什么不和助教协商好具体的加分措施呢,老师就是想鼓励问题,而且跟助教也算,为什么不事先沟通好,反正现在已经出成绩了,感觉也没啥要纠缠的想法了,反正2学分的课,之后请务必和老师沟通好具体的加分方式。
至于给分,刚开始老师意思好像是会调分,但是大家真的都考得太高了,不用调分优秀率也远超了,从我个人的感觉来看,我应该就是3-4个小题错了,大题基本答得差不多,拿了3.7,估计是没调分,而且没问题的直接扣了总评。
总之,这门课除去一些特殊因素,我认为还是非常不错的,感觉不像之前评论说的和多元内容差不多(我认识有些同学就是被之前评课社区劝退了),非常推荐大家选修。
老规矩,出分之后来评一下课,2学分的课听课的时候感觉东西很多很杂,其实复习的时候发现也就那点东西,主要内容还是列联表和广义线性模型(尤其是logistic模型)。老师上课基本上是根据PPT,然后部分内容会在黑板推导(这部分建议掌握,很可能成为考点)。这门课以应用为主,所以内容我本人感觉不是很系统,哪怕复习完也还是感觉很零散,没有整体上一个好的把握。看的出来老师水平很高,而且对这门课准备也充分,上课期间也会有一些统计思想的渗透,但老师的语调和语速实在让人难以集中,所以认真听课的人可能寥寥无几。一学期下来能学到东西,但是学到的东西也不多。作业量对得起2学分的,一周基本就三个题,有理论题也会有编程题,编程题用的函数基本上都能看老师发的代码自学,每周完成作业还是比较轻松。考试是开卷,基本上和上课没啥关系,考的就是最基本的数理统计,把老师上课写黑板的东西抄到书上弄明白就行。给分目测还行,不像去年一样完全不调分,但是调分力度应该也不大。
考试和作业相差很多,期末试卷总分60分,一个大题就占20分,压力还是有点大,最后肯定有调分。这门课本身还是有用的,而且每周一次课,每周3道作业题,也没有耽误太多时间,下一届的同学好像这门课不是必修了,根据自己的情况选择吧,毕竟熟悉一下logit模型也不算啥坏事