| 选课类别:素能拓展 | 教学类型:理论课 |
| 课程类别:素能拓展课程 | 开课单位:电子工程与信息科学系 |
| 课程层次:自由选修 | 学分:2.0 |
《多媒体内容智能分析导论》由张勇东、张天柱及谢洪涛老师教授,课程涉及多媒体数据表示、特征提取、图像检索、深度学习基础(如RNN、CNN),并简单介绍GAN、VAE、Diffusion等,整体以传统计算机视觉为主。课程结构涉及基础与前沿知识,适合对人工智能感兴趣的学生。尽管内容较深,老师们讲课认真负责,用鼓励与宽容态度对待学生,有助于提升学习体验。
课程包括四次小作业,两次项目实现、两次文献阅读,难度适中,注重学生动手能力及自主学习。期末考核为分组大作业,需汇报项目成果。在汇报中老师注重激励,反馈建设性,汇报风格宽松,压迫感小,只要付出努力,成果积极向上都可以得到好评和鼓励。
给分方面较为宽松,老师承诺突破优秀率限制,只要认真完成作业与汇报,成绩普遍较为理想。即便学习过程中略感压力,但成效和评分都较为满意,适合希望获得较好成绩的学生选修。
总体评价积极,学生认为课程提升专业能力,值得推荐。部分学生提到教师课堂提问较多,但大多认为老师学术水平高、平易近人。对于有AI背景或意愿进入实验室的学生,该课程提供了有价值的学术资源和机会。
之前的点评不小心被删掉了,难受,但还是再来简单评一下。
作业四次,两次项目实现两次文献阅读,都不难,对自己提升也挺大。
大作业是分组做项目然后汇报,也可以自己一组,确实比较卷,同学们做的也都特别好,但是老师给分也是拉满了,又一次突破了优秀率,只要认真做了都应该能收获到不错的成绩,但一定要展示给老师看到。
整体来讲,还是比较推荐想了解深度学习的同学来选这门课的,尽管可能在学习过程中确实会有些压力,但是认真完成后的收获和老师的给分还是很给力的。
这门课如果认真学的话确实能学到很多东西,老师讲课也很负责,ppt 上相关内容也很多,但是难度确实很大,不过老师承诺了优秀率会突破,事实也确实如此,所以给分方面不用太担心,只要最后的大作业认真去搞了,应该都不错的,毕竟老师也说了,大家还是本科生,这门课又是公选课,不能占用太多时间,所以主要态度要到位。
第一次写点评hhhh,总的来说课程难度不是很大,老师会讲几个方向的基础知识,选自己感兴趣的方向就行(也可以不听bushi)。这学期的作业有四次,都不难可以很快搞定。最重要的是老师人很好,期末考核的时候挺鼓励同学的hhh,给分也很好,推荐!
班上的同学都好强…比我大一的时候厉害多了。网上资料越来越多,ai迭代速度越来越快,同学也越来越强(樂)
比较适合对AI感兴趣的同学来听,从早期的特征降维到最新的多模态大模型都有涉猎,有基础也有前沿,感觉还是挺不错的。
作业大概4次,主要是论文调研和一些传统的CV之类,都不难,作为一门自由选修课已经非常利好了,写起来倒是很快。
几个老师都平易近人,非常nice,总体上非常推荐
7.17 Update
出分了,给了个4.0,看来只要按时交了作业,用心准备一下汇报,想拿到一个满意的成绩还是不难的。总的来说感觉没有像往年的评课说的那么卷,还是可以放心选的。当然作为信智学部大三老登,说不定在别人眼里我就是来卷的
最后分享一些课程相关的资料,均为计算机视觉/深度学习的公开课。
https://mhsung.github.io/kaist-cs492d-fall-2024/
https://uni-tuebingen.de/fakultaeten/mathematisch-naturwissenschaftliche-fakultaet/fachbereiche/informatik/lehrstuehle/autonomous-vision/lectures/computer-vision/
https://web.stanford.edu/class/cs231a/
今天写完了课程报告,来评一下这门课。
这门课虽然定位是一般通识课,但是上课讲授的内容却并不像大多数通识课那么“水”,主要内容包括多媒体数据表示、特征提取、图像检索、一些简单的深度学习基础(RNN,CNN),传统计算机视觉的“检测识别跟踪”(重点),GAN,VAE,Diffusion(简单介绍),最后一次课简单提了一下大模型和谢洪涛老师实验室在做的工作,整体来看这门课的内容还是以传统计算机视觉为主。由于本课程的通识课定位和选课群体以大一大二的同学为主(尤其大一,可能都是谢老师科社班上的同学),所以很多内容都是点到为止,不过对于从来没有接触过这些内容的同学,想要跟上老师的节奏可能还是需要自己课下花一点功夫,如果能坚持下来的话应该很有收获。
关于作业:一共有4次小作业,每一次的工作量都不大,一次作业的时间为两周,基本上就是论文阅读和跑一些代码(比如yolo,甚至都不需要自己配环境,官方就有提供colab环境开箱即用)。
最后大作业是三人组队完成一个小项目,在最后一次课结束的两周后汇报。说实话在汇报现场见到的在我们组之前汇报的同学们完成的大作业大多还是以课堂上讲的 “检测识别跟踪”的任务为主,目标检测和识别出现的频率很高,但是我汇报完后就走了,不知道后面的组的情况。不乏有拿现成项目来汇报的小组,但是我觉得如果能够调研一篇论文,跑通代码,跑出一点有意思的结果,再在汇报时讲清楚论文的来龙去脉的话应该分数也能取得不错的结果(还没出分,大概吧)。在汇报时两位老师也是以鼓励为主,没有对同学们进行过多的拷打,哪怕有的同学ppt上全是字,化身ppt reader,老师也还是很认真听,甚至对于一些使用了过于原始的模型和数据集来完成“检测识别跟踪”这些任务的同学,老师们也向那位同学介绍了技术发展的情况,还说如果对这方面感兴趣的话可以去他们的实验室实习,总体来说两位老师都很nice,在最后汇报的时候可以说是没有压力的。(一位认识的同学在汇报结束后,和我说部分同学的表现如果在他们那些需要做pre的研讨课上,估计是会被老师狠狠拷打的,这足以体现两位老师对同学们的宽容和鼓励为主的态度了)
今年这门课上有一个小插曲,就是张天柱老师在讲CNN的时候一个个提问全班同学,由于我是大三老登,这门课的内容我除了后面以yolo为主的检测识别跟踪之外几乎都学过,所以自然坐在最后一排摸鱼,提问到我时我没有听清老师的问题就哑口无言了,同学们也对张老师那次课堂上的提问有一些意见。但是在后来的课堂上,张老师便没有再这样提问了。有一次课后和张老师交流了一下,感觉张老师人还是不错的,而且学术水平很高,和他的交流中我也有所收获。
总而言之,这门课还是非常推荐的,不管是大一没有接触过深度学习/计算机视觉的同学还是信智学部大三大四的老登。前者用心上完这门课确实能有所收获,甚至还可以联系两位老师进入实验室;后者直接爽爽摸鱼。
目前还未出分,谢老师说过会申请突破优秀率,出分后再更新。
本人大二。关于课程,课程大概分为两大块,一部分是介绍深度学习,一部分好像是关于CV的,两部分都没怎么听,因为DL学过了,然后自己是在搞RL?目前和CV可能交集不是很大、但是两部分的课程在我偶尔抬头听的时候还是感觉老师都在认真讲的,DL都能听懂,CV就啥也不会了。所以其实很建议做CV方向的然后对DL有入门了解的同学来听,应该有所收获
关于平时作业,SIFT,rgb和两个文献阅读好像是。都很简单,前两个网上也有一堆开源代码,所以只要你做了,总是不会差的,就怕你根本不做(
关于大作业,本人不做CV,让女朋友选了一个关于风格迁移的方向,很有意思,最大收获应该是这是第一个和npy一起完成的东西^_^