数据分析及实践(刘淇) 2025春 2024春 2023春 2022春 2021春  课程号:DS300101
2025春 2024春 2023春 2022春 2021春  课程号:DS300101
5.2(40人评价)
5.2(40人评价)
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
选课类别:计划内与自由选修 教学类型:理论实验课
课程类别:本科计划内课程 开课单位:人工智能与数据科学学院
课程层次:专业核心   学分:3.0
课程主页:暂无(如果你知道,劳烦告诉我们!)
AI 总结 AI 总结为根据点评内容自动生成,仅供参考

课程内容与教学

刘淇老师的《数据分析及实践》课程涵盖了数据处理、统计方法、机器学习和深度学习等主题。尽管主题广泛,但课程设置更多作为导论性质,每个领域的讲解较为基础。课上存在频繁的小测,用于考勤和鼓励课中参与,但具体的教学内容与实验任务并不直接相关。

实验与作业

本课有五次实验和一次文献调研。实验涵盖了Python编程入门、网页爬虫和数据分析等内容。实验报告须自行撰写,且缺乏明确的评分标准和即时反馈。许多学生认为实验报告的评分较为主观,需展现个人思考和尝试,报告的完成程度对总评分有显著影响。文献调研需要深入研究并撰写报告,也在总评分中占重要权重。

考试及给分

期末考试主要覆盖课上讲授的PPT内容,形成了一种高压的背书模式,考试范围极广,考试安排紧密且不提供往年试卷或样卷。部分学生反映考试出题模式不尽合理,给分则因不公布具体标准而备受争议。尽管如此,一些学生通过勤勉的实验和报告工作获得了满意的成绩。

学生反馈

评价中对课程的看法不一,正面评价主要集中在通过课程学习到的实用技能,如Python和数据分析技术,对未来学习有潜在积极作用。反面意见则集中在课程内容与实验的脱节、小测频繁、实验评分不透明以及考试要求不明确上。特别是对于大二乃至未具备较强编程基础的学生而言,课程挑战较大,需自学搭配课外资源完成任务。

综合建议

选课前建议提前学习Python及相关数据分析库(如pandas和sklearn),并提升自学能力以应对实验的复杂性。如果希望丰富数据分析实践经验且能够投入较多精力,该课程仍然值得考虑。对于看重考前准备和平常反馈的学生,需慎重选择。

排序 学期

评分 评分 40条点评

匿名用户 2025春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

2025.8.31

千呼万唤始出来,拖了两个多月终于出分了,这效率无敌了👍。

选课须知

  1. 教务系统上的考核方式为大作业,但从 2024 春开始,考核变成期末闭卷考试(平时 : 实验 : 期末 = 2 : 3 : 5);
  2. 该课程与 CS4023 数据科学导论 以及 NNM2012 新媒体大数据分析 的学分不可重复认定(课程替代库里没有,但是 PPT 上这么写的);
  3. 考勤较多,点名不计其数,小测大概有 4 次,正确率会影响得分,与期末考试内容强相关
  4. 出分极其缓慢,不建议大四的同学选课。

2025 春实验:约 3 周一个实验,没有反馈

  1. Python 编程练习:只涉及基本的语法,那我缺的 Matplotlib、Pandas、Sklearn 这块谁给我补啊;
  2. 网页爬虫:Python 爬取 Nature 期刊数据并结构化存储
  3. 数据分析:基于 PISA 2018 数据集,进行探索性分析、可视化分析和特征关系分析
  4. 关联规则发掘:基于 PISA 2018 数据集,挖掘部分问卷属性的频繁项集关联规则
  5. 特征预测:基于 PISA 2018 数据集子集,对部分属性进行分类预测,并尝试调用大语言模型进行辅助分析。

一些有用的东西

为什么这门课会出现“课堂与实验严重脱节”的问题?这门课其实是在原本的《数据科学导论》基础上,增添了一些实践性的数据分析实验,但是课堂仍停留在导论层面,并没有随着实验而进行改革。于是,知识性的“数据分析”部分,和工具性的“数据实践”部分,就这样强硬拼凑在一起,摇身一变,成了今日所谓的《数据分析及实践》。不过这种授课方式最好水了,所以我估计老师也懒得改。

2025 春数据分析及实践 PPT V.S. 2019 秋 数据科学导论 PPT
残留的标题

本来想对这门课写一些系统性的分析和改革建议,不过鉴于嗯嗯擅长脱离群众、忽视实际的尿性,我觉得写了意义并不大,所以懒得写了。下面的内容全是“梦到哪说到哪”的,不保证真实性正确性合理性,大家权当看个乐子。

守序:广而不杂,深而不晦;条理井然,言之有序。
混乱:空而不实,乱而无章;逻辑混乱,漏洞百出。

善良:作业精研,指导详尽;考勤宽厚,待遇从容。
邪恶:实验放养,反馈无期;点名频仍,小测繁琐。

这门课是守序善良还是混乱邪恶大家心知肚明。上课也没啥人听,刚开学有一次我玩手机间隙抬头看了一圈,大部分人都低着头,有人荒野大乱斗、有人恶搞之家、有人潜伏、有人 Switch;小测没几个人会,直接零帧起手,开始怒斥群臣……课程内容主打一个点到为止广撒网,我打赌上完这门课的人知道什么是独热编码,但是没多少人知道这是什么:

from sklearn.preprocessing import OneHotEncoder

def one_hot_enc(df, f):
    x = df[[f]].fillna('missing')
    enc = OneHotEncoder(handle_unknown='ignore', sparse_output=False)
    one_hot_array = enc.fit_transform(x)
    colnames = enc.get_feature_names_out([f])
    df[colnames] = one_hot_array
    return df

实验不给反馈,考试不给范围,说要给参考公式也没给,出分也奇慢无比。还有,哪个神人想出来的考核从大作业改成考试的?虽然大作业可能会面临下图问题,但是通过一些恶心的手段来强行增加区分度的考试能强到哪去?用这些时间去打打比赛不比无脑背诵 PPT 上那些无聊的八股有用?

祖传的课程主页,没更新过的 Slides,神秘的阅读链接:

又红又专,理实交融,政治也是数据科学基础!

中英杂糅,混合双打:

不搞点图层遮挡,你怎么知道你看的是 PDF:

遍地贴满了失效的链接:

莫名其妙、夹带私货、大肆铺张的参考文献:

打好数理基础!直接对标高考!

简单的东西我要展开讲

复杂的东西你去自己猜:

AI 屋及乌,大 AI 无疆:

对不起我错了,要不你还是让 AI 算吧:

三过家门而不入,三乘数据而不改:

Java 取代 Python 势在必得!

杰森文档:

张冠李戴:

活算法?死算法!

MongoDB 是 NoSQL,PPT 是 NoUpdate:

我 TLS 肯定上不了台面:

有人托梦给你的答案???

“女生不用交”的“特权”小测,喜欢老师的恶趣味吗:

PPT 找不同!数据分析及实践 V.S. 数据库系统概论!


2025.6.19

没有往年卷是吧,跟你爆了😡😡😡

2025 春  数据分析及实践  期末考试

一、单选题(共 30 分)

1. 网络爬虫不包括( )
A. 载入过程   B. 解析过程   C. 检索过程   D. 存储过程

2. 某时间段抽取 10 位顾客的购买记录:购买物品 A、B、C 的分别有 2、3、5 人。求信息熵(  )
A. 5.06   B. 18.36   C. 1.03   D. 1.49

3. 哪一种数据变换方法把数据缩放到 [0, 1] 区间(  )
A. Z - score 标准化   B. 最小 - 最大规范化   C. 独热编码   D. 数据离散化

4. 关于假设检验,下列说法正确的是(  )
A. 假设检验的目的是接受原假设。
B. 第一类错误指拒绝了错误的原假设。
C. 假设检验中,犯第一类错误的错误率即为置信度。
D. 大数据分析不涉及假设检验。

5. 下列哪项不属于 NoSQL(数据库)的特点(  )
A. 数据模型简单   B. 数据有高度一致性   C. 灵活性强   D. 高性能

6. 关于 TF - IDF 说法正确的是(  )
A. TF 是逆文档频率。
B. IDF 用于衡量词语在单个文档中的重要性。
C. TF - IDF 可用于提取文档关键词。
D. TF - IDF 算法复杂,效率低。

7. 关于数据分布,说法错误的是(  )
A. 集中趋势反映了一组数据中心点位置,以及该组数据向中间靠拢或聚集水平。变异系数是常用指标。
B. 数据离散程度增大,集中趋势的测度值对该组数据的代表性越差,反之亦然。
C. 在数值型数据中,刻画数据围绕其中心位置附近分布数字特征时,常用方差和标准差。
D. 若极差或四分位差较大,建模时需考虑数据是否有长尾现象。

8. 某医院进行病症诊断,某病诊断出 120 例病例。后续确诊过程中,发现只有 80 例真正患病,其余 40 例是误诊(假阳性),则该诊断方法的正确率(Precision)为(  );假设样本中仍有 120 例未被诊断(漏诊,假阴性),则该诊断方法的查全率(Recall)为(  )
A. 66.7%  40%   B. 33.3%  60%   C. 66.7%  60%   D. 33.3%  40%

9. 哪些指标属于不确定性时序预测评价指标(  )
A. CRPS   B. MSE   C. RMSE   D. MAE

10. 哪个数据挖掘算法是最为代表的符号主义流派(  )
A. 感知机   B. 支持向量机   C. 决策树   D. 关联规则

二、简答题(共 20 分)

1. 请简述 3 种数据预处理方法,并说明为什么要进行数据预处理。

2. 请简述特征工程的意义以及主要流程(步骤)。

3. 请简述如何进行假设检验,并说明假设检验和参数估计的区别。

4. 请简述 ROC 的绘制方法,并说明当 AUC 为 0.5 和 1 时分别代表什么。

5. 请简述 K 近邻(KNN)算法的基本原理,并说明其为什么被称为“非参数方法”。

三、计算题(共 50 分)

1. 给定两个 5 维数据点 \(x_1=(1\ 1\ 0\ 1\ 0)\)\(x_2=(0\ 1\ 1\ 0\ 1)\),请依次计算 Jaccard 相似度、Cosine 相似度、Euclidean 距离、Pearson Correlation 值。

2. 概率矩阵分解方法可用于预测用户对未评分项目的评分。对每个用户 \(i\) 和每个项目 \(j\) 都可以通过潜在因子矩阵 \(U\) 与 \(V\) 表示,用户项目评分矩阵 \(R\) 可以近似建模为 \(R_{ij}\approx U_i^TV_j\),如图所示。

假设 \(R_{ij}\) 服从高斯分布,方差为 \(\sigma^2\),每个评分相互独立。用户潜在因子 \(U_i\) 和项目潜在因子 \(V_j\) 服从均值为 0、方差分别为 \(\sigma_U^2\) 和 \(\sigma_V^2\) 的高斯分布。用最大后验概率估计参数 \(U\) 和 \(V\),即最大化 \(p(U,\ V|R,\ \sigma^2,\ \sigma_U^2,\ \sigma_V^2)\),写出优化目标公式即可,不用求导计算。

3. 以下是某商店的交易清单。请使用 Apriori 算法,以支持值阈值 33.34%、置信度阈值 60%,详细记录算法的执行过程。列出每次数据库扫描的候选项集和频繁项集,列出所有最终的频繁项集,生成所有的关联规则,标出其中的强关联规则,并且按照置信度排序。

交易 ID物品
T1中性笔、笔记本、荧光笔
T2中性笔、笔记本
T3中性笔、矿泉水、巧克力
T4巧克力、矿泉水
T5巧克力、荧光笔
T6中性笔、矿泉水、巧克力

4. 滑雪。两种属性:天气(晴天、雨天、雪天)和降雪量(≥ 50、< 50)。小明 8 天的训练集如下:

天气晴天雨天雨天雪天雪天晴天雪天雨天
降雪< 50< 50≥ 50≥ 50< 50≥ 50≥ 50< 50
滑雪

(1) 计算训练集中“滑雪=是”和“滑雪=否”的先验概率;
(2) 计算每个属性在两类别下的条件分布;
(3) 请你帮助小明做出决策,使用贝叶斯分类器决策。

序号天气降雪
A晴天≥ 50
B雨天< 50
C雪天< 50

5. 某电网过去 6 小时的负荷(单位:MW)如下图:

小时123456
负荷500504509515520528

使用 ARIMA(1, 2, 1) 预测第 7 个小时的负荷。其中,AR(1) 系数为 \(\Phi_1=0.5\),MA(1) 系数为 \(\theta_1 = -0.4\),初始残差 \(\epsilon_1=0\)\(\epsilon_2=0\)\(\epsilon_3=0\)


2025.6.18

⚡⚡PPT 看得我不知天地为何物了⚡⚡

有没有前辈说说考试题型是什么😭😭😭

真的复习不下去了😭😭😭

(最后修改于 48 7 复制链接
猜猜我啊狠人,最强大脑!
Wind.伟大无需多言!
哈哈哈哈哈哈哈哈哈哈我去怎么记住题目的,太厉害了
omo啊呀卧槽 ,这个牛b
Cappuccino属实是造福后来人,瑞思拜
opt太强了😧
Oliveira兄弟你的大脑能不能借我用用(
立即登录,说说你的看法
Swayee 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:杀手
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:杀手
  • 收获:一般

课程内容:

  • 每节课都点名,形式为小测,算入总评。小测的时间较为随机,题目稍微有点难度,可能需要听课才能做出来;
  • 共计五次实验,每次实验给的时间都不长,约半个月;
  • 一篇文献调研,ddl和最后一次实验挤在一起。

实验内容:

  • Python入门级难度的编程练习,OJ平台,(第一次实验不需要写实验报告,之后的实验均需要报告);
  • 一个简单的网页爬虫,从三个任务中选一个:王者荣耀,豆瓣,评课社区;
  • 数据分析:参考模板数据集的一个子集;
  • 关联规则发掘,数据集同上;
  • 特征预测,数据集同上。

总评给分:

  • 本人的总评分数不是很理想,至少个人认为对不上自己的付出。
  • 助教表示优秀率给满,且最后一节课有优秀作业展示,从结果看是没啥问题。但不公布具体成绩明细,实验提交之后不再有回复。
  • 个人推测是课堂小测缺席一次就总评扣几分,那我确实该寄。不过已经修够所有学分了,便没有再纠结赋分。

你可能感兴趣的内容:

完美的数据分析JupyterNotebook模板

关联规则python实现

神经网络算法python实现

(最后修改于 20 1 复制链接
omo在你这楼留个档[2025春试卷回顾](https://icourse.club/course/20053/#review-93456)
立即登录,说说你的看法
sleeper 2025春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:没有
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:没有

难蚌,课程实验和上课正交,期末考试说只要ppt出现过就要考,600页ppt,把我当神了吗🤔考试时间也是逆天,第二天就是量物,教务处属于是把我当日本人整😨😥😱

10 0 复制链接
trytgug 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:中等
  • 给分:超好
  • 收获:很多

看到大家对这门课意见这么大,提供一些给学弟学妹们的个人看法,不喜勿喷

利益相关:小测全勤,实验和调研报告自认为写的还算认真,最后总评90,相较于我的code水平来说非常满意

感觉这门课的争议可能是因为报告作为主要的评分标准过于主观了,每个人对于自己写的报告肯定都是充满了信心,毕竟没有人会觉得自己辛辛苦苦写了几个小时的东西是一坨屎。这样主观的报告最后用客观的方式评分,必然会有很多人会产生“为啥我分这么低”的愤怒,高分也会觉得是自己写的很好,理所应当。

至于评分标准,中间问过好几次老师和助教,得到的回答有一点我想可能很关键——就是要有自己的想法,并且在报告中体现出来。我在每次报告中都会把实验过程中奇奇怪怪的尝试和心得写进去,这可能也是我总评比较高的原因。班上的大佬,每次布置实验光速写一篇完事,代码截图一粘,总页数2页,最后总评85,虽然人家真实水平比我高很多(逃

还有一点可能就是要和助教多交流,有一次周五晚去实验课,看到偌大的实验课教室里只有助教孤身一人,一问才知道,我是第一个来的。后来实验课也因为没同学去,改成了线上,我想问问那些说实验要求不明的同学,你们真的问过助教一句实验要求吗?

说到底,最逆天的还是科大的卡优秀率限制。这课如果没有优秀率限制,就是一门大家开开心心写报告不考试的好课,可是加上了优秀率限制,就得强行在报告里卷生卷死。或许以后这门课也会加入期末考试这种客观性的评价标准吧,高手速通,菜逼复习的死去活来喜提及格,不过大家都没异议,一个愿打一个愿挨。

至少对于我这个普普通通的学生来说,这门课让我学到了很多以后炼丹可能会用到的东西,让我凭借着勤勤恳恳地写好报告每一个步骤,就能得到一个很好的分数,所以我个人非常推荐这门课。如果真要来一场期末考试,最后出几道逆天难的压轴题,我必然还会回到属于我的普通的分数位置,看着佬们在我面前谈笑风生,还要互相装弱膜拜。难道科大的教学体系,就只为了让那前百分之十的人更加耀眼,我们这些普通人,就只配被你们踩在脚下,成为你们通向光辉未来的分数放大器和铺路石吗?

10 3 复制链接
细雨点洒在花前感谢同学的认真总结和评价,助教感动哭了
北铭有鱼狠狠点了
立即登录,说说你的看法
匿名用户 2023春
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:一般

我想这门课最大的问题其实在于:所有实验做之前几乎没有指导,做完后完全没有反馈。一学期花费这么多时间都是在实验报告上卷生卷死,最后给分也就这样,你说能有什么收获!

9 0 复制链接
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:一般

哈基咪南北绿多,阿西噶阿西,阿西哈雅酷奶农,哈基咪哈基,哈基咪摸南北绿多,阿西噶哈雅酷奶农,哈基咪曼波亚不亚不有待有待哦吗吉利曼波,哈基咪摸南北绿多,阿西嘎哈雅酷奶农,吗吉利哇呀曼波,哈基咪哈基咪我的贝绿多,亚不亚不有待有待啊曼波啊吗吉利,哈基咪摸南北绿多,哈基咪摸南北绿多,哈基咪摸南北绿曼波

8 0 复制链接
匿名用户 2025春
  • 课程难度:中等
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:没有
  • 难度:中等
  • 作业:很多
  • 给分:一般
  • 收获:没有

要是可以打零颗星就好了

完全是一坨屎

一坨屎

我说这课是一坨屎!!!!

实验五个,从没学过python的完全不友好

反正没有一行代码是我写的

考试既没重点也没往年题助教啥信息也不给

考点完全猜不透,根本是一坨

谁选谁倒霉吧我只能说

考试安排还很密集PPT700页傻逼来的

我说这课是傻逼来的!

7 0 复制链接
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

感觉老师上课有点摆,理论课学不到多少东西,没有纸质作业,不过上课经常有小测。

实验基本靠自己摸索,由于我太菜了,虽然花了很多时间但依然做得一塌糊涂。不过自学了pandas库,对以后有点帮助。


虽然我不太满意这门课,但43%优秀率已经很好了(虽然我没有优秀),只是实验报告这种形式容易导致内卷。

(最后修改于 7 0 复制链接
匿名用户 2025春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

分呢?为什么还不出分👿

(最后修改于 6 0 复制链接
snzisj 2025春
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:困难
  • 作业:中等
  • 给分:一般
  • 收获:一般

没有样卷,没有往年题,没有考纲,只有加起来七百多页的ppt,我不知道怎么赢


我也是不懂了,死活不愿意说公式会给到什么程度是干什么???


终于知道为什么不肯说公式会给到什么程度了,因为任何公式都不给

(最后修改于 6 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:很多

成绩分成三部分:小测(正确率会影响得分),实验(5次,依次为Python初步,爬虫,两次表格数据提取,以及自己选择若干模型,要写报告,会给实验模板),期末,比例为2:3:5。实验都做了,考前看了看PPT。出分太慢了,考得最早,但都秋季学期第一周周末了才出了,不过给分是真的好,本人纯摆子没想到也能拿4.0

(最后修改于 6 0 复制链接
Eastwind_ 2023春
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:中等
  • 给分:一般
  • 收获:很多

老师讲课水平高+1; 自己对这门学科感兴趣+1; 无作业无考试+1; 实验标准不明确且需要大量课下自学分别-1.

----

这门课这学期上了一个月后我注意到一个很有意思的地方: 它和22春孙广中老师开的计科选修课 "程序设计进阶与实践" 在许多彼此正交的维度上都颇为神似, 包括但不限于:

没有考试作业, 4次小实验和1次上机和1次大报告决定总评 (数据分析的第一个实验是python编程基础, 和程设进阶的上机可以相当) ;

课时安排是每周一次三节课;

每次上课教室都挤得要死, 到得稍微晚一点就得到处搜刮空座位;

老师讲得挺好, 就是没什么用;

实验难度对萌新极其离谱, 需要大量的课下自学;

卷王 (非贬义甚至比较褒义) 可以把你觉得很正常的实验任务做出来的效果卷出万花筒, 而作为萌新你甚至都听不懂他们在干什么;

......

甚至于这门课出分后很多人抱怨体验抽象给分不好, 感觉都和程设进阶是一个模板刻出来的结果, 不免使这种相似感又增加了几分. 不知道大数据有没有修过这两门课的同学和我有相似的感受.

----

等有空了补正经的评课.

6 0 复制链接
cccccz 2025春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

虽然作为妮可信智的学生,我已经习惯主要面向实验进行学习了。但是第一次碰到实验和上课内容完全正交的课程还是有一点难绷😇


考完试更:

沉默了,说不出话了,被震撼到了。

我们aids确实是这样的,代码作业是和上课正交的,考试是包含所有ppt内容的,公式是不给的,概念是要考的(甚至有的东西ppt上都没有/矛盾的)。

PPT上数据预处理那一章写了四部分,考试只问三个,剩下一个是和我的复习一样完全不重要吗?

当然,我能理解老师的苦衷,如果给出考试大纲,凭aids的卷度一定能把平均分干到80+甚至90+;实际上老师说这门课改成考试就是不希望大家再卷最后的报告这种东西。不过思考一下这个问题:对于一个aids的学生来说,如果卷是不可避免的,那么是熬夜背诵特征工程的定义和流程更有用,还是刷baseline之类的东西?

(最后修改于 5 0 复制链接
匿名用户 2024春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:简单
  • 作业:很少
  • 给分:超好
  • 收获:很多

我的成绩去哪了???

5 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

什么时候出分呢,考完快一个月了吧

5 0 复制链接
神游 2023春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:一般
  • 难度:简单
  • 作业:很少
  • 给分:超好
  • 收获:一般

要写课评的时候却发现这门课在pksq的风评坠落,表示略感惊奇,因为作为编程小白选了大佬云集的课总觉得身边的人都好厉害因而自觉调低了对成绩的期望,只是日常到课按时交实验和调研报告,结果得到的成绩居然还蛮好(?)

按着这学期的体验来说,这门课课上讲的和课后布置的仿佛是两个维度。

课上的节奏感觉一直都是蛮舒缓的,刘淇上课其实蛮有魅力,当我不困并且有兴致听讲的时候总是能给我清晰的讲解。不过作为数院人,中间有一段讲概统的内容因为几乎没学过会几乎听不懂,不过反正这门课没有期末考没听懂也无伤大雅。几乎每周都有的小测环节对我来说是把达摩克利斯之剑,不过记得有一周的课,三节课小测了三回,简直把我摸鱼的灵魂扼杀得死死的,小测不免太过频繁了:这样尽管到课的人数得到了保证,但上课效率实属难绷,有一次老师连着点了三个回答一个相当简单的问题却得到了不会三连,笑。

记得假期选上这门专业选修课之后,收到建议预习Python编程的短信,一开始不以为意,结果第一次课老师就布置了CODIA的Python实验——难度一题更比一题高,最后干脆一路ChatGPT写题,似乎后面的实验也没怎么用上ex1后面几道好难的题。结果之后的ex2~4,感觉老师似乎默认了我自然地就能掌握许多前置知识,每次布置下来的实验都让人耳目一新(在这并不是个褒义词,因为课上老师也没怎么教和实验有关的东西...), 咨询助教感觉他们总是在忙经常失踪,因而每次实验基本都是面向ChatGPT完成,感觉自己学会的好多还是latex的操作方法(bushi)。由于刘淇在课上对实验报告鲜明的偏好,做实验的时候自己也没想太多,实验只要能跑出个结果,老师要我多做几个图就多做几个图贴上去,让报告看起来不那么干瘪就算了结一个实验hhh。文献调研倒的确是认认真真地把时间花下去了,挑着老师发的一个实验室网页里的自己蛮感兴趣的论文啃下去,然后把论文的细节重新整合成了一篇调研报告,自我感觉做的工作尽管不止翻译和复述,但顶多也就是个梳理兼润色之劳。anyway就是朴朴素素地做了老师要求我做的,结课之后没多久就退了群,出分平平淡淡,所以看到pksq大家的评课反而觉得错愕o((⊙﹏⊙))o

5 1 复制链接
Eastwind_大部分人认为的槽点大概就是在 面向GPT试验 这件事上 (当然也可能有一部分是因为优秀率)
立即登录,说说你的看法
匿名用户 2025春
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:没有
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:没有

0分打给这门课,也打给我自己

为什么开学的时候选了这门课

4 0 复制链接
匿名用户 2025春
  • 课程难度:中等
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:很多
  • 给分:一般
  • 收获:一般

终于出分了……结果勉强还行吧,附上我的复习资料造福后世,筑波不会重修这门课了。

1.pdf

2.pdf

3.pdf


 

怎么还不出分怎么还不出分我的成绩呢成绩呢成绩呢


 

作为一个必修的ds人,不得不上了,想说几句:

1.这门课实验和上课考试完全正交

2.基本上每节课都要点名和小测,小测成绩计入总评

3.一共五个实验,实验内容并不容易,只能对着gpt 拟合,但是时间给的很紧迫,一个接着一个,也不知道实验的评分标准(到现在仍未得知自己实验分数)非常难顶

4.考试无样卷无考纲,只有700多面的ppt,所有都是范围,说会给公式,我考完怎么一个公式也没看到呢???选择题简答题全都是概念题,为什么还在闭卷呢???为什么不能给个样卷或者往年卷呢???

总而言之,这是一门 每节课小测点名,实验任务巨大,到现在教务系统上还写着“大作业”但是要对着ppt狂背所有内容考试还是记不住的神秘课程。

 

(最后修改于 4 0 复制链接
匿名用户 2025春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:杀手
  • 收获大小:一般
  • 难度:简单
  • 作业:很少
  • 给分:杀手
  • 收获:一般

选择简答题全考概念还不开卷。不如直接改名背书课算了

哪个nt提出这门课要从大作业改成考试的

(最后修改于 4 0 复制链接
匿名用户 2025春
  • 课程难度:简单
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:没有
  • 难度:简单
  • 作业:中等
  • 给分:一般
  • 收获:没有

哈姆,哈姆,哈姆,哈姆的哈的贝哈姆哈姆的的哈贝贝,哈姆的哈的贝哈姆哈姆的哈贝贝,哈姆,哈姆,古莫德那德米列洛姆,古莫德那德米列洛玛,古莫德那德米列洛玛,阿珂么德哈马迪,阿珂么德哈马迪,哈姆,哈姆,哈姆

3 0 复制链接
匿名用户 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

写这篇评课主要是来降低(提高?)幸存者偏差的比例。

考核方式:4实验+1调研报告+课堂小测(一般1-3题,频率较高,如果当时有在认真听课或者掌握相关基础应该难度不大,主要用于考勤,并且据助教说在如果考勤没到可能总评比较吃亏)

课程内容是数据分析中用到的各种思想和算法,印象最深的是先验后验那部分相关的,以及最后粗略涉及到推荐系统相关的SVM等算法,其它的因为没太听讲不太记得了。

看到其他同学评课里面讲到了面向GPT实验以及针对每次的实验及相关实验报告没有即时反馈的问题。由于本人在学期内没有成功使用过GPT,并且编程基础不太好,所以我的四个实验以及调研报告都是自学手册+面向CSDN编程,过程稍显艰难。而且因为拖延症,所以常常在ddl前一周才开始准备,ddl当天写完上交。自我感觉实验结果都是勉强达标,想写的很多,但是常因ddl迫在眉睫而放弃一些额外的想法。相对来说,调研报告是我最用心的一项,前后写了快两周。我做的是关于推荐系统的内容,以两篇论文为基本内容提取关键算法,用自己的话复述了一遍,然后还参考了一些使用类似算法或者应用于类似情景的论文进行了比较,总共写了12页。上交报告后的两节课(也就是最后两节课)才发现老师的授课也讲到了很多推荐算法(和我的报告中涉及的算法重复率40%左右)感觉总评要寄了。不过结果还不错,最后喜提优秀,对于我这种常年班级平均分上下拿不到优秀的人来说很是惊喜。(出分后发现有些大佬没有拿到高分,也不排除电风扇给分的可能)

对于给分,由于没有公布给分细则及每次实验的分数(助教的说法是怕大家因此卷实验报告),我只能给出我猜测的给分标准:考勤重要+报告中要美观并体现出自己的思考。老师比较重视报告格式的规范。此外,上课时多次强调了希望大家做实验时可以发散思考,不要只局限于实验要求。我虽然不知道怎么去拓展我的实验内容,但是尽量地多用几种方法去对比效果(例如选择不同的局部数据集)然后在调研报告里面也加入了很多自己的思考。其中当然也有投机的成分,因为知道实验很难拉开分数的差距(个别做的格外细致和详尽的除外),猜测调研报告可能是拉开差距的一环(能看出是否用心地阅读论文)。后来私下里了解到有不少同学都是抱着随便看看随便写写的态度来写调研报告的。

3 0 复制链接
leeeeeze 2025春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

这门课是被遗忘了吗 怎么还不处分 。考虑到ds高手们和ai卷怪们的存在,对最后的总评也不抱太大期望了


ai人选修 ,说实话这学期的各种课真的非常消磨人的学习热情。这门课上课授课内容覆盖面很广,但讲的都不深入,自己看PPT完全可以。后半学期每节课都有零帧起手的点名回答问题…(苦了刘翔同学)考试更是绷不住,选择简答考成文科题了,最后一道大题ARIMA的计算 随机过程b都不做考试要求的玩意结果出在了数据分析 ,凭着很模糊的记忆胡乱写几笔了事。事实就是几百页的ppt,每一页的每一行的每一个知识点都有可能出在期末试卷里 。体验总之很不好

(最后修改于 2 0 复制链接
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

那还是比量子物理阳间

  6.18下午计组

  6.18晚上数据库大作业答辩

  6.19下午这个

  6.20下午量子物理

  人形乱序超标量处理器√

  全考完再来评

(最后修改于 2 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:一般

兄弟们给个五分公平公正。

总结为自学的课,主要比重在实验,实验的知识大都要自学,上课不爱听因为听了就忘了。

最好的一点是老师讲的一些道理挺不错的。

不建议选啊兄弟们,不如自学Python什么的爽。

课很烂,实在是忍不了了。上课不如讲讲实验中的知识。

(最后修改于 2 1 复制链接
youxi666牛魔,我是必修🤓
立即登录,说说你的看法
匿名用户 2023春
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:很多

这学期花时间最多的一门课,实验确实需要很多精力,不过有GPT辅助,也还能接受,选这门课的同学建议提前熟悉pandas、sklearn(最好是熟练到常见方法不用查文档快速写出的程度)和latex,爬虫可以速成。

本人小测全勤,文献调研用USTC毕业论文模板写的,前两次实验报告倒是直接markdown水了过去(个人建议课程设计实验的时候如果用jupyter notebook的话其实可以把报告和代码直接集成,不必让同学们另写一份)

最后给分还算与付出精力匹配,拿了92。其实很建议在学ml之前学一下这门课作为前置。

2 0 复制链接
˃ʍ˂ 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

这门课只有4次实验+1次算法题+调研报告,结果实验一直没有反馈也没有具体的评分标准,尤其是调研报告,很难让人不怀疑评分具有很大的主观因素。

 

最绷不住的,提交实验的邮箱连个自动回复都没有

2 0 复制链接
匿名用户 2025春
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:超好
  • 收获大小:一般
  • 难度:困难
  • 作业:很多
  • 给分:超好
  • 收获:一般

出分真够慢的…给我的分挺好的,我的实验都是东拼西凑写的,还有两三个实验没跑出最终结果,但是小测全勤,期末考试因为被上届学姐打了预防针所以有心理准备,考得应该还行,这样能给我3.7我已经知足了。课是一坨,实验和课堂完全正交,上课还喜欢提问和小测,建议是好好准备期末考试,什么偏难怪的概念都看一看。

1 0 复制链接
pipisheep 2025春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:简单
  • 作业:很少
  • 给分:一般
  • 收获:很多

这门课当然是很有用的。我个人感觉收获很多。

但是没有往年卷太伤了。700多页PPT,几十个算法、模型。期末周结束后复盘,发现除了离散数学和计嵌,就这门课花时间最多。

不给往年卷,不给考试范围的意义在哪里?逼着学生把700-800页PPT背完吗?这种应用性质的课程,是把知识背下来重要,还是学懂会用重要呢?

不过pksq有大佬发了往年卷,学弟学妹们应该会好过很多吧

1 0 复制链接
匿名用户 2025春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:没有
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:没有

评课社区里本人很少给低分,但这次属实绷不住了。自认为复习的比较到位,但还是架不住这种离谱的出题模式。

(最后修改于 1 0 复制链接
匿名用户 2023春
  • 课程难度:简单
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:简单
  • 作业:很多
  • 给分:一般
  • 收获:一般

上课根本学不到东西,然而每节课小测,教室是3A,人又爆满,整个教室弥漫着汗臭脚臭

 

课程实验全靠自学,不过收获还是不少,鼓励卷报告我是比较反感的

1 0 复制链接
ColinJ 2021春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:很多

沙发~

19大数据,这课和《数据科学导论》其实是一门课,和往年的评价相对比,我觉得刘老师在这门课上的教学已经取得了很大的进步。

数据分析及实践主要从数据分析、数据统计、数据挖掘三个方面讲述了数据分析的全过程,包括数据处理、各种统计方法、机器学习、深度学习的东西都多多少少涉及了,由于课时的原因不可能深入的去讲,因此这门课更多的是一个导论课(所以我觉得改名是没有必要的)。

这课没有考试,分数全部由几次作业决定(上课有小测,听课就能做,但不知道算不算分;也没有去年的比赛),作业也由浅入深,非常照顾大二的同学。这个学期的作业主题是LOL,虽然可能对不玩游戏的同学有一些不公平,但是上课的时候说作业最后的效果并不完全和成绩绑定,报告写得好、经过多次试错等都可以给报告加分。还有一个调研报告,但说实话这个报告对于这门课的意义我感觉不是很大,如果这门课能增加一些课时给同学们分享可能会好一点。

大数据的同学和想选这门课的外院同学最好自己在开课前学好python的基础内容以免浪费时间,另外学习如何写一篇漂亮的报告也对这门课和之后的学习会有很大的帮助。

1 0 复制链接

其他老师的「数据分析及实践」课

刘淇老师的其他课

“科学与社会”研讨课 10.0 (2) 2025秋 2025春...
数据科学导论 8.8 (5) 2020秋 2019秋...
数据库概论 10.0 (1) 2021春
数据库概论 9.0 (1) 2020春 2019春...
数据科学导论 7.8 (4) 2021秋 2019秋
数据库概论 2017春