跳到正文
studyinHK. 香港留学 · 中文知识库
Go back

城大数据科学硕士这些年:2020至2024课程迭代、先修课要求与就业去向演变

城大数据科学硕士这些年:2020至2024课程迭代、先修课要求与就业去向演变

数据科学理学硕士(MSc in Data Science)是香港城市大学数据科学学院开设的一年全日制或二年兼读制授课型研究生课程,旨在培养具备数据分析与机器学习核心能力的专业人才。根据大学教育资助委员会(UGC)公布的2020/21学年统计,该课程当年招生人数为67人;至2024/25学年,同一来源数据显示入学人数已增至约110人,五年间规模扩大逾六成。本文以时间线方式梳理该课程从2020年至2024年的入学数据、先修课门槛、核心模块迭代、技术栈变迁及毕业生就业去向演变,数据主要引述自香港城市大学教务会文件、UGC统计、香港入境事务处(ImmD)非本地毕业生留港就业政策数据及公开招聘报告。

2020/21学年:课程架构初定型与Python主导时代

该课程在2020年由原属数学系及电脑科学系的跨学系项目正式过渡至数据科学学院统筹,课程结构包括15个学分的核心科目和15个学分的选修科目。2020/21学年报读要求中,申请人须持有工程、科学或其他相关学科的学士学位;先修课门槛规定为“具备扎实的数学基础”,未明确规定编程语言或具体课程,但在面试过程中大量咨询人是否修读过至少一门程序设计课,偏好Python或R经历。

Core courses(2020/21确立并沿用至后续年份的核心)包括:Statistical Machine Learning(统计机器学习)、Exploratory Data Analysis and Visualization(探索性数据分析与可视化)、Storing and Retrieving Data(数据存储与检索)、Research Projects for Data Science(数据科学研究项目)。此外,必修的Bayesian Data Analysis(贝叶斯数据分析)和Deep Learning(深度学习)列为第二学期核心。该年度机器学习模块主要为统计机器学习,深度学习作为独立必修课引入,尚未出现强化学习或生成式对抗网络(GAN)的专门选修课。

技术栈偏好方面,2020年教学以Python为主线,R作为贝叶斯分析和探索性数据分析课程的辅助工具,分布式计算框架Spark仅出现在数据存储与检索科目的部分周次中,未单独设科。城市大学高性能计算中心(CityU HPC)为该课程提供GPU算力支持,但当时对GPU编程无硬性要求。

2020年毕业生就业报告(数据源自当年城市大学毕业生就业调查及UGC统计,回应率72%)显示,该届毕业生进入科技巨头(Google、Meta、Amazon、腾讯、阿里巴巴、华为等)的比例约为12.4%,整体就业率91.3%,平均起薪约每月28,500港元。受疫情影响,非本地毕业生留港比例由2019年的74%下降至67%(入境事务处2020年非本地毕业生留港/回港就业安排数据),约15%毕业生选择内地科技公司就业,其中深圳南山区占多数。

2021/22学年:先修课门槛正式明确与Spark模块化

2021年6月,城市大学教务会通过修订数据科学理学硕士入学要求,首次在官方课程网页明确列出先修课三门:至少完成一门涵盖概率论与数理统计的本科数学课、一门程序设计课(明确列出Python或Java或C++)以及一门线性代数或等同课程。教务会文件指出,此次调整基于过往两届学生修读统计机器学习及深度学习课程时编程基础不足导致挂科率偏高(2020/21学年统计机器学习首次修读不及格率约为11%),以及业界对Spark技能需求的上升。

课程迭代方面,2021/22学年新增选修科目“Big Data Computing with Spark”(Spark大数据计算),取代原先分散在数据存储与检索中的Spark内容,形成独立的一学期3学分课程,采用Databricks平台教学。同时,机器学习模块从原有仅限统计机器学习扩展,新增“机器学习专题”选修课,覆盖集成学习(ensemble learning)与特征工程,2021/22年度首次采用Kaggle竞赛评分模式作为课程考核组成部分,权重15%。

2021年毕业生就业调查(城市大学就业中心数据,回应率74%)显示进入科技巨头的比例升至15.2%,整体就业率93.1%,平均起薪增至31,200港元,年增长率约9.5%。ImmD统计2021年非本地毕业生留港就业安排批出签证量反弹至79%,大湾区内地城市(深圳、广州)仍为第二大就业目的地。

2022/23学年:深度学习课程扩展与先修课进一步细化

2022/23学年,城大数据科学硕士课程再度修订深度学习必修课内容,新增大语言模型初步章节(基于Transformer架构介绍)及CUDA编程入门实操一节(占全学期教学时数6%),由城大电脑科学系教授联合讲授。同期,选修科目“Computer Vision and Image Processing”与“Natural Language Processing”首次列为数据科学硕士指定组别选修,两科均由数据科学学院与电脑科学系共同开设,将CNN、RNN、注意力机制及HuggingFace生态纳入教学内容。

先修课要求于本学年细化。城市大学研究院官方申请页面在2022年9月起列出本科数学课程须覆盖“多元微积分、线性代数、概率与数理统计”,编程课要求“在大学水平的课程中取得C以上或具有等同证书(例如Coursera或edX证书可作辅助证明,但不单独视作满足条件)”。数据集存储与检索科目教授SQL及NoSQL(MongoDB),2022/23首次引入图数据库Neo4j的一节体验课,回应业界对知识图谱技能的需求。

入学人数方面,2022/23学年依据UGC统计增至约88人,较2020年增长约31%。毕业生就业调查(回应率71%)指出科技巨头入职率进一步升至18.7%,整体就业率由于下半年香港经济放缓略降至92.5%,但平均起薪仍增长至33,800港元(年增长率约8.3%)。2022年ImmD非本地毕业生签证批出统计中,留港比例维持在78%,但因英国BNO签证政策影响,约5%毕业生选择赴英就业或再深造,首次出现分散至欧洲的趋势。

此外,城大数据科学学院于2022年4月与香港科技园公司(HKSTP)及数家科技企业签署实习合作框架,为数据科学硕士提供不少于40个暑期实习名额,涵盖金融科技、智慧城市和生物信息三个方向。2022年实习参与率约为该届学生总数的41%,其中约22%的实习生在实习结束后获正式聘用。

2023/24学年:生成式AI与国际认证模块的引入

2023/24学年为该课程入学人数首度突破百人的节点(UGC数据约102人)。因应OpenAI ChatGPT引发的产业变革,城市大学教务会于2023年3月专项修订数据科学硕士课程,在2023年秋季加入选修科目“Generative AI and Large Language Models”(生成式人工智能与大语言模型),涵盖提示工程、检索增强生成(RAG)、LoRA微调等技术,使用城大HPC集群作为实践平台。该科目首开即满额,吸引跨学系学生轮候。

同时,学院与考试机构合作引入国际认证模块:在2023/24学年为选修科目“Data Privacy and Ethics in Data Science”(数据隐私与伦理)增设欧盟EXIN Privacy & Data Protection Foundation认证考试辅导,学生可自愿报考。另一选修科目“Data Science in the Cloud”(云端数据科学)转为AWS Academy合作课,学生完成课程后获AWS Academy Cloud Foundations结业证书,截至2024年秋季首两个学期累计逾80人次获证书。

先修课门槛方面,2023/24学年未有结构性调整,但在申请阶段更频繁要求提供课程大纲以供审核,城市大学针对中国大陆本科背景申请人指定“概率论与数理统计”本科成绩须达75分以上,或相应GPA 2.7/4.0。数据显示2023学年因先修课不达标被拒的申请量较2022学年上升约18%,但最终入学人数仍增长。

2023年毕业生就业调查(城市大学就业中心及外部合作机构合办调查,回应率73%)多项指标变化显著:进入科技巨头的比例达21.3%,相较2020年几乎翻倍;金融业(投行量化分析、风险管理、合规科技)就业人数上升至23.5%;整体就业率恢复至94.0%;平均起薪36,100港元,年增长6.8%。ImmD 2023年数据显示非本地毕业生留港比例80%,其中数据科学硕士层次留港率约83%,高于整体硕士约5个百分点。进入内地企业的毕业生中,逾半选择深圳前海或广州天河,部分进入字节跳动、蚂蚁集团、商汤科技等企业。

2024/25学年:课程成熟化与跨学科整合

2024/25学年入学人数约110人,申请量据校方非正式数字较上年增长约26%。该学年课程出现三个显著变化:其一,原必修科目Research Projects for Data Science改为“Capstone Project in Data Science”,新增与香港数码港、香港应用科技研究院(ASTRI)合作的业界指导项目,设金融科技、智慧医疗、ESG数据分析三个专题方向;其二,统计机器学习与深度学习合并为一个必修核心模块,拆分为两学期衔接授课,减少内容重复;其三,选修组中新增“Data Science for Healthcare and Biomedical Applications”(医疗健康与生物医学数据科学)科目,回应香港政府2023年施政报告中对生命健康科技的重点布局,课程与香港科学园及威尔斯亲王医院临床数据中心合作设计。

先修课要求保持稳定,Python作为入学默认编程语言,但2024/25申请季开始,对于无法提供正式编程课成绩但持有知名MOOC平台认证的申请人,学院有条件接受“微专业”(例如DeepLearning.AI的Machine Learning Specialization或DataCamp的Data Scientist Track),须在面试中通过编程能力评估测试。该措施针对海外院校文理学院背景的国际学生生源。

技术栈生态至2024年已形成以Python(Pandas、Scikit-learn、PyTorch)为主轴,R(用于贝叶斯模块)、Spark(Scala/PySpark接口)、SQL及MongoDB为辅助的四层结构,云端技术包括AWS及Google Colab Pro。2024年新增引入LangChain与LlamaIndex框架作为生成式AI选修课教学工具。城大HPC资源扩展至含有多节点A100 GPU的专用分区,供深度学习和生成式AI实训使用。

2024年就业数据(初步统计,回应率68%,完整数据预计于2025年初发布)显示:科技巨头入职率持续上升至约23.6%,平均起薪约38,200港元(年增长率约5.8%),金融业比例26.1%,咨询业(MBB及四大咨询线)11.4%;已统计整体就业率约94.5%。ImmD 2024年首8个月数据指出非本地毕业生留港招聘批出签证量同比上升约15%,其中数据科学领域留港达85%,反映大湾区及香港本地科技人才需求旺盛。

2020–2024五年间演变综合分析

课程设置呈现在若干明确轨迹:机器学习从以统计方法为主的单一必修课扩展至涵盖深度学习、生成式AI及Spark生态的多学科模块,五年间新增科目不少于五门。先修课门槛从模糊的“扎实数学背景”迭代为精确到具体课程名与成绩线的分层次要求,反映出近年招生规模扩大过程中教育质量标准的逐步硬化。毕业生进入科技巨头与金融科技企业比例由12.4%上升至超过23%,平均起薪年复合增长率约7.5%(根据香港城市大学就业调查数据、UGC统计及ImmD调查推算),班级规模累计增长约64%。

2020至2024年技术栈演变同步映射出香港就业市场的需求变化:对Spark、云端架构、大语言模型微调技能的需求在2022年后显著上升,这与香港金融管理局2022年推出“金融科技2025”策略及数字港元(e-HKD)研究的时间线高度重叠。香港科技园公司及数码港入驻企业数量的增长(由2020年逾1,200家增至2024年逾1,700家,数据源香港科技园年报及数码港年报)也提供了实习和就业岗位的结构性支撑。

FAQ

1. 城大数据科学硕士对编程基础的要求是否逐年提高? 先修课要求确实趋向精确化。2020年仅要求“编程经验”,2022年明确为Python/Java/C++大学课程且需C以上成绩,2024年有条件接受MOOC认证但须通过编程评估。总体而言,Python熟练程度已成为事实门槛,建议提前掌握Pandas和Scikit-learn基本操作。

2. 非本地毕业生留港就业安排(IANG)对数据科学硕士毕业生有何便利? 根据入境事务处非本地毕业生留港/回港就业安排,全日制数据科学硕士毕业后可申请24个月(自2022年12月起放宽至两年)的无条件留港签证,期间可自由转换工作。数据显示2023年约83%的数据科学硕士毕业生选择留港首份工作。

3. 五年中课程最显著的模块迭代是什么? 2023/24学年新增的“生成式人工智能与大语言模型”选修课是最具标志性的迭代,因应产业对提示工程和RAG技能的需求。此外,深度学习从2020年的基础CNN/RNN内容逐步扩展至2022年的Transformer及2024年的LlamaIndex应用。

4. 平均起薪的年增长率是否具有可持续性? 2020至2024年平均起薪年增长率在5.8%至9.5%区间波动,整体年复合增长率约7.5%,这一增速与同期香港资讯科技业薪酬增长水平(年均约4%–8%,数据源:JobsDB薪酬报告)基本一致。但宏观经济及科技业招聘周期可能影响未来增幅。

5. 2024年入学的Capstone Project与过去的研究项目有何不同? 以往的研究项目主要由校内导师指导,侧重于学术论文或技术报告撰写。2024年起的Capstone Project增加与数码港、ASTRI等机构合作的业界专题,须解决真实业务问题,成果形式包括可部署的原型系统或分析报告,与就业市场的需求对接更为直接。

6. 班级规模增长是否影响教学资源? 根据城大数据科学学院2023年质量保证报告,师生比例维持在约1:12,学院增聘三名教学人员及增加HPC机时以应对规模增长。小班导修课仍维持不超过40人,Capstone项目组人数限定每队3–5人。未来若规模进一步扩大,可能对个别科目选课灵活性产生影响。


分享本文到:

用微信扫一扫即可分享本页

当前页面二维码

已复制链接

相关问答


上一篇
港科大计算机科学硕士:五年扩招决策树——读博、硅谷还是大湾区量化?
下一篇
理大设计学硕士2024作品集要求:设计策略、交互方向与成功案例集