中山大学软件学院
软件工程专业本科生课程教学大纲
Course Profile for Undergraduates of Software Engineering
最近更新 / Revision : yyyy.mm.dd
课程编号
Course CodeSE-000课程名称
Course Title
Managing and Mining Massive Data课程类别
Course Type〖选修〗
[Elective]学分
Credits周学时
Hours per Week总学时
Total Hours理论环节
Lecture Sessions实验环节
Laboratory Sessions0学时合计
Total开课学期
Semester第〖一/二/三/四〗学年夏季学期
Fall semester, [1st/2nd/3rd/4th] year课程负责人
Course Coordinator中文: English: Wei Wang
:[ weiw@cse.unsw.edu.au ]
Homepage:[ cse.unsw.edu.au/~weiw ]主要授课教师
Principal Instructors中文:English: Wei Wang教学助理配置
Teaching Assistants: 黄强
English: Qiang Huang课外交流时间
Office Hours主讲教师:每周6小时.
Instructor: 6 hours per week. 教学助理:无.TA: N/A. 课程主页
[URL] (待定)
[User name and password, if required]讨论社区
Forum[URL]课程描述
Course Description
通过这门课程的学习,学生可以
了解正确的数据挖掘的基本概念和基本任务
了解数据挖掘的难点和现有方法的优点和缺点
能够使用教授的内容解决一些实际的数据挖掘的问题
This course will introduce the fundamentals of data minging techniques covering the whole lifecycle of data mining (including data acquisition and preprocessing, similarity queries, classification, clustering, and association rule mining), closed with an data mining application (Remendation System). The course will he a blend of both practical and theoretical knowledge in this area. The expected learning outes are:
a correct understanding of fundamental concepts and techniques of Data Mining
understand the challenges and pros and cons of existing data mining methods.
Be able to solve some practical problem using learned data mining techniques. 先修课程
Prerequisites数学:线性代数,概率论和数理统计 (Linear Algebra, Probability and Statistics)
算法和数据结构 (Data Structure and Algorithms)
编程语言:能够使用C++ 或者 Ja熟练编程 Programming Language (C++ or Ja)后续课程
Successive Courses()
理论教学
Lecture Sessions教材
TextbookMining of Massive Datasets. Jure Leskovec, Anand Rajaraman, Jeff Ullman. Cambridge University Press. Online at: mmds./教学参考书
ReferencesData Mining: Concepts and Techniques, Jiawei Han and Micheline Kamber. Kaufmann Publishers, August 2000.
Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Addison-Wesley, 2005. ISBN: 0321321367.
Research papers from related conferences and journals (相关的研究论文及资料)教学方法
Approach理论教学内容
Lectures(3 hrs)
相似性查询(距离,相似度函数,精确查询技术:空间索引,倒排索引和相关的过滤技术)(4 hrs)
相似性查询技术(位置敏感哈希)(4 hrs)
分类技术(线性分类器 + k最近邻分类器 + 朴素贝叶斯分类器)(4 hrs)
分类技术(决策树分类器)+ 分类技术理论基础(泛化保证, 常见的错误)(4 hrs)
聚类技术(k-means,层次聚类技术,DBScan)(4 hrs)
关联规则(apriori和FP-growth)(4 hrs)
推荐系统(基于内容,协同过滤的推荐系统)(3 hrs)
推荐系统(基于矩阵分解的推荐系统 + Netflix竞赛得奖系统介绍)(3 hrs)
期末考试 (3 hrs)
Totally 36 hours. 布置作业
Assignments1 Weekly Written Assignments实验教学
Laboratory Sessions实验课时间
Lab Hours hours实验课地点
Lab Venue实验课方式
Lab Approach课外实验辅导
Additional Tutoring实验教学内容
实验平台
Platforms实战技能培养
Skill 备注
Note[若无其他补充说明,则删除本行!]总评成绩计算Course Assesent评分标准
GradingClass Participation1%Weekly Written Assignments40%Midterm Examination0%Final Examination50%Programming Assignments0%Total100%
课程教学大纲模板之填写说明:
软件学院的培养目标之一是"国际化",同时为便于我院与国外高校的合作交流,课程描述的每一项目均需提供英文描述,关键项目和易产生歧义的项目同时采用中,英文撰写.建议各位撰写人先参考几个国外高校的课程网站,以免英文专业术语出现太大偏差.
不同于其他非工科专业的课程描述,软件工程专业课程描述须给出每门课程实践环节的详细教学规格说明,譬如:课后作业(Written Assignments)与实验项目(Programming Assignments或Projects)的安排, 实验课的时间,地点和授课方式,以及TA课外辅导实验的安排等.独立设有实验课的课程,理论课与实验课合并为同一课程撰写单份课程描述.所有课程的课程描述必须足够细致,使得学院可据此估算每门课程的教师与TA合计教学成本(含理论课与实验课).
"课程编号"均采用"SE-"为前缀,后接3位阿拉伯数字(其中前1位表示开课年级,后2位表示序列号).课程描述撰写人首先起草课程编号,学院将统一编号课程简介,教学目标,主要Midterm Examination)或期末考试(Final Examination)是开卷考试,请在考试后面用括号注明"(Open Book)",对于数学基础课程或理论性较强的专业骨干课程,强烈建议安排期中考试,并将考试时间列在"理论教学内容"中.
凡无内容的栏目请不要留空,注明"无"或"None".
初,中,高"软件工程实训"课程的教学大纲采用类似,但不同的模板.
各位撰写人在起草所负责课程描述之前,请先参考以下4门课程的课程描述:线性代数,C语言程序设计,操作系统,编译原理.
- 4 -