项目说明
〇 知识目标
(1)掌握信息熵、条件熵、信息增益及信息增益比的含义。
(2)掌握决策树算法ID3、C4.5、CART 的优点。
(3)掌握正则项与稀疏解的概念。
(4)掌握朴素贝叶斯定理与公式。
(5)理解人工神经网络的含义。
(6)了解神经网络的正向及反向传播过程。
(7)掌握支持向量机、硬间隔支持向量机的含义。
(8)掌握马尔可夫链的应用。
(9)掌握非线性支持向量机的含义。
〇 能力目标
(1)能够应用决策树ID3、C4.5、CART 的算法。
(2)掌握正则项与稀疏解的概念。
(3)能够应用人工神经网络理论的算法。
(4)掌握朴素贝叶斯定理与公式。
(5)掌握硬间隔支持向量机的原理。
(6)掌握非线性支持向量机。
(7)能够应用马尔可夫链理论。
〇 素养目标
(1)培养学生处理大数据的理论、方法意识。
(2)培养学生处理大数据的数学思维。
(3)拓宽学生对大数据技术的应用领域。
〇 德技并修
大数据分析有助于找到问题的解决方案,如降低成本、节省时间并降低决策风险。
大数据越来越多地和人工智能关联起来。所谓人工智能,就是利用数学统计方法,统计
数据中的规律,然后利用这些统计规律进行自动化数据处理,使计算机表现出某种智能
的特性,而各种数学统计方法,就是大数据算法。
大数据算法的开发和使用需要高水平的数学、统计学、计算机科学等多学科知识,
需要掌握多种算法和技术,如机器学习、数据挖掘、自然语言处理等。同时,大数据算
法也需要大量的数据,以便于模型的训练和验证。因此,大数据算法的开发和使用需要
强大的计算资源和存储空间,以及高效的数据管理和处理系统。另外,大数据算法也面
临着各种挑战,如数据偏差、数据泄露、算法偏见等问题。因此,在开发和使用大数据
算法时,需要高度重视数据的质量和算法的透明度,以确保算法的准确性和公正性。
〇 项目说明
本项目包括9 个任务:决策树算法、聚类算法、朴素贝叶斯算法、K 近邻分类算法、
关联规则、逻辑回归、人工神经网络、支持向量机、马尔可夫链及自然语言处理等,使
学生掌握大数据分析的基本算法,包括分布式计算、并行计算和数据挖掘算法等。
