项目说明

〇 知识目标 (1)掌握信息熵、条件熵、信息增益及信息增益比的含义。 (2)掌握决策树算法ID3、C4.5、CART 的优点。 (3)掌握正则项与稀疏解的概念。 (4)掌握朴素贝叶斯定理与公式。 (5)理解人工神经网络的含义。 (6)了解神经网络的正向及反向传播过程。 (7)掌握支持向量机、硬间隔支持向量机的含义。 (8)掌握马尔可夫链的应用。 (9)掌握非线性支持向量机的含义。 〇 能力目标 (1)能够应用决策树ID3、C4.5、CART 的算法。 (2)掌握正则项与稀疏解的概念。 (3)能够应用人工神经网络理论的算法。 (4)掌握朴素贝叶斯定理与公式。 (5)掌握硬间隔支持向量机的原理。 (6)掌握非线性支持向量机。 (7)能够应用马尔可夫链理论。 〇 素养目标 (1)培养学生处理大数据的理论、方法意识。 (2)培养学生处理大数据的数学思维。 (3)拓宽学生对大数据技术的应用领域。 〇 德技并修 大数据分析有助于找到问题的解决方案,如降低成本、节省时间并降低决策风险。 大数据越来越多地和人工智能关联起来。所谓人工智能,就是利用数学统计方法,统计 数据中的规律,然后利用这些统计规律进行自动化数据处理,使计算机表现出某种智能 的特性,而各种数学统计方法,就是大数据算法。 大数据算法的开发和使用需要高水平的数学、统计学、计算机科学等多学科知识, 需要掌握多种算法和技术,如机器学习、数据挖掘、自然语言处理等。同时,大数据算 法也需要大量的数据,以便于模型的训练和验证。因此,大数据算法的开发和使用需要 强大的计算资源和存储空间,以及高效的数据管理和处理系统。另外,大数据算法也面 临着各种挑战,如数据偏差、数据泄露、算法偏见等问题。因此,在开发和使用大数据 算法时,需要高度重视数据的质量和算法的透明度,以确保算法的准确性和公正性。 〇 项目说明 本项目包括9 个任务:决策树算法、聚类算法、朴素贝叶斯算法、K 近邻分类算法、 关联规则、逻辑回归、人工神经网络、支持向量机、马尔可夫链及自然语言处理等,使 学生掌握大数据分析的基本算法,包括分布式计算、并行计算和数据挖掘算法等。
Image