机器学习实战(十) 发表于 2020-05-15 | 更新于 2020-05-31 | 分类于 机器学习实战 利用K-均值聚类算法对未标注数据分组聚类是一种无监督的学习,它将相似的对象归到同一个簇中,它有点像全自动分类。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好。K-means聚类算法,它可以发现k个不同的簇,且每个簇中心采用簇中所含值的均值计算而成。 簇识别(cluster iden ... 阅读全文 »
机器学习实战中的函数学习记录 发表于 2020-05-01 | 更新于 2020-06-13 | 分类于 机器学习实战 记录机器学习实战中遇到的函数1import numpy as np tile()tile(A, reps) tile函数的作用是让某个数组或矩阵A,以reps的维度重复,构造出新的数组,所以返回值也是个数组。1234a = array([0, 1])b = np.tile(a, 2)c = np.t ... 阅读全文 »
机器学习实战(九) 发表于 2020-05-01 | 更新于 2020-05-31 | 分类于 机器学习实战 数回归分类回归树 Classification And Regression Trees 分类回归树。该算法既可以用于回归还可以用于分类。 复杂数据的局部性建模数回归 优点:可以对复杂和线性的数据建模 缺点:结果不易理解 适用数据类型:数值型和标称型数据 第三章使用的树构建的算法是ID3。ID3的做 ... 阅读全文 »
机器学习实战(八) 发表于 2020-04-20 | 更新于 2020-04-30 | 分类于 机器学习实战 预测数值型数据:回归分类的目标变量是标称型数据,而回归是对连续性数据做出预测。 用线性回归找到最佳拟合直线线性回归 优点:结果易于理解,计算上不复杂 缺点:对非线性的数据拟合不好 适用数据类型:数值型和标称型数据 回归的目的是预测数值型的目标值。最直接的办法是依据输入写出一个目标值的计算公式。 Z ... 阅读全文 »
机器学习实战(七) 发表于 2020-04-07 | 更新于 2020-04-09 | 分类于 机器学习实战 利用AdaBoost元算法提高分类性能在做决定时,大家可能会吸取多个专家而不是一个人的意见,机器学习也有类似的算法,这就是元算法(meta-algorithm)。元算法是对其他算法进行组合的一种方式。 基于数据集多重抽样的分类器前面已经学习了五种不同的分类算法,它们各有优缺点,我们可以将不同的分类器 ... 阅读全文 »
机器学习实战(六) 发表于 2020-04-04 | 更新于 2020-04-06 | 分类于 机器学习实战 这一章的内容非常多,在神经网络大火前,SVM是最优秀的机器学习算法,尽管现在已经很少用了,但作为一本七年前的书还是很详细的讲解了,所以这里简单的记录下。 基于最大间隔分隔数据支持向量机 优点:泛化错误率低,计算开销不大,结果易理解 缺点:对参数调节和核函数选择敏感,原始分类器不加修改仅适用于处理二分 ... 阅读全文 »
机器学习实战(五) 发表于 2020-04-01 | 更新于 2020-04-04 | 分类于 机器学习实战 Logistic回归是一个最优化算法,比如如何在最短时间从A点到达B点? 回归:假设我们有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就叫做回归。 根据现有的数据对分类边界线建立回归公式,依次进行分类。这里的“回归”一次源于最佳拟合,表示要找到最佳拟合参数集。 L ... 阅读全文 »
机器学习实战(四) 发表于 2020-03-21 | 更新于 2020-03-24 | 分类于 机器学习实战 前两章的分类器只能给出分类结果,而不能给出概率,这一章将学习一个最简单的概率分类器,朴素贝叶斯分类器。之所以称为朴素,是因为整个形式化过程只做最原始,最简单的假设。 基于贝叶斯决策理论的分类方法朴素贝叶斯 优点:在数据较少的情况下仍然有效,可以处理多分类问题 缺点:对输入数据的准备方式较为敏感 适用 ... 阅读全文 »
机器学习实战(三) 发表于 2020-03-06 | 更新于 2020-03-15 | 分类于 机器学习实战 决策树的简介你是否玩过二十个问题的游戏,就是你在脑海中想某个事物,向你提问二十个问题推测出你想的东西。这个游戏的原理和决策树类似,下面是一个判断垃圾邮件的决策树。 决策树的构造决策树 优点:计算复杂度不高,输出的结果易于理解,对中间值的缺失不敏感,可以处理不相关特征的数据 缺点:可能会产生过度匹配 ... 阅读全文 »
Python虚拟环境的搭建 发表于 2020-02-19 | 更新于 2020-03-06 | 分类于 virtualenv 我使用的Ubuntu18已经自带了pyhon3.6,现在我想用pip安装一些其它的应用的版本和现有的有冲突,为了防止冲突,我需要另一个python环境。 python的安装这里因为是在Linux系统上,所以使用源码安装。PythonSource下载ptyhon3.8的源码 解压后进入Python-3 ... 阅读全文 »