强烈建议你试试无所不能的chatGPT，快点击我

常用机器学习方法总结

阅读量：5166 次

发布时间：2019-06-13

本文共 2344 字，大约阅读时间需要 7 分钟。

1.决策树算法

　　决策树是一种树形分类结构，一棵决策树由内部结点和叶子结点构成，内部结点代表一个属性（或者一组属性），该结点的孩子代表这个属性的不同取值；叶子结点表示一个类标。决策树保证每一个实例都能被一条从根结点到叶子结点的路径覆盖，叶子结点就是这条实例对应的类别，遍历这条路径的过程就是对这条实例分类的过程。关于决策树的详细介绍，可以参考。

损失函数

　　假设决策树T的叶结点个数为|T|，t是树T的某个叶结点，该结点有

C (T) = \sum t = 1 | T | N t H t (T) = - \sum t = 1 | T

损失函数

　　参数

优化目标

　　在决策树的构造阶段，其优化目标是寻找最优的分裂属性，具体实现是最大化属性选择指标，包括信息增益、信息增益比率、基尼指数等，构造阶段用贪心策略得到局部最优的模型。

　　在剪枝阶段，其优化目标是最小化损失函数

m i n T C a (T)

　　剪枝阶段是一个全局优化的过程，如果把

2.线性回归

　　线性回归使用线性模型拟合因变量与目标变量的关系，是最简单的预测模型。

假设函数

　　

h θ (x) = θ T x = θ 0 x 0 + θ 1 x 1 + . . . + θ n x n

，其中

损失函数

　　

C (θ) = 1 2 m \sum i = 1 m ( h θ ( x ( i ) ) - y ( i ) ) 2

优化目标

　　选择合适的参数组

　　

m i n θ (C (θ))

优化实现

　　使用梯度下降法，不断地进行迭代，每一步的方向是负梯度方向：

　　

θ j = θ j - α \partial \partial θ j C o s t ( θ ) = θ j - α 1 m \sum i = 1 m ( h θ (

3.逻辑回归　　

　　逻辑回归于线性回归有着惊人的相似，却又有着本质的不同，线性回归的假设函数度量了一个线性模型对因变量和目标变量的拟合，即给定一个输入，通过一个线性变换得到一个输出，而逻辑回归的假设函数计算的是对于给定输入，其输出y=1的概率，但逻辑回归与线性回归在计算形式上很相似，常常让误解为他们仅仅是假设函数的不同。

假设函数

h θ (x) = g (θ T x) = g (θ 0 x 0 + θ 1 x 1 + . . . + θ n x n)

损失函数

　　这里的损失函数不再是线性回归时的求误差平方和，因为误差平方和不是参数

C (θ) = - 1 m [ \sum i = 1 m y ( i ) l o g ( h θ ( x ( i ) ) ) + ( 1 -

优化目标

　　

m i n θ (C (θ))

优化实现

　　使用梯度下降法，不断地进行迭代，每一步的方向是负梯度方向：

　　

θ j = θ j - α \partial \partial θ j C o s t ( θ ) = θ j - α 1 m \sum i = 1 m ( h θ (

注意到，在优化实现上，逻辑回归与线性回归的形式一样的，只是具体的假设函数不同。实际上，这只是一个巧合，巧合之处在于，对各自的损失函数求偏导数后，其梯度值恰好是假设函数与y的表达式，但线性回归与逻辑回归的本质是不同的。

3.BP神经网络

　　已经介绍了BP神经网络，这里只是从模型、策略、算法这三个层面来总结一下BP，模型就是指假设函数，策略则指优化目标，算法即指优化实现。

假设函数

　　神经网络的假设函数不是一个简单的公式，它是多个逻辑回归函数逐层迭代的结果，形式上可以写成如下：

　　

a (1) = x

　　

a (2) = g (W (1) a (1))

　　

a (i) = g (W (i - 1) a (i - 1))

　　

. . . .

　　

a (L) = g (W (L - 1) a (L - 1))

　　

h W (x) = a (L)

　　其中

损失函数

　　神经网络的损失函数跟逻辑回归非常类似，但是神经网络的输出单元可能有多个，需要在每个输出单元上做一个累加：

　　

C o s t (W) = - 1 m [ \sum i = 1 m \sum k = 1 K y ( i ) k l o g ( h θ (

　　其中K表示输出层神经单元的个数，m表示训练数据实例个数。

优化目标

　　各个算法的优化目标基本上都是寻求适当的参数，使得损失函数最小。

　　

m i n W (C (θ))

优化实现

　　BP神经网络，利用反向传播，逐层采样梯度下降。

4.k近邻

损失函数

　　knn损失函数为0-1损失函数，假设给定一个实例x，其K个最近邻训练实例点构成的集合是

　　

c o s t (f) = 1 k \sum x i \in N k ( x ) I ( y i \neq c j ) = 1 - 1 k \sum

优化目标

m i n c o s t == m i n 1 - 1 k \sum x i \in N k ( x ) I ( y i = c j ) = m a x

转载于:https://www.cnblogs.com/GarfieldEr007/p/5040009.html

你可能感兴趣的文章

js 正则表达式验证小数点后几位

箭头与点的区别

[华为]统计大写字母个数

CentOS安装rar及用法

浅谈UitextField值变化的实时监视

PHP原生文件上传（单文件多文件均可）简单案例

智能手机音频信息取证

倒计时计算

listView加载在Dialog里面

夺命雷公狗---memcache NO:05 分布式的内存对象缓存系统的配置

WP开发图片保存到独立存储并从独立存储中读取

TYVJ-P1864 守卫者的挑战题解

【福利】论机房如何关闭方正软件保护卡

Android自定义控件：动画类（六）----ValueAnimator高级进阶（一）

五一放假作业4.30 用正则表达式写一个计算器！去掉括号，计算式子结果！

Jzoj5455【NOIP2017提高A组冲刺11.6】拆网线

Android 聊天室（一）

web性能优化

用SugarORM快速开发需要同步和保存大量数据的Android互联网客户端

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-20 16:41:07 当前IP: 18.222.110.69 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我