tech share
  • tech-share
  • Engineering
    • 登录鉴权
    • SSR 页面路由
    • npm 版本号
    • 缓存
    • 数据库容灾
    • 动态效果导出 gif
    • Chrome-devtools
    • C 端 H5 性能优化
    • Docker
    • Monorepo 最佳实践
    • 技术架构演化
    • 项目规范最佳实践
    • snowpack
    • 静态资源重试
    • 前端页面渲染分析
    • Git
    • 前端重构
    • 微前端
    • 项目依赖分析
    • 前端监控原理
    • webpack
    • BS 架构与 CS 架构
    • HTTPS
    • package-lock.json 生成逻辑
    • SVN(Subversion)
    • 数据库分类
    • gulp
    • 前端架构
    • Bundle & Bundless
    • 控制反转 IoC
  • JavaScript
    • Javascript 性能
    • JavaScript 原型(2) - 原型与原型链
    • JavaScript 原型(1) - 构造函数
    • JavaScript - Promise
    • ES6 解构赋值
    • 前端离线化
    • Proxy
    • Object.defineProperty()简介
    • TypeScript
  • MachineLearning
    • GAN生成对抗网络
    • 虚拟对抗训练
    • 深度度量学习
    • 原型网络
    • PyTorch优化器
    • 隐马尔可夫模型2
    • Shapley Value 算法
    • Embarassingly Autoencoder算法
    • AutoRec算法及其后续发展
    • 深度学习常用激活函数
    • 序列预测ConvTran算法
    • 联邦学习
    • 深度学习推荐系统算法整理
    • 隐马尔可夫模型
    • 黎曼优化方法
    • FM算法
    • 机器学习常见评价指标
    • VAE算法
    • Adam优化器详解
    • Transformer算法
    • Self-attention 推荐算法
    • CNN 卷积神经网络
    • 图嵌入
    • 集成学习算法
    • RecBole开源框架
    • NCE-PLRec
    • 深度学习初始化方法
    • RNN循环神经网络
    • PyTorch数据处理
    • PyTorch安装和基本操作
    • XGBoost算法
    • NCF算法与简单MF的对比
    • 计算最佳传输
  • CSS
    • 什么是BFC
    • 纯CSS实现可拖动布局
    • 滚动穿透解决方案
  • React
    • React 生命周期
    • React Ref
    • React Hooks
    • SWR
    • React 数据流
    • React 函数式组件和类组件的区别
  • 可视化
    • OffscreenCanvas
    • Echarts 平滑曲线端点为什么不平滑
    • 颜色空间
    • 词云布局解析
    • 3D 数学基础
    • Canvas 图片处理
    • GLGL ES
    • WebGL 中绘制直线
    • Graphics API
    • 现代计算机图形学基础
    • Canvas 灰度
  • Vue
    • Vue2.x全局挂载整理
    • Vue2.6.x源码阅读
      • Vue2.6.x源码阅读 - 2.目录结构分析
      • Vue2.6.x源码阅读 - 4.源码阅读-platform
      • Vue2.6.x源码阅读 - 1.准备工作
      • Vue2.6.x源码阅读 - 5.源码阅读-core-Vue构造函数
      • Vue2.6.x源码阅读 - 7.源码阅读-core-响应式原理
      • Vue2.6.x源码阅读 - 3.源码阅读-shared
      • Vue2.6.x源码阅读 - 6.源码阅读-core-组件挂载
    • Vue + TypeScript Web应用实践
    • Vue2.x指令
    • nextTick()的使用
    • vue-cli2.x 的使用与项目结构分析
    • Vue响应式原理及总结
    • VueX的使用
    • Electron-Vue + Python 桌面应用实践
    • Vite
    • Vue组件通信整理
    • 记录一个问题的探索过程
  • Linux
    • memcg
  • GameDev
    • 游戏中的几种投影视图
    • 从零开始写软渲染器06
    • 从零开始写软渲染器05
    • 从零开始写软渲染器04
    • 从零开始写软渲染器03
    • 从零开始写软渲染器02
    • 从零开始写软渲染器01
    • 从零开始写软渲染器00
    • 现代游戏常用的几种寻路方案(一)
  • Node
    • NPM Dependency
    • Node 优势
    • Node Stream
    • Node 模块系统
  • HTML
    • html5语义与结构元素
  • 跨端
    • Flutter 介绍
  • Golang
    • Golang 基础
  • AR
    • SceneKit
由 GitBook 提供支持
在本页
  • 三个基本问题
  • Decoding问题
  • learning
  • HMM的应用

这有帮助吗?

  1. MachineLearning

隐马尔可夫模型2

上一页PyTorch优化器下一页Shapley Value 算法

最后更新于4年前

这有帮助吗?

本篇,我们将介绍隐马尔可夫模型其余两种基本问题和算法,并介绍HMM在实际中的应用方法。

三个基本问题

Decoding问题

问题2:给定一个观测值序列O,一个模型λ=(π, A, B),如何选择一个最符合观测序列的状态序列?

解决这个问题的算法被称为Viterbi算法。和前向后向算法类似,该算法也使用到了动态规划的思想。

首先定义一个变量δ

这个变量的含义是,到时间t为止,沿着状态序列i产生出观测序列O的最大概率。

遵循这个变量,我们可以从t=0开始逐步迭代,直到得到产生完整观测序列的最优状态序列。如下图所示。

其中初始化阶段就是各个状态的初始概率乘上bi(o1),然后在递归过程中,计算从t-1的各种概率转移到当前N种状态时生成i状态的各种可能性的最大值。

另外一个变量则是用于记录在这个过程中得到最大值的那个j值,便于最后路径回溯时进行遍历。

最后当t=T时,逐个检查路径种最大可能性的状态,即可得到一条完整的状态序列。

事实上Viterbi算法在各种最短路径问题中也有一定应用。

learning

问题3:给定一个观测序列O,如何调整模型的参数(π, A, B),使得P(O|λ)最大?

解决这个问题用到的算法是Baum-Welch算法,其实就是经典的EM算法(Expectation-Maximization algorithm)的一种变体。

EM算法适用于模型存在隐变量的场景。例如现有200个人的身高样本,需要我们估计一个模型p(z)的参数z,身高和人的性别之间的关系。如果我们知道200个人各自的性别,那么可以用最大似然估计的方法来进行参数估计。但如果性别是一个隐藏变量,我们就无法进行估计。

隐马尔可夫链的问题3也是一样。如果我们清楚的知道隐状态序列,那么我们可以很自然地使用参数估计来估算这里的参数π, A, B。

于是我们使用EM算法,先对模型的隐变量的期望做一个估计,再将这个估计当作隐变量的实际值进行最大似然估计。这两个步骤交替进行,最后得到比较符合需要的结果。其步骤如下:

  1. 选择参数初值θ

  2. E步:确定Q函数。Q=ΣlogP(Y,Z|θ)log(Z|Y,θi),其中Y是观测值,Z是隐变量

  3. M步:估计使得Q函数最大的θ值,作为θ(i+1)

  4. 重复迭代直到参数θ收敛

将hmm场景中的参数代入Q函数式子,如下所示:

然后遵循步骤,在M步骤中对π, A, B分别进行拉格朗日乘子法估计即可。我们定义gamma为:

此处的数学推导需要一定功底。我们在下次专门介绍EM等算法时做详细介绍。

HMM的应用

HMM理论上可以用于一切有关时序的机器学习问题中,例如语音识别、NLP、推荐系统中。在这些问题中只需要找好对应的观测序列,隐藏状态即可。

例如推荐系统中,观测序列为用户对物品点击,隐藏状态为用户对物品的实际喜好。

可解出A矩阵为:

viterbi delta
viterbi recursion
hmm Q function
hmm gamma
hmm a