强烈建议你试试无所不能的chatGPT，快点击我

学习让机器学会学习-Meta Learning课程笔记-2

阅读量：4069 次

发布时间：2019-05-25

本文共 1355 字，大约阅读时间需要 4 分钟。

来源于李宏毅老师机器学习课程，笔记是其中meta learning部分，few-shot learning学习也可以观看此部分课程。

课程主页：

video:

bilibili：

Gradient Descent as LSTM

上一次讲到通过学习初始化参数的meta learning方法，那么是否有更多的方法呢？

20201009152830

每一次的update的，会很像RNN的time step，每一步训练都会更新参数，那么RNN是否可以用于meta learning呢？

那么RNN和lstm的原理是什么样的呢，这里先做了一些介绍，其实看图就让人回忆起来了。

详细原理可以参考：

LSTM由于加入了cell单元，相对于RNN会有更长期的记忆。具体原理下面会进行回顾

首先是输入向量z, 以及三个门（输入门、遗忘门、输出门）计算公式。

然后图中是lstm的输出： $c^t,h^t, y^t$ 的计算公式。

然后每一次都反复每个time step的步骤，就是LSTM的计算过程。

那么和meta learning会有什么关系呢？

梯度下降过程中，每个time step会通过梯度来更新参数 $\theta$ ，和LSTM中c很相似，那么LSTM中c是否也可以用 $\theta$ 来代替呢？

如图，将遗忘门 $z^f$ 置为全1的矩阵，将输入门 $z^i$ 所有元素置为meta learn的学习率。

实际过程中，当前time step的输入还可以引入更多东西（图中other），可以是当前参数 $\theta^{t-1}$ 的loss等。

同时， $z^f,z^i$ 是固定的，能否通过学习得到呢？即：

$z^i$ :自动学习给出适合当前的学习率。

$z^f$ 自动学习出做多少weight decay。 $z^f$ 是将之前的参数缩小，和weight decay一样的作用。

图上面是一般的lstm结构，下面是gradient descent中的lstm，对于初始参数 $\theta^0$ ，训练集中mini batch输入可以获得其梯度，然后更新参数的过程为：
$\theta^{t}=z^{f} \odot \theta^{t-1}+z^{i} \odot^{-\nabla_{\theta} l}$
同时每次的batch不一样，并且参数不一样，对应的梯度 $-\nabla_{\theta} l$ 也是不一样的（这里符号上没有做区别）。

图中就是一个训练数据集的三次参数update的过程，然后这个是“lstm”网络的前馈过程，然后使用训练数据，计算获得损失 $l(\theta^3)$ ，然后使用梯度更新“lstm”参数来使得损失最小。（这里有点套娃）

由于参数 $\theta$ 的数量巨大，不能直接输入“lstm”，所有会将所有维度的参数都复用一个“lstm”的cell。

Metric-based Approach

转载地址：http://jxaji.baihongyu.com/

你可能感兴趣的文章

Unix + OS AIX Crontab

my read_English

my ReadBook_zhulidianzishangwushi / dianzishangwushi

script cmd / Execute a system command

OS + Linux File nfs / ntfs / xfs / ext3 / ext4 / tmpfs / filemon recover lvm

Linux + Video cache

IBM Tivoli Omegamon

my read_animal / chicken

OS + Linux RedHat 5 Configuration / JDK / YUM

webServer fscs 0.1.1

IBM Technology Videos

my read_bureaucracy

Unix + OS IBM Aix Disk disk lvm / disk partition / disk mount / disk mon / File

OS + Linux Disk disk lvm / disk partition / disk mount / disk io

read_humor_international

my read_Country

OS + Linux File nfs / samba / rsync / inotify / smb / webdav

RedHat + OS CPU、MEM、DISK

project bbs_discuz

net TCP/IP / TIME_WAIT / tcpip / iperf / cain

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-20 02:47:13 当前IP: 18.223.43.117 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我