博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
学习让机器学会学习-Meta Learning课程笔记-2
阅读量:4069 次
发布时间:2019-05-25

本文共 1355 字,大约阅读时间需要 4 分钟。

来源于李宏毅老师机器学习课程,笔记是其中meta learning部分,few-shot learning学习也可以观看此部分课程。

课程主页:

video:

bilibili:

Gradient Descent as LSTM

上一次讲到通过学习初始化参数的meta learning方法,那么是否有更多的方法呢?

20201009152830

每一次的update的,会很像RNN的time step,每一步训练都会更新参数,那么RNN是否可以用于meta learning呢?

image-20201009173240813

那么RNN和lstm的原理是什么样的呢,这里先做了一些介绍,其实看图就让人回忆起来了。

详细原理可以参考:

image-20201009173250889

LSTM由于加入了cell单元,相对于RNN会有更长期的记忆。具体原理下面会进行回顾

image-20201009173308289

首先是输入向量z, 以及三个门(输入门、遗忘门、输出门)计算公式。

image-20201009173319624

然后图中是lstm的输出: c t , h t , y t c^t,h^t, y^t ct,ht,yt的计算公式。

image-20201009173340579

然后每一次都反复每个time step的步骤,就是LSTM的计算过程。

那么和meta learning会有什么关系呢?

image-20201009173350945

梯度下降过程中,每个time step会通过梯度来更新参数 θ \theta θ,和LSTM中c很相似,那么LSTM中c是否也可以用 θ \theta θ来代替呢?

如图,将遗忘门 z f z^f zf置为全1的矩阵,将输入门 z i z^i zi所有元素置为meta learn的学习率。

image-20201009173357809

实际过程中,当前time step的输入还可以引入更多东西(图中other),可以是当前参数 θ t − 1 \theta^{t-1} θt1的loss等。

同时, z f , z i z^f,z^i zf,zi是固定的,能否通过学习得到呢?即:

  • z i z^i zi:自动学习给出适合当前的学习率。
  • z f z^f zf自动学习出做多少weight decay。 z f z^f zf是将之前的参数缩小,和weight decay一样的作用。

image-20201009173412060

图上面是一般的lstm结构,下面是gradient descent中的lstm,对于初始参数 θ 0 \theta^0 θ0,训练集中mini batch输入可以获得其梯度,然后更新参数的过程为:

θ t = z f ⊙ θ t − 1 + z i ⊙ − ∇ θ l \theta^{t}=z^{f} \odot \theta^{t-1}+z^{i} \odot^{-\nabla_{\theta} l} θt=zfθt1+ziθl
同时每次的batch不一样,并且参数不一样,对应的梯度 − ∇ θ l -\nabla_{\theta} l θl也是不一样的(这里符号上没有做区别)。

图中就是一个训练数据集的三次参数update的过程,然后这个是“lstm”网络的前馈过程,然后使用训练数据,计算获得损失 l ( θ 3 ) l(\theta^3) l(θ3),然后使用梯度更新“lstm”参数来使得损失最小。(这里有点套娃)

image-20201009173418864

由于参数 θ \theta θ的数量巨大,不能直接输入“lstm”,所有会将所有维度的参数都复用一个“lstm”的cell。

image-20201009173423925

image-20201009173436971

image-20201009173446693

image-20201009173453021

Metric-based Approach

image-20201009173502324

image-20201009173509751

image-20201009174044199

image-20201009174052076

image-20201009174102910

image-20201009174108500

image-20201009174116976

image-20201009174124006

image-20201009174135383

image-20201009174144170

image-20201009174153053

image-20201009174205940

image-20201009174212053

image-20201009174217496

转载地址:http://jxaji.baihongyu.com/

你可能感兴趣的文章
Unix + OS AIX Crontab
查看>>
my read_English
查看>>
my ReadBook_zhulidianzishangwushi / dianzishangwushi
查看>>
script cmd / Execute a system command
查看>>
OS + Linux File nfs / ntfs / xfs / ext3 / ext4 / tmpfs / filemon recover lvm
查看>>
Linux + Video cache
查看>>
IBM Tivoli Omegamon
查看>>
my read_animal / chicken
查看>>
OS + Linux RedHat 5 Configuration / JDK / YUM
查看>>
webServer fscs 0.1.1
查看>>
IBM Technology Videos
查看>>
my read_bureaucracy
查看>>
Unix + OS IBM Aix Disk disk lvm / disk partition / disk mount / disk mon / File
查看>>
OS + Linux Disk disk lvm / disk partition / disk mount / disk io
查看>>
read_humor_international
查看>>
my read_Country
查看>>
OS + Linux File nfs / samba / rsync / inotify / smb / webdav
查看>>
RedHat + OS CPU、MEM、DISK
查看>>
project bbs_discuz
查看>>
net TCP/IP / TIME_WAIT / tcpip / iperf / cain
查看>>