纯numpy 实现简易回归网络 (前向传递、反向传递、更新参数)-python黑洞网

本站消息

站长简介/公众号

出租广告位,需要合作请联系站长

从新来过

1064

文章

893124

访问

+关注

分类

暂无分类

日期归档

2024-11(2)

纯numpy 实现简易回归网络 (前向传递、反向传递、更新参数)

发布于2020-02-27 09:20 阅读(1283) 评论(0) 点赞(5) 收藏(4)

文章目录

代码

./utils.py
./main.py

运行截图

觉得好就点个赞吧~

代码

./utils.py

import numpy as np


def fc_forward(x, w, b):
    """z = x @ w + b

    全连接层(full connect)的前向传播"""
    assert w.shape[0] == x.shape[1]
    assert w.shape[1] == b.shape[0]
    return np.matmul(x, w) + b


def fc_backward(x, w, z_grad):
    """z = x @ w + b

    全连接层的反向传播"""
    # x @ w = z
    # -> z.shape = x.shape[0], z.shape[1]
    assert z_grad.shape[0] == x.shape[0]
    assert z_grad.shape[1] == w.shape[1]

    x_grad = z_grad @ w.T
    w_grad = x.T @ z_grad / x.shape[0]  # 除去 batch_size
    b_grad = np.mean(z_grad, 0)

    return x_grad, w_grad, b_grad


def relu_forward(z):
    """a = relu(z)

    relu前向传播"""
    return z * (z > 0)


def relu_backward(z, a_grad):
    """a = relu(z)

    relu反向传播"""
    return a_grad * (z > 0)


def mse(y_true, y_pred):
    """loss = np.mean((y_true - y_pred) ** 2, axis=-1)

    均方误差

    :param y_true: shape = (batch_size, class_num)
    :param y_pred: shape = (batch_size, class_num)
    :return: shape = (batch_size,)"""
    assert y_true.shape == y_pred.shape
    return np.mean((y_true - y_pred) ** 2, axis=-1)


def mse_grad(y_true, y_pred):
    """grad = d_loss/d_y_pred = 2 * (y_true - y_pred) * -y_pred

    :param y_true: shape = (batch_size, class_num)
    :param y_pred: shape = (batch_size, class_num)
    :return: shape = (batch_size, class_num)"""

    assert y_true.shape == y_pred.shape
    return 2 * (y_pred - y_true)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64

./main.py

from utils import *
import numpy as np
import matplotlib.pyplot as plt

batch_size = 1000
lr = 1e-1

# 1. 准备数据
np.random.seed(0)
x = np.linspace(-1, 1, batch_size).reshape(batch_size, 1)
true = x ** 2 + 2 + np.random.randn(batch_size, 1) * 0.1  # y_true

# 2. 初始化权重与偏置
w1 = np.random.randn(1, 100) * 0.1
w2 = np.random.randn(100, 1) * 0.1
b1 = np.zeros((100,))
b2 = np.zeros((1,))

for i in range(501):
    # 1. forward
    z = fc_forward(x, w1, b1)  # (batch_size, 100)
    a = relu_forward(z)  # (batch_size, 100)
    pred = fc_forward(a, w2, b2)  # (batch_size, 1)

    # 2. loss
    loss = mse(true, pred)  # (batch_size,)

    # 3. backward
    pred_grad = mse_grad(true, pred)  # (batch_size, 10)
    a_grad, w2_grad, b2_grad = fc_backward(a, w2, pred_grad)  # (batch_size, 100), (100, 1), (1,)
    z_grad = relu_backward(z, a_grad)  # (batch_size, 100)
    _, w1_grad, b1_grad = fc_backward(x, w1, z_grad)  # (1, 100), (100,)

    # 4. update
    w1 -= lr * w1_grad  # (1, 100)
    w2 -= lr * w2_grad  # (100, 1)
    b1 -= lr * b1_grad  # (100,)
    b2 -= lr * b2_grad  # (1,)
    if i % 10 == 0:
        print(i, np.mean(loss))  # 500 0.012295234080318703
    if i % 100 == 0:
        plt.scatter(x, true, 5)
        plt.plot(x, pred)
        plt.show()

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45