Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất |TiiLaZ

Bài 3.1: Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất

Mục tiêu bài học

Giải thích rõ hàm mất mát (loss function) là gì, tại sao cần thiết.
Minh họa chi tiết từng bước học qua ví dụ: mạng học giải phương trình y=2x+1.
Giúp người học thấy được vai trò của sai số trong quá trình huấn luyện.

1. Ôn lại: Mạng nơ ron “giải phương trình”?

Ta muốn dạy mạng nơ ron học hàm số: y=2x+1

Mạng sẽ không biết công thức. Nó sẽ tự học ra biểu thức đó chỉ từ dữ liệu ví dụ.

2. Cấu trúc mạng đơn giản

Gọi x là đầu vào, mạng sẽ tạo ra dự đoán theo công thức:

2. Cấu trúc mạng đơn giản

Gọi xxx là đầu vào, mạng sẽ tạo ra dự đoán theo công thức:

\[\hat{y} = w \cdot x + b y^=w⋅x+b \]

Trong đó:

w: trọng số (slope)
b: bias (điểm chặn)
y^: đầu ra do mạng dự đoán
y: đầu ra đúng (theo hàm y=2x+1)

3. Dữ liệu huấn luyện

Ta cung cấp cho mạng 3 cặp giá trị (x,y):

x	y=2x+1
1	3
2	5
3	7

4. Mạng bắt đầu học – Ví dụ chi tiết theo từng bước

Giả sử ban đầu:

w=1.0
b=0.0

Ta tính từng cặp dữ liệu và mất mát theo bảng:

STT	x	y (thật)	y^=w⋅x+b	Sai số e=y^−y	Sai số bình phương e^2
1	1	3	1.0⋅1+0=1.0	1.0−3=−2.0	4.00
2	2	5	1.0⋅2+0=2.0	2.0−5=−3.0	9.00
3	3	7	1.0⋅3+0=3.0	3.0−7=−4.0	16.00

Tính trung bình sai số bình phương (MSE):

\[ \text{MSE} = \frac{4.0 + 9.0 + 16.0}{3} = \frac{29.0}{3} \approx 9.67 \]

→ Đây là hàm mất mát của mạng tại thời điểm hiện tại.

5. Giảm mất mát bằng cách cải thiện dự đoán

Mạng sẽ cố điều chỉnh www, bbb để dự đoán tốt hơn → mất mát giảm.

Giả sử sau khi cập nhật, mạng có:

w=2.0
b=0.5

Tính lại:

STT	x	y thật	y^=2.0x+0.5	Sai số e	Sai số bình phương e^2
1	1	3	2.5	-0.5	0.25
2	2	5	4.5	-0.5	0.25
3	3	7	6.5	-0.5	0.25

MSE mới:

\[ \text{MSE} = \frac{0.25 + 0.25 + 0.25}{3} = 0.25 \]

→ Mất mát đã giảm rõ rệt từ 9.67 xuống còn 0.25!

6. Diễn giải dễ hiểu

So sánh	Ý nghĩa
Ban đầu	Mạng dự đoán kém, sai số cao
Sau cập nhật	Mạng tiến gần hàm đúng, sai số giảm
Nhìn sai số nhỏ lại	→ mạng đang học đúng hướng

7. Kết luận

Hàm mất mát đo sai số giữa dự đoán và thực tế → càng nhỏ càng tốt.
Nhờ mất mát, mạng biết mình đang sai và tự điều chỉnh.
Đây là mục tiêu trung tâm trong quá trình huấn luyện.
Trong bài này, chúng ta thấy rõ mạng đang học hàm y=2x+1 như một học sinh học toán.

Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất

Bài 3.1: Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất

Mục tiêu bài học

1. Ôn lại: Mạng nơ ron “giải phương trình”?

2. Cấu trúc mạng đơn giản

2. Cấu trúc mạng đơn giản

3. Dữ liệu huấn luyện

4. Mạng bắt đầu học – Ví dụ chi tiết theo từng bước

Giả sử ban đầu:

Ta tính từng cặp dữ liệu và mất mát theo bảng:

Tính trung bình sai số bình phương (MSE):

5. Giảm mất mát bằng cách cải thiện dự đoán

Giả sử sau khi cập nhật, mạng có:

MSE mới:

6. Diễn giải dễ hiểu

7. Kết luận

Bài mới

Gradient Là Gì? Cách Mạng Nơ Ron Dùng Gradient Để Học

Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất

Mạng Nơ Ron Học Như Thế Nào?

Bài liên quan

Gradient Là Gì? Cách Mạng Nơ Ron Dùng Gradient Để Học

Mạng Nơ Ron Học Như Thế Nào?

Perceptron – Viên gạch đầu tiên của mạng nơ ron