Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất

Bài 3.1: Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất

Mục tiêu bài học

  • Giải thích rõ hàm mất mát (loss function) là gì, tại sao cần thiết.
  • Minh họa chi tiết từng bước học qua ví dụ: mạng học giải phương trình y=2x+1.
  • Giúp người học thấy được vai trò của sai số trong quá trình huấn luyện.

1. Ôn lại: Mạng nơ ron “giải phương trình”?

Ta muốn dạy mạng nơ ron học hàm số: y=2x+1

Mạng sẽ không biết công thức. Nó sẽ tự học ra biểu thức đó chỉ từ dữ liệu ví dụ.


2. Cấu trúc mạng đơn giản

Gọi x là đầu vào, mạng sẽ tạo ra dự đoán theo công thức:

2. Cấu trúc mạng đơn giản

Gọi xxx là đầu vào, mạng sẽ tạo ra dự đoán theo công thức:

\[\hat{y} = w \cdot x + b y^​=w⋅x+b \]

Trong đó:

  • w: trọng số (slope)
  • b: bias (điểm chặn)
  • y^​: đầu ra do mạng dự đoán
  • y: đầu ra đúng (theo hàm y=2x+1)

3. Dữ liệu huấn luyện

Ta cung cấp cho mạng 3 cặp giá trị (x,y):

xy=2x+1
13
25
37

4. Mạng bắt đầu học – Ví dụ chi tiết theo từng bước

Giả sử ban đầu:

  • w=1.0
  • b=0.0

Ta tính từng cặp dữ liệu và mất mát theo bảng:

STTxy (thật)y^=w⋅x+bSai số e=y^−ySai số bình phương e^2
1131.0⋅1+0=1.0 1.0−3=−2.0 4.00
2251.0⋅2+0=2.0 2.0−5=−3.09.00
3371.0⋅3+0=3.0 3.0−7=−4.016.00

Tính trung bình sai số bình phương (MSE):

\[ \text{MSE} = \frac{4.0 + 9.0 + 16.0}{3} = \frac{29.0}{3} \approx 9.67 \]

→ Đây là hàm mất mát của mạng tại thời điểm hiện tại.


5. Giảm mất mát bằng cách cải thiện dự đoán

Mạng sẽ cố điều chỉnh www, bbb để dự đoán tốt hơn → mất mát giảm.

Giả sử sau khi cập nhật, mạng có:

  • w=2.0
  • b=0.5

Tính lại:

STTxy thậty^=2.0x+0.5Sai số eSai số bình phương e^2
1132.5-0.50.25
2254.5-0.50.25
3376.5-0.50.25

MSE mới:

\[ \text{MSE} = \frac{0.25 + 0.25 + 0.25}{3} = 0.25 \]

Mất mát đã giảm rõ rệt từ 9.67 xuống còn 0.25!


6. Diễn giải dễ hiểu

So sánhÝ nghĩa
Ban đầuMạng dự đoán kém, sai số cao
Sau cập nhậtMạng tiến gần hàm đúng, sai số giảm
Nhìn sai số nhỏ lại→ mạng đang học đúng hướng

7. Kết luận

  • Hàm mất mát đo sai số giữa dự đoán và thực tế → càng nhỏ càng tốt.
  • Nhờ mất mát, mạng biết mình đang sai và tự điều chỉnh.
  • Đây là mục tiêu trung tâm trong quá trình huấn luyện.
  • Trong bài này, chúng ta thấy rõ mạng đang học hàm y=2x+1 như một học sinh học toán.

Comments are closed.