Bài 3.1: Hàm mất mát là gì? – Dạy mạng giải phương trình bậc nhất
Mục tiêu bài học
- Giải thích rõ hàm mất mát (loss function) là gì, tại sao cần thiết.
- Minh họa chi tiết từng bước học qua ví dụ: mạng học giải phương trình y=2x+1.
- Giúp người học thấy được vai trò của sai số trong quá trình huấn luyện.
1. Ôn lại: Mạng nơ ron “giải phương trình”?
Ta muốn dạy mạng nơ ron học hàm số: y=2x+1
Mạng sẽ không biết công thức. Nó sẽ tự học ra biểu thức đó chỉ từ dữ liệu ví dụ.
2. Cấu trúc mạng đơn giản
Gọi x là đầu vào, mạng sẽ tạo ra dự đoán theo công thức:
2. Cấu trúc mạng đơn giản
Gọi xxx là đầu vào, mạng sẽ tạo ra dự đoán theo công thức:
\[\hat{y} = w \cdot x + b y^=w⋅x+b \]Trong đó:
- w: trọng số (slope)
- b: bias (điểm chặn)
- y^: đầu ra do mạng dự đoán
- y: đầu ra đúng (theo hàm y=2x+1)
3. Dữ liệu huấn luyện
Ta cung cấp cho mạng 3 cặp giá trị (x,y):
x | y=2x+1 |
---|---|
1 | 3 |
2 | 5 |
3 | 7 |
4. Mạng bắt đầu học – Ví dụ chi tiết theo từng bước
Giả sử ban đầu:
- w=1.0
- b=0.0
Ta tính từng cặp dữ liệu và mất mát theo bảng:
STT | x | y (thật) | y^=w⋅x+b | Sai số e=y^−y | Sai số bình phương e^2 |
---|---|---|---|---|---|
1 | 1 | 3 | 1.0⋅1+0=1.0 | 1.0−3=−2.0 | 4.00 |
2 | 2 | 5 | 1.0⋅2+0=2.0 | 2.0−5=−3.0 | 9.00 |
3 | 3 | 7 | 1.0⋅3+0=3.0 | 3.0−7=−4.0 | 16.00 |
Tính trung bình sai số bình phương (MSE):
\[ \text{MSE} = \frac{4.0 + 9.0 + 16.0}{3} = \frac{29.0}{3} \approx 9.67 \]→ Đây là hàm mất mát của mạng tại thời điểm hiện tại.
5. Giảm mất mát bằng cách cải thiện dự đoán
Mạng sẽ cố điều chỉnh www, bbb để dự đoán tốt hơn → mất mát giảm.
Giả sử sau khi cập nhật, mạng có:
- w=2.0
- b=0.5
Tính lại:
STT | x | y thật | y^=2.0x+0.5 | Sai số e | Sai số bình phương e^2 |
---|---|---|---|---|---|
1 | 1 | 3 | 2.5 | -0.5 | 0.25 |
2 | 2 | 5 | 4.5 | -0.5 | 0.25 |
3 | 3 | 7 | 6.5 | -0.5 | 0.25 |
MSE mới:
\[ \text{MSE} = \frac{0.25 + 0.25 + 0.25}{3} = 0.25 \]→ Mất mát đã giảm rõ rệt từ 9.67 xuống còn 0.25!
6. Diễn giải dễ hiểu
So sánh | Ý nghĩa |
---|---|
Ban đầu | Mạng dự đoán kém, sai số cao |
Sau cập nhật | Mạng tiến gần hàm đúng, sai số giảm |
Nhìn sai số nhỏ lại | → mạng đang học đúng hướng |
7. Kết luận
- Hàm mất mát đo sai số giữa dự đoán và thực tế → càng nhỏ càng tốt.
- Nhờ mất mát, mạng biết mình đang sai và tự điều chỉnh.
- Đây là mục tiêu trung tâm trong quá trình huấn luyện.
- Trong bài này, chúng ta thấy rõ mạng đang học hàm y=2x+1 như một học sinh học toán.