Bài 3: Mạng nơ ron học như thế nào? – Quá trình huấn luyện
Mục tiêu bài học:
- Hiểu khái niệm học từ dữ liệu trong mạng nơ ron.
- Biết vì sao mạng cần huấn luyện, và huấn luyện là gì.
- Làm quen với các khái niệm như hàm mất mát, cập nhật trọng số, và cách mạng “học” từ sai lầm.
- Ví dụ minh họa: phân biệt hình ảnh mèo và chó.
1. Máy tính “học” là sao?
Khi con người học, ta thử – sai – sửa để rút kinh nghiệm. Mạng nơ ron cũng vậy: nó bắt đầu với các trọng số ngẫu nhiên, thử đoán, nếu sai thì tự điều chỉnh để đoán tốt hơn lần sau.
Quá trình đó gọi là huấn luyện mạng nơ ron (training a neural network).
2. Học từ ví dụ
Giả sử bạn có 10 bức ảnh, mỗi ảnh được gắn nhãn:
- Ảnh 1: Mèo → Gán nhãn 0
- Ảnh 2: Chó → Gán nhãn 1
- …
Mỗi lần mạng xử lý một ảnh, nó sẽ đưa ra kết quả dự đoán (ví dụ: 0.3 – có thể hiểu là “có vẻ là mèo”).
So sánh với nhãn thật (ví dụ: đúng là “mèo” = 0), ta tính sai số → gọi là hàm mất mát (loss function).
3. Hàm mất mát là gì?
Hàm mất mát là cách đo mạng đã đoán sai bao nhiêu.
Ví dụ:
- Dự đoán: 0.3
- Nhãn đúng: 0
→ Mất mát = (0.3−0)^2=0.09
Mục tiêu của huấn luyện là giảm tổng sai số của tất cả các lần đoán.
4. Cập nhật trọng số – Mạng tự sửa sai
Sau mỗi lần đoán sai, mạng nơ ron sẽ tự điều chỉnh các trọng số để dự đoán tốt hơn vào lần sau. Quá trình điều chỉnh này được thực hiện bằng một kỹ thuật gọi là Lan truyền ngược (Backpropagation), kết hợp với thuật toán tối ưu như Gradient Descent.
Tuy nhiên, bạn chỉ cần hiểu ý tưởng đơn giản:
Mạng nhìn sai → Biết mình sai → Tự điều chỉnh để lần sau bớt sai hơn.
5. Ví dụ minh họa: Phân biệt mèo và chó
Giả sử mạng nơ ron được đưa cho:
- 100 ảnh mèo → nhãn = 0
- 100 ảnh chó → nhãn = 1
Mạng bắt đầu học:
- Ở đầu: đoán linh tinh
- Qua từng lần học: mạng điều chỉnh trọng số
- Sau nhiều lần: mạng nhận ra đặc điểm nào giống “mèo”, đặc điểm nào giống “chó” → đoán chính xác hơn
Cứ như vậy, mạng nơ ron dần học được cách phân biệt hai loài mà không cần lập trình sẵn quy tắc.
Kết luận
- Mạng nơ ron học từ ví dụ bằng cách đoán, tính sai số và tự điều chỉnh.
- Toàn bộ quá trình này gọi là huấn luyện mạng.
- Quá trình lặp lại hàng ngàn lần giúp mạng ngày càng chính xác và thông minh hơn.