Bài 2+: Perceptron – Viên gạch đầu tiên của mạng nơ ron
Mục tiêu bài học:
- Hiểu Perceptron là gì và tại sao nó quan trọng.
- Biết cách Perceptron xử lý dữ liệu đầu vào và đưa ra quyết định.
- Thực hành qua ví dụ đơn giản: đi học nhóm hay không.
1. Perceptron là gì?
Perceptron là mạng nơ ron đơn giản nhất, được giới thiệu vào năm 1958 bởi Frank Rosenblatt.
Nó chỉ có một lớp duy nhất, gồm:
- Các đầu vào: x1,x2,…,xn
- Các trọng số: w1,w2,…,wn
- Một bias
- Một hàm kích hoạt kiểu bật/tắt (step function)
2. Cách hoạt động
Perceptron thực hiện các bước sau:
- Nhân từng đầu vào với trọng số tương ứng
- Cộng tất cả lại + thêm bias
- Nếu tổng lớn hơn 0 → kết quả là 1 (bật)
Nếu tổng không lớn hơn 0 → kết quả là 0 (tắt)
Công thức:
\[ \text{Output} = \begin{cases} 1 & \text{nếu } \sum_{i=1}^{n} w_i x_i + \text{bias} > 0 \\ 0 & \text{ngược lại} \end{cases} \]3. Ví dụ minh họa: Có nên đi học nhóm không?
Giả sử bạn đang cân nhắc có nên đi học nhóm vào chiều nay hay không. Quyết định dựa vào:
Yếu tố | Giá trị (0 = Không, 1 = Có) |
---|---|
Có bài khó cần hỏi không? (x₁) | 1 |
Có bạn thân học chung không? (x₂) | 0 |
Chọn trọng số:
- w1=0.7 , w2=0.6 , bias = -0.5
Tính tổng:
\[ \text{Tổng} = (0.7 \cdot 1) + (0.6 \cdot 0) + (-0.5) = 0.7 – 0.5 = 0.2 \]Vì 0.2 > 0 → quyết định: Đi học nhóm
4. Giới hạn của Perceptron
Perceptron chỉ có thể xử lý các bài toán đơn giản, có thể phân chia bằng một đường thẳng (gọi là phân loại tuyến tính). Ví dụ:
- Phân biệt mèo và chó nếu có đặc điểm rõ ràng
- Phân loại điểm cao/thấp theo ngưỡng
Nhưng nó không xử lý được các bài toán phức tạp hơn, như:
- Phân biệt hình chữ X – vì không thể vẽ một đường thẳng để chia đúng
- Nhận diện chữ viết tay, hình ảnh phức tạp…
→ Chính vì thế, chúng ta cần mạng nhiều lớp
Kết luận
- Perceptron là nơ ron đơn giản nhất, nhưng là nền móng cho toàn bộ mạng nơ ron hiện đại.
- Nó hoạt động như một bộ lọc: nếu tổng > 0 → ra 1; ngược lại → ra 0.
- Dù còn hạn chế, Perceptron giúp ta hiểu rõ cơ chế ra quyết định của mạng nơ ron.