Câu hỏi
Ví dụ nào dưới đây thuộc ứng dụng của học tǎng cường? Select one: A. Dư đoán doanh số B. Dự báo thời tiết C. Phân đoạn khách hàng D. Phát triển trò chơi
Giải pháp
4.5
(217 Phiếu)
Thanh Hà
người xuất sắc · Hướng dẫn 8 năm
Trả lời
D
Giải thích
Học tăng cường (Reinforcement Learning) là một phương pháp học máy trong đó một agent học cách thực hiện các hành động trong một môi trường để tối đa hóa một hàm thưởng (reward function). Trong các ví dụ được đưa ra, "Phát triển trò chơi" là ứng dụng phổ biến nhất của học tăng cường. Trong phát triển trò chơi, agent có thể được thiết kế để học cách chơi trò chơi tốt hơn thông qua quá trình thử và sai, nhận được thưởng khi thực hiện các động作 đúng đắn và bị phạt khi thực hiện sai. Điều này giúp tạo ra các trò chơi có độ khó và độ đa dạng cao, cũng như khả năng thích nghi với các chiến lược mới. Các ví dụ khác như dự đoán doanh số, dự báo thời tiết, và phân đoán khách hàng thường không sử dụng học tăng cường như là phương pháp chính. Thay vào đó, chúng có thể sử dụng các phương pháp học máy khác như học có giám sát (supervised learning) hoặc học không có giám sát (unsupervised learning) tùy thuộc vào bài toán cụ thể.