Trong Tập 1 - Kiến thức Nền tảng về Học Máy - chúng tôi đề cập
đến các chủ đề sau:
Định nghĩa Học Máy, ứng dụng, các nhóm chính và những khái niệm
cơ bản trong các hệ thống Học Máy.
Các bước cơ bản trong một dự án Học Máy.
Học bằng cách khớp một mô hình theo dữ liệu.
Tối ưu hàm mất mát.
Quản lý, làm sạch và chuẩn bị dữ liệu.
Chọn và thiết kế đặc trưng.
Chọn mô hình và tinh chỉnh siêu tham số (Hyperparameter Tuning)
bằng kiểm định chéo (Cross-Validation).
Các thách thức trong Học Máy, đặc biệt là dưới khớp (Underfitting)
và quá khớp (Overfitting)(đánh đổi độ chệch/phương sai).
Các thuật toán học phổ biến nhất:
Hồi quy Tuyến tính và Đa thức (Linear and Polynomial Regression),
Hồi quy Logistic (Logistic Regression),
k-điểm gần nhất (k-Nearest Neighbors),
Máy Vector Hỗ trợ (Support Vector Machines),
Cây Quyết định (Decision Trees),
Rừng Ngẫunhiên (Random Forests),
và các phương pháp Ensemble.
Giảm chiều dữ liệu huấn luyện để đối phó với “lời nguyền số chiều”
(Curse of Dimensionality).
Các kỹ thuật học không giám sát (unsupervised learning) khác, bao gồm
Phân cụm (Clustering),
Ước lượng Mật độ (Density Estimation),
và Phát hiện Bất thường (Anomaly Detection).
Trong Tập 2 - Mạng nơ-ron Nhân tạo & Học sâu - chúng tôi đề cập
đến các chủ đề sau:
Mạng nơ-ron là gì và chúng hoạt động tốt ở những bài toán nào.
Xây dựng và huấn luyện các mạng nơ-ron sử dụng TensorFlow và Keras.
Các kiến trúc mạng nơ-ron quan trọng nhất:
Mạng truyền xuôi (Feedforward nets) cho dữ liệu dạng bảng (Tabular Data),
Mạng tích chập (Convolutional nets) cho thị giác máy tính,
Mạng hồi tiếp (Recurrent nets) và bộ nhớ ngắn hạn dài (Long Short-Term Memory - LSTM)
cho xử lý chuỗi,
Kiến trúc Mã hóa/Giải mã (encoder/decoders) và Transformers cho
xử lý ngôn ngữ tự nhiên,
Các bộ tự mã hóa (Autoencoder) và mạng đối sinh (GAN) để học các mô hình sinh
(Generative learning).
Các kỹ thuật huấn luyện mạng Học Sâu.
Cách xây dựng một tác tử (agent) (ví dụ như bot trong trò chơi) có thể học các chiến lược
tốt thông qua quá trình thử và sai (Trial and Error) trong Học tăng cường (Reinforcement
Learning).
Nạp và tiền xử lý hiệu quả lượng dữ liệu lớn.
Huấn luyện và triển khai các mô hình TensorFlow ở quy mô lớn.
Phần đầu chủ yếu dựa trên Scikit-Learn, và phần sau sẽ sử dụng TensorFlow và Keras.