Skip to content
  • Tiếng Việt
  • English

Giới thiệu sách “Khai thác dữ liệu” (Data Mining)

Giáo trình khai thác dữ liệu (Data Mining) của tác giả PGS.TS Đỗ Phúc, nhà xuất bản Đại học Quốc gia Tp.HCM phát hành năm 2022, sách bao gồm các bài giảng về môn học khai thác dữ liệu của tác giả sử dụng để giảng dạy cho sinh viên và học viên sau đại học tại trường Đại học Công nghệ Thông tin, ĐHQG-HCM từ năm 2010 đến nay.

Quyển giáo trình gồm có 9 chương: 

- Chương 1: Tổng quan về khai thác dữ liệu 

- Chương 2: Tập phổ biến và luật kết hợp 

- Chương 3: Dãy phổ biến 

- Chương 4: Phân lớp dữ liệu 

- Chương 5: Lý thuyết tập thô 

- Chương 6: Gom cụm dữ liệu 

- Chương 7: Khai thác văn bản

- Chương 8: Khai thác dữ liệu lớn bằng thư viện Scikit-learn và Apache Spark

- Chương 9: Dùng phần mềm Weka để khai thác dữ liệu

Sách bao gồm các phần căn bản và nâng cao cho các học viên Cao học và Nghiên cứu sinh. Với sự xuất hiện của thư viện Scikit-learn và thư viện Apache Spark, chúng ta có thể tiến hành khai thác dữ liệu bằng cách sử dụng các hàm của thư viện. Trình bày các thư viện này trong chương 8. Đặc biệt là thư viện Apache Spark để khai thác dữ liệu lớn bằng khung phân tán. Trong chương 8 tác giả dùng ngôn ngữ lập trình Python với thư viện Scikit-learn và thư viện PySpark để thực hiện các tác vụ cơ bản của khai thác dữ liệu như tìm luật kết hợp, phân lớp gom cụm dữ liệu và gom cụm dữ liệu lớn trên nền tính toán phân tán Apache Spark. 

Sách được biên soạn dựa trên các tài liệu tham khảo nổi tiếng và các bài báo về Khai thác dữ liệu đã công bố. Các tài liệu này được liệt kê trong phần tài liệu tham khảo.

Sách dự kiến sẽ phục vụ bạn đọc từ đầu học kì 1 năm học 2022-2023.

Thông tin chi tiết: https://www.facebook.com/LibUIT.Fanpage/posts

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin