23-04-2026
Chúc mừng Kiều Phương - sinh viên ngành An toàn thông tin - có bài báo khoa học được chấp nhận đăng tại Hội nghị khoa học quốc tế về Công nghệ Thông tin Thông minh - The 11th International Conference on Intelligent Information Technology (ICIIT 2026) tại Đà Nẵng, Việt Nam. Bài báo: “Checklist-Guided Reinforcement Learning for Adaptive SQL Injection Detection with Dynamic WAF Evasion”- Sinh viên thực hiện: Đinh Bạch Kiều Phương - ATTT2021- Giảng viên hướng dẫn: ThS. Ngô Khánh Khoa, ThS. Đỗ Thị Phương Uyên, ThS. Đỗ Hoàng Hiển, TS. Phan Thế Duy - Tóm tắt bài báo: SQL Injection (SQLi) remains a critical threat to web applications despite defensive mechanisms like WAF. Traditional tools rely on fixed payloads, limiting adaptability against obfuscated attacks. This paper proposes a checklist-integrated reinforcement learning framework that dynamically optimizes sqlmap configuration based on real-time feedback and discovered defense patterns. The framework comprises four core components: a Crawler for systematic reconnaissance, an RL agent that learns to configure sqlmap through Q-learning, Sqlmap for secure execution, and the target web application. The key innovation is encoding blocked keywords discovered during testing directly into the RL state space, enabling the agent to avoid redundant exploration of already-blocked patterns. Evaluated on SQLi MicroBenchmark (60 vulnerable and non-vulnerable SQL queries), the system achieves 53.3% true positive rate (16/30 vulnerable samples) with 904.9 average HTTP requests and 52.9 seconds average runtime in Feedback mode—a 60% reduction in requests and 64% improvement in runtime compared to sequential Sqlmap default. Perfect specificity (0% false positive rate) is maintained across 30 non-vulnerable samples. Payload analysis reveals that the agent learns diverse techniques including commentbased filtering bypass, parentheses escaping, time-based blind injection, and error-based exploitation. Results demonstrate that checklist-integrated RL reduces testing overhead while maintaining practical detection efficiency compared to traditional sequential scanning, and achieves competitive black-box performance without requiring database instrumentation. The approach offers practical value for automated security assessment in resource-constrained and time-sensitive penetration testing scenarios. - Tóm tắt bài báo (tiếng Việt): SQL Injection (SQLi) vẫn là một mối đe dọa nghiêm trọng đối với các ứng dụng web, ngay cả khi đã có các cơ chế phòng vệ như WAF. Các công cụ truyền thống thường dựa vào tập payload cố định, khiến khả năng thích ứng với các kỹ thuật né tránh ngày càng tinh vi bị hạn chế. Bài báo này đề xuất một phương pháp mới kết hợp checklist với học tăng cường (reinforcement learning), cho phép tối ưu hóa cấu hình của Sqlmap một cách linh hoạt dựa trên phản hồi thời gian thực và các mẫu phòng vệ được phát hiện trong quá trình kiểm thử. Hệ thống được xây dựng gồm bốn thành phần chính: bộ Crawler phục vụ trinh sát, tác nhân học tăng cường (RL agent) sử dụng Q-learning để điều chỉnh cấu hình Sqlmap, công cụ Sqlmap thực thi kiểm thử, và ứng dụng web mục tiêu. Điểm nổi bật của phương pháp là việc mã hóa các từ khóa bị chặn (blocked keywords) trực tiếp vào không gian trạng thái của RL, giúp tác nhân tránh lặp lại những thử nghiệm không hiệu quả và tối ưu hóa quá trình tìm kiếm lỗ hổng.Khi đánh giá trên bộ dữ liệu SQLi MicroBenchmark gồm 60 truy vấn (bao gồm cả có và không có lỗ hổng), hệ thống đạt tỷ lệ phát hiện đúng 53,3% (16/30 mẫu có lỗ hổng), với trung bình 904,9 request HTTP và thời gian chạy khoảng 52,9 giây trong chế độ Feedback. So với phương pháp quét tuần tự mặc định của Sqlmap, cách tiếp cận này giúp giảm 60% số lượng request và cải thiện 64% thời gian thực thi. Đồng thời, hệ thống vẫn duy trì độ chính xác tuyệt đối với 0% false positive trên các mẫu không có lỗ hổng. Phân tích các payload cho thấy tác nhân học được nhiều kỹ thuật đa dạng như vượt qua bộ lọc bằng comment, escape dấu ngoặc, khai thác dạng time-based blind injection và error-based injection. Kết quả cho thấy việc tích hợp checklist với học tăng cường không chỉ giảm đáng kể chi phí kiểm thử mà còn duy trì hiệu quả phát hiện trong môi trường black-box, không cần can thiệp vào cơ sở dữ liệu. Phương pháp này mang lại giá trị thực tiễn cao cho các bài toán đánh giá an ninh tự động, đặc biệt trong các kịch bản hạn chế tài nguyên và yêu cầu thời gian nhanh. - Thông tin Hội nghị ICIIT 2026:ICIIT 2026 (The 11th International Conference on Intelligent Information Technology) là hội nghị khoa học quốc tế về Công nghệ Thông tin Thông minh, dự kiến tổ chức tại Đà Nẵng từ ngày 05–08/03/2026. Hội nghị được đồng tổ chức bởi Đại học FPT, Swinburne Việt Nam và HKCBEES, với sự hỗ trợ của các tổ chức học thuật trong và ngoài nước. Các bài báo được chấp nhận có thể được xuất bản trong kỷ yếu hội nghị của ACM hoặc tạp chí quốc tế liên quan, được lưu trữ trong ACM Digital Library và lập chỉ mục bởi Ei Compendex và Scopus.Thông tin chi tiết tại: https://www.facebook.com/share/p/1CJ4FqTphG/ Đông Xanh - Cộng tác viên truyền thông Trường Đại học Công nghệ Thông tin