Tích hợp máy học với các phương pháp thống kê giúp tăng cường các mô hình dự đoán nguy bệnh tật
Mới đây, các nhà khoa học của Trường Đại học Bắc Kinh đã tiến hành đánh giá có hệ thống các nghiên cứu về việc tích hợp máy học vào các phương pháp thống kê trong các mô hình dự đoán bệnh tật.
Các nhà nghiên cứu Trường Đại học Bắc Kinh đã tiến hành đánh giá có hệ thống toàn diện về việc tích hợp máy học vào các phương pháp thống kê cho các mô hình dự đoán rủi ro bệnh tật, làm sáng tỏ tiềm năng của các mô hình tích hợp này trong chẩn đoán lâm sàng và các hoạt động sàng lọc. Nghiên cứu do Giáo sư Feng Sun, Khoa Dịch tễ học và Thống kê sinh học, Trường Đại học Y tế Công cộng, Đại học Bắc Kinh dẫn đầu đã được công bố trên tạp chí Health Data Science.
Dự đoán nguy cơ bệnh tật rất quan trọng đối với việc chẩn đoán sớm và đưa ra các quyết định lâm sàng hiệu quả. Tuy nhiên, các mô hình thống kê truyền thống, chẳng hạn như hồi quy logistic và mô hình hồi quy Cox ước tính tỷ lệ nguy hiểm, thường gặp phải những hạn chế do các giả định cơ bản không phải lúc nào cũng đúng trong thực tế.
Trong khi đó, các phương pháp máy học, mặc dù có tính linh hoạt và khả năng xử lý dữ liệu phức tạp và không có cấu trúc, nhưng vẫn chưa chứng minh được hiệu suất vượt trội hơn so với các mô hình truyền thống trong một số trường hợp nhất định. Để giải quyết những thách thức này, việc tích hợp máy học với các phương pháp thống kê truyền thống sẽ có thể cung cấp các mô hình dự đoán mạnh mẽ và có tính chính xác hơn.
Đánh giá có hệ thống đã phân tích nhiều chiến lược tích hợp khác nhau cho các mô hình phân loại và hồi quy, bao gồm các quy tắc nổi tiếng như majority voting, weighted voting, stacking và lựa chọn mô hình, trên cơ sở liệu các dự đoán từ phương pháp thống kê và học máy có mâu thuẫn, không đồng nhất hay không. Nghiên cứu này phát hiện ra rằng, các mô hình tích hợp thường cho kết quả dự đoán vượt trội hơn cả các phương pháp thống kê và máy học sử dụng riêng lẻ. Ví dụ, stacking đặc biệt hiệu quả đối với các mô hình liên quan đến hơn 100 yếu tố dự báo, vì nó cho phép kết hợp các điểm mạnh của các mô hình khác nhau trong khi giảm thiểu các điểm yếu.
Giáo sư Feng Sun, nhà nghiên cứu cao cấp của nghiên cứu, cho biết: "Những phát hiện của chúng tôi cho thấy rằng việc tích hợp máy học vào các phương pháp thống kê truyền thống để dự đoán nguy cơ bệnh tật có thể cung cấp các mô hình chính xác và tổng quát hơn. Phương pháp tiếp cận này có tiềm năng nâng cao khả năng ra quyết định lâm sàng và cải thiện kết quả cho bệnh nhân".
Trong tương lai, nhóm nghiên cứu tổ chức thực hiện kế hoạch xác minh và cải thiện thêm các phương pháp tích hợp hiện có và phát triển các công cụ toàn diện để có thể đánh giá các mô hình này trong nhiều bối cảnh lâm sàng khác nhau. Mục tiêu cuối cùng là thiết lập các mô hình tích hợp hiệu quả và tổng quát hơn phù hợp với các tình huống khác nhau, cuối cùng là thúc đẩy các hoạt động chẩn đoán và sàng lọc lâm sàng.