Sốt rét vẫn là một thách thức sức khỏe toàn cầu nghiêm trọng, đặc biệt ở các vùng nhiệt đới và cận nhiệt đới. Mặc dù các phương pháp chẩn đoán truyền thống có hiệu quả, chúng ta vẫn đối mặt với một số hạn chế liên quan đến độ chính xác, tốn thời gian và công sức làm việc thủ công.
Nghiên cứu này đề xuất một khuôn khổ chẩn đoán tự động, tiên tiến để phát hiện bệnh sốt rét bằng cách sử dụng kiến trúc đa mô hình tích hợp các kỹ thuật học sâu (deep learning) và học máy (machine learning). Khung này áp dụng phương pháp học chuyển giao (transfer learning) tích hợp các mô hình ResNet 50, VGG16, và DenseNet-201 để trích xuất đặc trưng. Tiếp theo là quá trình hợp nhất đặc trưng và giảm chiều dữ liệu thông qua phương pháp phân tích thành phần chính (principal component analysis). Một cơ chế lai (hybrid) kết hợp giữa máy véc-tơ hỗ trợ (support vector machine) và mạng bộ nhớ dài-ngắn (long short-term memory) được sử dụng để phân loại. Một cơ chế biểu quyết theo đa số (majority voting) được dùng để tổng hợp kết quả đầu ra từ tất cả các mô hình nhằm nâng cao độ tin cậy của dự đoán.
Phương pháp này đã được kiểm chứng trên một bộ dữ liệu công khai bao gồm 27.558 hình ảnh phết máu mỏng quan sát dưới kính hiển vi. Kết quả cho thấy hiệu suất vượt trội, đạt độ chính xác 96.47%, độ nhạy 96.03%, độ đặc hiệu 96.90%, độ chuẩn xác 96.88% và chỉ số F1-score là 96.45% khi sử dụng mô hình tổ hợp biểu quyết theo đa số. Phân tích so sánh cho thấy những tiến bộ của khung này so với các phương pháp hiện có về độ tin cậy trong chẩn đoán và hiệu quả tính toán. Công trình này nhấn mạnh tiềm năng của các giải pháp dựa trên trí tuệ nhân tạo (AI) trong việc thúc đẩy chẩn đoán bệnh sốt rét và đặt nền tảng cho các ứng dụng trong những bệnh lây truyền qua đường máu khác.
Giải thích thuật ngữ
Deep Learning:Học sâu, là một lĩnh vực con của Machine Learning (Học máy), cốt lõi của nó là sử dụng các mạng nơ-ron nhân tạo có nhiều lớp (deep neural networks) để máy tính có thể tự động học hỏi và trích xuất các thông tin hữu ích từ một lượng lớn dữ liệu. Hãy tưởng tượng bộ não con người có rất nhiều tế bào thần kinh liên kết với nhau thành nhiều lớp để xử lý thông tin. Deep Learning hoạt động theo cách tương tự, dữ liệu hình ảnh, âm thanh, văn bản,… được đưa vào lớp đầu tiên của mạng nơ-ron. Mỗi lớp sau đó sẽ xử lý đầu ra của lớp trước đó, dần dần nhận diện ra những đặc điểm ngày càng phức tạp và trừu tượng hơn.
Lớp đầu tiên có thể chỉ nhận diện được các chi tiết đơn giản như các cạnh, góc hoặc màu sắc trong một bức ảnh;Các lớp tiếp theo sẽ kết hợp những chi tiết này để nhận ra các bộ phận phức tạp hơn như mắt, mũi, tai; Lớp cuối cùng có thể tổng hợp tất cả thông tin để kết luận rằng đó là khuôn mặt của một người cụ thể.
Feature Fusion:Kết hợp đặc trưng(hoặc hợp nhất đặc trưng) là kỹ thuật kết hợp thông tin đặc trưng từ các nguồn khác nhau hoặc từ các giai đoạn xử lý khác nhau để tạo ra một bộ đặc trưng duy nhất, mạnh mẽ và giàu thông tin hơn.Trong Deep Learning, các lớp khác nhau của mạng nơ-ron sẽ học được những loại đặc trưng khác nhau:
- Các lớp nông (gần đầu vào) học được các đặc trưng ở mức độ thấp, chi tiết như kết cấu, màu sắc, các cạnh. Những đặc trưng này rất tốt cho việc xác định vị trí chính xác của đối tượng;
- Các lớp sâu (gần đầu ra) học được các đặc trưng ở mức độ cao, mang tính ngữ nghĩa như hình dạng tổng thể của một vật thể và những đặc trưng này giúp xác định đối tượng đó là gì.
- Kết hợp đặc trưng chính là quá trình "trộn" các đặc trưng ở các cấp độ này lại với nhau, thay vì chỉ dựa vào các đặc trưng ở lớp cuối cùng, mô hình sẽ kết hợp cả thông tin chi tiết từ các lớp đầu và thông tin ngữ nghĩa từ các lớp sâu.
Transfer Learning:Học chuyển giao là một kỹ thuật trong học máy, trong đó một mô hình đã được huấn luyện để thực hiện một tác vụ sẽ được tái sử dụng làm điểm khởi đầu để huấn luyện một mô hình cho một tác vụ thứ hai nhưng có liên quan.
Dimensionality reduction:Giảm chiều dữ liệulà kỹ thuật biến đổi dữ liệu từ không gian có số chiều (số thuộc tính/đặc trưng) cao xuống không gian có số chiều thấp hơn, nhưng vẫn cố gắng giữ lại những thông tin quan trọng và cốt lõi nhất của dữ liệu gốc.
GIỚI THIỆU
Đánh giá trên hồng cầu (Red blood cell - RBC) là một công cụ chẩn đoán quan trọng đối với nhiều loại bệnh, bao gồm thiếu máu, Thalassemia và sốt rét¹⁻³. Khi các đặc điểm hình thái của hồng cầu bị thay đổi, sự thay đổi này có thể là dấu hiệu của việc nhiễm ký sinh trùng, ví dụ như bệnh sốt rét. Thông thường, các bệnh về máu được chẩn đoán dựa trên việc kiểm tra mẫu máu. Tuy nhiên, hình ảnh dưới kính hiển vi đóng một vai trò then chốt trong việc chẩn đoán các bệnh lý này. Việc kết hợp đếm số lượng hồng cầu và kiểm tra sự thay đổi về hình thái của tế bào có thể mang lại một chẩn đoán toàn diện hơn.
Sốt rét là một thách thức sức khỏe toàn cầu gây ra các ca tử vong, đặc biệt là ở trẻ em nhỏ và phụ nữ mang thai. Đây là một bệnh do muỗi truyền, phổ biến rộng rãi ở các vùng nhiệt đới và cận nhiệt đới. Nguyên nhân phổ biến gây bệnh là do ký sinh trùng Plasmodiumspp. lây nhiễm sang người thông qua muỗi cái Anopheles spp. Vào năm 2022, Tổ chức Y tế Thế giới (TCYTTG) báo cáo rằng 96% các ca mắc sốt rét trên toàn cầu được ghi nhận tại 29 quốc gia. Ước tính đã có 249 triệu ca mắc sốt rét, với tần suất là 58 ca trên 1000 người có nguy cơ cao⁷. Tại châu Phi, các ca mắc sốt rét chiếm 90% tổng số ca trên toàn cầu và 92% số ca tử vong liên quan đến sốt rét⁸.
Điển hình, các triệu chứng của bệnh sốt rét tương tự như nhiều bệnh khác, chẳng hạn như bệnh cúm, bao gồm sốt cao, đổ mồ hôi và đau đầu. Ngoài ra, bệnh còn biểu hiện qua các triệu chứng như buồn nôn, nôn mửa và các ảnh hưởng đến hệ cơ⁹. Nếu bệnh không được điều trị thích hợp hoặc sử dụng thuốc không hiệu quả, sẽ dẫn đến những hậu quả nghiêm trọng, đặc biệt đối với trẻ em và phụ nữ mang thai. Mức độ nghiêm trọng bao gồm tổn thương hồng cầu, dẫn đến tình trạng thiếu máu trầm trọng và rối loạn chức năng hệ hô hấp¹. Bên cạnh đó, bệnh còn ảnh hưởng đến chức năng của hệ cơ xương khớp và cơ tim, có thể gây ra các biến chứng nguy hiểm.
Phân tích hình ảnh y học dưới kính hiển vi đã đóng góp đáng kể vào việc xác định và phân loại nhiều bệnh lý về máu. Việc kiểm tra các hình ảnh này bằng phương pháp thủ công có thể dẫn đến chẩn đoán không chính xác do nhiều lý do (kinh nghiệm hay vật thể giả). Trên toàn cầu, hầu như tất cả hình ảnh dưới kính hiển vi được chuẩn bị dưới dạng giọt máu mỏng và dày được số hóa¹'¹⁰'¹¹. Điển hình là bệnh sốt rét, một trong những bệnh lây truyền qua đường máu thường được chẩn đoán thông qua hình ảnh dưới kính hiển vi. Nhìn chung, phết máu ngoại vi, hay còn gọi là lam máu nhuộm Giemsa là tiêu chuẩn vàng để chẩn đoán bệnh sốt rét. Kỹ thuật này bao gồm việc kiểm tra trực quan (soi) các lam máu giọt dày và lam máu giọt mỏng. Mục đích của việc kiểm tra các lam máu giọt dày đã nhuộm dưới kính hiển vi là để phát hiện và định lượng mật độ ký sinh trùng. Các lam máu giọt mỏng được sử dụng để định loài ký sinh trùng sốt rét¹'¹¹. Trong chẩn đoán, mức độ thay đổi hình thái của hồng cầu cho thấy mức độ nghiêm trọng của bệnh sốt rét. Các thay đổi này bao gồm sự biến đổi về kích thước, sự phân bố và hình dạng⁴'¹¹. Các hồng cầu bị nhiễm bệnh có màu đỏ nhạt, trong khi ký sinh trùng có màu xanh lam và đỏ sẫm¹.
Tuy nhiên, kỹ thuật thủ công này đặt ra một số thách thức đáng kể, thúc đẩy việc tìm tòi các giải pháp tự động dựa trên trí tuệ nhân tạo (AI). Thứ nhất, việc chẩn đoán chính xác đòi hỏi trình độ chuyên môn cao và quá trình đào tạo chuyên sâu, vì những thay đổi về hình thái của hồng cầu phải được đánh giá cẩn thận để xác định mức độ nhiễm bệnh. Hơn nữa, sự phân biệt bằng mắt thường giữa KSTSR với các cấu trúc, tạp chất khác hay vật thể giả của tế bào (cellular artifacts) hoặc tình trạng nhiễm KSTSR trong máu (parasitemia) có thể rất không rõ ràng, làm tăng nguy cơ chẩn đoán sai, nhầm.
Một hạn chế lớn khác nằm ở tính chất tốn nhiều công sức của việc soi lam kính thủ công¹'². Để tự tin kết luận một kết quả là âm tính, một chuyên gia soi lam phải kiểm tra kỹ lưỡng ít nhất 200 vi trường ở độ phóng đại cao mà không phát hiện bất kỳ ký sinh trùng nào⁶. Quy trình này tốn nhiều thời gian và dễ xảy ra sai sót do nhân lực xét nghiệm, đặc biệt là trong các môi trường lâm sàng có khối lượng công việc lớn hoặc nguồn lực hạn chế. Ngoài ra, tính thống nhất và khả năng lặp lại của việc chẩn đoán thủ công có thể khác biệt đáng kể giữa các kỹ thuật viên và tại các phòng xét nghiệm khác nhau. Sự khác biệt này có thể ảnh hưởng đến thời gian chẩn đoán và hiệu quả của việc điều trị, đặc biệt là ở các vùng lưu hành bệnh, nơi mà việc đưa ra quyết định nhanh chóng là rất quan trọng.
Trước những thách thức này, có một nhu cầu rõ ràng về các giải pháp chẩn đoán hiệu quả, chính xác và có khả năng mở rộng hơn. Trong những năm gần đây, các kỹ thuật AI, đặc biệt là học máy (machine learning - ML) và học sâu (deeplearning - DL) ra đời đã có tác động đáng kể trong lĩnh vực này¹². Các phương pháp này giải quyết một số hạn chế, chẳng hạn như sự thiếu chính xác, tốn thời gian và đòi hỏi nỗ lực thủ công lớn². Hơn nữa, AI cung cấp khả năng phân tích số lượng lớn hình ảnh trong thời gian ngắn hơn rất nhiều.
Một ưu điểm lớn của AI là khả năng tự động hóa việc phát hiện bệnh sốt rét, bao gồm xác định sự hiện diện, chủng loài và mật độ nhiễm KSTSR⁴. Vì việc phát hiện và phân loại dựa trên AI thường nhanh hơn và thống nhất hơn so với các phương pháp thủ công, nên chúng góp phần vào việc chẩn đoán đáng tin cậy hơn và các phác đồ điều trị được tiêu chuẩn hóa. Do đó, việc ứng dụng các kỹ thuật AI khác nhau trong chẩn đoán sốt rét đã có sự tăng độ bao phủ chẩn đoán đáng kể. Trong bối cảnh này, cả hai thuật toán ML và DL đang được áp dụng rộng rãi để hỗ trợ một loạt các nhiệm vụ liên quan đến việc phát hiện và phân tích bệnh sốt rét³.
Những đóng góp chính của nghiên cứu này bao gồm:
+ Phát triển một khung phân loại kết hợp (hybrid): Một khung chẩn đoán mới được đề xuất bằng cách tích hợp nhiều kiến trúc học sâu (DL) ResNet-50, VGG-16 và DenseNet-201 với các bộ phân loại truyền thống như máy vector hỗ trợ (SVM) và mạng bộ nhớ dài-ngắn hạn (LSTM). Cách tiếp cận này giúp cải thiện độ chính xác trong chẩn đoán phát hiện bệnh sốt rét;
+ Thực hiện hợp nhất đặc trưng để biểu diễn tối ưu: Nghiên cứu giới thiệu một chiến lược hợp nhất đặc trưng nhằm kết hợp và giảm thiểu hiệu quả các đặc trưng có số chiều cao được trích xuất từ mô hình DL khác nhau. Quá trình này loại bỏ các đặc trưng dư thừa hoặc không liên quan, đồng thời giữ lại các đặc trưng chứa nhiều thông tin nhất, từ đó tạo ra một vector đặc trưng có tính phân loại cao;
+ Áp dụng cơ chế biểu quyết theo đa số để đưa ra quyết định đáng tin cậy: Một phương pháp tổ hợp biểu quyết theo đa số được sử dụng để tổng hợp các dự đoán từ nhiều bộ phân loại khác nhau. Chiến lược này đảm bảo quyết định cuối cùng ổn định và đáng tin cậy hơn bằng cách giảm khả năng phân loại sai số hoặc tình trạng quá khớp (overfitting) của từng mô hình riêng lẻ;
+ Đánh giá hiệu suất toàn diện bằng đa chỉ số: Phương pháp được đề xuất được đánh giá một cách nghiêm ngặt thông qua nhiều chỉ số hiệu suất,gồm độ chính xác (accuracy), độ chuẩn xác (precision), độ bao phủ (recall), điểm F1 (F1-score) và mật độ KSTSR dưới đường cong (AUC). Điều này đảm bảo khả năng khái quát hóa về hiệu suất của mô hình trong các kịch bản khác nhau.
+ Phân tích so sánh các phương pháp hiện có: Kết quả thu được từ hệ thống đề xuất được so sánh với các phương pháp tiên tiến khác trong y văn. Khung phân loại kết hợp cho thấy hiệu suất vượt trội, đạt được độ chính xác phân loại cao hơn và độ tin cậy chẩn đoán lớn hơn, chứng tỏ ưu điểm của việc tích hợp các bộ phân loại Học sâu (DL) với Học máy (ML);
+ Đóng góp cho lĩnh vực chẩn đoán y tế dựa trên AI: Nghiên cứu này không chỉ tạo ra bước tiến trong lĩnh vực phát hiện bệnh sốt rét mà còn đóng góp vào lĩnh vực rộng lớn hơn là ứng dụng AI trong chăm sóc sức khỏe. Bằng cách đánh giá hiệu năng và xác thực một quy trình chẩn đoán tự động và đáng tin cậy, nghiên cứu đã đặt nền móng cho những phát triển trong tương lai của các hệ thống chẩn đoán bệnh thông minh.
Phần còn lại của bài báo này được cấu trúc như sau: Các nghiên cứu liên quan về phát hiện bệnh sốt rét bằng phương pháp trí tuệ nhân tạo (AI) được đề cập trong mục Tổng quan tài liệu. Trước khi trình bày phương pháp luận đã áp dụng, chúng tôi cung cấp mục Thông tin nền tảng để mô tả các kỹ thuật được sử dụng. Mục Vật liệu và Phương pháp giới thiệu các quy trình được đề xuất sử dụng thuật toán học máy và học sâu. Kết quả của các phương pháp đã áp dụng được trình bày trong mục Kết quả. Mục Bàn luận giải thích ý nghĩa của các kết quả và so sánh chúng với các công trình liên quan khác. Cuối cùng, mục Kết luận tóm tắt nghiên cứu và phác thảo các định hướng cho công việc trong tương lai.
(Còn nữa) --> Tiếp theo Phần 2
CN. Nguyễn Thái Hoàng& TS.BS. Huỳnh Hồng Quang
Viện Sốt rét-KST-CT Quy Nhơn