(Tiếp theo Phần 1)
TỔNG QUAN TÀI LIỆU
Nhiều nghiên cứu đã được thực hiện để chẩn đoán bệnh sốt rét bằng cách dùng một loạt các thuật toán AI. Mặc dù bệnh sốt rét vẫn đang được chẩn đoán bằng các kỹ thuật truyền thống như xét nghiệm chẩn đoán nhanh, xét nghiệm phản ứng chuỗi polymerase (PCR)³,¹³, các thuật toán AI vẫn cho thấy nhiều hứa hẹn. Các mạng nơ-ron tích chập (convolutional neural networks - CNN), đặc biệt với các kiến trúc đa dạng và sự tích hợp với nhiều kỹ thuật khác nhau, đã chứng tỏ khả năng phát hiện bệnh sốt rét một cách tỉ mỉ. Hơn nữa, hình ảnh kính hiển vi đang được sử dụng rộng rãi để khảo sát, ở cả dưới dạng phết máu mỏng hoặc phết máu dày.
Một loạt các mô hình học máy (ML) đã được sử dụng để dự báo bệnh sốt rét, bao gồm độ che phủ rừng ngẫu nhiên (random forest - RF), mạng nơ-ron nhân tạo (artificial neural network - ANN), hồi quy tuyến tính đa biến và hệ thống suy luận mờ thần kinh-thích ứng³. Nghiên cứu này đã sử dụng bộ dữ liệu huyết học của 2207 bệnh nhân Ghana chỉ với 20 đặc trưng. Các kết quả được đánh giá bằng các chỉ số thống kê, bao gồm R, R2, MSE và RMSE. Mô hình ANN cho thấy hiệu suất tốt nhất trong số các mô hình, trong khi RF là mô hình kém nhất.
Một bộ dữ liệu hồng cầu đã được Sunarko và cộng sự¹ sử dụng để phát hiện bệnh sốt rét. Công trình này đã đề xuất phương pháp của Otsu để phân đoạn các tế bào và phân biệt nền ảnh và ranh giới tế bào với KSTSR. Các đặc trưng thống kê và độ xiên (skewness) đã được sử dụng để phát hiện các tế bào khỏe mạnh so với các tế bào bị nhiễm bệnh. Tổng cộng 2000 hình ảnh phết máu mỏng được sử dụng để huấn luyện và 2000 hình ảnh kính hiển vi khác được sử dụng để kiểm tra. Cả hình ảnh thang độ xám (grayscale)và hình ảnh RGB đều được phân tích để trích xuất sự phân bố cường độ. Ngoài ra, phương pháp phân cụm K-means đã được sử dụng để phân loại các màu sắc khác nhau trong tế bào, bao gồm cả việc xác định KSTSR. Kết quả cho thấy độ chính xác trong việc phát hiện các tế bào bị nhiễm bệnh là 94,6%.
Nghiên cứu của Muhammed và cộng sự¹⁰ tập trung vào việc nhận dạng hình thái hồng cầuhình thành như chuỗi đồng xu (rouleaux formation)của các tế bào hồng cầu do KSTSR gây ra. Hai mô hình CNN đã được sử dụng với các kích thước ảnh đầu vào khác nhau. Nghiên cứu này đã cho thấy kích thước ảnh tối ưu là 300 × 300, mang lại độ chính xác 90,95% trong việc phát hiện sự hình thành hồng cầu chuỗi đồng xu bất thường. Một phần mở rộng của công trình đó đã được trình bày trong nghiên cứu¹¹, trong đó 5 mô hình CNN đã được sử dụng cho một bộ dữ liệu thu thập từ 100 bệnh nhân bị bệnh. Các mô hình này bao gồm XceptionNet, ResNet 50, DenseNet, EfficientNetB4 và CNN tùy chỉnh, đạt được độ chính xác lần lượt là 96,4%, 98,5%, 99%, 96,2% và 98,4%.
Kassim và cộng sự¹⁴ đã tiến hành một nghiên cứu dựa trên dữ liệu thực tế được tuyển chọn ở Bangladesh. Họ đã sử dụng tổng cộng 965 hình ảnh kính hiển vi phết máu mỏng của 193 bệnh nhân. Ngoài ra, bộ dữ liệu được chia thành một bộ dữ liệu đa giác (polygon set) và một bộ dữ liệu điểm (point set) để phân biệt tương ứng với ảnh huấn luyện và ảnh kiểm tra. Các tác giả đã trình bày mô hình RBCNet bằng cách sử dụng U-Net để phân đoạn các tế bào hồng cầu và sau đó áp dụng Faster R-CNN để phân biệt các tế bào hồng cầu bị nhiễm và không bị nhiễm. Độ chính xác đối với các hình ảnh được kiểm tra (bộ dữ liệu điểm) là 97,54 ± 1,44.
Một khuôn khổ toàn diện đã được phát triển trong nghiên cứu² để nhận dạng các tế bào hồng cầu trong hình ảnh kính hiển vi (KHV). Để xác định chính xác các vùng quan tâm, các tế bào hồng cầu đã được mô tả đặc điểm một cách hiệu quả bằng mô hình CNN dựa trên vùng. Hoyos và cộng sự đã phát triển một mô hình dựa trên học sâu sử dụng YOLOv8 để phát hiện ký sinh trùng sốt rét cùng với bạch cầu, dựa trên hình ảnh kính hiển vi phết máu dày. Nghiên cứu này kết luận rằng mô hình được phát triển đã cho thấy các kết quả hứa hẹn so với các công trình liên quan khác, đạt độ chính xác 98,00% trong phát hiện bạch cầu và 95,00% trong phát hiện KSTSR⁶. Một nghiên cứu liên quan khác tập trung vào việc sử dụng các mô hình học máy khác nhau để chẩn đoán bệnh sốt rét³.
Các thuật toán được áp dụng là ANN, hồi quy tuyến tính đa biến, hệ thống suy luận mờ thần kinh-thích ứng và rừng ngẫu nhiên. Tất cả mô hình được huấn luyện dựa trên 15 tiêu chí liên quan đến các thông số huyết học của xét nghiệm máu, như số lượng hồng cầu, nồng độ haemoglobin,… Sai số bình phương trung bình, căn bậc hai sai số bình phương trung bình, hệ số R2 và hệ số R đã được sử dụng để mô tả các kết quả dự đoán bệnh sốt rét.
Vào năm 2023, các mô hình CNN tự động đã được phát triển để chẩn đoán bệnh sốt rét¹³. Các tác giả đã sử dụng một mô hình CNN tùy chỉnh, ResNet50, và MobileNetV2. Một bộ dữ liệu gồm 27.558 hình ảnh phết máu với 50% hình ảnh có ký sinh trùng và 50% hình ảnh không có ký sinh trùng đã được khảo sát. Mô hình CNN phát hiện bệnh sốt rét với độ chính xác 95,50%, MobileNetV2 đạt độ chính xác 97,06% và ResNet50 mang lại độ chính xác 96,70%. Theo đó, MobileNetV2 liên tục thể hiện sự vượt trội trong việc chẩn đoán bệnh sốt rét. Câu hỏi liệu hình ảnh phết máu mỏng hay phết máu dày phù hợp hơn cho việc phát hiện sốt rét đã được trả lời bởi Ozsahin và cộng sự¹⁵.
Trong bối cảnh này, một mô hình CNN tùy chỉnh đã được áp dụng cho một bộ dữ liệu chứa các hình ảnh nhiễm ký sinh trùng P. falciparum và P. vivax cùng với các hình ảnh không nhiễm bệnh. Hơn nữa, một phương pháp học chuyển giao đã được áp dụng để kiểm định mô hình bằng cách sử dụng VGG16, ResNet50 và Inception V3. Các chỉ số đánh giá, bao gồm độ chính xác, độ chuẩn xác, độ nhạy và chỉ số F1-score, đã chứng tỏ hiệu suất mạnh mẽ đối với hình ảnh phết máu dày. Do đó, nghiên cứu cho thấy hình ảnh phết máu dày vượt trội hơn hình ảnh phết máu mỏng trong chẩn đoán sốt rét.
Các nghiên cứu trước đây cũng đã chứng minh việc phát hiện sốt rét tự động dựa vào việc sử dụng các thuật toán học máy và học sâu. Với sự mạnh mẽ của các thuật toán học sâu (DL) trong việc xử lý các bộ dữ liệu hình ảnh kính hiển vi quy mô lớn, chúng tôi đã áp dụng một khuôn khổ dựa trên học sâu để phát hiện sốt rét bằng hình ảnh phết máu mỏng. Trong số các thuật toán DL, VGG 16, ResNet50 và DenseNet-201 chiếm ưu thế trong chẩn đoán bệnh, chẳng hạn như bệnh sốt rét. Bảng 1 tóm tắt các công trình liên quan theo năm công bố, bộ dữ liệu, kết quả, ưu điểm và nhược điểm.
Bảng 1. So sánh các nghiên cứu liên quan trong chẩn đoán bệnh sốt rét bằng kỹ thuật AI
| Nghiên cứu | Năm | Tập dữ liệu | Phương pháp | Kết quả | Ưu điểm | Nhược điểm |
| Muhammad và cộng sự¹¹ | 2025 | 772 (616 + 156) ảnh có hình thái hồng cầu chuỗi đồng xu và 772 ảnh có hình thái bình thường | XceptionNet, ResNet 50, DenseNet, EfficientNetB4, mạng CNN tùy chỉnh | Độ chính xác 99% đối với mô hình DeseNet-201 | Hình thái hồng cầu chuỗi đồng xu của tế bào hồng cầu được phát hiện bằng các thuật toán học sâu (DL). | Mất cân bằng giữa số lượng ảnh nhuộm Giemsa và ảnh nhuộm tại thực địa. |
| Ozsahin và cộng sự³ | 2024 | Dữ liệu liên quan đến 2207 bệnh nhân | MLR, ANN, ANFIS, và RF | Hiệu suất mô hình được đánh giá bằng các chỉ số R, R², RMSE và MSE | Phát triển các mô hình học máy (ML) lai để chẩn đoán sốt rét. | Chỉ sử dụng các thuật toán học máy. Khả năng tổng quát hóa của phương pháp bị hạn chế. |
| Hoyos và Hoyos⁶ | 2024 | 222 ảnh gốc và 666 ảnh tăng cường | YOLOv8 | Độ chính xác 91% đối với ảnh gốc và 95% đối với ảnh tăng cường | Phát hiện ký sinh trùng sốt rét và bạch cầu với độ chính xác cao. | Sự đa dạng của các ảnh được huấn luyện thấp. Số lượng tập dữ liệu được sử dụng ít. |
| Khan và cộng sự² | 2024 | 12.500 ảnh kính hiển vi tăng cường | R-CNN & ResNet- 18, 50, 101, 152 & GoogleNet | R-CNN vượt trội hơn các bộ phân loại khác với độ chính xác 91,21% | Một khuôn khổ mới đã được trình bày để phát hiện bệnh sốt rét. | Những thay đổi về hình thái tế bào không được xem xét. |
| Hemachandran và cộng sự¹⁴ | 2023 | 27.558 ảnh kính hiển vi | CNN & ResNet-50 & MobileNet-V2 | MobileNet-V2 vượt trội hơn với độ chính xác 97%. | So sánh hiệu suất của nhiều mô hình học sâu trên một tập dữ liệu lớn. | Sử dụng một mạng CNN truyền thống. |
| Muhammad và cộng sự¹⁰ | 2023 | 51 ảnh (hình thái hồng cầu chuỗi đồng xu) và 180 ảnh (hình thái bình thường) | Mạng CNN tùy chỉnh cho hình thái bình thường và hình thái hồng cầu chuỗi đồng xu | Độ chính xác: 90,95% (300 × 300) & 87,75% (500 × 500) | Đánh giá hiệu suất của mạng CNN trong việc phát hiện hình thái tế bào bất thường trên các kích thước ảnh khác nhau. | Số lượng ảnh tương đối thấp (6088). Độ sâu của các lớp CNN (5 lớp)ở mức thấp. |
| Ozsahin và cộng sự¹⁵ | 2022 | 300 ảnh phết máu giọt đặc nhiễm ký sinh trùng và 319 ảnh phết máu giọt mỏng | Mạng CNN tùy chỉnh, ResNet-50, VGG16, và Inception V3 | Hiệu suất tốt nhất trên ảnh phết máu giọt đặc với độ chính xác 96,97%. | Phát triển một mô hình mới để chẩn đoán sốt rét dựa trên các kỹ thuật học sâu. | Số lượng ảnh tương đối ít. |
| Sunarko và cộng sự¹ | 2020 | Dữ liệu liên quan đến 150 bệnh nhân nhiễm bệnh và 50 bệnh nhân khỏe mạnh (2000 ảnh) | Phương pháp Otsu + Phân cụm K | Độ chính xác: 94,6% Độ đặc hiệu: 96,2% Độ nhạy: 93% | Một phương pháp phân đoạn dựa trên ngưỡng đã được áp dụng để chẩn đoán sốt rét. | Lượng dữ liệu thấp. Việc phát hiện ký sinh trùng ở giai đoạn thể phân liệt còn hạn chế. |
| Kassim và cộng sự¹³ | 2020 | Tập hợp đa giác là 34.226 hồng cầu, và tập hợp điểm là 162.443 hồng cầu | RBCNet dựa trên U-Net và Faster R-CNN | Phát hiện tế bào với độ chính xác trên 97% | Một thuật toán học sâu mới đã được trình bày để phân đoạn tế bào hồng cầu bằng cách sử dụng một tập dữ liệu lớn. | Không phân loại tế bào nhiễm và không nhiễm. |
Thông tin nền tảng
Nghiên cứu này được phát triển dựa trên việc sử dụng các thuật toán Học máy (ML) và Học sâu (DL) để chẩn đoán bệnh sốt rét. Các thuật toán DL được sử dụng để trích xuất các đặc trưng của những hình ảnh soi dưới kính hiển vi, trong khi các thuật toán ML được dùng để phân loại thành ảnh bình thường hoặc bất thường. Trong các kỹ thuật dựa trên DL, mạng nơ-ron tích chập (CNN) là cốt lõi của kiến trúc mạng, với sự điều chỉnh về số lượng và thứ tự của các lớp. Trong quá trình triển khai, chúng tôi đã áp dụng các mô hình ResNet50, VGG 16 và DenseNet 201. Bên cạnh đó,máy vector hỗ trợ (SVM) và mạng Bộ nhớ dài-ngắn (LSTM) cũng được đề cập trong mục Vật liệu và Phương pháp.
ResNet 50
Năm 2016, Mạng nơ-ron tồn lưu (Residual Neural Network - ResNet), do He và các cộng sự giới thiệu, nhằm mục đích nâng cao hiệu suất bằng cách tích hợp các kết nối dư giữa các lớp. Các kết nối này giúp giảm thiểu tổn thất, tăng cường thu nhận kiến thức, cải thiện hiệu quả huấn luyện và làm cho mô hình trở nên mạnh mẽ hơn trong việc chống lại hiện tượng quá khớp (overfitting). Các mô hình ResNet bao gồm nhiều lớp, dao động từ 34 đến 1202, với các biến thể về số lượng khối dư và các phép toán cơ bản. Trong số này, ResNet-50 là phiên bản được sử dụng rộng rãi nhất, bao gồm 49 lớp tích chập và một lớp kết nối đầy đủ (fully connected - FC)¹⁶.
VGG16
Năm 2014, các học giả của Đại học Oxford đã tạo ra VGG16¹⁵. Mô hình này bao gồm 13 lớp tích chập được chia thành 5 phân đoạn, cùng với một phân đoạn chứa ba lớp kết nối đầy đủ¹⁵,¹⁷. Do đó, kiến trúc cơ bản của mạng này đã tạo nên tên gọi của nó là "VGG16". Thông thường, mỗi lớp sử dụng một bộ lọc nhân 3×3 để giảm số lượng tham số và các hiệu ứng phi tuyếntính (nonlinear effects). VGG 16 nổi bật với kiến trúc sâu hơn, dẫn đến đặc điểm học lũy tiến (progressive learning) từ cấp độ thấp đến cấp độ cao. Khả năng biểu đạt phi tuyến nâng cao của nó cho phép nắm bắt nhiều đặc trưng hơn và xử lý dữ liệu đầu vào phức tạp một cách hiệu quả¹⁷. Những đặc điểm này làm cho VGG16 đặc biệt hữu ích cho các tác vụ như nhận dạng và phân loại hình ảnh.
DenseNet − 201
Mạng tích chập dày đặc (Dense Convolutional Network - DenseNet) là một phương pháp DL được thiết kế để tăng cường sự lan truyền của các đặc trưng và tái sử dụng các đặc trưng đã được trích xuất. Mô hình này được khởi xướng bởi Huang và các cộng sự (2017). Nó kết nối trực tiếp mỗi lớp với tất cả các lớp khác theo một mô hình truyền thẳng (feed-forward pattern). Cấu hình này thúc đẩy luồng thông tin, tác động đến sự dư thừa của các tham số và giảm thiểu hiện tượng quá khớp¹⁸. Mô hình này giải quyết vấn đề độ dốcbiến mất (vanishing gradient, hay còn gọi là suy giảm đạo hàm), cho phép các gradient lan truyền hiệu quả hơn trong quá trình lan truyền ngược. Do đó, DenseNet thường đạt được độ chính xác cao hơn với số lượng tham số ít hơn so với các mô hình DL truyền thống khác. Điều này làm cho nó phù hợp hơn cho việc phân loại và phân đoạn hình ảnh¹⁹. Các lớp được kết nối dày đặc của DenseNet-201 cho phép nó nắm bắt các mối quan hệ phức tạp giữa các đặc trưng, làm cho nó rất phù hợp với các tác vụ đòi hỏi sự phân biệt chi tiết²⁰.
(Còn nữa) --> Tiếp theo Phần 3
CN. Nguyễn Thái Hoàng& TS.BS. Huỳnh Hồng Quang
Viện Sốt rét-KST-CT Quy Nhơn