Bối cảnh: Sốt xuất huyết là một vấn đề sức khỏe cộng đồng toàn cầu nghiêm trọng, đòi hỏi phải giám sát mật độ quần thể muỗi Aedes, loài muỗi đóng vai trò làm véc tơ truyền bệnh. Việc giám sát này là yếu tố then chốt trong phòng ngừa bệnh sốt xuất huyết. Mục tiêu nghiên cứu này là giải quyết khó khăn trong việc nhận diện và đếm trứng muỗi của các chủng muỗi hoang dã trong quá trình theo dõi mật độ Aedes albopictus (Diptera: Culicidae) bằng bẫy đẻ trứng (ovitrap) trong các khảo sát thực địa.Phương pháp: Các nhà nghiên cứu đã xây dựng một tập dữ liệu gồm 1729 hình ảnh về trứng muỗi Ae. albopictus từ các dòng hoang dã và sử dụng mô hình Segment Anything để tăng cường khả năng ứng dụng của mô hình phát hiện trong các môi trường phức tạp. Một mô hình hai giai đoạn dựa trên Mạng nơ-ron tích chập khu vực (Faster R-CNN) được sử dụng để thiết lập mô hình phát hiện trứng muỗi Ae. albopictus. Quá trình nhận diện và đếm được thực hiện thông qua phương pháp lợp ngói (tile overlapping), trong khi biện pháp lọc hình thái học được áp dụng để loại bỏ tạp chất. Hiệu suất của mô hình được đánh giá dựa trên các chỉ số độ chính xác (precision), độ nhạy tái lặp (recall) và thang điểm F1, đồng thời độ chính xác trong việc đếm được đánh giá bằng giá trị R-squared và sai số bình phương trung bình gốc (RMSE).Kết quả: Thực nghiệm cho thấy khả năng nhận diện vượt trội của mô hình, với độ chính xác đạt 0.977, độ nhạy đạt 0.978, và điểm F1 là 0.977. Giá trị R-squared giữa số lượng trứng thực tế và số lượng trứng được nhận diện đạt 0.997, với RMSE là 1.742. Thời gian phát hiện trung bình cho mỗi ô là 0.48 giây, nhanh hơn hơn 10 lần so với phương pháp tương tác giữa người-máy trong việc đếm toàn bộ một hình ảnh.Kết luận: Mô hình đã chứng minh hiệu suất xuất sắc trong việc nhận diện và đếm trứng muỗi Ae. albopictus, cho thấy tiềm năng ứng dụng lớn. Nghiên cứu này mang đến sự hỗ trợ công nghệ mới nhằm nâng cao hiệu quả kiểm soát véc-tơ và tiêu chuẩn sức khỏe cộng đồng.
 Tóm tắt bằng đồ hoạ
 Ghi chú: Image Acquisition: Thu nhận hình ảnh; Plant debris: Mảnh vụn thực vật; Gravel: Sỏi; 
insect: Côn trùng; Egg: Trứng; Automatic Identification: Nhận dạng tự động và Automatic Counting: Đếm tự động
  Sốt xuất huyết, một bệnh sốt cấp tính do vi-rút Dengue gây ra, được truyền bởi muỗi Aedes aegypti hoặc Aedes albopictus (Diptera: Culicidae), là một bệnh truyền nhiễm phổ biến và lan rộng nhanh chóng do muỗi. Với đặc điểm tỷ lệ mắc bệnh cao và khả năng lây nhiễm mạnh, sốt xuất huyết đặt ra mối đe dọa nghiêm trọng đối với sức khỏe và an toàn cộng đồng, khi có khoảng 2,5 tỷ người có nguy cơ nhiễm hàng năm, gây ra những thách thức đáng kể đối với cả sự phát triển kinh tế và y tế công cộng. Với sự phát triển của các hiện tượng toàn cầu như di chuyển bằng đường hàng không, thương mại hàng hải, biến đổi khí hậu và đô thị hóa, muỗi có thể di chuyển xa trong thời gian ngắn, dẫn đến gia tăng nguy cơ nhiễm sốt xuất huyết và mở rộng phạm vi phân bố địa lý hàng năm. Mặc dù vắc-xin sốt xuất huyết đã được cấp phép rộng rãi, việc phổ biến vắc-xin vẫn chậm do các lo ngại về an toàn được phát hiện ở người nhận, cùng với việc hiện nay chưa có thuốc kháng vi-rút nào được cấp phép để điều trị nhiễm sốt xuất huyết. Do đó, phòng ngừa nhiễm sốt xuất huyết là một vấn đề y tế công cộng cấp bách cần được giải quyết trên toàn cầu.
 Kiểm soát véc-tơ đã được chứng minh là một phương pháp hiệu quả để ngăn ngừa lây nhiễm sốt xuất huyết. Bằng cách hạn chế tương tác giữa muỗi và con người cũng như kiểm soát số lượng quần thể muỗi, sự lây lan của virus có thể được giảm thiểu. Hiệu quả của kiểm soát véc-tơ phụ thuộc vào việc giám sát các véc-tơ. Nghiên cứu đã chỉ ra rằng năng lực sinh sản của muỗi cái có thể cung cấp thông tin quan trọng trong việc giám sát muỗi, chẳng hạn như ước tính mật độ quần thể và xác định các điểm sinh sản tiềm năng. Việc giám sát muỗi Aedes có thể hiệu quả trong việc định hướng phân bổ nguồn lực để kiểm soát mật độ muỗi, qua đó ngăn ngừa sự lây lan của bệnh sốt xuất huyết.Trong số các phương pháp không dùng/phi hóa chất để giám sát muỗi Aedes, bẫy trứng (ovitraps) được coi là một cách hiệu quả để theo dõi quần thể muỗi nhờ chi phí thấp, dễ vận hành và tính chuẩn hóa. Phương pháp này đã được áp dụng rộng rãi ở các khu vực như Malaysia, Indonesia và Rome. 
 Bẫy trứng, hoạt động bằng cách thu thập trứng muỗi, có khả năng định lượng năng lực sinh sản của muỗi cái. Thông qua việc phân tích số lượng và hành vi của trứng muỗi, kích thước quần thể muỗi có thể được ước tính chính xác, từ đó hỗ trợ việc ra quyết định trong kiểm soát véc-tơ. Tuy nhiên, trứng muỗi được thu thập bằng bẫy trứng thường cần được nhận dạng trong phòng thí nghiệm bằng các công cụ như kính hiển vi. So với việc nhận dạng muỗi trưởng thành, việc nhận dạng trứng đòi hỏi kỹ năng chuyên môn cao hơn. Trong hầu hết trường hợp, việc nhận dạng và đếm trứng muỗi được thực hiện thủ công, dẫn đến khối lượng công việc lớn, hiệu quả thấp và có mức độ sai sót chủ quan nhất định. Do đó, tối ưu hóa quá trình nhận dạng và đếm trứng, tránh sai sót do con người và nâng cao hiệu quả là điều cốt yếu để giám sát hiệu quả mật độ muỗi Aedes và hỗ trợ ra quyết định kiểm soát véc-tơ.
 Các nghiên cứu trước đây đã khám phá các phương pháp cải thiện việc đếm trứng muỗi bằng cách thu thập hình ảnh và sử dụng công nghệ nhận diện và đếm tự động hỗ trợ bởi máy tính. Phương pháp này, với sự kết hợp giữa tương tác người–máy tính, nhanh gấp đôi so với phương pháp đếm thủ công truyền thống sử dụng kính lúp hoặc kính hiển vi. Mặc dù phương pháp này cho phép người lao động thực hiện việc đếm từ xa, nhưng nó vẫn phụ thuộc nhiều vào lao động thủ công. Việc áp dụng rộng rãi công nghệ xử lý hình ảnh số đã cải thiện đáng kể quá trình đếm trứng muỗi. Do hình ảnh RGB (đỏ, xanh lá, xanh dương) cung cấp thông tin tính toán hạn chế, chúng thường được chuyển đổi sang các hệ màu khác như HSV (sắc độ, độ bão hòa, độ sáng), HSL (sắc độ, độ bão hòa, độ sáng), YIQ (độ sáng, sắc độ đồng pha, sắc độ vuông pha) và không gian màu CIELAB (Ủy ban Quốc tế về Chiếu sáng năm 1976 Lab). Sau đó, phân đoạn hình ảnh được sử dụng để phân biệt trứng muỗi và nền. Việc xác định ngưỡng cho phân đoạn hình ảnh là yếu tố then chốt trong toàn bộ quá trình. Việc điều chỉnh thủ công ngưỡng phân đoạn yêu cầu người vận hành có kinh nghiệm trước đó và các hình ảnh khác nhau có thể yêu cầu các ngưỡng khác nhau đáng kể. Ngoài ra, giấy thấm thu thập mẫu có thể bị tối màu do sự phát triển của vi khuẩn hoặc nấm, hoặc do ngâm trong nước thải, làm phức tạp thêm việc xác định ngưỡng. Để giải quyết vấn đề này, các nhà nghiên cứu đã áp dụng các thuật toán tối ưu hóa để xác định ngưỡng, chẳng hạn như tối ưu hóa tham số bằng tìm kiếm lưới, giảm thiểu độ mờ nhòe và sử dụng sóng Gabor.
 Những tiến bộ nhanh chóng trong học máy đã được ứng dụng rộng rãi vào việc đếm trứng muỗi trong những thập kỷ gần đây. Chẳng hạn, một nghiên cứu ban đầu của Gusmão và cộng sự đã sử dụng phân cụm k-means để phân biệt trứng muỗi, nền ảnh và tạp chất dựa trên thông tin hình ảnh từ hệ màu CIELAB. Trong các nghiên cứu này, sau khi vùng chứa trứng muỗi được trích xuất thông qua phân đoạn ngưỡng, số lượng trứng muỗi được xác định bằng cách so sánh tổng số điểm ảnh mà trứng chiếm với số điểm ảnh của từng quả trứng riêng lẻ. Một số nghiên cứu khác đã triển khai quy trình này bằng cách sử dụng các phần mềm xử lý hình ảnh sẵn có như ImageJ, ICount hoặc các công cụ tự phát triển như Egg-Counter và MECVision để thực hiện việc đếm trứng muỗi tự động ban đầu.Tất cả nghiên cứu này đều dựa vào quy mô điểm ảnh để nhận dạng và đếm trứng muỗi, điều này mang lại lợi thế tự nhiên khi mật độ trứng cao và xảy ra sự xếp chồng, vì không cần phải xem xét hình thái của từng quả trứng riêng lẻ. Tuy nhiên, phương pháp này cũng có một số hạn chế nhất định. Khi mẫu được thu thập trên các giấy lọc đặt trong môi trường thực địa, các tạp chất như mảnh vụn thực vật, cát và xác côn trùng có thể được thu thập cùng với trứng muỗi. Do đó, các điểm ảnh được phân đoạn có thể bao gồm không chỉ trứng muỗi mà còn các tạp chất khác, làm cho việc thu thập thông tin chính xác về các trường hợp dương tính thật và âm tính thật trở nên khó khăn. Mặc dù hầu hết các nghiên cứu đã tối ưu hóa kết quả bằng cách thiết lập các ngưỡng kích thước hoặc thực hiện chỉnh sửa thủ công để loại bỏ tạp chất, điều này lại tạo ra sự không chắc chắn trong thao tác của con người, đồng thời các ngưỡng được đặt cũng ảnh hưởng đáng kể đến độ chính xác của phương pháp.
 Một phương pháp học máy khác dựa trên các thao tác ở cấp độ cá nhân hóa. Phân đoạn hình ảnh giải quyết việc xác định loại cho từng pixel, trong khi phát hiện đối tượng kết hợp phân đoạn với tri thức để xác định loại và vị trí của mục tiêu. AlexNet đã đạt được một bước đột phá quan trọng trong lĩnh vực nhận dạng hình ảnh, làm nổi bật khả năng của mạng nơ-ron tích chập(CNN), vốn đã được áp dụng rộng rãi trong các lĩnh vực y học và sức khỏe cộng đồng. Phát hiện đối tượng đã được sử dụng rộng rãi để phát hiện và nhận dạng nhiều loại côn trùng, chẳng hạn như tằm có giá trị kinh tế và sâu bệnh phá hoại mùa màng.Trong giám sát véc-tơ, phát hiện đối tượng được áp dụng cho tất cả giai đoạn sống của muỗi (trứng, ấu trùng, nhộng và muỗi trưởng thành), với phần lớn các nghiên cứu tập trung vào giai đoạn ấu trùng và trưởng thành. Phát hiện đối tượng đã cho thấy tiềm năng đáng kể trong giám sát véc-tơ, dù thông qua các thuật toán một giai đoạn như Single Shot MultiBox Detector (SSD) và You Only Look Once (YOLO) để phát hiện ấu trùng muỗi, hay các thuật toán hai giai đoạn như Faster Region-based Convolutional Neural Network (Faster R-CNN) để nhận dạng muỗi trưởng thành. 
 Một số nhà nghiên cứu đã sử dụng phát hiện đối tượng để nhận dạng trứng muỗi. Chẳng hạn, Javed và cộng sự đã thu thập 100 hình ảnh đại thể và vi ảnh của các dòng muỗi trong phòng thí nghiệm bằng máy ảnh và kính hiển vi, sau đó phát hiện trứng bằng Mask R-CNN, với độ chính xác, độ nhạy và điểm F1 đều trên 0,9 ở cả cấp độ macro và micro.Mặc dù phần lớn các nghiên cứu dựa trên các dòng muỗi trong phòng thí nghiệm, một số nhà nghiên cứu đã hướng tới các dòng muỗi hoang dã. De Santana và cộng sự đã sử dụng Region-based Fully Convolutional Networks (R-FCN) để nhận dạng trứng muỗi được thu thập từ môi trường tự nhiên, đạt độ chính xác phân loại 91%. Garcia và cộng sự đã thực hiện tiền xử lý hình ảnh trước khi phát hiện đối tượng, trong đó thông tin RGB và CIELAB được sử dụng để phân biệt giữa các pixel trứng muỗi và pixel không phải trứng, đồng thời các đối tượng kích thước nhỏ được loại trừ khỏi quy trình. Sau đó, R-CNN được sử dụng để phát hiện dựa trên kết quả phân loại, đạt tỷ lệ phát hiện 91% với chỉ số intersection over union (IoU) là 0,3. Mặc dù nghiên cứu đã nhấn mạnh việc loại bỏ nền ngoài giấy lọc trước khi phát hiện, phương pháp này chủ yếu xử lý các vùng màu đen phát sinh trong quá trình thu nhận hình ảnh bằng ống kính phóng đại. Hiệu quả của phương pháp này trong việc loại bỏ các nền phức tạp hơn vẫn cần được kiểm chứng thêm.
 Mặc dù các nghiên cứu này báo độ chính xác và độ nhạy cao, song vẫn tồn tại một số hạn chế. Quá trình tiền xử lý hình ảnh phụ thuộc vào sự can thiệp thủ công thông qua phần mềm xử lý hình ảnh của bên thứ ba và các tham số áp dụng thiếu tính tổng quát. Hơn nữa, bất kể tỷ lệ pixel hay tỷ lệ vật thể, phần lớn hình ảnh được thu thập đại diện cho trứng muỗi được lấy trong phòng thí nghiệm, điều này có thể dẫn đến tỷ lệ phát hiện thấp hơn khi xác định các hình ảnh được thu thập từ môi trường tự nhiên trong các ứng dụng thực tiễn.
 Nghiên cứu này nhằm giải quyết vấn đề nhận diện và đếm tự động trứng muỗi Ae. albopictus từ các chủng hoang dã. Các nhà khoa học đã thu thập một số lượng lớn mẫu từ các khảo sát thực địa để huấn luyện mô hình phát hiện đối tượng và chuẩn hóa quy trình tiền xử lý hình ảnh. Mô hình Segment Anything Model (SAM), một mô hình phân đoạn hình ảnh dựa trên trí tuệ nhân tạo (AI), đã được sử dụng để giải quyết hiệu quả vấn đề nhiễu nền phức tạp, mở rộng khả năng ứng dụng trong nhiều kịch bản khác nhau. Sau đó, mô hình Faster R-CNN, một mô hình phát hiện đối tượng dựa trên AI, được áp dụng để học thông tin đầy đủ về các đối tượng.Để nhận diện, chúng tôi sử dụng phương pháp chia nhỏ hình ảnh bằng cách lợp ngói, giúp tăng tỷ lệ điểm ảnh của mục tiêu là trứng và tránh tác động của việc trứng muỗi bị phân đoạn trong quá trình nhận diện. Ngoài ra, chúng tôi đã tối ưu hóa kết quả nhận diện thông qua lọc hình thái học nhằm đảm bảo độ chính xác và độ tin cậy của việc nhận diện và đếm. Phương pháp của chúng tôi đã chứng minh khả năng mạnh mẽ trong việc nhận diện và đếm.
  Hình 1 minh họa phương pháp nghiên cứu. Sau khi thu thập hình ảnh trứng muỗi Ae. albopictus từ các khảo sát thực địa bằng máy ảnh, quá trình gán nhãn thủ công được thực hiện để tạo các thẻ (tag) cần thiết cho việc huấn luyện. Mô hình SAM được sử dụng để phân đoạn hình ảnh thành khu vực giấy lọc và khu vực không phải giấy lọc, qua đó loại bỏ hiệu quả nền phức tạp và chỉ giữ lại khu vực giấy lọc. Chúng tôi thiết kế một bộ tạo câu lệnh (prompt generator) để cho ra câu lệnh dạng điểm point cho SAM. So với các thuật toán khác yêu cầu huấn luyện tham số, SAM có thể được sử dụng trực tiếp mà không cần huấn luyện, cho thấy sức mạnh tính toán to lớn.
 Tập dữ liệu sau đó được chia thành các tập huấn luyện, xác thực và kiểm tra theo tỷ lệ 6:2:2, trong đó các tập huấn luyện và xác thực được xử lý thông qua phân đoạn. Tiếp theo, mô hình Faster R-CNN được huấn luyện dựa trên các lát cắt hình ảnh. Cuối cùng, phương pháp lợp ngói ô ảnh được sử dụng để nhận diện trứng muỗi Ae. albopictus, và phép lọc hình thái được áp dụng để đếm số lượng trứng đã xác định.
 Fig. 1
 Các bước trong hình:
 1. Data Acquisition: Thu thập dữ liệu; 2. Image Preprocessing: Tiền xử lý hình ảnh;
 Segment Anything Model (SAM): Mô hình phân đoạn bất kỳ (SAM); Point prompt generator: Bộ tạo câu lệnh điểm; Prompt encoder: Bộ mã hóa câu lệnh; Image encoder: Bộ mã hóa hình ảnh;
 Lightweight mask decoder: Bộ giải mã mặt nạ nhẹ; Origin image: Hình ảnh gốc; Divide dataset 6:2:2: Chia tập dữ liệu 6:2:2; Extract, clip, modify: Trích xuất, cắt, chỉnh sửa;
 Training, Validation, Testing: Huấn luyện, xác thực, kiểm tra; Overlap: Chồng chéo; 3. Model training: Huấn luyện mô hình; Faster R-CNN Model: Mô hình Faster R-CNN; ResNet + FPN: ResNet + FPN
 Feature Map: Bản đồ đặc trưng; ROI Pooling: Kết hợp ROI; RPN (Region Proposal Network): Mạng Đề xuất vùng (RPN); Fully connected layers: Các lớp kết nối đầy đủ; bbox, class: hộp giới hạn, lớp;
 4. Model Testing: Kiểm tra mô hình; Evaluate Detection: Đánh giá phát hiện;
 F-score: Điểm F; Evaluate Counting (morphological filtering): Đánh giá đếm (lọc hình thái); R-square: R-bình phương.
 (Còn nữa)
 CN. Nguyễn Thái Hoàng & TS.BS. Huỳnh Hồng Quang
 Viện Sốt rét-KST-CT Quy Nhơn