Thanh niên 27 tuổi dự đoán chính xác số liệu về Covid-19

Không được đào tạo chính thống về y học hoặc dịch tễ học, nhưng bằng kiến thức về khoa học máy tính và toán học, Youyang Gu đưa ra những con số dự báo đều gần như chính xác so với thực tế.

Hồi tháng Ba, tháng Tư năm ngoái, người ta đánh giá mức độ ảnh hưởng của COVID-19 chỉ dựa vào nguồn dữ liệu của Imperial College London (ICL), và Health Metrics and Evaluation (IHME) có trụ sở tại Seattle, Washington. Nhưng các mô hình thường đưa ra những dự báo không giống nhau.

ICL cảnh báo Mỹ có thể chứng kiến ​​khoảng 2 triệu ca tử vong do COVID-19 vào mùa hè, trong khi dự báo của IHME thận trọng hơn nhiều, đưa ra con số khoảng 60.000 ca tử vong vào tháng 8. Con số thực tế: có 160.000 người chết vì COVID-19 tại Hoa Kỳ vào đầu tháng Tám.

Sự khác biệt lớn trong các số liệu dự báo vào mùa xuân năm ngoái đã thu hút sự chú ý của nhà khoa học dữ liệu trẻ tuổi, tên là Youyang Gu.

Hồi tháng Tư, 2020, Youyang Gu sống cùng cha mẹ ở Santa Clara, California. Khi ấy, anh dành ra một tuần lễ để tạo công cụ dự đoán tử vong COVID của riêng mình và lập một trang web để hiển thị thông tin bệnh tật. Chẳng bao lâu sau, mô hình của Gu bắt đầu có kết quả chính xác hơn cả, so với mô hình của các tổ chức được tài trợ hàng trăm triệu USD và có hàng chục năm kinh nghiệm.

Gu, chàng trai trẻ, có bằng thạc sĩ kỹ thuật điện toán và khoa học máy tính của Học viện Công nghệ Massachusetts (MIT) và một bằng khác về toán học. Tuy không được đào tạo chính thức trong lĩnh vực liên quan đến đại dịch như y học hoặc dịch tễ học, nhưng anh cho rằng kiến thức của mình đối với các mô hình dữ liệu tỏ ra hữu ích trong thời kỳ đại dịch.

“Mô hình của anh ấy là mô hình duy nhất có vẻ đúng đắn nhất,” Jeremy Howard, chuyên gia dữ liệu và nhà khoa học nghiên cứu nổi tiếng tại Đại học San Francisco, nhận xét rằng các mô hình khác được chứng minh là vô nghĩa, không có sự xem xét kỹ lưỡng. Và Gu là người thực sự xem xét dữ liệu và thực hiện nó một cách nghiêm chỉnh.

thien tai toan hoc 1
Gu, một người nhập cư Trung Quốc lớn lên ở Illinois và California, có những dự báo gần như chính xác về số ca tử vong vì COVID-19. Hình: Twitter.

Mô hình dự báo mà Gu xây dựng hết sức đơn giản. Trước tiên, Gu xem xét việc kiểm tra mối quan hệ giữa các xét nghiệm COVID, số lần nhập viện và một vài yếu tố khác. Anh nhận thấy những dữ liệu đó được các tiểu bang và chính phủ liên bang báo cáo không nhất quán, trừ số tử vong hàng ngày là có vẻ đáng tin cậy. “Các mô hình khác sử dụng nhiều nguồn dữ liệu, nhưng tôi quyết định dựa vào số ca tử vong để dự đoán số người chết trong tương lai,” Gu nói. “Đó là cách duy nhất để loại các thông tin gây nhiễu khác.”

Sự thay đổi mới lạ, tinh vi của mô hình của Gu đến từ việc anh sử dụng các thuật toán học để phân tích các số liệu của mình. Sau khi tốt nghiệp MIT, Gu đã dành một vài năm làm việc trong ngành tài chính để viết các thuật toán cho các hệ thống giao dịch tần số cao – công việc đòi hỏi các dự báo đưa ra phải rất chính xác. Với COVID, Gu so sánh dự đoán của mình với tổng số ca tử vong được báo cáo cuối cùng và liên tục điều chỉnh phần mềm máy tính để đưa ra những tiên lượng chính xác hơn. Mặc dù công việc đòi hỏi số giờ như một công việc toàn thời gian, Gu vẫn tự nguyện làm không lương, sống bằng tiền tiết kiệm của mình. Anh muốn dữ liệu của mình được coi là không có bất kỳ xung đột lợi ích hoặc thành kiến ​​chính trị nào.

Mặc dù chưa hoàn hảo, nhưng ngay từ đầu, mô hình của Gu hoạt động khá tốt. Vào cuối tháng Tư, anh dự đoán Hoa Kỳ sẽ chứng kiến ​​80.000 người chết vào ngày 9 tháng Năm. Số người chết thực tế là 79.926 người. Cũng vào cuối tháng Tư, IHME dự đoán Hoa Kỳ sẽ không vượt qua 80.000 ca tử vong trong cả năm 2020. Gu dự đoán 90.000 ca tử vong vào ngày 18 tháng Năm và 100.000 ca tử vong vào ngày 27 tháng Năm, và một lần nữa, con số của Gu chính xác. Trong khi IHME dự đoán virus sẽ từ từ biến mất do biện pháp giãn cách xã hội và các chính sách khác, Gu dự đoán sẽ có một làn sóng lây nhiễm và tử vong lớn thứ hai, khi nhiều tiểu bang tái mở cửa sau khi bị đóng. Gu lại đúng!

IHME đã phải đối mặt với một số chỉ trích vào tháng Ba và tháng Tư, khi các con số của nó không khớp với những gì xảy ra. Tuy nhiên, số liệu của trung tâm uy tín, có trụ sở tại Đại học Washington và được tài trợ hơn 500 triệu USD từ Quỹ Bill & Melinda Gates này, đã được trích dẫn gần như hàng ngày trong các cuộc họp giao ban của các thành viên trong chính quyền cựu Tổng thống Donald Trump.

Các quan chức IHME vẫn tích cực quảng bá cho số liệu của mình, và đưa ra “lạc quan tếu” rằng vào tháng Bảy sẽ không có ca tử vong nào nữa. Thực tế vào thời điểm ấy, mỗi ngày Mỹ vẫn mất đi từ 1.000 đến 1.500 sinh mạng. Gu nói IHME làm những điều vô ích. Nhưng Christopher Murray, giám đốc IHME vẫn cho rằng các dự báo của họ đã được cải thiện một cách triệt để.

thien tai toan hoc 1
Tình hình đại dịch xấu hơn so với dự báo của IHME. Trong hình minh họa,  các nhân viên y tế đang chuyển xác một bệnh nhân COVID-19. Credit: Isaac Quesada/Unsplash

Nhưng mùa xuân năm đó, hàng tuần, nhiều người bắt đầu chú ý đến công việc của Gu hơn. Anh đã gắn cờ mô hình của mình cho các phóng viên trên Twitter và các nhà dịch tễ học qua thư điện tử, yêu cầu họ kiểm tra số liệu của mình. Vào cuối tháng Tư, nhà sinh vật học nổi tiếng của Đại học Washington, Carl Bergstrom, đã tweet về mô hình của Gu và không lâu sau đó, Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh Hoa Kỳ (CDC) đưa các con số của Gu lên trang web dự báo COVID của họ. Khi đại dịch bùng phát, Gu, một người nhập cư Trung Quốc lớn lên ở Illinois và California, thường xuyên tham gia các cuộc họp với CDC.

Lưu lượng truy cập vào trang web của Gu bùng nổ với hàng triệu người ghi danh hàng ngày để được biết điều gì đang xảy ra ở tiểu bang họ đang sinh sống cũng như trên toàn quốc. Niềm tin càng được củng cố, khi những con số xuất hiện sau đó đều đúng với dự đoán của Gu.

Với sự quan tâm sâu sắc đến những dự báo về đại dịch gây chết người này, nhiều mô hình bắt đầu xuất hiện trong suốt mùa xuân và mùa hè năm 2020. Nicholas Reich, phó giáo sư tại khoa thống kê sinh học và dịch tễ học tại Đại học Massachusetts, Amherst, đã thu thập khoảng 50 mô hình và đo lường về độ chính xác trong nhiều tháng tại Trung tâm dự báo COVID-19. Reich nói: “Mô hình của Youyang Gu luôn nằm trong danh sách dẫn đầu về độ chính xác.”

Vào tháng 11, Gu quyết định ngừng “cuộc chơi” (dự báo số ca tử vong). Phó giáo sư Reich nhận xét đó là một thái độ khiêm tốn đáng khen ngợi. Reich nói: “Anh ấy thấy các mô hình khác đang hoạt động tốt và tự cho đã hoàn thành công việc của mình.” Một tháng trước khi dừng dự án, Gu dự đoán Hoa Kỳ sẽ ghi nhận 231.000 trường hợp tử vong vào ngày 1 tháng 11. Khi đến ngày 1 tháng 11, Hoa Kỳ báo cáo có 230.995 người chết vì COVID. Con số suýt soát chỉ 5 người!

Sau một thời gian nghỉ ngơi, Gu, năm nay đã bước sang tuổi 27, đang sống trong một căn hộ ở New York, quyết định…trở lại cuộc chơi, với những con số liên quan đến COVID. Lần này, Gu tập trung vào số người bị nhiễm ở Hoa Kỳ, tốc độ triển khai vaccine và thời điểm mà cả nước đạt được miễn dịch cộng đồng. Dự báo Gu đưa ra, là có khoảng 61% dân số Hoa Kỳ sẽ miễn dịch cộng đồng do được chích ngừa vaccine hoặc đã bị nhiễm trùng từ trước, là vào tháng Sáu, 2021.

Saigonnhonews (Theo Bloomberg)