Khởi đầu câu chuyện

Ngay khi đợt dịch mới bắt đầu đạt đỉnh ở Vũ Hán, các bạn Trung Quốc đã thử nghiệm vô số cách thức điều trị, thuốc cho SARS, cho H1N1, HIV, sốt rét, thậm chí cả thuốc Đông Y để bổ trợ. Trong số đó có nhắc đến việc sử dụng hydroxychloroquine, một loại thuốc trị bệnh sốt rét. Câu chuyện về nó ban đầu râm ran nhưng rồi trở nên ầm ĩ khi Trump nhắc đến trong cuộc họp tóm tắt tình hình thường ngày ở Nhà Trắng vào ngày 19/03/2020, thúc giục người Mĩ sử dụng nó để chữa Covid-19: "Có gì để mà mất? Thử nó đi". Chủ nhật, ngày hôm sau, ông thúc giục việc bỏ qua việc thử nghiệm lâm sàng và khi được hỏi về lý do thúc đẩy một phương pháp chữa trị chưa được kiểm chứng, ông nói: "Ở Pháp, họ đã có thử nghiệm cho kết quả tốt". Vậy là câu chuyện dẫn về một nghiên cứu ở nước Pháp.

Con đường từ một nghiên cứu nhỏ ở Marseilles đến những người có ảnh hưởng ở Silicon Valley, kênh Fox News rồi Nhà Trắng bày ra trước mắt chúng ta những bài học sâu sắc tinh tế về công việc nghiên cứu khoa học và mối liên hệ qua lại của chúng với cuộc sống thực tế. Qua một số tìm hiểu cơ bản, tôi bất ngờ là làm thế nào mà một nghiên cứu được thực hiện ngớ ngẩn, đầy rẫy những sai lầm không khó để nhận ra đối với những người làm nghiên cứu nghiêm túc lại có thể đi xa đến thế. Tại sao thay vì vứt vào sọt rác nó lại được nhắc đi nhắc lại trong vô số cuộc tranh luận ở khắp nơi trên thế giới. Bạn hãy cùng tôi đi tìm hiểu kĩ hơn để biết được rằng câu chuyện hóa ra không hề đơn giản như chúng ta tưởng ban đầu.

Vào đầu tháng ba, nhóm nghiên cứu của Raoult ở IHU Méditerranée Infection (tiếng Pháp: Institut hospitalo-universitaire en maladies infectieuses de Marseilles) đã làm một thực nghiệm để tìm hiểu xem việc sử dụng hydroxychloroquine riêng hay có kết hợp với azithromycin có chữa được Covid-19 hay không. Đúng ra thì con đường trưởng thành của một nghiên cứu khoa học nói chung là như sau.

Nó trước hết được trình bày thành một bài báo khoa học, gửi đăng (submit) vào hội nghị hay tạp chí khoa học. Mục đích là để được chấp nhận (accept) xuất bản trong kỉ yếu hội nghị hay trong tạp chí, từ đó công bố rộng rãi đến cộng đồng khoa học. Để kiểm soát chất lượng, bài báo phải vượt qua phản biện chéo (peer review) bởi các chuyên gia trong ngành. Lúc này, từ những lỗi nhỏ nhặt như sai chính tả, hành văn lủng củng cho đến những lỗi nặng như sai về thiết kế thực nghiệm, cách thức xử lý số liệu, cách thức đưa ra kết luận... đều phải được mổ sẻ, đưa ra tranh luận và đề nghị sửa chữa khắc phục. Có những bài báo bị loại bỏ ngay từ đầu vì nghiên cứu trình bày có những sai lầm cơ bản không thể sửa chữa. Có những bài báo chỉ được chấp nhận sau khi trải qua nhiều vòng phản biện, nhiều lần khắc phục những điểm yếu, bổ sung những thực nghiệm mới hay thậm chí gần như làm lại thực nghiệm từ đầu.

Quá trình trên có thể mất rất nhiều thời gian từ vài tháng đến hàng năm. Nhưng đó mới chỉ là khởi đầu. Khi được đăng, nghiên cứu vẫn chỉ được đảm bảo chất lượng dựa trên trình độ của một số ít người phản biện, uy tín của ban biên tập, uy tín của nơi xuất bản. Có rất nhiều bài báo sau khi công bố đã bị phát hiện có những sai lầm cơ bản không thể sửa chữa, bị rút lại (retract). Có vô số những bài báo có chất lượng chỉ đủ để vớt qua vòng phản biện của những tạp chí hạng thấp, dần chìm vào quên lãng.

Với tôi, mục đích cuối của nghiên cứu khoa học không dừng ở đó. Giá trị của nó cần được toàn cộng đồng khoa học ghi nhận, rồi có những nghiên cứu mới phát triển dựa trên hướng đi mà nó chỉ ra. Ở mức cao hơn nữa, phát hiện của nó ghi tạc vào tài nguyên tri thức của nhân loại, giá trị của nó được chứng tỏ trực tiếp hoặc gián tiếp qua những áp dụng rộng rãi trong thực tế cuộc sống xã hội này. Nghĩa là, bài báo đó sẽ phải trải qua một quá trình phản biện lâu dài của cả cộng đồng nghiên cứu và thực tiễn cuộc sống để đạt được tới bước phát triển cuối cùng. Quá trình phản biện chéo để được đăng tạp chí vì thế có thể coi là một bước sàng lọc ban đầu.

Quá trình truyền thống trên không hề hoàn hảo. Mọi người vẫn đang tìm cách cải thiện vì những lý do như quá rườm rà gây mất thời gian và vẫn ẩn chứa tiêu cực. Nhưng đó là sẽ nằm trong một câu chuyện khác tôi sẽ kể bạn sau.

Quay trở lại câu chuyện chính. Trong giai đoạn dịch bệnh khẩn cấp, có nhiều nhóm nghiên cứu liên quan đến Covid-19 đã chọn công bố rộng rãi ở dạng trước in (preprint), nghĩa là bỏ qua bước sàng lọc trên. Sẽ không có gì đáng nói nếu nó vẫn được cẩn trọng trải qua việc phản biện mở (open review) của toàn cộng đồng khoa học. Sự khác biệt là giờ đây chúng đi thẳng đến môi trường phổ thông đại chúng bình dân. Những kết luận có thể đúng có thể sai nhưng chưa được nhìn nhận đánh giá nghiêm khắc của những người có chuyên môn có thể gây ra nhiều tác hại khôn lường như bị chính trị gia lợi dụng để tuyên truyền, bị bóp méo thành tin giả để phát tán hoặc bị đơn giản hóa thành các chỉ dẫn sai và áp dụng đại trà. Đó là những rủi ro đáng kể phải tính tới. Dẫu sao các nhóm nghiên cứu như nhóm ở đại học hoàng gia London trong tình thế bất khả kháng đã buộc phải lựa chọn con đường đi này.

Nhưng ở đây có vẻ như sự lựa chọn của Raoult thì không trong sáng như thế. Sau khi hoàn thành thực nghiệm ban đầu, bằng cách nào đó, Raoult đã có được Gregory Rignano như một nhà quảng bá hiệu quả. Ông luật sư này xuất hiện trên Fox News với tư cách là cố vấn của trường dược Stanford để nói chuyện về phương pháp chữa này, khẳng định "100% là tỉ lệ chữa khỏi coronavirus". Rigano viết một tài liệu chia sẻ trên Google Drive cổ vũ việc sử dụng chloroquine với James Todaro, một nhà đầu tư chuỗi khối (blockchain) có bằng dược ở trường Columbia nhưng bỏ không hành nghề. Tài liệu ban đầu có đồng tác giả thứ ba, một nhà sinh học nghỉ hưu, người đã phủ nhận không biết gì về chuyện này khi được Wired hỏi. Tài liệu này được chế bản cho giống một bài báo nghiên cứu, đã tìm thấy độc giả ở tầng lớp thượng lưu của Silicon Valley. Nó được nhiều nhà đầu tư có ảnh hưởng chia sẻ rồi đến tay một ông trùm trong lĩnh vực lan truyền ảnh hưởng: Elon Musk. Vào ngày 16 tháng 3, ông ta tweet đường dẫn đến tài liệu cho 33 triệu người theo dõi mình. Khi câu chuyện đã đến Fox News, Silicon Valley thì sau đó chỉ còn là vấn đề thời gian để nó vòng đến Nhà Trắng, rơi vào tay trùm cuối Donald Trump.

Luồng thông tin dội trở ngược lại nước Pháp. Dân chúng Pháp đam mê tán phét và tranh luận không thể nào bỏ qua chủ đề này. Nó được bàn luận trên khắp các kênh truyền hình, ví dụ như ở LCI lci (tiếng Pháp), hay báo chí, ví dụ như trên báo Le Monde lemonde1 (tiếng Pháp). Bạn có thể bắt gặp được gần như tất cả các kiểu luận điểm của tất cả mọi người đến từ tất cả các ngành nghề khác nhau. Thậm chí tổng thống Pháp Macron vào giữa tháng 4 cũng bất ngờ ghé thăm phòng thí nghiệm của Raoult và nêu quan điểm, xem Le Parisien leparisien (tiếng Pháp). Trừ phi có những nhà khoa học có uy tín được tin tưởng, được lắng nghe, những cuộc tranh luận đại chúng công cộng ngang hàng này không giúp ai tìm đến được sự thật vì nó không hề mang tinh thần khoa học. Đôi khi tôi bắt gặp những nhà khoa học chân chính hiền lành vụng về cố gắng trong cô đơn bảo vệ quan điểm khoa học của mình trước số đông và thấy được sự đồng cảm lớn. Không ít lần tôi cũng bị ở trong hoàn cảnh kiểu như vậy rồi. Nhưng cũng cần phải nhấn mạnh rằng tôi không hề có ý định tạo cảm giác thiện ác đối đầu giữa một bên là thiểu số các nhà khoa học chân chính và một bên là đa số quần chúng nhân dân dốt nát. Mỗi cá thể con người đều mang nhược điểm ít nhiều ngu dốt, cảm tính, dễ nhầm lẫn, bảo thủ, dễ tự ái. Với đúng tinh thần khoa học thì những cuộc tranh luận của chúng ta thực chất là cùng hợp lực nhằm chống lại những nhược điểm đó, để dần tìm ra sự thật đang bị ẩn giấu. Để bảo vệ được sự ngay thẳng khoa học như Feynman nói, mỗi người phải thấm nhuần được tinh thần khoa học, một điều không hề đơn giản. Đó trước hết là quá trình liên tục và mãi mãi chống lại những nhược điểm trên ở trong chính bản thân mình chứ không phải là của ai khác.

Cái đáng buồn to lớn nhất chính là khi chứng kiến cuộc nói chuyện đi chệch hướng, luẩn quẩn trong tăm tối của những suy nghĩ hẹp hòi đả kích lẫn nhau, của những luận điểm lòng vòng phản khoa học, mãi không thể nào thoát ra để tìm được đến sự thật như mong muốn.

Tôi lại lan man nữa rồi. Quay trở lại câu chuyện chính. Cộng đồng khoa học không hề yếu nên hiển nhiên với một nghiên cứu nhỏ, làm vội vã, đầy sai lầm cơ bản thì sẽ vấp phải nhiều phê phán về chuyên môn. Nhóm nghiên cứu vì thế hứa hẹn sẽ công bố bài báo theo con đường chính thống và công khai dữ liệu thực nghiệm. Kết quả là bài báo có phản biện chéo "Hydroxychloroquine và azithromycin như là cách điều trị COVID-19: kết quả của thử nghiệm lâm sàng không ngẫu nhiên nhãn mở" (Hydroxychloroquine and azithromycin as a treatment of COVID-19: results of an open-label non-randomized clinical trial) sciencedirect được công bố vào ngày 20 tháng 3 ở International Journal of Antimicrobial Agents (IJAA). Ta gọi là nghiên cứu 1. Sau đó là một nghiên cứu tiếp theo được cho là sẽ với thực nghiệm được làm cẩn thận, tỉ mỉ hơn (dù không qua phản biện): "Hiệu ứng lâm sàng và vi sinh của việc kết hợp hydroxychloroquine và azithromycin với 80 bệnh nhân COVID-19 với ít nhất sáu ngày theo dõi tiếp theo: một nghiên cứu quan sát" (Clinical and microbiological effect of a combination of hydroxychloroquine and azithromycin in 80 COVID-19 patients with at least a six-day follow up: an observational study) mediterranee-infection. Ta gọi là nghiên cứu 2. Nghiên cứu 2 sử dụng rất nhiều kết quả của các bệnh nhân của nghiên cứu 1. Rất tiếc nghiên cứu mới vẫn không khắc phục được mấy những sai lầm nghiêm trọng của nghiên cứu cũ nên ở đây tôi sẽ tập trung vào phân tích nghiên cứu 1.

Vào tháng 5, trong bản nháp, tôi đã viết thế này:

Khi đã có đầy đủ hơn thông tin để nhìn lại, các chuyên gia uy tín vào phản biện, mọi sự sẽ thấy khá rõ ràng, câu chuyện sẽ bị chìm dần vào quá khứ. Cuối cùng thì cuộc sống bừa bộn, chúng ta có biết bao những vấn đề mới cần quan tâm, tại sao tôi lại mất thời gian sân si bới móc lại câu chuyện này? Vì tôi không muốn những bài học về nghiên cứu khoa học trong câu chuyện này bị chìm vào quên lãng. Giá trị của chúng mới là điều tôi muốn quan tâm. Chúng có thể sẽ có tác dụng khi bạn và tôi cần nhận xét đánh giá một nghiên cứu để ra quyết định trong một thời gian hạn hẹp. Chúng có thể sẽ có tác dụng khi bạn và tôi muốn tự mình mở mang tâm trí với một chủ đề khoa học nào đó mà chẳng tìm đâu ra người phân tích hộ cho mình. Chúng có thể sẽ có tác dụng khi bạn và tôi đang trực tiếp làm nghiên cứu, cần phải đánh giá các nghiên cứu hiện hành để chọn lựa một hướng đi có tiềm năng nhất trong hoàn cảnh thiếu thông tin, mọi thứ mù mờ. Chúng có thể sẽ có tác dụng khi bạn và tôi đang cố gắng đảm bảo chất lượng công việc nghiên cứu bằng cách tách mình ra liên tục phán xét công việc nghiên cứu của chính mình, với đầu óc phê bình khách quan sâu sắc nhất. Hi vọng là, câu chuyện này sẽ là lời dẫn tuyệt vời để đi đến những câu chuyện nghiên cứu khác.

Bây giờ (vào tháng 6), tôi nhận ra là mình đã quá lạc quan khi nghĩ rằng sau hai tháng, với sức mạnh của cộng đồng nghiên cứu, giá trị của phương pháp chữa trị đã được làm rõ. Thực tế là câu chuyện càng ngày càng trở nên đại chúng hóa, chính trị hóa, mở rộng ở mức độ kịch tính hơn. Rất nhiều nghiên cứu đa dạng tiếp tục được diễn ra, có cả kết quả tích cực lẫn tiêu cực, với đủ loại chất lượng. Tôi thấy rất buồn khi có thêm một số lượng lớn sức lao động và tiền của đã bị lãng phí khi đáng ra có thể dành cho các phương pháp chữa trị có triển vọng khác. Đó cũng là một phần lý do (ngoài việc lười biếng) khiến tôi chậm chễ hoàn thành bài viết này. Tôi nghĩ là tôi cũng phải mở rộng câu chuyện, nghĩa là không dừng ở các nghiên cứu của Raoult mà phải mở rộng chủ đề ra xa hơn.

Chi tiết phản biện nghiên cứu 1

Trước hết, ở phần dưới này tôi sẽ trình bày về cách thức tôi thường phản biện bài báo, với những chi tiết cho riêng bài báo cho nghiên cứu 1 của Raoult.

Đa số các phát hiện dưới đây được tham khảo từ nhiều nguồn như trong danh sách có ở cuối bài. Vì điều kiện hạn chế vì trí nhớ và thời gian nên tôi xin lỗi nếu có một số trích dẫn không được thực hiện chi tiết, nghĩa là bỏ qua việc nói điều này được lấy từ mục nào phần nào của bài nào mà chỉ tổng quan ngầm hiểu là từ một trong số bài ở trong danh sách. Các nguồn chính có phản biện của cộng đồng khoa học cho bài báo thứ nhất pubpeer1, phản biện của cộng đồng khoa học cho bài báo thứ hai pubpeer2, các bài viết công phu forbetterscience, les-crises1. Do là người ngoài ngành nên rất xin lỗi nếu có một số mô tả hay thuật ngữ chuyên môn viết hay dịch chưa sát. Hi vọng sẽ nhận được góp ý của bạn để có thể dần khắc phục được hết những khuyết điểm này.

Thể loại bài báo

Điều đầu tiên cần xem xét là thể loại bài báo. Nếu bài báo thuộc dạng trước in (preprint) thì bình thường nên chờ qua phản biện, được chấp nhận công bố thì mới đọc. Điều này giúp tránh mất thời gian vào những nghiên cứu kém chất lượng. Ở đây là một trường hợp ngoại lệ do hoàn cảnh dịch bệnh. Nghiên cứu 1 của Raoult trước khi được công bố ở IJAA có thể tạm coi là dạng trước in, sau đó là bài báo tạp chí. Nghiên cứu 2 là trước in.

Nguồn gốc bài báo

Sau đó cần để ý đến nguồn gốc bài báo. Trước hết là việc tạp chí hay hội thảo có uy tín không. Sở dĩ có cả hội thảo vì không phải lúc nào bài báo hội thảo cũng kém hơn tạp chí. Cái này hoàn toàn phụ thuộc vào lĩnh vực. Với toán học thì chỉ có tạp chí nhưng với khoa học máy tính thì nhiều bài báo hội thảo lại được coi có chất lượng cao hơn bài báo tạp chí. Nếu nơi công bố ở thứ hạng thấp thì ta bắt buộc phải tăng độ nghi ngờ. Chú ý là có tồn tại những nơi tệ hại, việc phản biện chéo có thể được thực hiện rất sơ sài, đôi khi bị bỏ qua. Tệ hơn nữa thì quá trình công bố có thể hoàn toàn tiêu cực, nghĩa là người viết bỏ tiền hoặc thông qua mối quan hệ để đăng bài. Có những nơi mà thông tin về sự kém chất lượng hay tiêu cực có thể tìm kiếm dễ dàng. Cũng có lúc để phát hiện được, ta phải mất công để điều tra kĩ hơn. Ở đây, nghiên cứu 1 mặc dù qua phản biện chéo ở IJAA nhưng có một vài dấu hiệu tiêu cực. Thứ nhất là trong số các tác giả có biên tập viên của tạp chí J.M. Rolain và Philippe Colson. Đây là dấu hiệu nhỏ. Thứ hai, nghiêm trọng hơn là quá trình phản biện quá ngắn, theo thông tin bài báo là chỉ trong 1 ngày. Với chỉ riêng điều này, đúng ra đã có thể khẳng định việc có tiêu cực.

Liên quan đến nguồn gốc thì nhóm tác giả và nơi nghiên cứu cũng cần xem xét. Chú ý là với một số tạp chí hay hội thảo tân tiến, khi có điều kiện, có thể áp dụng biện pháp mù đúp (double blind), một biện pháp mạnh để tránh sự thiên lệch. Khi đó ngoài việc người nghiên cứu không biết ai là người phản biện thì người phản biện cũng không biết ai là người nghiên cứu. Tên tác giả và những chi tiết liên quan đến nhóm nghiên cứu đều phải được che đậy trong văn bản khi gửi lên phản biện. Trong trường hợp đó thì nên bỏ qua việc xem xét này. Ở đây, giả sử có thông tin, ta sẽ tìm hiểu xem nhóm tác giả, nơi nghiên cứu có uy tín không. Nếu là xuất phát từ những nước kém phát triển trong riêng ngành đó, ví dụ như khi trong danh sách tác giả của một bài báo về khoa học máy tính, ta toàn thấy tên Trung Quốc, Ấn Độ, Việt Nam thì bắt buộc phải tăng độ nghi ngờ. Vấn đề ở đây không phải là sự phân biệt đối xử hay kì thị mà hoàn toàn là quyết định mang tính thống kê: Các nghiên cứu từ những nơi như vậy thường có chất lượng thấp. Nếu có quá nhiều thời gian rỗi hoặc khi độ nghi ngờ tăng cao trong quá trình phản biện, ta nên làm một cuộc điều tra về phong cách và chất lượng nghiên cứu trung bình của nhóm tác giả, đơn vị nghiên cứu trong lịch sử. Việc này chỉ có thể làm nếu nhóm tác giả hay đơn vị nghiên cứu có tính ổn định cao, hoặc khi chịu ảnh hưởng rõ nét, tập trung từ người đứng đầu. Lịch sử nghiên cứu của nhóm Raoult, rất tiếc, có một số điều tiêu cực. Ở forbetterscience, Elisabeth Bik phát hiện việc sửa chữa hình ảnh, số liệu, bài báo bị gỡ bỏ, hay vào năm 2006 bị American Society for Microbiology (ASM) cấm gửi đăng báo trong một năm sau khi phát hiện có lỗi trong một bài báo gửi đăng. Sẽ là không khách quan khi chỉ nói đến tiêu cực. Lịch sử nghiên cứu của Raoult có một số thành tựu không thể chối bỏ, như có thể tham khảo ở sciencemag. Điểm yếu ở đây là chúng nằm ở lĩnh vực khá khác biệt với nghiên cứu đang phân tích. Có một điều nguy hiểm là khi bạn đạt được thành công trong bất cứ lĩnh vực gì, bạn dễ bị ngủ quên trên chiến thắng, mất đi sự khiêm tốn, ảo tưởng về trí tuệ siêu phàm của bản thân, có xu hướng áp đặt hiểu biết của mình lên mọi thứ, ngay cả với những thứ lệch so với tầm hiểu biết của mình. Đây là điều tối kị với việc bảo vệ ngay thẳng khoa học. Điều này có thể phản ánh qua phát biểu của Raoult về mô hình dịch tễ (epidemic modeling) ở trong cùng bài viết trên với đại ý các nhà mô hình dịch tễ là lang băm, không có ví dụ nào về dịch bệnh truyền nhiễm đã được dự đoán bỏi mô hình.

Cũng phải nói lại lần nữa rằng tất cả những thứ liên quan đến nguồn gốc bài báo ở trên chỉ là thông tin tham khảo, là yếu tố phụ giúp chúng ta thực hiện quá trình phản biện nhanh và chính xác hơn. Ví dụ như từ việc xem xét lịch sử, ta biết được lỗi hay gặp của nhóm tác giả để tập trung xem xét. Tất cả các quyết định phản biện cho bài báo chỉ căn cứ vào nội dung trực tiếp của chính nghiên cứu đó. Một câu hỏi đặt ra là nếu nghiên cứu trong bài báo có sử dụng tài nguyên hay trích dẫn số liệu của nghiên cứu kém chất lượng khác thì chả nhẽ ta lại bỏ qua vì nó đến từ nơi khác, không phải nội dung trực tiếp. Không có gì là mâu thuẫn ở đây vì bản thân cái quyết định sử dụng nằm hoàn toàn trong nghiên cứu, là điểm yếu lớn mà ta quan tâm.

Nguyên tắc, tiêu chuẩn cơ bản cần tuân theo

Bây giờ mới đến phần chính, đi sâu vào nội dung nghiên cứu. Đầu tiên là cần phải đảm bảo những nguyên tắc tổng quan của một nghiên cứu khoa học. Tùy theo mỗi ngành sẽ có tiêu chuẩn cụ thể hơn. Ví dụ như hai tiêu chuẩn vàng của thử nghiệm lâm sàng (clinical trial) là tính mù kép (double blinded) và thử nghiệm được kiểm soát và mang tính ngẫu nhiên (randomized controlled trial RCT). Ở đây, để chứng minh là phương pháp điều trị này hiệu quả, ta sẽ so sánh kết quả điều trị giữa hai nhóm bệnh nhân. Một nhóm được chữa theo cách thông thường, gọi là nhóm kiểm soát (control) và nhóm được chữa theo phương pháp đề xuất, gọi là nhóm điều trị (treatment). Với nguyên tắc kiểm soát ngẫu nhiên, bệnh nhân ở hai nhóm phải được lựa chọn hoàn toàn ngẫu nhiên từ một tập hợp và hai nhóm phải được kiểm soát bằng các phương pháp thống kê, đo lường để được đảm bảo là gần tương đương nhau. Điều này đảm bảo đầu vào của hai đối tượng so sánh là tương đương nhau, có thế phép so sánh mới có nghĩa. Với nguyên tắc mù kép, cả người điều trị (bác sĩ) và người bệnh đều không được biết về loại thuốc chữa. Điều này đảm bảo tránh việc bác sĩ ở giữa chừng tùy theo diễn tiến của bệnh mà can thiệp vào việc điều trị của từng nhóm theo các cách thức khác nhau. Tốt nhất, cách thức chữa trị riêng cho từng nhóm phải được mô tả chi tiết cho từng tình huống từ trước. Lý tưởng, tất cả phải được công bố từ trước. Nghĩa là trong thử nghiệm lâm sàng, việc chữa trị phải được đăng kí trước (pre-registration), công bố công khai nghi thức thử nghiệm (trial protocol) và các sửa đổi sau đó đi kèm lý do, công bố công khai kế hoạch phân tích (analysis plan) và các sửa đổi sau đó đi kèm lý do, đồng ý chia sẻ dữ liệu. Nghi thức thử nghiệm ở đây bao gồm mục đích, thiết kế, phương pháp, cân nhắc thống kê và các khía cạnh khác liên quan đến việc tổ chức thử nghiệm pubmed. Theo tôi, những tiêu chuẩn chặt chẽ này cũng cần phải được áp dụng một cách phù hợp cho các ngành khoa học thực nghiệm như khoa học máy tính, nơi các nguyên tắc về cách thức làm thực nghiệm vẫn đang còn quá lỏng lẻo. Ví dụ ở khoa học máy tính, theo tôi, trước khi làm các thực nghiệm cho bài báo thì các tác giả phải lưu một bản đăng kí thể hiện tất cả các thông tin chi tiết về ý tưởng, cách thức sẽ làm, kì vọng về kết quả ra sao. Sau khi làm thực nghiệm xong, các tác giả viết bài báo với đầy đủ quá trình làm thực nghiệm, kết quả thực nghiệm, các phân tích. Phân tích phải bao gồm tất cả các thông tin tích cực lẫn tiêu cực: cái gì đúng như kì vọng đã đăng kí, cái gì không, các hướng nên tiếp tục, các hướng nên loại bỏ, lý do..., trình bày mọi thứ có thể giống như tinh thần về ngay thẳng khoa học mà Feynman đã nói ở link. Việc đánh giá bài báo khi đó phải căn cứ vào toàn bộ quá trình, từ ý tưởng ban đầu, triển khai thực nghiệm, lấy kết quả, đến phân tích và kết luận. Vấn đề nhức nhối hiện nay là việc đánh giá hiện đang ưu tiên lệch lạc về hướng mọi thứ đều tốt đẹp: kết quả cuối cùng phải tích cực, nghĩa là phương pháp đề xuất bắt buộc phải cho kết quả tốt hơn, ý tưởng luôn đúng đắn. Nó đã ngầm khuyến khích việc lọc bỏ các điều tiêu cực ở tất cả các khâu. Đó không thể là một hệ thống công bố khoa học tốt. Dù sao, đây là một vấn đề lớn nên tôi xin hẹn các bạn ở những bài viết khác để bàn kĩ hơn về vấn đề này.

Hai tiêu chuẩn vàng ở trên đều là thể hiện cụ thể của nguyên tắc nghiên cứu tổng quan hơn: Thực nghiệm phải được thiết kế để giảm thiểu tối đa sự ưu tiên lệch lạc (bias) có thể làm kết quả trở nên vô nghĩa. Không được chủ quan bỏ qua bất kì điều gì dù là nhỏ nhặt nhất. Ví dụ như trong một hoạt động thực nghiệm đo đạc tính toán nào đó sai lầm đặt niềm tin vào một người mà bỏ qua việc kiểm tra chéo. Tất cả các phương pháp đã được chứng minh là hiệu quả trong điều kiện cho phép đều phải được áp dụng. Đây chính là bài học tránh một số bẫy lừa chính mình như trong ví dụ đo điện tích electron ở bài link. Ở đây, con người vì áp đặt mong muốn về khoảng giá trị của đại lượng muốn đo đã vô ý đưa ý kiến chủ quan của mình vào việc lựa chọn kết quả thực nghiệm, nghĩa là cố gắng tìm mọi cách bác bỏ các kết quả được cho là không hợp lý và dễ dàng chấp nhận kết quả được cho là hợp lý. Cũng trong bài viết đó, bài học này cũng được thể hiện trong câu chuyện thực nghiệm với chuột. Ở đây, một yếu tố tưởng nhỏ (âm thanh sàn nhà) nhưng hóa ra lại có ảnh hưởng quan trọng đến việc chuột ghi nhớ đường. Với hiểu biết ban đầu, yếu tố này dễ dàng bị bỏ qua, dẫn đến tất cả các kết luận rút ra trong rất nhiều thực nghiệm có cùng cấu hình đều sai. Chỉ khi Young, bằng phương pháp đúng đắn, mất rất nhiều công sức phân tích, thực hiện các thực nghiệm so sánh một cách cực kì cẩn trọng mới có thể phát hiện ra yếu tố này.

Nghiên cứu của Raoult không tuân theo hai tiêu chuẩn trên. Đây là điều cố ý vì Raoult đã có lần phát biểu trong một bài phỏng vấn được dịch ra tiếng Anh pubpeer3. Ở đó Raoult bác bỏ tất cả các tiêu chuẩn trên, ví dụ: "Tôi chưa bao giờ thực hiện các thử nghiệm ngẫu nhiên [...] Tác dụng của các phương pháp ngẫu nhiên, có thể nó có tác dụng đối với những người bị nhồi máu cơ tim, nhưng với các bệnh truyền nhiễm, nó không có ý nghĩa". Các ý kiến cho thấy một là Raoult không thấm nhuần được chút nào về ngay thẳng khoa học, hai là vì cái tôi cá nhân quá cao nên coi mình đứng trên tất cả, có hiểu biết hơn tất cả để nghi ngờ tất cả tác dụng của các tiêu chuẩn trên.

Hậu quả là, trong nghiên cứu, nhóm điều trị và nhóm kiểm soát được lấy từ hai tập hợp người riêng rẽ: nhóm điều trị là gần như tất cả những bệnh nhân ở trong học viện của nhóm nghiên cứu IHU ở Marseilles, trong khi nhóm kiểm soát là một số ít bệnh nhân còn lại và các bệnh nhân rải rác ở các trung tâm phía nam của nước Pháp (Nice, Avignon và Briançon). Vì ở nhiều nơi với các tổ chức khác nhau, không thể đảm bảo là nghi thức (protocol) chữa trị được tuân theo chính xác: bệnh nhân có thể không được chăm sóc tốt, hoặc đơn giản là được chăm sóc ý tế khác so với kế hoạch. Cả người điều trị và bệnh nhân đều biết về cách thức chữa trị. Tùy thuộc tình hình điều trị thực tế, một trong số được điều trị bổ sung với azithromycin, một loại chống nhiễm khuẩn. Đây là một can thiệp tùy tiện không nằm trong thiết kế từ trước. Chỉ riêng điều này cũng đủ làm vô hiệu toàn bộ kết quả so sánh về sau.

Tiêu chí lựa chọn là các bệnh nhân lớn hơn 12 tuổi, có vi rút ở trong cuống họng. Có ba nhóm bệnh nhân từ nhẹ đến nặng: không triệu chứng (asymptomatic), URTI: người bị viêm mũi, viêm họng, hoặc sốt vừa và đau cơ, LRTI: người bị viêm phổi hoặc viêm phế quản. Ở Marseilles, tất cả các bệnh nhân sẽ ở nhóm điều trị nếu không có bệnh lý đặc biệt (vấn đề về mắt hoặc tim) hoặc không mang thai. Các bệnh nhân bị loại trừ được cho vào nhóm kiểm soát. Việc cố tình sắp xếp một cách tùy tiện này càng làm hỏng sự cân bằng giữa hai nhóm cần so sánh. Việc lệch lạc này được thể hiện rõ qua việc so sánh các thống kê cơ bản giữa hai nhóm, ví dụ độ tuổi của nhóm điều trị trung bình là 51.2 trong khi của nhóm kiểm soát là 37.3 (xem hai bảng bên dưới).

Cách thức làm thực nghiệm, đo lường và báo cáo kết quả

Về mặt thống kê, từ các tham số định trước, các tác giả sử dụng phương pháp Fleiss with CC để tính số lượng bệnh nhân ít nhất cần có là 48 (24 điều trị và 24 kiểm soát). Việc tính toán này như một số người chỉ ra là có thể đã bị sai. Trong thực tế, ngay cả khi con số này đúng thì số lượng bệnh nhân cũng không được đảm bảo, thực tế là 42, và khá lệch giữa hai nhóm, bao gồm 26 trong nhóm điều trị và 16 trong nhóm kiểm soát.

Một yếu tố không kém quan trọng trong thiết kế nghiên cứu là cách thức nhà nghiên cứu lựa chọn đo và báo cáo kết quả, phải làm sao tuyệt đối khách quan. Ở đây, ngoài việc sai lệch so với tiêu chuẩn ban đầu, trong kết quả cuối nhóm nghiên cứu lại cố tình loại bỏ thêm 6 người, trong đó 1 rời bệnh viện vì khỏi bệnh, 1 dừng điều trị do nôn mửa và có 4 người có tình trạng trở nặng (3 người được chuyển đến đơn vị chăm sóc tập trung (ICU), 1 người qua đời). Sáu người này được nhóm nghiên cứu coi là người thất lạc (lost people) trong thử nghiệm lâm sàng, nôm na dùng để chỉ những người bỏ đi vì một lý do nào đó mà không thông báo, không theo việc điều trị đến cuối nên không lấy được kết quả cần thiết. Vấn đề có người thất lạc chỉ thường xảy ra với thử nghiệm quy mô lớn. Trong 6 trường hợp bị bỏ ra ngoài, không có trường hợp nào như vậy. Lý do loại bỏ là vì không thể lấy mẫu xét nghiệm về số lượng vi rút ở cổ họng từng ngày là không chính đáng, vô lý, theo hướng có lợi cho nhóm điều trị vì 4 người trở nặng này đều nằm trong nhóm điều trị. Đúng nguyên tắc, nhóm người này phải được tính là 1 trường hợp khỏi bệnh và 5 trường hợp điều trị thất bại. Việc đúng phải làm ở đây là tìm ra phương pháp hợp lý để phản ánh các trường hợp cực đoan này trong kết quả cuối cùng ngay cả khi không lấy được mẫu xét nghiệm. Hợp lý có nghĩa là phải định ra được độ đo sao cho các trường hợp khỏi bệnh phải có độ đo tốt hơn các trường hợp còn lại, các trường hợp trở nặng phải có độ đo tồi hơn các trường hợp còn lại. Điều này liên quan đến vấn đề tiêu chí chính được trình bày ngay phía dưới.

Một tùy tiện khác là trong đăng kí thử nghiệm, nghiên cứu được mô tả là sẽ đánh giá dữ liệu PCR ở ngày 1, ngày 4, ngày 7, ngày 14 nhưng nghiên cứu lại đưa ra kết quả là ngày 6, khác biệt so với kế hoạch mà không nêu được lý do chính đáng. Nếu không phải là cố tình thì các tác giả đã rơi vào cái bẫy vô tình lựa chọn kết quả đúng theo mong muốn từ trước của mình.

Tiêu chí đánh giá

Tiêu chí đánh giá kết quả cần được định nghĩa rõ ràng từ trước. Tiêu chí chính thường được gọi là điểm cuối chính (primary endpoint), là kết quả chính của nghiên cứu thể hiện sự hiệu quả hay không của phương pháp điều trị. Có thể có các tiêu chí phụ khác nhưng tiêu chí chính là căn cứ duy nhất. Có cái bẫy sẽ mắc vào ở đây nếu các tác giả kết luận dựa trên tiêu chí phụ khi tiêu chí chính không tốt. Đây là lỗi phân tích rõ ràng, vì khi tiêu chí chính là tiêu cực, không thể có kết luận gì nữa. Vai trò của điểm cuối phụ chỉ là hỗ trợ cho thông điệp chỉ ra của điểm cuối chính.

Từ nội dung bài báo, ta thấy trong thử nghiệm này, điểm cuối chính là độ sạch của vi rút (ở đáy mũi (back of the nose)) ở ngày thứ 6 sau điều trị. Các Tiêu chí phụ là: i) xóa sạch vi rút (ở đáy mũi) vào ngày 14; ii) cải thiện kết quả điều trị: nhiệt độ cơ thể, tỉ lệ thở, ngày nằm viện và tỉ lệ tử; iii) sự xuất hiện của hiệu ứng lề (side effect).

Một vấn đề quan trọng là việc định ra điểm cuối chính là không hề tùy tiện, trái lại còn cực quan trọng. Lý tưởng, nó phải thể hiện đúng mục đích cuối cùng, cụ thể ở đây là bệnh nhân có được chữa khỏi bệnh hay không. Nếu hiểu đúng tinh thần này thì việc tìm ra một độ đo đúng đắn hơn điểm cuối chính của nhóm tác giả đã lựa chọn là hoàn toàn khả thi. Khi đó kết quả cuối sẽ có thể bao gồm 6 trường hợp không lấy được mẫu xét nghiệm ở trên. Vì lựa chọn sai nên câu hỏi cần phải trả lời là: "Liệu chloroquine có giúp điều trị và bảo vệ các ca bệnh nặng nhằm cứu mạng người" bị suy biến trở thành câu hỏi: "Liệu chloroquine có giúp cơ thể loại bỏ vi rút ở đáy mũi nhanh chóng hơn". Như nhiều nghiên cứu đã chỉ ra, việc tỉ lệ vi rút giảm hoặc hết ở đáy mũi không chứng tỏ được ca bệnh được chữa khỏi, thậm chí giảm nhẹ. Vi rút có thể vẫn còn đầy ở những bộ phận khác. Mối liên hệ giữa một kết quả xét nghiệm PCR (ta sẽ quay trở lại chi tiết hơn ở phần kết quả) với việc khỏi bệnh theo les-crises1 đã được nhiều nghiên cứu chỉ rõ.

Nghiên cứu jcm đã chỉ ra rằng với 273 mẫu đã chắc chắn có vi rút, được xét nghiệm với phương pháp PCR “RoRp-P2”, kết quả chỉ là dương tính với 28%, nghĩa là tới 72% là âm tính giả. Vì thế các phòng thí nghiệm phải sử dụng nhiều phương pháp khác nhau để giảm sự kém chính xác này.

Báo cáo cdc cũng khẳng định: “Kết quả âm tính là không đủ để bác bỏ sự nhiễm Covid-19 và không nên được sử dụng như một cơ sở duy nhất cho việc điều trị [...]. Kết quả âm tính giả có thể xảy ra với các mẫu xét nghiệm (specimen) được thu thập, vận chuyển, xử lý sai. Kết quả âm tính giả có thể xảy ra nếu các chất ức chế khuếch đại (amplification inhibitor) có mặt trong mẫu vật hoặc nếu không có đủ sinh vật trong mẫu vật. [...] Giá trị tiên đoán dương tính hay âm tính rất phụ thuộc vào tỷ lệ hiện mắc. Kết quả xét nghiệm âm tính giả có nhiều khả năng xảy ra khi tỷ lệ mắc bệnh cao.

Trong les-crises2 có đề cập: “Hiện tại chúng ta thực hiện lấy mẫu ở mũi, nhưng chúng ta biết rằng vi rút không có trong mũi ở mọi giai đoạn của bệnh [...] Một xét nghiệm có thể âm tính mặc dù bệnh nhân có triệu chứng và thực sự bị nhiễm. Điều này là do virus nằm ở sâu hơn nhiều, ví dụ như trong phổi.”

Để minh họa, ta có thể xem bài báo Nature nature với kết quả xét nghiệm PCR của 9 bệnh nhân:

Nghĩa là, lượng vi rút (đo bằng RNA sao chép bởi mL, thang logarit) của 9 bệnh nhân giảm nhanh hơn ở mũi (đường vàng) hơn là ở đờm (sputum) (đường da cam) hay ở phân (stools) (đường xám).

Vì thế, rất khó hiểu cho việc không báo cáo tình trạng lâm sàng (clinical status) của bệnh nhân trong kết quả ngày 6 để biết được rằng họ đã khỏi hay không. Ta hoàn toàn có thể nghi ngờ là rất nhiều bệnh nhân dù có kết quả xét nghiệm PCR với mẫu ở đáy mũi là âm tính đều chưa khỏi bệnh, thể hiện ở việc họ vẫn tiếp tục nằm viện để có kết quả xét nghiệm. Họ khó có thể đã khỏe mà vẫn cố nằm viện chỉ để với mục đích cung cấp mẫu xét nghiệm, cống hiến cho khoa học. Tất nhiên đó chỉ là thêm một nghi ngờ.

Chi tiết kết quả và phân tích

Dù việc câu hỏi có bị suy biến như vậy thì nếu tìm được câu trả lời chính xác, nghiên cứu vẫn có thể có một chút giá trị. Rất tiếc là kết quả và phân tích trong bài báo cũng có rất nhiều vấn đề.

Các độ đo trong bảng là kết quả của việc xét nghiệm, bao gồm 2 bước: lấy mẫu và phân tích PCR. Độ đo này không hề lý tưởng, có sai số. Ngay bước lấy mẫu cũng là công việc phức tạp, cần người có chuyên môn, tiềm ẩn sai sót, ví dụ lấy mẫu với lượng không đủ. Sau đó, ta thực hiện phân tích PCR từ mẫu lấy. Độ đo thể hiện trong bảng không thể hiện "lượng vi rút" mà là số lần ít nhất thực hiện khuếch đại (nhân đôi) số lượng mã gen (genetic code) của RNA của vi rút từ trong mẫu để đạt được lượng đủ lớn (lớn hơn M) để máy đo có thể phát hiện được (dùng fluorrescence). Nếu thực hiện quá một số lần CT nhất định mà vẫn không phát hiện được vi rút thì ta coi là âm tính. Số lần tối đa thực hiện CT này được gọi là ngưỡng quay vòng (cycle threshold - CT). Dù lựa chọn CT là bao nhiêu thì lúc nào cũng sẽ có sai số âm và sai số dương: chọn quá bé sẽ làm cho mẫu dễ dàng được coi là âm tính, và ngược lại, chọn quá cao thì mẫu nào cũng là dương tính hết. Trong nghiên cứu này, CT = 35. Cần chú ý là các kết quả PCR có tham số ngưỡng khác nhau thì không thể so sánh được với nhau.

Bảng kết quả cụ thể:

Ta có thể thấy một số vấn đề nghiêm trọng.

Đầu tiên là sự sai khác so với mô tả ban đầu. Trong bảng kết quả vẫn bao gồm bệnh nhân số 1, 4 có độ tuổi là 10, đúng ra phải loại bỏ vì tiêu chí chọn mẫu là 12 tuổi trở lên.

Có một sự khác biệt rõ ràng giữa bản trước in và bản cuối như Leonid Schneider ở forbetterscience đã chỉ ra:

Việc chỉnh sửa nội dung viết giữa các bản là rất bình thường nhưng việc chỉnh sửa kết quả là một vấn đề nghiêm trọng, cần được giải thích thấu đáo. Lý do là việc lấy kết quả ngay từ lúc đầu đã phải làm rất cẩn thận ở mọi khâu, kể cả khâu tổng hợp cuối thành bảng để phân tích, để giảm thiểu mọi sai sót. Nếu phải chỉnh sửa do phát hiện sai sót thì cần phải quay trở lại tìm hiểu nguyên nhân chi tiết để xem kết quả còn có thể tin tưởng được nữa hay không.

Số liệu không được thể hiện nhất quán, độ đo có lúc chính xác là CT, lúc chỉ thể hiện NEG (tương đương CT = 35), lúc thể hiện POS (CT = ?), lúc thì không có (ND). Quá nhiều số liệu bị thiếu (ND trong bảng). Ngoại trừ Marseilles, các xét nghiệm không được làm hàng ngày. Thậm chí có 5 bệnh nhân không được xét nghiệm vào ngày thứ 6, ngày được chọn để lấy kết quả cho tiêu chí chính. Tại sao bệnh nhân số 6 lại không được xét nghiệm vào ngày 5, 6 khi vẫn nằm viện ở ngay trung tâm Marseilles?

Phương pháp đo không đồng nhất ở các đơn vị nên mới có giá trị chung chung POS, NEG. Có thể giả thiết là nó không được phân tích ở Marseilles mà ở các bệnh viện vùng khác. Không thể dám chắc là PCR được thực hiện với cùng một đoạn mồi (primer) và cùng giá trị CT. Nghĩa là POS (hay NEG) ở các vùng khác không có nghĩa là POS (hay NEG) ở Marseilles.

Phương pháp đo được mô tả sơ sài, lựa chọn giá trị CT = 35 là không dễ lý giải. Mục 3-8-4 les-crise cho thấy CT = 35 là quá thấp, dễ dẫn tới âm tính giả.

Có hiện tượng bất thường về số liệu, khi bệnh nhân có thể âm tính rồi lại dương tính và ngược lại. Điều này chứng tỏ số liệu bị viết sai hoặc là phương pháp đo không đáng tin cậy. Một ví dụ là ở biểu đồ sau:

Mọi người thường chỉ chú trọng vào sự khác biệt giữa hai đường cong, mà không nhận ra sự thật là tỉ lệ dương tính đúng ra chỉ giảm lại có 3 lần tăng lên ở nhóm kiểm soát.
Một điều cũng cần được nói tới là ở đây khoảng tin cậy (confidence interval) cũng bị bỏ qua. Chi tiết về khái niệm này chúng ta sẽ xem vào một bài viết khác. Về cơ bản, nó thể hiện độ sai số của kết quả trong thống kê với lý do có thể đến từ nhiều nguồn. Khi so sánh hai số x, y, ta không so sánh giá trị tuyệt đối của chúng mà thực tế là so sánh hai khoảng [x-e,x+e] với [y-f, y+f]. Nếu ví dụ mặc dù x > y nhưng hai khoảng lại quá chồng lấn lên nhau thì vẫn chưa kết luận được là x > y. Ở đây, khi vẽ lại kết quả bỏ các kết quả không có (ND) và có tính đến độ khoảng tin cậy thì kết quả là ta không kết luận được gì cả, quá nhiều khoảng bao nhau, đè lên nhau.

Một trong những lý do là vấn đề muôn thuở trong thống kê: lượng mẫu quá nhỏ để cho bất cứ kết luận nào có thể được đưa ra.

Kết luận cuối

Với nhiều lựa chọn và chế biến dữ liệu tùy tiện, mang đậm tính chủ quan, kết quả chính của nghiên cứu ở trở thành: Có 36 người còn lại đã hồi phục, và số người nhận được điều trị (nhóm điều trị) hết sạch vi rút nhanh hơn số người không (nhóm kiểm soát). Cụ thể như kết luận trong bài báo: 70% bệnh nhân được điều trị bởi được chữa khỏi vi rút, so sánh với 12.5% với nhóm kiểm soát. Ba kết luận được đưa ra:

i) hydroxychloroquine có hiệu quả trong việc làm sạch vi rút ở đáy múi [...] chỉ trong 3 đến 6 ngày, ở hầu hết các bệnh nhân,
ii) Sự khác biệt này với nhóm kiểm soát bắt đầu ngay từ ngày thứ 3 nhập viện
iii) Những kết quả này là “có tầm quan trọng rất lớn bởi vì một bài báo gần đây đã chỉ ra rằng thời gian trung bình có vi rút ở Trung Quốc là 20 ngày (thậm chí là 37 ngày là khoảng thời gian dài nhất)”.

Kết luận iii quan trọng, liên quan đến việc so sánh với nghiên cứu ở Trung Quốc và có một loạt các vấn đề. Thứ nhất là phải cùng mốc thời gian đếm (ngày hết vi rút tính từ ngày có triệu chứng đầu tiên). Khoảng thời gian từ 3 đến 6 ngày trong nghiên cứu là tính từ ngày điều trị, nghĩa là tương đương 7-10 ngày từ ngày có triệu chứng, đem so với 20 ngày trong nghiên cứu Trung Quốc. Nhưng còn rất nhiều khác biệt khác không thể bỏ qua: số lượng mẫu là khác nhau; hai biến thể vi rút ở hai vùng (dễ là) khác nhau; phương pháp PCR khác nhau vì khác biệt về đầu mồi (primer) và đặc biệt là giá trị CT (35 ở Marseilles và 45 của Trung Quốc); so sánh khác đại lượng, trung vị ở Marseilles so sánh với trung bình ở Trung Quốc.

Nói kĩ hơn một chút về giá trị của CT. Với giá trị CT = 35 thì việc âm tính sẽ xảy ra nhanh hơn với giá trị CT = 45. Để có cảm nhận nào đó với giá trị CT = 35, ta có thể tham khảo kết quả của một nghiên cứu khác:

để thấy rằng thời gian trung bình là 8-9 ngày, gần như tương ứng với giá trị 7-10 của nghiên cứu. Cần nhấn mạnh rằng việc so sánh chính xác là không thể vì dù dùng cùng giá trị CT, các cấu hình xét nghiệm khác nhau sẽ dẫn tới kết quả nhiều khả năng là khác nhau với cùng một mẫu xét nghiệm.

Nghiên cứu 2 sử dụng nhiều kết quả của nghiên cứu 1 và vấp phải nhiều sai lầm tương tự. Chi tiết có thể đọc thêm ở Twitter của Lu Chen twitter1.

Lạm bàn

Dưới đây là một số vấn đề bàn thêm cũng như bài học rút ra trong trường hợp này.

Để tránh nội dung quá dài, có một số vấn đề tiêu cực tôi không muốn đề cập đến nhiều. Một là ở đây rất có thể còn có mâu thuẫn lợi ích khi Sanofi, nhà sản xuất chloroquine, là một trong những đối tác của viện nghiên cứu. Một vấn đề khác là liệu thử nghiệm này có là phạm luật. Các vấn đề này được xem xét rất chi tiết ở trong các tài liệu tham khảo.

Ta cũng có thấy sai trái ngay ở trong tư tưởng của một số nhà làm nghiên cứu.

Việc ngụy biện cho việc không có thời gian để làm tỉ mỉ, cẩn thận trong khi kết quả vì dịch bệnh đang cần rất gấp là rất nguy hiểm. Đúng là cần kết quả gấp nhưng kết quả phải đúng. Kết quả sai sẽ dẫn đến tai hại khôn lường. Đa số các nghiên cứu gấp gáp không qua phản biện dạng này về sau nhìn lại sẽ là rác, hoàn toàn vô dụng. Một số bài, ví dụ như acpjournals, đã chỉ ra những tác hại chính như là: các chính phủ, nhà chính trị, cá nhân hiểu sai hoặc cố tình hiểu sai cổ vũ cho việc sử dụng hydroxychloroquine để chữa trị, cá biệt có vụ gây chết người; quá tập trung tiền của và thời gian cho việc nghiên cứu về loại thuốc này trong khi còn có các hướng điều trị khác tiềm năng hơn; gây ra sự thiếu hụt về các loại thuốc có chứa hydroxychloroquine trên thị trường, nghĩa là thiếu thuốc cho các bệnh nhân cần đến.

Nghiên cứu khoa học không phải là chia ra hai phe rồi đấu tranh đúng sai. Nếu giả sử sau này phương pháp chữa trị này được chứng tỏ là đúng thì cũng không hề làm các nghiên cứu của Raoult về vấn đề này từ vô giá trị quay trở lại có giá trị. Thái độ của Philippe Gautret trong các cuộc phỏng vấn như ở lci hoàn toàn thể hiện tính coi đồng nghiệp như kẻ thù đang tấn công mình, ganh đua, bè phái phản khoa học. Rộng hơn, việc tranh luận tính đúng sai của nghiên cứu phải tập trung vào nội dung chính của nó. Không thể lan man dùng các kết quả khác thực chất là không liên quan để khẳng định giá trị của nghiên cứu. Ví dụ luận điểm so sánh tỉ lệ chữa khỏi ở vùng Marseilles và các nơi khác ở Pháp. Tỉ lệ này không có nghĩa vì có thể ở Marseilles tỉ lệ chữa khỏi cao do xét nghiệm diện rộng và điều trị cho cả các ca không có triệu chứng. Việc bám vào một so sánh giữa hai nhóm với quá nhiều yếu tố tác động và còn vô kiểm soát hơn nữa càng cho thấy là sự hiểu biết sai trái phản khoa học của nhóm nghiên cứu này.

Môi trường nghiên cứu của nhóm nghiên cứu này thực chất đã bị nhiễm độc. Điều này một lần nữa chứng tỏ ngay cả ở những nước phát triển vẫn có thể tồn tại những môi trường độc hại cho khoa học. Có thể kể đến một trường hợp khác tiêu biểu là phòng thí nghiệm của cựu giáo sư đại học Cornell Brian Wansink với loạt bài báo pizza nổi tiếng npr. Tôi hứa sẽ viết về nó trong một dịp khác. Không hiếm những môi trường như thế ở khắp nơi trên thế giới đâu. Cũng vì thế, rất tiếc việc sang Tây làm việc một thời gian cũng không hề đảm bảo là sẽ thấu hiểu được tinh thần khoa học.

Có một luận điểm cũng khá nguy hiểm là tách biệt việc thực hành chữa trị của bác sĩ với việc nghiên cứu của các nhà khoa học liberation (tiếng Pháp), lemonde2 (tiếng Pháp). Mở rộng ra thì đây là mối quan hệ với thực tế tức thời và nghiên cứu xa xôi hơn. Con người, với bản tính tùy tiện, dễ thay đổi, dễ sai lầm, dễ bị đánh lừa, chỉ có thể may mắn dùng linh cảm, hay trực giác của mình đưa ra được quyết định đúng, giải quyết được vấn đề trong một số ít lần. Đề cao linh cảm, hay trực giác, là đề cao sự tùy tiện, về dài hạn, chính là kẻ thù cản trở sự tiến bộ lâu dài. Chủ đề lớn nên tôi sẽ quay trở lại trong các bài viết khác.

Theo dự định lúc ban đầu, để nhấn mạnh cho việc phải tuyệt đối cẩn trọng và giữ thái độ khách quan với các nghiên cứu trước in, dù cho kết quả là tích cực hay tiêu cực với việc chữa trị sử dụng hydroxychloroquine, tôi định áp dụng việc phản biện này cho một số bài báo khác, ví dụ như nghiên cứu của nhóm tác giả Trung Quốc medrxiv cho kết quả tích cực hay nghiên cứu ở Mỹ pmc cho kết quả tiêu cực. Một nghiên cứu được Lancet phản biện, xuất bản rồi rút lại ở đây lancet đã trở thành một câu chuyện tiêu biểu hơn cả. Nó khiến cho việc viết về những nghiên cứu kia không còn cần thiết. Nghiên cứu này được cho là đã sử dụng dữ liệu khá lớn của công ty Surgisphere đến từ bệnh viện ở nhiều nơi trên thế giới để bác bỏ tác dụng của hydroxychloroquine. Nó đã gây ra nhiều ảnh hưởng lớn, một trong số đó là những quyết định của WHO ra cảnh báo tạm dừng mọi thử nghiệm với hydroxychloroquine rồi lại rút lại cảnh báo này. Với một nghiên cứu cho kết quả ngược lại với các nghiên cứu của Raoult nhưng có chất lượng tồi tệ không kém, tôi chắc chắn phải có một bài viết riêng để đối sánh. Chi tiết về vụ việc bạn có thể xem trước ở bài viết này respectfulinsolence.

Lời kết

Tôi không hề có ý định viết một bài dài như thế. Nhưng thực sự là có quá nhiều điều để nói. Câu chuyện cứ kéo dài ra mãi nên cho đến hôm nay câu chuyện mới coi như tạm hoàn thành. Tôi rất vui nếu các bạn kiên trì đọc được đến những dòng cuối này. Hẹn gặp lại trong những câu chuyện khoa học khác.

Tài liệu tham khảo

lci
[lemonde]
leparisien
sciencedirect
mediterranee-infection
les-crises1
les-crises2
forbetterscience
guardian1
guardian2
pubpeer1
pubpeer2
pubpeer3
pubpeer3
jcm
cdc
nature
twitter1
medrxiv
npr
acpjournals
pmc
lancet
respectfulinsolence
liberation
lemonde2