Các công cụ mới cho phân tích nhanh chuỗi vi rút Corona và theo dõi biến thể
TNNN - Đại dịch COVID-19 đã thúc đẩy quá trình giám sát bộ gen của vi rút trên quy mô chưa từng có, các nhà khoa học trên thế giới sử dụng giải trình tự bộ gen để theo dõi sự lây lan của các biến thể mới của vi rút SARS-CoV-2.
Sự tích lũy nhanh chóng các trình tự bộ gen của vi rút tạo ra cơ hội mới để theo dõi mối liên hệ và tương tác lây truyền toàn cầu và cục bộ, nhưng việc phân tích quá nhiều dữ liệu bộ gen là một thách thức.
Russ Corbett-Detig, trợ lý giáo sư kỹ thuật phân tử tại trường Đại học California (UC) tại Santa Cruz, cho biết: “Hiện có hơn một triệu trình tự bộ gen của SARS-CoV-2. Không ai có thể đoán trước được con số đó khi chúng tôi bắt đầu giải trình tự loại vi rút này”.
Số lượng tuyệt đối của trình tự bộ gen vi rút corona và sự tích tụ nhanh chóng của chúng khiến cho thấy đặt các trình tự mới trên một "cây phả hệ gia đình" tất cả chúng có liên quan với nhau ra sao. Nhưng nhóm của Corbett-Detig tại Viện Genomics UC Santa Cruz đã phát triển một phương pháp mới thực hiện điều này với tốc độ nhanh chưa từng có. Phương pháp này được gọi là Vị trí lấy mẫu cực nhanh trên các cây phả hệ hiện có (UShER), công cụ mạnh mẽ này được mô tả trên tạp chí Nature Genetics ngày 10 tháng 5 năm 2021.
UShER xác định các mối quan hệ giữa các bộ gen vi rút mới được giải trình tự của người dùng và tất cả các bộ gen vi rút SARS-CoV-2 đã biết bằng cách thêm chúng vào cây phả hệ (cây phát sinh loài) hiện có, một sơ đồ phân nhánh giống như cây phả hệ cho thấy vi rút đã phát triển ra sao trong các dòng khác nhau khi nó tích lũy các đột biến. Tác giả đầu tiên Yatish Turakhia, một nhà nghiên cứu sau tiến sĩ, học giả tại Viện Genomics cho biết: "Chúng tôi có thể duy trì một cây phả hệ toàn diện gồm hơn 1,2 triệu trình tự vi rút corona và cập nhật nó với các chuỗi mới trong thời gian thực.Không có công cụ nào khác có thể xử lý các cây phả hệ có quy mô này với hiệu quả tương đương. Điều này giúp chúng tôi theo dõi tất cả các biến thể đang lưu hành, bao gồm cả các biến thể mới đang xuất hiện".
Có thể sử dụng phương pháp phân tích trình tự này để phát hiện ra các chủng vi rút mới khi chúng xuất hiện và theo dõi sự tiến hóa cũng như động thái lây truyền của chúng. Đồng thời sử dụng để xác định mối liên hệ giữa các trường hợp nhiễm vi rút corona riêng lẻ và để theo dõi các chuỗi lây truyền, một cách tiếp cận được gọi là truy tìm tiếp xúc bộ gen.
Corbett-Detig, một tác giả của bài báo cho biết: “Thách thức là phải có kết quả sớm để đưa ra những dự đoán có ý nghĩa mà các cơ quan y tế công cộng sử dụng nhằm cố gắng kiểm soát một đợt bùng phát dịch. Phương pháp của chúng tôi là đặt hàng có cường độ nhanh hơn bất kỳ thứ gì khác ngoài kia, đặt các mẫu mới trong phần mười giây".
UShER và các công cụ trực quan hóa dữ liệu liên quan có sẵn cho cộng đồng nghiên cứu thông qua Trình duyệt gen UCSC SARS-CoV-2, cũng cung cấp quyền truy cập vào nhiều loại dữ liệu và kết quả từ các nghiên cứu khoa học liên tục về vi rút, bao gồm các biến thể mới liên quan đặc biệt. "Trình duyệt của chúng tôi là nguồn thông tin toàn diện nhất về các đột biến xuất hiện trong vi rút và ý nghĩa của nguồn thông tin này đối với cuộc chiến chống lại vi rút", đồng tác giả David Haussler, giáo sư kỹ thuật phân tử sinh học và là giám đốc của Viện Genomics cho biết. "Nhờ nhóm của Russ, nó bao gồm cây phả hệ toàn diện nhất trên thế giới thuộc các dòng khác nhau của vi rút và cây đó tiếp tục phát triển hàng tuần, nhanh khi dữ liệu mới xuất hiện".
Giống như tất cả các loại vi rút, SARS-CoV-2 có được các đột biến khi nó nhân lên và lây lan. Hầu hết các biến thể ngẫu nhiên này trong trình tự bộ gen không ảnh hưởng đến hành vi của vi rút, nhưng các nhà nghiên cứu vẫn có thể sử dụng chúng để xác định các biến thể hoặc chủng vi rút khác nhau, xem chúng có liên quan ra sao và xác định xem hai mẫu có phải là một phần của cùng một chuỗi truyền động.
Các nhà khoa học đã xác định được một số đột biến quan trọng xuất hiện để làm cho vi rút dễ lây lan hơn. Các biến thể của SARS-CoV-2 với những đột biến này đang lây lan nhanh hơn các biến thể khác. Đồng tác giả Angie Hinrichs, một kỹ sư của UCSC Genome Browser, đã sử dụng UShER để xác định rằng một trong những biến thể này, được gọi là B.1.1.7, đã xâm nhập vào Hoa Kỳ. Hiện nay nó là chủng chủ yếu ở Hoa Kỳ.
Turakhia cho biết ông bắt đầu sử dụng UShER để nghiên cứu một biến thể mới đã xuất hiện tại Ấn Độ và có dường như đang lan truyền nhanh chóng ở đó. Được biết đến với cái tên B.1.617, dòng vi rút này có đột biến kép mà các nhà khoa học quan tâm.
Ông nói: "Chúng tôi vẫn chưa biết nó có liên quan ra sao, nhưng điều quan trọng là phải theo dõi nó". Corbett-Detig nói: “Bộ gen của vi rút có thể tiết lộ không tìm thấy các chuỗi lây truyền thông qua theo dõi tiếp xúc thông thường”. Cách tiếp cận này có thể giúp xác định các sự kiện siêu lây lan, trong đó một người truyền vi-rút cho nhiều người khác và nó cũng cho thấy rằng hai trường hợp từ cùng một vị trí thực là các bệnh nhiễm trùng không liên quan, không thuộc cùng một chuỗi lây truyền, vì trình tự vi-rút khác nhau quá nhiều .
Ông nói: “Đó là một cách tiếp cận có thể có giá trị trong tương lai, vì vậy chúng tôi đang xây dựng các công cụ để cho phép mọi người thực hiện công việc này trong thời gian thực. Nếu bạn muốn biết ai đã truyền vi rút cho ai, hoặc ở đâu trên thế giới có một mẫu mới, bạn cần lấy mẫu từ cộng đồng của mình và chiếu chúng lên cây phả hệ đã biết của tất cả các trình tự gen SARS-CoV-2 khác và các phương pháp cây phát sinh loài thông thường không thể làm được điều này trong một khoảng thời gian thích hợp".
Đó là bởi vì các phương pháp thông thường phải tính toán lại toàn bộ cây phả hệ mỗi khi thêm các trình tự mới , điều này quá mất thời gian khi có hàng trăm nghìn trình tự. UShER đặt các mẫu vào hệ thống phát sinh loài toàn cầu hiện có gần như ngay lập tức và nó cung cấp một cây phả hệ con cháu địa phương và các nước láng giềng gần nhất của các mẫu được thêm vào để có thể hình dung và kiểm tra chi tiết các mối quan hệ của chúng.
Các nhà nghiên cứu đã chỉ ra rằng UShER tìm đúng vị trí trong 97% trường hợp. Trong 3% khác, các vị trí không chính xác nhưng rất gần với vị trí thực và vẫn hữu ích cho việc theo dõi liên hệ. Cũng có thể sử dụng UShER để kiểm soát chất lượng nhằm nhanh chóng xác định và loại bỏ các trình tự chất lượng thấp chứa trình tự lỗi. Có thể trực quan hóa kết quả UShER và khám phá trên nền tảng Nextstrain để có hình ảnh tương tác về cây phả hệ và sơ đồ về cách thức lây lan của vi rút.
Trường Đại học California, Santa Cruz.
T. Tố Quyên dịch
Nguồn: Lab Manager – Hoa Kỳ