Ðội ngũ gồm 99 nhà khoa học vừa hợp lực giải mã thành công bộ gien người hoàn chỉnh, đồng thời sửa lỗi các phiên bản trước đó và mang đến cái nhìn mới về gien di truyền ở loài người.
Ðội ngũ tham gia dự án phải cần đến 6 báo cáo để mô tả công trình khổng lồ về bộ gien người. Và giới khoa học cuối cùng có được những số liệu thống kê tìm kiếm lâu nay để hiểu thêm về cách thức ADN ảnh hưởng đến nguy cơ bệnh tật. Ví dụ, các nhà nghiên cứu khám phá hơn 100 gien mới, và tìm ra hàng triệu biến thể di truyền. Một số biến thể nhiều khả năang đóng vai trò gây bệnh tật ở người.
![]() |
Công trình để đời
Cách đây một thế kỷ, các nhà khoa học thời đó biết rằng gien ngườiđược phân bổ trên 23 cặp nhiễm sắc thể. Thế nhưng, các cấu trúc vi mô lạ lùng, bề ngoài giống như những con giun, vẫn là một bí ẩn lớn. Ðến cuối thập niên 1970, giới chuyên gia bắt đầu sở hữu được năng lực xác định một vài gien người cụ thể và tiến hành giải mã chúng. Dù vậy, công cụ thời đó vẫn quá thô sơ, khiến không ít các nhà khoa học phải mất cả sự nghiệp mới lần theo dấu vết một gien di truyền.
Ðến cuối thế kỷ 20, mạng lưới các nhà di truyền học quốc tế bắt đầu được hình thành, cho phép triển khai nỗ lực giải mã toàn bộ ADN trên các nhiễm sắc thể ở người trên phạm vi toàn cầu. Vào thời điểm đó, Dự án Bản đồ Gien người quả thật là công trình vĩ đại, dựa trên số lượng trình tự gien đáng nể. Các nhà khoa học biết rằng hệ gien người chứa tổng cộng 3 tỷ cặp cơ sở, mỗi cặp gồm 2 đơn vị cấu trúc của ADN hoặc ARN, gọi là nucleobase. Nếu xem đây là những cặp “ký tự” thì 3 tỷ cặp cơ sở đó tạo nên chuỗi văn bản dài đủ để ghi chép đầy hàng trăm quyển sách.
Khi đội ngũ chuyên gia bắt tay vào dự án, công nghệ hiện đại nhất vào thời đó mà họ có thể sử dụng chỉ đủ năng lực giải mã trình tự của vài chục “ký tự” (nucleobase) hoặc cặp cơ sở. Các nhà nghiên cứu bị đẩy vào tình thế phải sắp xếp các trình tự giống như trường hợp sắp xếp từng mẩu của một trò chơi ghép hình khổng lồ. Ðể tập hợp, họ tìm kiếm những mẩu có đuôi tương đồng, có nghĩa là chúng xuất phát từ các phần chồng chéo của bộ gien. Phải mất nhiều năm để họ dần tập hợp các đoạn trình tự gien thành những mảng ghép lớn hơn.
Năm 2000, Nhà Trắng tuyên bố các nhà khoa học đã hoàn thành bản thảo đầu tiên của bộ gien người. Chi tiết của dự án được công bố trong năm kế tiếp. Thế nhưng, những chuỗi gien dài vẫn tiếp tục là điều bí ẩn, trong khi giới chuyên gia chật vật trong nỗ lực tìm ra vị trí chính xáccủa hàng triệu các cặp cơ sở khác. Trên thực tế, bộ gien người thực sự là một bộ ghép hình vô cùng phức tạp và khó thực hiện.
![]() |
Nhiều gien của con người tồn tại dưới dạng những bản sao gần như tương đồng. Tùy theo vị trí của chúng, các bản sao có thể đảm nhận những nhiệm vụ khác nhau. Các bản sao khác, chẳng hạn như gien giả, lại bị vô hiệu hóa bởi đột biến. Thậm chí một mẩu ADN ngắn thuộc về một gien cụ thể nhưng vẫn có thể lắp vừa vào những đoạn gien khác, dù không đúng vị trí của nó. Và gien cũng chỉ chiếm phần nhỏ trong bộ gien người. Ða số được cấu tạo từ các sợi ADN như siêu vi trùng, tồn tại chủ yếu để tự sao chép, trong khi lại “cài” những bản sao này vào các trình tự gien.
Bộ gien tham chiếu
Ðầu thập niên 2000, các nhà nghiên cứu đã cải thiện được khả năng “lắp ghép”, đồng thời viết những chương trình máy tính mới để tìm ra vị trí của các gien cụ thể. Theo thời gian, các nhà nghiên cứu tạo nên bản thảo tốt hơn cho bộ gien người, gọi là bộ gien tham chiếu. Giới khoa học gia sử dụng bộ gien tham chiếu làm kim chỉ nam cho các nỗ lực sắp xếp trình tự gien. Chẳng hạn, những nhà di truyền học lâm sàng có thể phân loại các đột biến gây bệnh bằng cách so sánh gien bệnh nhân với bộ gien tham chiếu.
Bộ gien tham chiếu gần đây nhất được công bố năm 2013. Ðây là phiên bản được cải thiện hơn hẳn bộ đầu tiên, nhưng còn xa mới được xem là hoàn tất; 8% bộ gien bị bỏ trống. “Về cơ bản, toàn bộ thông tin về một nhiễm sắc thể của người hoàn toàn không được ghi chép”, theo tiến sĩ Michael Schatz, nhà sinh học máy tính của Ðại học Johns Hopkins (Mỹ).
Năm 2019, tiến sĩ Adam Phillippy, nhà sinh học máy tính của Viện Nghiên cứu Bộ Gien người, và tiến sĩ Karen Miga, nhà di truyền học thuộc Ðại học California ở Santa Cruz (Mỹ), đã sáng lập một tổ chức với mục tiêu hoàn tất bộ gien. Tiến sĩ Phillippy thú nhận một phần động lực thôi thúc ông phải bắt tay thực hiện dự án táo bạo trên là vì: “Tôi khó chịu khi nhìn vào những khoảng trống trên bộ gien người”.
![]() |
Sau thời gian vận động, đội ngũ các chuyên gia cuối cùng lên đến 99 thành viên trực tiếp giải trình tự bộ gien, thêm hàng chục chuyên gia khác nghiên cứu dữ liệu thu được. Vì ảnh hưởng của dịch Covid-19, họ làm việc từ xa, trao đổi thông tin qua ứng dụng Slack. Cùng nhau, họ tận dụng năng lực của các siêu máy tính đời mới, có thể đọc những chuỗi gien có chiều dài hàng chục ngàn cặp cơ sở. Các nhà nghiên cứu cũng phát minh những kỹ thuật mới nhằm tìm ra các địa điểm diễn ra sự tái lặp bí ẩn của các trình tự gien.
Qua nhiều nỗ lực, họ bổ sung hoặc sửa chữa hơn 200 triệu cặp cơ sở trên bộ gien tham chiếu. Giờ đây, các chuyên gia có thể tự tin khi nói rằng bộ gien người chứa đến 3,05 tỷ cặp cơ sở. Khi giải mã những đoạn gien mới, họ cũng phát hiện hơn 2.000 gien chưa từng được ghi chép. Ða số đều bị vô hiệu hóa vì đột biến, nhưng 115 trong số này dường như có thể tạo ra protein. Ðội ngũ khoa học gia cho rằng phải mất nhiều năm để có thể hiểu rõ tác dụng của chúng.
Nhóm chuyên gia ước tính được bộ gien người chứa tổng cộng 19.969 gien mã hóa protein. Với việc hoàn thành kỳ công này, họ có thể nghiên cứu kỹ lưỡng hơn sự khác biệt về gien di truyền giữa người và người. Dựa trên phân tích, các nhà nghiên cứu tìm ra hơn 2 triệu vị trí mới trong bộ gien. Ðiều này cho phép mở ra kỷ nguyên mới trong nỗ lực khám phá liên quan đến gien di truyền ở người trong thời gian tới.
HỒNG HOANG
Bình luận