Màn hình của 250.000 loài tiết lộ tinh chỉnh về mã di truyền

Mã di truyền chỉ ra cách thông tin di truyền được dịch thành các protein cụ thể ít cứng nhắc hơn các nhà khoa học từ lâu, theo nghiên cứu được công bố hôm nay (9 tháng 11) trên eLife. Trong bài báo, các nhà khoa học báo cáo sàng lọc bộ gen của hơn 250.000 loài vi khuẩn và vi khuẩn cổ và tìm thấy năm sinh vật dựa trên một mã di truyền thay thế, biểu thị các nhánh trong lịch sử tiến hóa chưa được giải thích đầy đủ.

Mã di truyền đề cập đến cách trình tự của các bazơ DNA nucleotide dẫn đến các chuỗi axit amin cụ thể trong quá trình tổng hợp protein. Để thực hiện tổng hợp này, ribosome đọc các sợi mRNA - bản sao của các bit bộ gen của sinh vật - theo từng phần của ba ba cơ sở cùng một lúc. Mỗi chuỗi ba ba ba, được gọi là codon, liên kết với một RNA chuyển giao cụ thể (tRNA) vận chuyển một axit amin tương ứng đến ribosome để thêm vào chuỗi protein. Một sinh vật có mã di truyền thay thế, giống như năm trường hợp mới mà các tác giả nghiên cứu tìm thấy, có codon tương ứng với các axit amin khác nhau so với mã di truyền tiêu chuẩn được sử dụng bởi phần lớn các dạng sống đã biết.

"Mã di truyền đã được đặt trong đá trong 3 tỷ năm", đồng tác giả nghiên cứu Yekaterina Shulgina, một sinh viên tốt nghiệp Đại học Harvard về sinh học hệ thống, nói với The Scientist. "Thực tế là một số sinh vật đã tìm ra cách để thay đổi nó thực sự hấp dẫn đối với tôi. Thay đổi mã di truyền đòi hỏi phải thay đổi các phân tử cổ xưa, quan trọng như tRNA rất cơ bản đối với cách thức hoạt động của sinh học.

Như vậy, mã này được cho là được bảo tồn phần lớn trên tất cả các dạng sống, với các nhà khoa học tìm thấy ngoại lệ thỉnh thoảng trong vài thập kỷ nghiên cứu vừa qua. Ngoài việc tìm ra năm mã di truyền thay thế mới, nhóm nghiên cứu cũng xác minh bảy mã khác đã được phát hiện từng mã một trong quá khứ, nâng tổng số trường hợp ngoại lệ đã biết ở vi khuẩn lên 12.

"Tôi rất vui khi thấy rằng tất cả các kết quả mà chúng tôi đã đưa ra cho đến nay trong [bài báo mới]," nhà hóa sinh Dieter Söll của Đại học Yale, người không làm việc trong nghiên cứu, nói với The Scientist. Söll đã nghiên cứu sự tiến hóa của mã di truyền trong nhiều thập kỷ và là người đầu tiên tìm thấy một mã di truyền thay thế trong vi khuẩn. Phương pháp của nhóm nghiên cứu là "rất tốt", ông nói - đặc biệt là vì cách nó minh họa rằng "mã di truyền cực kỳ linh hoạt".

"Để tìm lại mọi thứ mà chúng tôi đã biết và tăng gấp đôi số lượng các phân bổ lại đã biết" là đặc biệt ấn tượng, giáo sư tiến hóa gen của Đại học Dublin Kenneth Wolfe, người cũng không làm việc trong nghiên cứu cho biết. "Những gì họ đang tìm kiếm thực sự rất hiếm."

Shulgina và đồng tác giả nghiên cứu Sean Eddy, một nhà sinh vật học tại Harvard và là một nhà nghiên cứu của Viện Y khoa Howard Hughes, đã phát triển một thuật toán gọi là Codetta - được đặt theo tên của Đá Rosetta - có thể sàng lọc bộ gen của một sinh vật và dự đoán axit amin nào mà các codon của nó sẽ thêm vào một protein nhất định. Thuật toán nhanh chóng sàng lọc một bộ gen và so sánh nó với các protein của sinh vật trong một cơ sở dữ liệu có tên Pfam. Nếu đủ các biến thể từ mã tiêu chuẩn xuất hiện một cách nhất quán, Codetta gắn cờ sinh vật có khả năng sử dụng một axit amin thay thế cho một codon cụ thể. Từ đó, các nhà nghiên cứu có thể xác nhận thực nghiệm công việc của nó bằng cách tìm kiếm tRNA dự đoán trong sinh vật.

Codetta xuất sắc trong việc tìm kiếm các mã di truyền gần giống với tiêu chuẩn. Ví dụ, tất cả các chuyển đổi mới được phát hiện ảnh hưởng đến arginine, thường được mã hóa bởi các codon AGG, CGA và CGG. Trong một số mã di truyền thay thế mới được phát hiện, các codon này được gán lại cho axit amin tryptophan, đã được liên kết với TGG codon tương tự.

Trước nghiên cứu mới, tất cả các mã di truyền thay thế được biết đến trong vi khuẩn liên quan đến việc thay đổi codon "dừng lại" hướng dẫn máy móc tế bào rằng nó đã đạt đến cuối protein thành một liên quan đến axit amin. Kết quả mới cho thấy các mã di truyền thay thế đầu tiên trong vi khuẩn đại diện cho sự chuyển đổi codon cảm giác - nghĩa là thay đổi codon từ axit amin này sang axit amin khác.

Xác định các mã thay thế này là rất quan trọng, Eddy nói, bởi vì các nhà khoa học dự đoán những protein mà một sinh vật sẽ tổng hợp dựa trên bộ gen của nó làm như vậy với giả định rằng mã di truyền tiêu chuẩn đang diễn ra. Tính toán sai lệch, sau đó, sẽ cải thiện độ chính xác của những dự đoán đó và ngăn ngừa lỗi được mã hóa vào cơ sở dữ liệu khi ngày càng có nhiều bộ gen được giải trình tự.

 

Nhưng những thay đổi này không nên xảy ra trong những trường hợp bình thường, Eddy giải thích.

"Nếu bạn cố gắng thay đổi ý nghĩa của codon, về cơ bản bạn đang giới thiệu các đột biến đồng thời trên khắp bộ gen", Eddy nói với The Scientist. "Mỗi nơi mà codon đó được sử dụng, bạn chỉ cần thay thế một axit amin. Thật đáng kinh ngạc khi một sinh vật có thể sống sót qua điều đó." Dừng sự thay đổi codon ít "kịch tính", Eddy nói thêm, bởi vì thay đổi codon dừng lại thành codon cảm giác không thực sự thay đổi chức năng của protein, mà chỉ mở rộng đuôi của nó.

Một phần lý do thay đổi xảy ra, Shulgina giải thích, là một số bộ gen vi khuẩn có thể có thành phần thấp của một số nucleotide nhất định so với những người khác. Điều đó đưa việc sử dụng codon dựa vào các nucleotide đó xuống gần như bằng không, giúp một sinh vật dễ dàng sống sót thay đổi mà không thay đổi quá nhiều protein một cách quyết liệt.

"Ít nhất là trong vi khuẩn, có vẻ như những loại lực này có thể giải thích tại sao mã di truyền tiến hóa theo cách này", Shulgina nói. "Điều này có thể hoàn toàn khác nếu chúng ta nhìn vào các dạng sống khác như sinh vật nhân chuẩn." Các trường hợp ngoại lệ đối với mã di truyền tiêu chuẩn đã được tìm thấy trong các sinh vật nhân chuẩn đơn bào như nấm men, nhưng các chuyên gia hy vọng các mã thay thế sẽ hiếm gặp ở các sinh vật nhân chuẩn phức tạp hơn.

Truy tìm lý do tại sao những mã di truyền thay thế này xuất hiện trong lịch sử tiến hóa là khó khăn, nhiều nhà nghiên cứu nói với The Scientist,một phần không nhỏ vì con người không thể xem nó xảy ra. Nhưng các tác giả có một số giả thuyết.

Trong một trường hợp, Shulgina đã xác định được một loại vi khuẩn sử dụng cùng một mã thay thế như một loại virus vi khuẩn lây nhiễm vào nó, chỉ ra rằng vi khuẩn dường như đã tiến hóa một mã thay thế ngăn chặn máy móc tế bào của nó bị tấn công - và phage sau đó có thể đã thực hiện sự thích nghi tương tự để theo vật chủ của nó.

Để kết thúc, vi khuẩn và vi khuẩn cổ đại diện cho việc chạy thử nghiệm dễ dàng nhất cho Codetta. Shulgina, Eddy và các nhà nghiên cứu khác cho biết họ rất háo hức để xem những gì thuật toán tìm thấy trong cuộc sống nhân chuẩn; Tuy nhiên, việc chạy một màn hình trên bộ gen nhân chuẩn sẽ rất khó khăn vì có bao nhiêu tiếng ồn sẽ được thêm vào tín hiệu. Bộ gen nhân chuẩn có đầy đủ các pseudogen không chức năng, Shulgina giải thích, sẽ cần phải được lọc ra hoặc được tính đến trong bản cập nhật Codetta để tránh nhầm lẫn thuật toán.

Nhóm nghiên cứu cũng chạy Codetta trên bộ gen của nấm men, một sinh vật nhân chuẩn nổi tiếng vì có mã di truyền thay thế và thực hiện một khám phá mới giúp xác nhận dự đoán của nó về vi khuẩn. Tại một thời điểm, thuật toán không đủ tự tin để gán một axit amin cho một codon cụ thể. Sau khi nghiên cứu thêm, hóa ra nấm men sử dụng cùng một codon để mã hóa hai axit amin khác nhau.

"Phương pháp của tôi không được xây dựng để tìm ra điều đó; nó được xây dựng để tìm các mã hóa khác nhau, không phải mã hóa mơ hồ", Shulgina nói. "Codetta không muốn chọn bất kỳ axit amin nào cho codon đó, vì vậy theo một nghĩa nào đó, nó đã thất bại một cách rất chính xác."

Eddy và Shulgina có kế hoạch tinh chỉnh thuật toán và nói rằng biết trước những hạn chế này sẽ cho phép các nhà nghiên cứu khác thực hiện công việc của họ và chạy màn hình gen của riêng họ. Để đạt được điều đó, Shulgina và Eddy đã cung cấp Codetta trên GitHub cho bất kỳ nhà nghiên cứu nào có thể muốn sử dụng nó hoặc phát triển phiên bản của riêng họ.

"Vì chúng ta chỉ làm trầy xước bề mặt của đa dạng sinh học vi sinh vật thực sự, tôi nghĩ rất có thể Codetta sẽ hữu ích trong việc phát hiện ra các chuyển đổi codon bổ sung", nhà hóa sinh Pavel Baranov của Đại học Cork, người không làm việc trong nghiên cứu, nói với The Scientist qua email. "Tôi rất háo hức để tự mình thử nó."

Tuy nhiên, các dự đoán tính toán của Codetta phải được xác nhận bằng quang phổ khối và các công cụ khác, nhà sinh vật học hệ thống của Đại học Göttingen Martin Kollmar nói với The Scientist.

Đặc biệt, Kollmar muốn thấy nhiều trường hợp xác minh thử nghiệm hơn, chẳng hạn như kiểm tra kỹ xem các protein được tổng hợp bởi các mã di truyền thay thế có thành phần axit amin dự kiến. Nhưng, ông nói thêm, "đây là công việc khó khăn và nằm ngoài phạm vi của bài báo đó."

Trong khi đó, mọi nhà nghiên cứu đã nói chuyện với The Scientist cho biết họ hy vọng Codetta sẽ tiếp tục tìm ra ngoại lệ mới đối với các quy tắc được đặt ra bởi mã di truyền.

"Nghiên cứu này là một minh họa tốt đẹp rằng hầu như không có gì được bảo tồn phổ biến [trên tất cả sự sống]," nhà sinh vật học Antonis Rokas của Đại học Vanderbilt, người không tham gia vào công việc cho biết. "Sinh học chỉ là, theo một cách nào đó, khoa học về các trường hợp ngoại lệ."