Mạng lưới thần kinh "Ảo giác"
Protein, là các phân tử giống như dây được tìm thấy trong mọi tế bào, tự nhiên gấp lại thành các hình dạng ba chiều phức tạp. Những hình dạng gấp này là chìa khóa cho gần như mọi quá trình sinh học, bao gồm phát triển tế bào, sửa chữa DNA và trao đổi chất. Nhưng sự phức tạp của hình dạng protein khiến chúng khó nghiên cứu. Các nhà hóa sinh thường sử dụng máy tính để dự đoán cách các chuỗi protein, hoặc trình tự, có thể gấp lại. Trong những năm gần đây, deep learning đã cách mạng hóa tính chính xác của công việc này. "Đối với dự án này, chúng tôi đã tạo ra các chuỗi protein hoàn toàn ngẫu nhiên và đưa các đột biến vào chúng cho đến khi mạng lưới thần kinh của chúng tôi dự đoán rằng chúng sẽ gấp lại thành các cấu trúc ổn định", đồng tác giả Ivan Anishchenko cho biết, Ông là một giảng viên sinh hóa tại Đại học Y washington và là nhà nghiên cứu trong phòng thí nghiệm của David Baker tại Viện Thiết kế Protein UW Medicine.
"Không có lúc nào chúng tôi hướng dẫn phần mềm hướng tới một kết quả cụ thể", Anishchenko nói, "Những protein mới này chỉ là những gì máy tính mơ ước."
Trong tương lai, nhóm nghiên cứu tin rằng có thể điều khiển trí tuệ nhân tạo để nó tạo ra các protein mới với các tính năng hữu ích.
"Chúng tôi muốn sử dụng học sâu để thiết kế các protein có chức năng, bao gồm các loại thuốc dựa trên protein, enzyme, bạn đặt tên cho nó", đồng tác giả sam Pellock, một học giả sau tiến sĩ tại phòng thí nghiệm Baker cho biết.
Nhóm nghiên cứu, bao gồm các nhà khoa học từ UW Medicine, Đại học Harvard và Viện Bách khoa Rensselaer (RPI), đã tạo ra hai nghìn chuỗi protein mới được dự đoán sẽ gấp lại. Hơn 100 trong số này đã được sản xuất trong phòng thí nghiệm và được nghiên cứu. Phân tích chi tiết về ba protein như vậy đã xác nhận rằng các hình dạng được dự đoán bởi máy tính thực sự đã được thực hiện trong phòng thí nghiệm.
"Các nghiên cứu NMR của chúng tôi, cùng với các cấu trúc tinh thể tia X được xác định bởi nhóm nghiên cứu của Đại học Washington, chứng minh độ chính xác đáng chú ý của các thiết kế protein được tạo ra bởi phương pháp ảo giác", đồng tác giả Theresa Ramelot, một nhà khoa học nghiên cứu cao cấp tại RPI ở Troy, New York cho biết. Gaetano Montelione, đồng tác giả và giáo sư hóa học và sinh học hóa học tại RPI, lưu ý.
"Phương pháp ảo giác được xây dựng dựa trên các quan sát mà chúng tôi thực hiện cùng với phòng thí nghiệm Baker tiết lộ rằng dự đoán cấu trúc protein với học sâu có thể khá chính xác ngay cả đối với một chuỗi protein duy nhất không có họ hàng tự nhiên. Tiềm năng để ảo giác các protein hoàn toàn mới liên kết các phân tử sinh học cụ thể hoặc hình thành các vị trí hoạt động enzyme mong muốn là rất thú vị.
"Cách tiếp cận này đơn giản hóa rất nhiều thiết kế protein", tác giả cao cấp David Baker, giáo sư hóa sinh tại Trường Y khoa UW, người đã nhận được Giải thưởng Đột phá năm 2021 về Khoa học Đời sống cho biết. "Trước đây, để tạo ra một loại protein mới với hình dạng đặc biệt, trước tiên mọi người đã nghiên cứu cẩn thận các cấu trúc liên quan trong tự nhiên để đưa ra một bộ quy tắc sau đó được áp dụng trong quá trình thiết kế. Các bộ quy tắc mới là cần thiết cho mỗi loại nếp gấp mới. Ở đây, bằng cách sử dụng một mạng lưới học sâu đã nắm bắt được các nguyên tắc chung về cấu trúc protein, chúng tôi loại bỏ sự cần thiết phải có các quy tắc cụ thể và mở ra khả năng tập trung trực tiếp vào các bộ phận chức năng của protein.
"Khám phá cách sử dụng tốt nhất chiến lược này cho các ứng dụng cụ thể hiện là một lĩnh vực nghiên cứu tích cực và đây là nơi tôi mong đợi những đột phá tiếp theo", Baker nói.
Reference: Anishchenko I, Pellock SJ, Chidyausiku TM, et al. De novo protein design by deep network hallucination. Nat. 2021. doi:10.1038/s41586-021-04184-w.
December 2, 2021
Ian C. Haydon/UW Medicine Institute for Protein Design.