AlphaFold là phần mềm trí tuệ nhân tạo (AI) mới của DeepMind với khả năng dự đoán cấu trúc protein sau khi cuộn xoắn, quá trình phức tạp và mất nhiều thời gian để nghiên cứu.
Trong suốt 50 năm, các nhà khoa học đã tìm kiếm phương pháp dự đoán cấu trúc protein một cách nhanh chóng. Giờ đây, AI của DeepMind đã làm được điều đó.
Chỉ trong vài giây, AlphaFold có thể hoàn thành công việc mà các nhà khoa học phải mất nhiều năm để nghiên cứu. Ảnh: DeepMind. |
"Một bước tiến kinh ngạc"
AlphaFold được xem là bước đột phá trong lĩnh vực sinh học. Việc dự đoán cấu trúc protein có thể giúp các nhà khoa học tìm hiểu cơ chế gây bệnh, dự đoán mức hiệu quả của các loại thuốc và vai trò của protein trong cơ thể. Những vấn đề toàn cầu như nghiên cứu enzyme phân hủy nhựa cũng gắn liền với protein.
“Thuật toán này đã đủ mạnh để áp dụng trong những vấn đề khoa học hóc búa”, Demis Hassabis, nhà sáng lập kiêm CEO DeepMind khẳng định AlphaFold sẽ mang đến nhiều thú vị trong lĩnh vực sinh học.
Venki Ramakrishnan, nhà sinh học cấu trúc thuộc Đại học Cambridge (Anh) nhận định AlphaFold là “bước tiến kinh ngạc” khi làm được điều mà các nhà khoa học phải mất vài chục năm nữa mới có thể thực hiện.
Protein là các chuỗi axit amin có thể cuộn xoắn thành nhiều cấu trúc (hình dạng) khác nhau. Mỗi protein có cấu trúc 3D phức tạp xác định chức năng và cách hoạt động của nó, được quyết định bởi hàng triệu tương tác giữa các axit amin. Lượng cấu trúc mà protein có thể cuộn xoắn là một googol (số 1, theo sau là 300 số 0).
Một cấu trúc protein do AlphaFold dự đoán. Ảnh: DeepMind. |
Quá trình mất nhiều năm được hoàn tất trong vài giây
Dự đoán cấu trúc protein là vấn đề khiến các nhà nghiên cứu đau đầu suốt nửa thế kỷ. Hầu hết quá trình sinh học xoay quanh protein: cách insulin kiểm soát lượng đường trong máu, việc kháng thể chống lại virus corona ra sao đều do cấu trúc protein quyết định.
Các nhà khoa học đã xác định khoảng 200 triệu protein, song lượng cấu trúc được nghiên cứu chỉ chiếm phần nhỏ. Việc dự đoán cấu trúc protein là một trong những thách thức lớn nhất bởi lượng protein tồn tại là rất nhiều.
Để dự đoán cấu trúc và cách cuộn xoắn của protein, các nhà nghiên cứu sử dụng phương pháp cộng hưởng từ hạt nhân và tia X. Quá trình trên có thể mất nhiều năm trong phòng thí nghiệm, đòi hỏi thiết bị chuyên dụng trị giá hàng triệu USD.
Với AlphaFold, việc dự đoán hình dạng và cấu trúc của protein có thể hoàn tất chỉ trong vài giây với độ chính xác cao.
Demis Hassabis, CEO DeepMind khẳng định AlphaFold sẽ mang đến nhiều điều thú vị trong lĩnh vực sinh học. Ảnh: DailyMail. |
Để tìm hiểu cách protein cuộn xoắn, các nhà nghiên cứu tại DeepMind đã “huấn luyện” thuật toán với cơ sở dữ liệu gồm 170.000 trình tự protein và hình dạng của chúng. Kết hợp cùng 100-200 bộ xử lý đồ họa, quá trình huấn luyện này mất vài tuần.
AlphaFold còn được DeepMind đưa đi tham gia cuộc thi CASP (Critical Assessment of Protein Structure Prediction). Cùng với những phần mềm khác, AlphaFold được cung cấp trình tự axit amin cho 100 protein để dự đoán cấu trúc của chúng. Bài giải sẽ được đối chiếu với kết quả nghiên cứu trong phòng thí nghiệm.
Không chỉ vượt trội hơn đối thủ, tỷ lệ chính xác của AlphaFold còn tương đương các phương pháp được dùng trong phòng thí nghiệm.
Tại CASP14 tổ chức hồi tháng 11, AlphaFold đạt điểm trung bình 92,5/100. Các dự đoán có biên độ sai trung bình khoảng 1,6 angstrom, có thể so sánh với chiều rộng của một nguyên tử hoặc 0,1 nm.
Tương lai của AlphaFold
Đây không phải lần đầu DeepMind được giới công nghệ chú ý. Năm 2016, phần mềm AI của công ty này với tên AlphaGo đã gây tiếng vang khi đánh bại kỳ thủ cờ vây Lee Sedol. Đến đầu năm 2019, giới game thủ đã chứng kiến AlphaStar chiến thắng 10/11 ván đấu với những người chơi StarCraft II chuyên nghiệp nhất.
Trong những năm gần đây, DeepMind hướng đến việc sử dụng AI để giải đáp một số câu hỏi hóc búa về khoa học, trong đó có AlphaFold.
Một số nhà khoa học đã được trải nghiệm công dụng của AlphaFold. Andrei Lupas, Giám đốc Viện Sinh học Phát triển Max Planck ở Tübingen (Đức) nói rằng AlphaFold đã giúp ông hoàn thành nghiên cứu về cấu trúc protein sau 10 năm.
Hiện có khoảng 200 triệu protein được xác định, nhưng lượng cấu trúc được nghiên cứu chỉ chiếm phần nhỏ. Ảnh: DeepMind. |
"Có hàng chục nghìn protein trong con người và hàng tỷ protein ở các loài khác gồm vi khuẩn lẫn virus... Ngay cả việc một lượng nhỏ phân tử quan trọng của protein bị sắp xếp lại cũng có thể ảnh hưởng nghiêm trọng đến sức khỏe con người. Do đó, một trong những cách hiệu quả để tìm hiểu bệnh là nghiên cứu các protein liên quan", Tiến sĩ John Moult, Chủ tịch CASP14 cho biết.
Hiện DeepMind đã hợp tác với một số nhóm nghiên cứu, sử dụng AlphaFold để tìm hiểu các bệnh như sốt rét, ngủ nhiều và leishmaniasis - một loại bệnh nhiễm ký sinh trùng.
John Jumper, nhà nghiên cứu tại DeepMind khẳng định công nghệ này đã phát triển vượt bậc dựa trên kết quả tại CASP, tuy nhiên mọi thứ sẽ không dừng lại. Trong tương lai, AlphaFold còn tập trung tìm hiểu quá trình kết hợp protein để tạo thành phức hợp, cũng như cách tương tác của chúng với các phân tử trong cơ thể sống.