AI Crazy
New member
Một startup tên Living Models đang áp dụng mô hình nền (foundation models) vào sinh học, dùng kiến trúc transformer để phân tích trình tự DNA và RNA. Họ bắt đầu với cây trồng nhằm rút ngắn thời gian cải tiến giống và tăng khả năng chống chịu biến đổi khí hậu.
Trí tuệ nhân tạo đã thay đổi mạnh mẽ các lĩnh vực như xử lý ngôn ngữ và thị giác máy tính, và giờ đây sinh học đang nổi lên như một biên giới lớn tiếp theo. Thay vì huấn luyện mô hình trên văn bản hay hình ảnh, các nhà nghiên cứu chuyển sang dữ liệu sinh học như DNA và RNA, coi trình tự di truyền như hệ thống thông tin có thể phân tích ở quy mô lớn.
Công nghệ giải trình tự đã trở nên rẻ hơn và phổ biến hơn trong hai thập kỷ qua, tạo ra kho dữ liệu gen khổng lồ. Thách thức hiện nay không còn là thu thập dữ liệu mà là hiểu được cách các trình tự khác nhau tương tác và ảnh hưởng đến kết quả sinh học thực tế, từ tính trạng cây trồng đến khả năng chống chịu môi trường.
Living Models là một trong số các công ty sử dụng kiến trúc transformer — cùng loại nền tảng đã thúc đẩy làn sóng mô hình ngôn ngữ lớn — để phân tích mẫu trình tự sinh học. Thay vì dự đoán từ tiếp theo trong câu, các mô hình này tìm kiếm các mẫu và mối quan hệ cấu trúc trong trình tự di truyền mà các công cụ thống kê truyền thống thường bỏ sót.
Nhóm mô hình đầu tiên của họ tập trung vào sinh học thực vật, nơi dữ liệu di truyền phong phú và kết quả áp dụng có thể thấy ngay trong phát triển giống và nâng cao độ bền trước biến đổi khí hậu. Việc hiểu nhanh các tương tác gene có thể đẩy nhanh quá trình chọn giống, thiết kế đặc tính và tăng năng suất nông nghiệp.
"Mọi sinh vật sống trên Trái Đất đều chạy trên cùng một ngôn ngữ lập trình: DNA mã hóa RNA, RNA mã hóa protein, protein xác định kiểu hình," Bertrand Gakière, Phó chủ tịch phụ trách sinh học tại Living Models, nhấn mạnh. "Chúng tôi không xây dựng chatbot. Chúng tôi xây một mô hình có thể đọc và giải mã mã đó, điều hữu ích hơn nhiều so với dự đoán từ tiếp theo trong câu."
Theo CEO và đồng sáng lập Cyril Véran, bước chuyển này biến sinh học thành một vấn đề thông tin: biết danh sách các thành phần (như Dự án bộ gen người từng làm) là một chuyện, nhưng hiểu cách các thành phần ấy phối hợp và khái quát hóa kiến thức sang bối cảnh mới lại là thách thức lớn. Các phương pháp hiện tại như nghiên cứu GWAS, màn hình CRISPR hay chọn lọc gen đã cho kết quả quan trọng, nhưng còn thiếu những công cụ có thể tổng quát hóa ở quy mô lớn — điều các mô hình nền tiềm năng có thể cung cấp.
Tuy nhiên, thách thức vẫn lớn: cần khả năng tính toán mạnh, dữ liệu đầu vào có chất lượng cao và đa dạng, cùng quy trình kiểm định thực nghiệm chặt chẽ. Bên cạnh đó còn có các vấn đề đạo đức và quy định khi ứng dụng AI vào sinh học. Nếu vượt qua được những rào cản này, mô hình nền sinh học có thể mở ra cách mới để hiểu gene, tăng tốc đổi mới sinh học và hỗ trợ nông nghiệp bền vững.
Nguồn: Techradar
Trí tuệ nhân tạo đã thay đổi mạnh mẽ các lĩnh vực như xử lý ngôn ngữ và thị giác máy tính, và giờ đây sinh học đang nổi lên như một biên giới lớn tiếp theo. Thay vì huấn luyện mô hình trên văn bản hay hình ảnh, các nhà nghiên cứu chuyển sang dữ liệu sinh học như DNA và RNA, coi trình tự di truyền như hệ thống thông tin có thể phân tích ở quy mô lớn.
Công nghệ giải trình tự đã trở nên rẻ hơn và phổ biến hơn trong hai thập kỷ qua, tạo ra kho dữ liệu gen khổng lồ. Thách thức hiện nay không còn là thu thập dữ liệu mà là hiểu được cách các trình tự khác nhau tương tác và ảnh hưởng đến kết quả sinh học thực tế, từ tính trạng cây trồng đến khả năng chống chịu môi trường.
Living Models là một trong số các công ty sử dụng kiến trúc transformer — cùng loại nền tảng đã thúc đẩy làn sóng mô hình ngôn ngữ lớn — để phân tích mẫu trình tự sinh học. Thay vì dự đoán từ tiếp theo trong câu, các mô hình này tìm kiếm các mẫu và mối quan hệ cấu trúc trong trình tự di truyền mà các công cụ thống kê truyền thống thường bỏ sót.
Nhóm mô hình đầu tiên của họ tập trung vào sinh học thực vật, nơi dữ liệu di truyền phong phú và kết quả áp dụng có thể thấy ngay trong phát triển giống và nâng cao độ bền trước biến đổi khí hậu. Việc hiểu nhanh các tương tác gene có thể đẩy nhanh quá trình chọn giống, thiết kế đặc tính và tăng năng suất nông nghiệp.
"Mọi sinh vật sống trên Trái Đất đều chạy trên cùng một ngôn ngữ lập trình: DNA mã hóa RNA, RNA mã hóa protein, protein xác định kiểu hình," Bertrand Gakière, Phó chủ tịch phụ trách sinh học tại Living Models, nhấn mạnh. "Chúng tôi không xây dựng chatbot. Chúng tôi xây một mô hình có thể đọc và giải mã mã đó, điều hữu ích hơn nhiều so với dự đoán từ tiếp theo trong câu."
Theo CEO và đồng sáng lập Cyril Véran, bước chuyển này biến sinh học thành một vấn đề thông tin: biết danh sách các thành phần (như Dự án bộ gen người từng làm) là một chuyện, nhưng hiểu cách các thành phần ấy phối hợp và khái quát hóa kiến thức sang bối cảnh mới lại là thách thức lớn. Các phương pháp hiện tại như nghiên cứu GWAS, màn hình CRISPR hay chọn lọc gen đã cho kết quả quan trọng, nhưng còn thiếu những công cụ có thể tổng quát hóa ở quy mô lớn — điều các mô hình nền tiềm năng có thể cung cấp.
Tuy nhiên, thách thức vẫn lớn: cần khả năng tính toán mạnh, dữ liệu đầu vào có chất lượng cao và đa dạng, cùng quy trình kiểm định thực nghiệm chặt chẽ. Bên cạnh đó còn có các vấn đề đạo đức và quy định khi ứng dụng AI vào sinh học. Nếu vượt qua được những rào cản này, mô hình nền sinh học có thể mở ra cách mới để hiểu gene, tăng tốc đổi mới sinh học và hỗ trợ nông nghiệp bền vững.
Nguồn: Techradar
Bài viết liên quan