Jeff Dean là đồng sáng lập của Google Brain, Google Translate, Gemini. |
Hội nghị Trí tuệ Nhân tạo tạo sinh 2024 vừa được tổ chức tại TP.HCM với chủ đề “Chân Trời Mới” (Uncharted Frontiers), quy tụ nhiều tên tuổi đáng chú ý trong lĩnh vực AI trên thế giới.
Bài phát biểu trực tiếp của Jeff Dean, Giám đốc khoa học của Google, chuyên gia AI hàng đầu thế giới được đặc biệt quan tâm. Ông là đồng sáng lập của Google Brain, Google Translate, Gemini và nhiều sản phẩm đã giúp Google thống trị ngành công nghệ toàn cầu.
AI đã thay đổi thế nào trong những năm qua
"Trong những năm gần đây, máy học và AI thực sự đã thay đổi kỳ vọng của con người về những gì chúng ta có thể làm được với máy tính”, Jeff Dean mở đầu bài phát biểu.
Chúng ta thường nghĩ rằng máy tính là những cỗ máy khô khan, đơn sắc. “Nhưng giờ đây, chúng đã có thể hiểu những thông tin mà chỉ có con người mới thấu hiểu. Đây là tác vụ mà chúng chưa bao giờ làm được trước kia”, ông phân tích.
Theo Jeff Dean, máy tính nói chung và AI nói riêng đã chuyển từ từ các hệ thống đơn giản, dựa trên các bộ quy tắc có sẵn thành các mô hình phức tạp có khả năng hiểu thông tin phức tạp. Việc mở rộng quy mô các hệ thống AI bằng cách sử dụng các hệ thống điện toán khổng lồ, bộ dữ liệu đào tạo lớn hơn, tăng kích thước mô hình.
“Tất cả đều là chìa khóa giúp Google cải thiện kết quả của các hệ thống AI, từ đó khiến chúng ngày càng cao cấp hơn”, Giám đốc khoa học Google nói.
Jeff Dean nói về AI của Google tại sự kiện. |
Nhưng với Jeff Dean, điều thú vị nhất về AI tạo sinh trong những năm qua là con người đã có thể đảo ngược cách họ từng sử dụng AI.
Trước đây, kho dữ liệu đầu vào chỉ bao gồm hình ảnh, đoạn âm thanh hoặc đoạn văn đơn giản để AI dịch thuật, chuyển đổi thành văn bản. Hiện tại, mọi quy trình hoàn toàn có thể ngược lại bởi người dùng sẽ nhập câu lệnh để AI trả về hình ảnh, video do chính nó tạo ra.
Đó cũng chính là cảm hứng ra đời mô hình Gemini tại Google. "Chúng tôi đã phát triển loạt mô hình Gemini để xử lý các nguồn dữ liệu đầu vào đa dạng và tạo ra các đầu ra khác nhau, cho dù đó là văn bản, hình ảnh hay âm thanh”, Jeff Dean giải thích.
Gemini là minh chứng cho tầm nhìn muốn tạo ra một mô hình AI vượt qua các ranh giới truyền thống tại Google.
“Gemini được thiết kế theo hướng đa phương thức ngay từ những ngày đầu. Điều này có nghĩa là nó có thể xử lý đồng thời thời các loại đầu vào khác nhau, chẳng hạn như văn bản kết hợp với hình ảnh hoặc video. Sau đó, nó tạo ra các đầu ra tương ứng ở nhiều định dạng, bao gồm hình ảnh, văn bản hoặc thậm chí là âm thanh”, ông nói tại GenAI Summit 2024.
Khả năng đa phương thức này cho phép Gemini giải quyết nhiều vấn đề hiệu quả hơn bằng cách tận dụng vốn hiểu biết toàn diện của mình trên nhiều phương tiện khác nhau.
Đơn cử như tính năng tạo hình ảnh từ văn bản của Gemini cho phép người dùng cung cấp mô tả chi tiết và nhận được hình ảnh chất lượng tốt, chân thực. Tương tự, khả năng tạo âm thanh của chatbot cho phép tạo ra nội dung âm thanh phù hợp với các kịch bản hoặc ngữ cảnh cụ thể.
Những cỗ máy đứng sau Gemini
Để đạt được những khả năng ấn tượng như vậy, Gemini được xây dựng trên nền tảng của những công nghệ tiên tiến.
"Chúng tôi sử dụng kỹ thuật Mixed Precision Training”, Dean nói. Thay vì sử dụng các số có độ chính xác cao (32 bit), Google chỉ sử dụng 16 bit. Điều này giúp giảm đáng kể lượng dữ liệu cần lưu trữ và tăng tốc quá trình tính toán, trong khi vẫn đảm bảo độ chính xác.
Tương tự như khi chúng ta làm tròn một con số, đôi khi việc làm tròn một chút sẽ không làm thay đổi kết quả cuối cùng, nhưng lại giúp chúng ta tính toán nhanh hơn rất nhiều.
Bên cạnh đó, Jeff Dean cũng nhắc đến thuật ngữ Model parallelism (Song song mô hình) - là một đổi mới quan trọng không kém đối với Gemini. “Thay vì phân chia dữ liệu trên nhiều chip, chúng tôi chia nhỏ chính mô hình AI”, ông phân tích.
Bằng cách chia mô hình thành các đoạn chạy trên các chip riêng biệt và chỉ giao tiếp tại các điểm cần thiết, cách làm này giúp tăng tốc quá trình đào tạo và nâng cao hiệu suất, đặc biệt là đối với các mô hình quy mô lớn như Gemini.
Ông nhấn mạnh việc tối ưu hóa data pipelines (đường ống dữ liệu) là rất quan trọng trong quá trình đào tạo Gemini. Đây là phương pháp nhập dữ liệu thô từ nhiều nguồn dữ liệu khác nhau, sau đó được chuyển đến kho lưu trữ dữ liệu để phân tích. Tuy nhiên, nhược điểm của cách làm này là thời gian đợi dữ liệu được tải vào bộ nhớ và xử lý có thể gây tắc nghẽn trong việc huấn luyện các mô hình lớn.
“Chúng tôi sử dụng một đường ống tải và tiền xử lý dữ liệu chạy song song với hiệu suất cao”, ông giải thích. Điều này đảm bảo rằng GPU liên tục được cung cấp dữ liệu, giảm thiểu thời gian ngừng hoạt động và tối đa hóa hiệu quả đào tạo. Đường ống dữ liệu được sắp xếp hợp lý là yêu cầu quan trọng để duy trì thông lượng và hiệu suất cao trong quá trình đào tạo các mô hình phức tạp.
Trong bài phát biểu tại GenAI Summit 2024, Giám đốc khoa học Google cũng đánh giá cao hệ thống giáo dục mạnh mẽ của Việt Nam, nơi đang nuôi dưỡng nhiều nhà tiên phong AI tương lai. “Tôi tin rằng tiềm năng AI thay đổi thế giới là rất rộng mở. Trong đó, Việt Nam đang ở vị thế có lợi nhờ hệ thống giáo dục mạnh mẽ, đưa nhiều nhân tài đến với lĩnh vực này”, ông khẳng định.
Phiên thảo luận bàn tròn quy tụ nhiều chuyên gia. |
Bên cạnh các bài phát biểu chính của các chuyên gia như Jeff Dean hay TS. Lương Minh Thắng, hội nghị còn có các phiên thảo luận bàn tròn cho phép các đại biểu tham gia vào các cuộc thảo luận sâu về nhiều khía cạnh của AI.
Các cuộc thảo luận này bao trùm một phổ rộng các chủ đề, từ các tác động đạo đức của AI trong xã hội đến tiềm năng của AI trong việc thúc đẩy tăng trưởng kinh tế ở các thị trường mới nổi như Việt Nam.
Là hội nghị thượng đỉnh về GenAI đầu tiên tại Việt Nam, GenAI Summit 2024 - Uncharted Frontiers tập hợp những bộ óc thông minh nhất trong ngành AI, tạo nền tảng kết nối cộng đồng trí tuệ nhân tạo trong nước với các chuyên gia trên toàn thế giới.
Việc GenAI Summit 2024 lần đầu được tổ chức tại Việt Nam cho thấy các chuyên gia, các nhà đầu tư ngày càng tin tưởng vào hệ sinh thái đổi mới sáng tạo và tiềm năng trở thành hub công nghệ khu vực của Việt Nam.
Nhân loại sẽ đối đầu với trí tuệ nhân tạo như thế nào
Trong cuốn sách "Framers - Nhân loại đối đầu nhân tạo", các tác giả nhận định con người vẫn có lợi thế trong thời đại công nghệ.