Bén duyên với nghiên cứu từ những bài toán trên lớp
Sinh năm 1987, anh Nguyễn Hữu Thiện lớn lên với niềm yêu thích đặc biệt dành cho các bài toán logic. Lúc học cấp THCS, anh thường dành hàng giờ chỉ để tìm ra một cách giải sáng tạo và độc đáo cho bài toán vừa học. Đam mê đó đưa Thiện vào lớp chuyên Toán của Trường THPT chuyên Hưng Yên, nơi anh đoạt giải nhì quốc gia và mở ra cánh cửa vào chương trình cử nhân tài năng của Đại học Bách khoa Hà Nội.
Thay vì tiếp tục học toán thuần túy, Thiện chọn khoa học máy tính vì mong muốn gắn tư duy toán học với những sản phẩm có tính ứng dụng cao trong đời sống. Trong một bài tập lớn, anh gây ấn tượng với giảng viên và được mời tham gia nhóm nghiên cứu về xử lý tiếng Việt, trải nghiệm đầu tiên đặt nền móng cho con đường học thuật sau này.
Khi thử nghiệm tự động hóa một số quy trình trong dự án, Thiện phát hiện khả năng của các thuật toán máy học và quyết định tổng hợp kết quả thành bài báo khoa học đầu tay và đoạt giải nhì nghiên cứu khoa học cấp Bộ và củng cố quyết tâm ra nước ngoài học tiếp.
Sau quá trình nỗ lực, anh Nguyễn Hữu Thiện chọn Mỹ là nơi để tiếp tục theo đuổi giấc mơ, sau đó, anh gửi thư cho nhiều giáo sư danh tiếng để tìm cơ hội cho mình. Người trả lời anh bằng giọng văn chân thành chính là Giáo sư Ralph Grishman, Đại học New York. Năm 2012, Thiện sang Mỹ và bắt đầu hành trình nghiên cứu sinh.

Rẽ hướng nhờ một lớp học của bố già AI
Những năm đầu tại New York không hề dễ dàng, Thiện phải tự mình tìm hiểu nhiều hướng nghiên cứu nhưng chưa tìm được đề tài đủ đột phá để theo đuổi lâu dài. Trong lúc chán nản, tuyệt vọng, anh theo học lớp của Giáo sư Yann LeCun người được mệnh danh là “bố già” trong lĩnh vực AI.
Tại đây, Thiện nhận ra deep learning gần như chỉ được ứng dụng cho thị giác máy tính và đặt câu hỏi liệu những kỹ thuật này có thể giải quyết bài toán ngôn ngữ mà anh vẫn luôn theo đuổi.
Câu thử nghiệm tưởng chừng đơn giản lại mang đến bước ngoặt lớn. Kết quả tốt hơn nhiều so với phương pháp cũ, giúp Thiện tự tin chọn hướng đi mới. Năm 2016, anh được trao giải thưởng Harold Grad dành cho nghiên cứu sinh xuất sắc của NYU.
Vươn ra quốc tế và những dự án dữ liệu khổng lồ
Rời New York sau quá trình miệt mài học tập, nghiên cứu, Thiện sang Canada làm nghiên cứu sau tiến sĩ với Giáo sư Yoshua Bengio, một trong ba ông tổ của học sâu hiện đại. Đây là giai đoạn anh mở rộng kiến thức và xây dựng phong cách nghiên cứu độc lập.
Từ năm 2018, Thiện gia nhập Đại học Oregon, cũng chính tại đây, anh trở thành một trong những người dẫn dắt các nghiên cứu chủ chốt về học sâu cho xử lý ngôn ngữ, được đồng nghiệp gọi là ngôi sao trẻ của khoa.
Một trong những dự án quan trọng nhất của Thiện là CulturaX bộ dữ liệu gồm 167 ngôn ngữ, quy mô hàng chục terabyte. CulturaX được nhiều phòng thí nghiệm lớn sử dụng để huấn luyện mô hình AI, trong đó có Stability AI và Eleuther AI.
Từ nền tảng này, nhóm Thiện phát triển Vistral, rồi tiếp tục xây dựng SaoLa-3B-Instruct, mô hình tiếng Việt được huấn luyện trên hơn 230 tỷ token, quy mô chưa từng có với tiếng Việt. Anh kể rằng tên Sao la thể hiện niềm tự hào với loài vật quý hiếm của Việt Nam, đồng thời là kỳ vọng về chất lượng và tính độc bản của mô hình.

Với gần 20 năm theo đuổi nghiên cứu, Thiện chia sẻ với bất cứ ai điều quan trọng nhất không phải thành quả mà là tinh thần theo đuổi những điều mới mẻ. Chỉ cần quá trình làm giúp mình học thêm điều gì đó, thì thất bại cũng không hề vô nghĩa.
Giáo sư Reza Rejaie, Trưởng khoa Khoa học máy tính Đại học Oregon đánh giá Thiện là người đi đầu trong nhiều dự án AI lớn của khoa, dẫn dắt mọi người trong từng dự án nghiên cứu và luôn tìm ra lời giải cho những bài toán quy mô lớn.
Trong tương lai, Thiện mong muốn tạo điều kiện để nhiều sinh viên Việt Nam tiếp cận học thuật quốc tế, đồng thời tiếp tục đóng góp cho hệ sinh thái dữ liệu mở và mô hình AI tiếng Việt./.