Nghề 'huấn luyện' AI

Alexej Savreux, 34 tuổi, sinh sống tại thành phố Kansas (Mỹ), từng làm đủ các nghề trong nhiều năm trước khi trở thành một huấn luyện viên AI tại công ty OpenAI sở hữu chatbot ChatGPT vốn tạo nên "cơn sốt" trong thời gian gần đây.
chatgpt-090523-1683598559.jpg
Biểu tượng ChatGPT tại văn phòng ở Washington, DC, Mỹ. Ảnh minh họa: AFP/TTXVN

Công việc này đã giúp anh thu nhập 15 USD/giờ, cao hơn mức lương tối thiểu của người dân tại thành phố này.

Dù không được chú ý đến khi ChatGPT trở nên ngày càng nổi tiếng, nhưng Savreux và các nhân viên hợp đồng đã dành vô số thời gian trong những năm qua để "dạy dỗ" các hệ thống của OpenAI để những hệ thống này đưa ra những phản ứng chính xác hơn. Những việc họ làm đáp ứng một nhu cầu cấp thiết và không ngừng của các công ty AI đó là cung cấp dữ liệu đầu vào gồm câu chữ, nhãn hiệu và các thông tin khác để huấn luyện công cụ AI.

Savreux chia sẻ tuy đây không phải là một công việc có thể mang lại danh tiếng hay sự giàu có, thậm chí có thể coi là tầm thường, nhưng lại là một việc thiết yếu. “Bạn có thể thiết kế bất cứ mạng nơron nhân tạo hay mời bất cứ nhà nghiên cứu nào mà bạn muốn, nhưng nếu không có người thu thập, chọn lọc hay gắn nhãn dữ liệu, bạn sẽ không có ChatGPT. Bạn sẽ không có gì cả.” - anh Savreux nói.

Sonam Jindal, phụ trách chương trình AI, lao động và nền kinh tế từ Partnership on AI, cho rằng có rất nhiều cuộc thảo luận xoay quanh AI nhưng hầu như chưa có chủ đề nào đề cập việc công nghệ này vẫn phụ thuộc phần lớn vào sức lao động của con người.

Trong nhiều thập niên qua, ngành công nghệ được vận hành dựa vào sức lao động của hàng nghìn nhân viên tay nghề thấp, lương thấp mới xây dựng nên những “đế chế” công nghệ như ngày nay. Công việc của nhóm này thường mang tính tạm thời và không được nhiều người biết đến một khi công nghệ của công ty trở nên phổ biến bởi khi đó mọi công trạng thuộc về các nhà điều hành và các nhà nghiên cứu. Đến nay, mô hình này cũng vẫn tiếp tục được chuyển tiếp sang lĩnh vực công nghệ AI.

Trong một báo cáo năm 2021, Partnership on AI nêu rõ nhu cầu về công việc “làm giàu dữ liệu" có xu hướng tăng cao. Dù vậy trước thực trạng trên, báo cáo kêu gọi các doanh nghiệp trong lĩnh vực công nghệ xây dựng bộ hướng dẫn tự nguyện, cam kết chi trả công bằng cho nhân viên hợp đồng và thực hiện một số cải tiến khác. Cho đến nay, Deepmind, công ty con về AI của Google, là công ty công nghệ duy nhất công khai cam kết tuân thủ các nguyên tắc trên. Bà Jindal chia sẻ có rất nhiều người đã nhận ra tầm quan trọng của công việc huấn luyện AI. Đây là một công việc mới do AI tạo ra, những đóng góp của người lao động tham gia ngành này cũng cần được tôn trọng và đánh giá cao.

Tuy không có thống kê cụ thể về số lượng nhân viên hợp đồng làm việc cho các công ty AI, nhưng có thể khẳng định đây là một công việc ngày càng phổ biến trên thế giới. Theo hãng tin trực tuyến Semafor, OpenAI đã thuê khoảng 1.000 người ở các khu vực Đông Âu và Mỹ Latinh, để gán nhãn dữ liệu có nội dung độc hại, hay đào tạo phần mềm của công ty về các nhiệm vụ kỹ thuật máy tính. OpenAI vẫn là một công ty nhỏ, chỉ với khoảng 375 nhân viên tính đến tháng 1/2023. Tuy nhiên con số này chưa đủ để phản ánh toàn bộ quy mô hoạt động của công ty, do không bao gồm các nhân viên làm việc theo hợp đồng.

Bên cạnh đó, việc tạo ra dữ liệu để đào tạo các mô hình AI không phải là công việc đơn giản và đủ phức tạp để thu hút các nhà khởi nghiệp AI tương lai. Anh Jatin Kumar, một công dân tại bang Texas, cho biết anh đã làm nhân viên huấn luyện AI theo hợp đồng được 1 năm sau khi anh tốt nghiệp đại học chuyên ngành khoa học máy tính. Đây là cơ hội giúp anh Kumar có thể khám phá làm quen với công nghệ AI thế hệ mới, trong khi phát triển công ty công nghệ chuyên sản xuất phần mềm giúp thanh toán hóa đơn bệnh viện của riêng mình, mang tên Bonsai.

Anh Kumar cho biết đã làm việc với khoảng 100 nhân viên hợp đồng khác trong các nhiệm vụ tạo dữ liệu đào tạo, sửa đáp án lời và tinh chỉnh mô hình bằng cách đưa ra phản hồi về câu trả lời. Ngoài ra, các nhân viên cũng tham gia xử lý cuộc hội thoại bị người dùng “báo xấu” khi chứa các nội dung không phù hợp, sắp xếp theo những lỗi liên quan và từ đó được sử dụng để đào tạo các mô hình AI khác. Anh Kumar chia sẻ dù bắt đầu công việc này như một cách để giúp đỡ công ty OpenAI và tìm hiểu về các công nghệ hiện có nhưng dần dần anh đã coi đây là là niềm đam mê thực thụ của anh.

Linh Tô (TTXVN)