Có ba cách tiếp cận để khai thác, sử dụng OpenAI ChatGPT và các mô hình OpenAI GPT khác có liên quan, với mức độ phức tạp tăng dần:
- Đơn giản nhất là sử dụng ChatGPT ngay lập tức, đặt câu hỏi trực tiếp cho nó.
- Sử dụng các công cụ để tạo, điều chỉnh và đánh giá lời nhắc đầu vào để cải thiện chất lượng kết quả đầu ra.
- Xây dựng các mô hình GPT hoặc các mô hình mô hình ngôn ngữ lớn khác (LLM – Large Language Models) tùy chỉnh dựa trên dữ liệu tùy chỉnh và thao tác với các tham số của mô hình.
Sử dụng các tính năng có sẵn của ChatGPT
Hình thức sử dụng này là dễ tiếp cận nhất và được sử dụng phổ biến nhất hiện nay. Người dùng có thể sử dụng giao diện web-chat tại địa chỉ https://chat.openai.com. Hiện tại không có quyền truy cập API, chỉ có quyền truy cập thông qua nhập/xuất văn bản. Microsoft có kế hoạch cung cấp API cho dịch vụ này trong phiên bản Azure OpenAI.
Các doanh nghiệp và cá nhân có thể sử dụng phương pháp này để bổ sung hoặc tạo nội dung, để thao tác trên văn bản (ví dụ: làm mềm ngôn ngữ hoặc lấy một giọng điệu cụ thể) và để tóm tắt hoặc đơn giản hóa nội dung. Điều này có thể được thực hiện với các khoản đầu tư hạn chế. Tuy nhiên, có những rủi ro khi sử dụng ChatGPT và do nhiều người dùng chưa có kinh nghiệm nên họ có nguy cơ bỏ qua các hạn chế về dữ liệu, phân tích và bảo mật.
Rủi ro lớn nhất đối với các trường hợp sử dụng ChatGPT vào việc tạo nội dung mới là ChatGPT có thể tạo đoạn văn xuôi hùng hồn với lời lẽ tự nhiên, nhưng lại chứa ít nội dung có giá trị hoặc tệ hơn là chứa các tuyên bố không trung thực. Người dùng bắt buộc phải xem xét về tính chính xác, phù hợp, hữu ích và thực tế trước khi chấp nhận bất kỳ kết quả nào.
Một hạn chế đáng kể là mô hình không bao gồm dữ liệu thời gian thực cũng như các sự kiện lịch sử gần đây. Mô hình ChatGPT hiện tại được đào tạo vào tháng 12 năm 2021 và không tích hợp các thông tin mới hơn.
Sử dụng kỹ thuật lời nhắc (Prompt Engineering hay còn gọi là Chat Prompt)
Prompt Engineering liên quan đến việc phát triển một cách tiếp cận có hệ thống để tạo, điều chỉnh các câu hỏi và từ khóa định hướng (prompt) đầu vào để cải thiện chất lượng kết quả đầu ra từ ChatGPT.
Trong ChatGPT, từ khóa định hướng là yếu tố quan trọng trong việc thúc đẩy kết quả. Những thay đổi nhỏ trong lựa chọn từ khóa định hướng và thứ tự từ khóa định hướng có thể dẫn đến những thay đổi đáng kể trong đầu ra. Từ khóa định hướng cũng có thể chứa dữ liệu cần được kết hợp hoặc xem xét khi tạo phản hồi.
Mặc dù Prompt Engineering có thể xem là một công việc thủ công, nhưng các doanh nghiệp nên xem xét tự động hóa công việc này bằng cách tự xây dựng các công cụ tạo AI prompt, hoặc chọn prompt phù hợp từ các site cung cấp Prompt trực tuyến mất tiền hoặc miễn phí. Bạn nên sử dụng Prompt bằng tiếng Anh để có thể tối ưu năng suất xử lý của ChatGPT.
Hiện nay, các nguồn về Chat Prompt trên Internet vẫn còn khá hạn chế, chủ yếu nó được cung cấp bởi những người nổi tiếng từ các post trên mạng xã hội. Một trong số những địa chỉ đó là https://chat-prompt.com, đây là một cơ sở dữ liệu để tìm kiếm và trao đổi các mẫu prompt sử dụng với ChatGPT và các mô hình AI khác như MidJourney và DALL-E 2.0...
Sử dụng các mô hình GPT tùy chỉnh
Người dùng không thể truy cập và tùy chỉnh được mô hình GPT trong ChatGPT do OpenAI không cho phép làm điều đó. Tuy nhiên, bắt đầu từ mô hình GPT thế hệ thứ 3 (GPT-3) OpenAI đã cung cấp cho người dùng khả năng tùy chỉnh mô hình.
Hiện nay, trên thế giới các bên thứ ba đã cho ra đời hàng ngàn ứng dụng dựa trên việc tùy chỉnh mô hình GPT thế hệ thứ 3 hoặc 4, các ứng dụng này có mặt trong nhiều lĩnh vực khác nhau từ sản xuất, giáo dục, sáng tạo cho đến lập trình games... Do dữ liệu huấn luyện AI được chuẩn bị riêng cho các mục tiêu nên các ứng dụng này thường có thể tạo ra kết quả tốt hơn so với mô hình GPT ban đầu.
Nhà cung cấp Viable sử dụng GPT-3 để giúp các doanh nghiệp phân tích tương tác và phản hồi của khách hàng. Sử dụng dữ liệu phi cấu trúc, hệ thống có thể tạo báo cáo tóm tắt tương tác và phản hồi của khách hàng. Bằng cách tùy chỉnh GPT-3, Viable có thể tăng độ chính xác của các báo cáo từ 66% lên 90%.
Điều tương tự cũng xảy ra với Keeper Tax, một công cụ đơn giản hóa việc hạch toán bằng cách tự động phân loại và trích xuất dữ liệu từ ngân hàng hoặc tài khoản thanh toán để đưa vào các báo cáo thuế. Keeper Tax sử dụng GPT-3 để giải thích dữ liệu bảng sao kê ngân hàng nhằm tìm ra các khoản chi phí có thể được khấu trừ thuế. Các lập trình viên của công ty đã thêm khoảng 500 mẫu dữ liệu mới mỗi tuần để tinh chỉnh mô hình GPT-3. Keeper Tax cho biết quá trình huấn luyện tạo ra sự cải thiện 1% từ tuần này sang tuần khác.
Mặc dù cách tiếp cận này đòi hỏi các doanh nghiệp phải có các kỹ năng, có dữ liệu và cả kinh phí, nhưng sự xuất hiện của thị trường dành cho các mô hình chuyên biệt phù hợp với mục đích của bên thứ ba có thể khiến cho tùy chọn này ngày càng trở lên hấp dẫn.
Một số trường hợp sử dụng ChatGPT/GPT-4 trong doanh nghiệp
Về cơ bản, các trường hợp sử dụng ChatGPT (ChatGPT use cases) tập trung vào việc cải thiện các quá trình tạo nội dung và tự động hóa chuyển đổi một cách nhanh chóng và hấp dẫn. Ba cách tiếp cận được nêu trong Hình 1 có thể cho phép ChatGPT use cases sau:
Tạo nội dung dạng văn bản: ChatGPT có thể tạo ra văn bản “nháp” đáp ứng độ dài và văn phong mong muốn, sau đó người dùng có thể xem xét văn bản này. Cách này có thể sử dụng cho mục đích tạo ra các loại bản thảo khác nhau gồm mô tả tiếp thị, thư giới thiệu, bài tiểu luận, tài liệu hướng dẫn, tài liệu đào tạo, bài đăng tin tức...
Trả lời câu hỏi: Cách này cho phép người dùng tìm câu trả lời dựa trên lời nhắc và dữ liệu đã biết. Ví dụ: “Quãng đường đi ô tô từ Hà Nội đến TP Hồ Chí Minh dài bao nhiêu km?”
Thiết lập giọng điệu: Làm mềm hoặc chuyên nghiệp hóa ngôn ngữ.
Tóm tắt: Cho phép rút gọn tóm tắt các cuộc hội thoại, bài báo, email và trang web. Chuyển đổi từ đoạn văn sang các gạch đầu dòng và ngược lại. Độ dài của bản tóm tắt có thể được chỉ định.
Phân loại nội dung: Thành các chủ đề hoặc các quan điểm khác nhau.
Đơn giản hóa: Tiêu đề, dàn ý, trích xuất nội dung chính.
Cải thiện hiệu suất của Chatbot: Có nhiều phương pháp có thể cải thiện, bao gồm trích xuất thực thể, phân loại quan điểm trong toàn bộ cuộc trò chuyện, câu hỏi nhúng và các phương pháp khác. Lưu ý rằng những điều này cũng có thể được sử dụng để cải thiện hiệu suất của các ứng dụng khác liên quan đến tương tác của người dùng.
Tạo, dịch, giải thích và kiểm tra mã lập trình (code): Mặc dù chỉ mới xuất hiện nhưng cách tiếp cận này hứa hẹn sẽ tăng cường quá trình phát triển phần mềm. Chúng thường được tích hợp với môi trường phát triển tích hợp (IDE).
Danh sách sau đây cung cấp một số ví dụ dành riêng cho lĩnh vực sử dụng các ChatGPT use cases được nêu ở trên:
Dịch vụ khách hàng: Cải thiện khả năng nhận dạng ý định của chatbot, tóm tắt các cuộc trò chuyện, trả lời câu hỏi của khách hàng và định hướng khách hàng đến các nguồn tài nguyên. Làm điều này đòi hỏi bối cảnh doanh nghiệp - mô tả dịch vụ, các quyền, logic kinh doanh, bản sắc và giọng điệu thương hiệu,...
Bán hàng và tiếp thị: Tương tác với khách hàng tiềm năng trên website hoặc trong chatbot. Đưa ra các khuyến nghị. Cung cấp bản mô tả sản phẩm. Làm điều này đòi hỏi bối cảnh doanh nghiệp - tài liệu sản phẩm, quyền, logic kinh doanh, bản sắc và giọng điệu thương hiệu,...
Trợ lý cá nhân: Quản lý lịch trình, tóm tắt email, soạn và trả lời email, cũng như soạn thảo các tài liệu chung.
Giáo dục: Tạo trải nghiệm học tập cá nhân, giống như gia sư.
Chăm sóc sức khỏe: Chatbot và các ứng dụng có thể cung cấp các bản mô tả bằng ngôn ngữ đơn giản về thông tin y tế và các khuyến nghị điều trị.
Lập trình phần mềm: ChatGPT có thể viết code từ văn xuôi, chuyển đổi code từ ngôn ngữ lập trình này sang ngôn ngữ lập trình khác, sửa mã sai và giải thích mã.
Các mối quan tâm về đạo đức
Có nhiều rủi ro liên quan đến GPT và các mô hình ngôn ngữ lớn khác. Doanh nghiệp nên xác định mức độ của những rủi ro này và giải quyết một cách thích hợp. Dưới đây chúng tôi liệt kê những điều quan trọng nhất:
“Hallucinations” (ảo giác): Câu trả lời sai. Sử dụng các “số liệu thống kê” để chọn từ tiếp theo. Không có “sự hiểu biết” thực sự về nội dung.
Đảm bảo sự giám sát của con người và xem xét kết quả đầu ra. Sử dụng thông tin phản hồi. Hùng biện không bằng sự thật.
Các vấn đề về dữ liệu đào tạo: Dữ liệu lỗi thời, sai lệch, bị cấm hoặc sai.
Xem xét các rủi ro: vấn đề đạo đức, uy tín, pháp lý, tài chính.
Sở hữu trí tuệ (IP) và vi phạm bản quyền: Dữ liệu đào tạo độc quyền.
Tham khảo ý kiến của bộ phận pháp lý về rủi ro của các mô hình.
“Deepfakes”: Các mô hình có thể tạo nội dung giả mạo theo phong cách cần thiết.
Xem xét để phát hiện sự lạm dụng: tin giả, thông tin sai lệch, mạo danh được cá nhân hóa, thao túng, quy kết sai.
Tiết lộ thông tin: Thông tin mật và thông tin nhận dạng cá nhân (PII).
Hãy chú ý đến dữ liệu nào đang được sử dụng. Làm việc với các nhà cung cấp về chính sách sử hữu và dử dụng dữ liệu đó.
OpenAI ChatGPT không xác định cách dữ liệu sẽ được sử dụng. Cần đảm bảo rằng thông tin mật không được sử dụng.
Microsoft đang lên kế hoạch kích hoạt các chính sách về an toàn và bảo mật trên Azure OpenAI giống như đối với các dịch vụ Azure khác.
Gian lận và lạm dụng: Đánh giá sai, giấy tờ giả, thư rác, lừa đảo.
Phát triển các chính sách giải quyết những vấn đề này và/hoặc xác định thời điểm những vấn đề này xảy ra.
Không kiểm tra đầu ra: Nhân viên và những người dùng khác không kiểm tra đầu ra trước khi họ sử dụng.
Đảm bảo các chính sách sử dụng ChatGPT được áp dụng và thực thi.
Bản chất hộp đen: Các hệ thống thiếu khả năng giải thích mô hình. Không có lý do hoặc quy trình dẫn mô hình đến một kết luận cụ thể.
Xác định nơi cần có khả năng giải thích và trong những trường hợp đó, hãy sử dụng phương pháp có thể giải thích được.
Tập trung quyền lực: LLM chỉ có thể được phát triển bởi các đơn vị lớn do yêu cầu về chi phí và cơ sở hạ tầng. Hãy tự hỏi mình những câu hỏi này để liên tục theo dõi khả năng chấp nhận:
Liệu điều này có tạo ra một môi trường cạnh tranh không lành mạnh?
Nếu điều này chỉ có thể được sử dụng thông qua OpenAI endpoint, người dùng có bị khóa sản phẩm không?