Làm sáng tỏ các mô hình ngôn ngữ lớn như ChatGPT: Vượt qua sự cường điệu

Mô hình ngôn ngữ lớn là gì

ChatGPT đã gây bão trên toàn thế giới, khiến mọi người choáng ngợp với khả năng tạo ra ngôn ngữ tự nhiên đầy sắc thái và hùng hồn của nó. Nhưng dù ấn tượng ở bề ngoài nhưng nhìn kỹ bên dưới lại bộc lộ những điểm yếu đáng chú ý.

Trong bài đăng này, chúng tôi sẽ làm sáng tỏ hoạt động bên trong của các mô hình ngôn ngữ lớn (LLM) như ChatGPT. Mục tiêu của tôi là một phân tích có căn cứ để tách biệt sự thật khỏi hư cấu về những tiến bộ AI gần đây.

LLM hoạt động như thế nào: Hiểu được những hứa hẹn và hạn chế đồng thời của chúng

Mô hình ngôn ngữ lớn là gì

Vậy LLM chính xác là gì và các mô hình như thế nào ChatGPT vận hành? Tóm lại:

  • LLM sử dụng bộ dữ liệu văn bản khổng lồ, cho phép chúng dự đoán ngôn ngữ của con người rất trôi chảy
  • Nhưng không giống như con người, LLM thiếu hiểu biết, lý luận và nền tảng thực tế về thế giới thực.
  • Vì vậy, mặc dù chúng có thể tạo ra văn bản bóng bẩy đẹp mắt nhưng chúng thường thiếu sự mạch lạc, chính xác hoặc nền tảng logic hợp lý.

Hãy cùng khám phá cơ chế và hạn chế của LLM kỹ hơn…

LLM không thực sự hiểu những từ họ tạo ra

Chìa khóa để hiểu điểm mạnh và điểm yếu của LLM nằm ở phương pháp đào tạo của họ:

  • Họ tiếp thu tới hàng trăm tỷ từ từ các trang web, sách, bài báo, v.v.
  • Bằng cách phát hiện các mẫu từ, họ tìm hiểu xác suất về các chuỗi tiềm năng
  • Điều này cho phép họ tạo ra các kết hợp mới phù hợp với các mẫu ngôn ngữ đó

Tuy nhiên, không có ý nghĩa được mã hóa gắn liền với những từ đó. Trình tự dự đoán đơn thuần dựa trên các ví dụ trước đó.

Vì vậy, mặc dù có tài hùng biện nhưng không có sự hiểu biết hoặc lý luận thực sự nào xảy ra đằng sau hậu trường. Và điều đó giải thích nhiều lỗi thực tế rõ ràng và những lỗ hổng logic của LLM.

LLM thiếu nền tảng trong thế giới thực

Hơn nữa, vì LLM chỉ sử dụng nội dung văn bản trong quá trình đào tạo nên họ thiếu kiến ​​thức thực tế về cách thực tế vận hành.

Vì vậy, bất kỳ “sự thật” hoặc “kiến thức” nào được hiển thị bởi các mô hình như ChatGPT nông cạn và không chính xác – được ghép lại từ các mẫu chữ hơn là dựa trên sự thật.

Sự thiếu lý luận và cơ sở thực tế này giải thích cho những tuyên bố nổi tiếng là sai hoặc vô nghĩa của LLM. Câu trả lời của họ nghe có vẻ đáng kinh ngạc nhưng thường hoàn toàn là hư cấu.

Không có hệ thống nhận dạng hoặc niềm tin nhất quán

Cuối cùng, LLM cũng thiếu nhận dạng liên tục để gắn kết các câu trả lời với nhau:

  • Con người phát triển niềm tin gắn kết và tính chính trực xung quanh các chủ đề theo thời gian
  • LLM như ChatGPT tạo ra từng phản hồi một cách độc lập mà không nhất quán
  • Vì vậy, bạn sẽ thấy những mâu thuẫn trắng trợn khi bạn thăm dò chúng qua các câu hỏi

Trong sự cô lập, kết quả đầu ra LLM có thể có vẻ mạch lạc và thông minh. Nhưng hãy đẩy xa hơn và những sai sót của họ sẽ trở nên rõ ràng.

Suy nghĩ kết thúc: Sự lạc quan được đo lường khi đối mặt với sự cường điệu

Sự tiến bộ nhanh chóng trong ngôn ngữ tự nhiên AI thật ấn tượng. Trong các ứng dụng hẹp, các công cụ như ChatGPT thể hiện lời hứa.

Tuy nhiên, những tuyên bố thổi phồng về trí thông minh ở cấp độ con người có vẻ còn quá sớm. LLM đã tiến xa nhưng vẫn phải đối mặt với những hạn chế cơ bản liên quan đến nhận thức sinh học.

Sự phấn khích là cần thiết, nhưng sự cường điệu nên được tiết chế. Con đường phía trước vẫn còn dài, nhưng LLM cung cấp một cái nhìn thoáng qua về những khả năng trong tương lai.

Làm sáng tỏ các mô hình ngôn ngữ lớn như ChatGPT: Vượt qua sự cường điệu

Bình luận

Chúng tôi sẽ không công khai email của bạn. Các ô đánh dấu * là bắt buộc *

Di chuyển đến đầu trang