11 Nhược điểm của nội dung ChatGPT

Nổi bật

  • Tại sao nội dung ChatGPT chất lượng thấp vẫn được phê duyệt bởi con người.
  • ChatGPT hàm chứa đầy đủ thông tin, ngay cả khi nó cần phải ngắn gọn.
  • Giáo sư chỉ ra một sai sót khiến cho những bài luận được tạo ra bởi ChatGPT không hoàn hảo.
  • ChatGPT thất bại khi đối mặt với bài kiểm tra của android Voight-Kampff và lí do đáng ngạc nhiên tại sao điều này lại quan trọng.

ChatGPT tạo ra nội dung có tính toàn diện và độ chính xác cao.

Nhưng các nhà nghiên cứu, nghệ sĩ và giáo sư cảnh báo về những hạn chế cần phải nhận thức để giảm chất lượng của nội dung.

Trong bài viết này, chúng ta sẽ xem xét 11 nhược điểm của nội dung ChatGPT. Hãy bắt đầu.

1. Sử dụng cụm từ làm cho nó bị phát hiện là không thuộc loài người

Các nhà nghiên cứu đang nghiên cứu cách phát hiện nội dung được tạo bởi máy tính đã phát hiện ra các mẫu tạo nên âm thanh không tự nhiên.

Một trong những điều lạ của trí tuệ nhân tạo là nó khó xử lý những thành ngữ.

Một thành ngữ là một cụm từ hoặc câu thành một ý nghĩa nghĩa bóng, ví dụ như "mọi điều xấu đều có cái hay của nó".

Một nội dung thiếu những thành ngữ có thể là một tín hiệu cho thấy nội dung được tạo ra bởi máy tính - và điều này có thể là một phần của thuật toán phát hiện.

Đây là điều mà nghiên cứu năm 2022 về tính bảo mật chống phản đối của các đặc trưng Neural-Statistical trong phát hiện các Generative Transformer nói về dị thường trong nội dung do máy tạo ra:

"Các tính năng thành ngữ phức tạp được dựa trên tần suất của các từ và cụm từ cụ thể xuất hiện trong văn bản được phân tích thường xuất hiện nhiều hơn trong văn bản của con người."

…Trong số những thuộc tính câu phức tạp này, các thuộc tính thành ngữ giữ lại khả năng dự đoán mạnh nhất trong việc phát hiện các mô hình sinh ra hiện tại.”

Không thể sử dụng thành ngữ này góp phần làm cho kết quả đầu ra và đọc từ ChatGPT trở nên kỳ quặc và không tự nhiên.

2. ChatGPT Thiếu khả năng thể hiện cảm xúc

Một nghệ sĩ đã bình luận về cách ChatGPT tạo ra kết quả giống như nghệ thuật, nhưng thiếu những phẩm chất thực sự của biểu hiện nghệ thuật.

Biểu cảm là hành động truyền đạt suy nghĩ hoặc cảm xúc.

Đầu ra ChatGPT không chứa biểu thức, chỉ chứa các từ.

Nó không thể tạo ra nội dung đạt đến tâm trạng cảm xúc của con người bởi nó không có suy nghĩ hoặc cảm xúc thực sự.

Nghệ sĩ âm nhạc Nick Cave, trong bài viết đăng trên thư thông báo Red Hand Files của ông, đã bình luận về lời bài hát ChatGPT đã gửi cho ông, được tạo ra trong phong cách của Nick Cave.

Bộ công cụ tiếp thị nội dung mới được trang bị trí thông minh nhân tạo
Áp dụng công nghệ thế hệ mới trước khi đối thủ của bạn làm. Tạo nội dung tối ưu hóa và nhắm mục tiêu tốt để đạt được kết quả nhanh gấp ba lần.

Anh ý đã viết:

"Điều làm nên một bài hát tuyệt vời không phải là sự giống nhau gần như đến tận đáng kể với một tác phẩm có thể nhận ra."

... nó là cuộc đối đầu thở không ra hơi với sự dễ tổn thương, nguy hiểm và nhỏ bé của mình, chống lại một cảm giác khám phá bất ngờ; nó là hành động nghệ thuật đem lại sự cứu rỗi khuấy động trái tim người nghe, khi người nghe nhận ra trong cơ chế bên trong bài hát máu của chính họ, cuộc đấu tranh và nỗi đau của mình."

Hang động gọi lời bài hát ChatGPT là sự chế nhạo.

Đây là lời bài hát ChatGPT giống như lời bài hát của Nick Cave:

“Tôi mang máu của các thiên thần trên đôi tay
Tôi có lửa của địa ngục trong ánh mắt
Tôi là vua của vực thẳm, tôi là triều đại của bóng tối
Tôi là người mà họ sợ, trong bóng tối họ nghe theo”

Và đây là một đoạn lời bài hát thật sự của Nick Cave (Brother, My Cup Is Empty):

“Tôi đã trượt trên cầu vồng
Tôi đã đu đưa trên những vì sao
Bây giờ kẻ vô gia cư này
Lao đến đập cốc lên những thanh sắt
Hãy xem, cốc của tôi đã khô
Có vẻ như tôi đã để lại những ánh sáng cũ
Có vẻ như tôi đang quét dọn những tro bụi
Của những ngọn lửa đã từng cháy”

Dễ dàng nhận thấy rằng lời bài hát được tạo ra bởi máy tính tương tự lời bài hát của nghệ sĩ, nhưng nó không thực sự truyền tải được điều gì.

Lời bài hát của Nick Cave kể một câu chuyện đầy cảm xúc, lòng khao khát, sự xấu hổ và sự lừa dối chủ ý của người đang nói trong bài hát. Nó thể hiện những suy nghĩ và cảm xúc.

Dễ hiểu vì sao Nick Cave gọi đó là sự nhạo báng.

3. ChatGPT không sản xuất các thông tin chi tiết

Một bài báo được đăng trên The Insider đã trích dẫn một học giả nhận xét rằng các bài luận văn được tạo bởi ChatGPT thiếu thông tin chi tiết về chủ đề.

ChatGPT tóm tắt chủ đề nhưng không cung cấp cái nhìn độc đáo về chủ đề.

Con người tạo ra thông qua kiến thức, nhưng cũng thông qua kinh nghiệm cá nhân và nhận thức chủ quan của họ.

Giáo sư Christopher Bartel của Đại học Appalachian State được trích dẫn bởi The Insider cho rằng, mặc dù một bài tiểu luận ChatGPT có thể thể hiện chất lượng ngữ pháp cao và các ý tưởng tinh vi, nó vẫn thiếu sự hiểu biết.

Bartel nói:

"Chúng rất mềm mịn. Không có bối cảnh, không có sự sâu sắc hay hiểu biết."

Sự nhận thức là đặc trưng của một bài luận tốt và đó là điều mà ChatGPT không đặc biệt giỏi.

Việc thiếu hiểu biết này là điều cần cân nhắc khi đánh giá nội dung được tạo ra bởi máy.

4. ChatGPT nói quá nhiều

Một bài báo nghiên cứu được xuất bản vào tháng 1 năm 2023 đã phát hiện ra các mẫu mã trong nội dung của ChatGPT làm cho nó ít thích hợp cho các ứng dụng quan trọng.

Bài báo có tựa đề là "ChatGPT - Gần như chuyên gia con người? So sánh ngữ liệu, đánh giá và phát hiện".

Nghiên cứu cho thấy con người ưa thích những câu trả lời từ ChatGPT trong hơn 50% các câu hỏi liên quan đến tài chính và tâm lý học.

Nhưng ChatGPT không thể trả lời các câu hỏi về y tế vì con người thích những câu trả lời trực tiếp - điều mà trí tuệ nhân tạo không cung cấp được.

Các nhà nghiên cứu viết:

“…ChatGPT hoạt động kém hiệu quả trong việc hỗ trợ lĩnh vực y tế trong cả tiếng Anh và tiếng Trung.

ChatGPT có xu hướng đưa ra những câu trả lời dài dòng trong các tư vấn y tế trong tập dữ liệu mà chúng tôi thu thập được, trong khi các chuyên gia con người có thể trực tiếp đưa ra câu trả lời hoặc đề xuất đơn giản và trực quan hơn, điều này có thể giải thích tại sao tình nguyện viên coi các câu trả lời của con người đối với lĩnh vực y tế hữu ích hơn.

ChatGPT có xu hướng đề cập đến một chủ đề từ nhiều góc độ khác nhau, điều này khiến nó không phù hợp khi câu trả lời tốt nhất là một câu trả lời trực tiếp.

Những người tiếp thị sử dụng ChatGPT cần lưu ý điều này vì những khách truy cập trang web yêu cầu câu trả lời trực tiếp sẽ không hài lòng với một trang web đầy dẫy chi tiết.

Và chúc may mắn khi xếp hạng một trang quá đầy đủ từ khóa trong những đoạn trích nổi bật của Google, nơi câu trả lời ngắn gọn và rõ ràng có thể hoạt động tốt hơn trong Google Voice và có cơ hội xếp hạng cao hơn so với một câu trả lời dài dòng.

OpenAI, nhà sản xuất của ChatGPT, thừa nhận rằng việc cung cấp các câu trả lời dài dòng là một giới hạn đã biết đến.

Bài báo cáo của OpenAI cho biết:

"Mô hình thường quá dài dòng..."

Sự thiên vị của ChatGPT trong việc cung cấp các câu trả lời dài dòng là điều cần được lưu ý khi sử dụng kết quả đầu ra của ChatGPT, bởi vì bạn có thể gặp phải các tình huống khi câu trả lời ngắn gọn và trực tiếp hơn là tốt hơn.

5. Nội dung ChatGPT được tổ chức rất có hệ thống và logic rõ ràng

ChatGPT có một phong cách viết không chỉ dài dòng mà còn có xu hướng theo một bản mẫu mang lại cho nội dung một phong cách độc nhất chưa giống con người.

Chất lượng phi nhân tính này được tiết lộ trong sự khác biệt giữa cách con người và máy tính trả lời các câu hỏi.

Bộ phim Blade Runner có một cảnh hiển thị một loạt các câu hỏi được thiết kế để tiết lộ liệu người trả lời câu hỏi đó là con người hay một loại máy tính nhân tạo.

Các câu hỏi này là một phần của một bài kiểm tra tưởng tượng được gọi là "Kiểm tra Voigt-Kampff".

Một trong các câu hỏi là:

“Bạn đang xem TV. Bỗng một con ong bò trên tay bạn. Bạn sẽ làm gì?”

Một phản ứng bình thường của con người có thể là kêu rên, đi ra ngoài và vỗ tay bắt nó, và vân vân.

Nhưng khi tôi đặt câu hỏi này với ChatGPT, nó đưa ra một câu trả lời được tổ chức tỉ mỉ tóm tắt câu hỏi và sau đó đưa ra nhiều kết quả có lý - không trả lời đúng câu hỏi thực sự.

Ảnh chụp màn hình của ChatGPT trả lời một câu hỏi trong kiểm tra Voight-Kampff

hình ảnh câu hỏi ong đốt (wasp-question-63d254a0ab63b-sej.png)

Câu trả lời rất có tổ chức và logic, tạo cảm giác rất không tự nhiên, điều này là không mong muốn.

6. ChatGPT quá chi tiết và bao hàm

ChatGPT được đào tạo để thưởng cho máy tính khi con người hài lòng với câu trả lời.

Các người đánh giá con người có xu hướng ưa thích các câu trả lời có nhiều chi tiết hơn.

Nhưng đôi khi, như trong bối cảnh y tế, một câu trả lời trực tiếp là tốt hơn một câu trả lời chi tiết.

Điều đó có nghĩa là máy cần được thúc đẩy để trở nên ít toàn diện hơn và trực tiếp hơn khi những đặc tính đó quan trọng.

Từ OpenAI:

“Những vấn đề này phát sinh từ sự thiên vị trong dữ liệu huấn luyện (những người huấn luyện thích các câu trả lời dài hơn để trông có vẻ toàn diện hơn) và những vấn đề quá tối ưu được biết đến rõ”.

7. ChatGPT nói dối (âm ảnh sự thật)

Bài báo nghiên cứu trên đã chỉ ra rằng ChatGPT có xu hướng nói dối.

Nó báo cáo:

"Khi trả lời một câu hỏi yêu cầu kiến thức chuyên môn từ một lĩnh vực cụ thể, ChatGPT có thể bịa đặt sự thật để trả lời..."

Ví dụ, trong các câu hỏi liên quan đến pháp luật, ChatGPT có thể tạo ra một số điều khoản pháp lý không tồn tại để trả lời câu hỏi đó.

Khi một người dùng đặt câu hỏi mà chưa có câu trả lời tồn tại, ChatGPT cũng có thể bịa đặt sự thật để cung cấp một câu trả lời.

Trang web Futurism đã ghi lại các trường hợp nội dung do máy tạo sẵn được đăng trên CNET đầy sai sót và "nhiều lỗi ngớ ngẩn".

CNET nên đã có một ý tưởng rằng điều này có thể xảy ra, bởi vì OpenAI đã đăng một cảnh báo về đầu ra không chính xác:

"ChatGPT đôi khi viết những câu trả lời có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa."

CNET cho rằng họ đã chuyển các bài viết được tạo bởi máy để được xem lại bởi con người trước khi xuất bản.

Một vấn đề với việc đánh giá bởi con người là nội dung của ChatGPT được thiết kế để nghe có vẻ chính xác và thuyết phục, điều đó có thể lừa được một người đánh giá không phải là chuyên gia trong lĩnh vực đó.

8. ChatGPT là không tự nhiên vì nó không phân nhánh

Bài báo nghiên cứu "ChatGPT hiện đại đến đâu so với chuyên gia con người?" cũng nhấn mạnh rằng giao tiếp của con người có thể có ý nghĩa gián tiếp, điều này đòi hỏi ta phải thay đổi chủ đề để hiểu được.

ChatGPT quá bó buộc với ý nghĩa đen, điều này dẫn đến các câu trả lời đôi khi không trúng đích do trí tuệ nhân tạo bỏ sót chủ đề thực tế.

Các nhà nghiên cứu đã viết:

"Phản hồi của ChatGPT thường tập trung chặt chẽ vào câu hỏi đã cho, trong khi con người lại phân kỳ và dễ dàng chuyển sang các chủ đề khác."

Về mặt đa dạng nội dung, con người có sự khác biệt lớn đa dạng hơn ở các khía cạnh khác nhau, trong khi ChatGPT thích tập trung vào câu hỏi chính.

Con người có thể giải đáp được ý nghĩa ẩn sau câu hỏi dựa trên khái niệm thông thường và kiến thức của họ, nhưng ChatGPT dựa trên những từ văn phong phú ở câu hỏi đang cần…”

Con người có thể dễ dàng chuyển hướng khỏi câu hỏi đơn thuần, điều này rất quan trọng để trả lời các câu hỏi dạng "còn cái gì".

Ví dụ, nếu tôi hỏi:

"Ngựa quá to để làm thú cưng nhà. Còn chú gấu trúc thì sao?"

Câu hỏi trên không đang hỏi xem gấu trúc là một con vật nuôi thích hợp. Câu hỏi đó liên quan đến kích thước của con vật.

ChatGPT tập trung vào tính thích hợp của chú gấu trúc như một con vật nuôi thay vì tập trung vào kích thước.

Ảnh chụp màn hình của câu trả lời ChatGPT quá bó buộc

Hình ảnh câu hỏi về chú ngựa

9. ChatGPT Có Thiên Hướng Hướng Đến Tính Khách Quan

Đầu ra của ChatGPT thường hướng tới tính trung lập và cung cấp thông tin. Tuy nhiên, đôi khi có sự thiên vị trong đầu ra có thể giúp ích nhưng không luôn như vậy.

Báo cáo nghiên cứu chúng ta vừa thảo luận cho biết tính trung lập là một đặc tính không mong muốn trong các câu hỏi pháp lý, y tế và kỹ thuật.

Con người thường có xu hướng chọn một phe khi đưa ra những ý kiến ​​như thế này.

10. ChatGPT Hướng Thiên Về Hình Thức Chính Thức

Đầu ra của ChatGPT có thiên vị khiến nó khó thả lỏng và trả lời với các biểu hiện thông thường. Thay vào đó, các câu trả lời của nó có xu hướng trở nên trang trọng.

Người ta, trái lại, thường trả lời câu hỏi bằng một phong cách cộng đồng hơn, sử dụng ngôn ngữ hàng ngày và lóng nói - ngược lại với sự trang trọng.

ChatGPT không sử dụng viết tắt như GOAT hoặc TL;DR.

Các câu trả lời cũng thiếu các ví dụ về nghịch hươn, ẩn dụ và hài hước, điều này có thể làm cho nội dung ChatGPT quá trang trọng đối với một số loại nội dung.

Các nhà nghiên cứu viết:

“…ChatGPT thường sử dụng liên từ và trạng từ để truyền đạt luồng ý logic, chẳng hạn như "Nói chung", "tuy nhiên", "Thứ nhất", "Thứ hai", "Cuối cùng" và vân vân."

11. ChatGPT Vẫn Đang Trong Quá Trình Đào Tạo

ChatGPT hiện đang trong quá trình đào tạo và cải tiến.

OpenAI khuyên bạn nên tiến hành xem xét toàn bộ nội dung được tạo ra bởi ChatGPT bởi một con người, và liệt kê điều này là một thực hành tốt.

OpenAI đề xuất giữ con người trong vòng lặp:

"Nơi có thể, chúng tôi khuyến khích đánh giá các kết quả bằng con người trước khi sử dụng trong thực tế."

Điều này đặc biệt quan trọng trong các lĩnh vực đòi hỏi tính chính xác cao và cho việc tạo mã.

Con người cần nhận thức được giới hạn của hệ thống và có quyền truy cập vào bất kỳ thông tin nào cần thiết để xác minh đầu ra (ví dụ, nếu ứng dụng tổng hợp ghi chú, con người cần dễ dàng truy cập các ghi chú gốc để tham khảo lại).

Điều không mong muốn của ChatGPT

Rõ ràng rằng ChatGPT có nhiều vấn đề khiến cho nó không thích hợp cho việc tạo nội dung không giám sát. Nó chứa đựng các thành kiến và không tạo ra nội dung tự nhiên hoặc chứa đựng các hiểu biết chân thành.

Bên cạnh đó, khả năng không cảm nhận và không sáng tác được những ý tưởng mới khiến nó trở thành một lựa chọn tệ cho việc tạo ra các tác phẩm nghệ thuật.

Người dùng nên áp dụng các lời nhắc chi tiết để tạo ra nội dung tốt hơn so với nội dung mặc định mà nó tend to đưa ra.

Cuối cùng, kiểm tra lại bằng con người đối với nội dung được tạo ra bởi máy không phải lúc nào cũng đủ, bởi vì nội dung của ChatGPT được thiết kế để có vẻ chính xác, ngay cả khi thực tế không phải như vậy.

Điều này có nghĩa là những người xem xét chuyên sâu là những chuyên gia về chủ đề cụ thể có thể phân biệt được nội dung đúng và sai.

Bài viết liên quan

Xem thêm >>