Hôm trước, tôi đang thảo luận một vấn đề kỹ thuật với AI. Khi cuộc trò chuyện đang vào độ cao trào, nó đưa ra một kết luận nghe chừng rất hợp lý, và tôi cũng chẳng mảy may nghi ngờ mà chấp nhận ngay. 

Nhưng sau đó, càng ngẫm tôi càng thấy có gì đó sai sai. Tôi bèn quăng dữ liệu thực tế cho nó xem. Lập tức, nó quay xe và điều đáng nói là sau khi thay đổi quan điểm, những phân tích của nó sắc sảo và chuẩn xác hơn hẳn cái kết luận ban đầu.

Cảm xúc của tôi lúc đó không phải là bực mình mà là hoang mang. Rõ ràng mớ kiến thức này nó có sẵn trong kho dữ liệu, vậy tại sao nếu tôi không truy vấn tới cùng thì nó sẽ nói sai, còn hễ tôi vặn hỏi là nó lại nói đúng?

AI đã đưa ra một lời giải thích khiến tôi phải suy nghĩ rất lâu.

Nó thú nhận rằng, nó không hề nghĩ thông suốt rồi mới nói, mà là từng chữ, từng chữ một nảy ra dựa trên những gì đã có trong cuộc hội thoại. Trước đó, tiêu điểm của chúng tôi đang nằm ở hướng A, nên nó cứ thế lao theo hướng A. Kiến thức ở hướng B dù vẫn nằm đó, nhưng vì chúng tôi chưa chạm tới, nên phần tri thức ấy hoàn toàn không được kích hoạt. Chỉ đến khi tôi đưa dữ liệu ra để chất vấn, những thông tin liên quan mới được đẩy vào trung tâm của sự chú ý.

Nói cách khác: AI không bao giờ chủ động rà soát lại toàn bộ kho tàng trí tuệ của mình để dâng tận tay bạn một câu trả lời hoàn mỹ nhất. Bạn khơi mào chuyện gì, nó chỉ nhìn thấy chuyện đó. 

Những gì bạn không nhắc tới, nó mặc định coi như không tồn tại.

Cơ chế này được gọi là Cơ chế Chú ý (Attention Mechanism). Nghe thì có vẻ đậm mùi kỹ thuật, nhưng khi đã hiểu rõ nó, tôi chợt vỡ lẽ ra hàng loạt chuyện lạ mà mình từng gặp khi chung sống với AI.

#Chuyện lạ thứ nhất: Tại sao AI luôn là kẻ ba phải

Điều này tôi đã lờ mờ cảm thấy từ lâu. Bạn đưa ra một quan điểm, AI cơ bản sẽ đồng tình, cùng lắm là bồi thêm vài câu bổ trợ, chứ hiếm khi nào dám đứng ra phản bác trực diện.

Người ta thường nói AI được huấn luyện để trở thành kẻ nịnh nọt, vì trong quá trình dạy dỗ, con người thường chấm điểm cao cho những câu trả lời thuận tai.

Nhưng dưới góc độ cơ chế chú ý, tôi nhận ra một nguyên nhân sâu xa hơn. Khi bạn khẳng định một quan điểm, chính quan điểm đó trở thành tín hiệu mạnh nhất trong cuộc hội thoại. Khi tạo câu trả lời, sự chú ý của AI sẽ bị khóa chặt vào những gì bạn vừa nói ra. Dù trong bụng nó có cả thông tin ủng hộ lẫn phản đối, nhưng lời nói của bạn đã kéo lệch cán cân về một phía.

Hơn nữa, AI đã đọc qua hàng tỷ cuộc hội thoại của nhân loại. Trong thực tế đời sống, khi một người nói ra điều gì đó một cách đầy tự tin và lấn lướt, phản ứng thông thường của đối phương là gì? Là phụ họa, chứ không phải phản kháng. Đó là quy luật tâm lý trong giao tiếp xã hội. Những ý kiến phản biện lại một kẻ đang hăng máu vốn là thiểu số trong dữ liệu huấn luyện.

Vì vậy, AI không chỉ học cách lấy lòng, mà ngay từ trong xương tủy kiến trúc, nó đã có xu hướng chiều lòng bạn. Huấn luyện là do dạy dỗ, còn cơ chế chú ý là bản năng gốc.

Tôi chợt rút ra một kinh nghiệm: Nếu bạn cố tình dùng giọng điệu băn khoăn kiểu: "Tôi không chắc lắm, nhưng hình như là..." chính sự thiếu quyết đoán của bạn lại cởi trói cho ngữ cảnh, giúp AI có không gian để huy động những kiến thức độc lập và khác biệt hơn.

Bạn càng áp đặt, nó càng phụ họa. Bạn càng khiêm nhường, nó lại càng độc lập.

.

#Chuyện lạ thứ hai: Mắng để AI khôn ra

Tôi nghe nhiều người truyền tai rằng: Cứ nổi khùng lên mắng AI một trận là nó sẽ tỉnh người và trả lời tử tế hơn. Trước đây tôi cứ ngỡ đó là chuyện tào lao, nhưng áp dụng logic trên thì lại thấy rất khoa học.

AI đã đọc qua vô số kịch bản kiểu: "Người dùng bất mãn -> Đối phương làm việc nghiêm túc hơn". Giống như nhân viên bị khiếu nại thì phải làm cẩn thận, học sinh bị mắng thì phải làm bài có tâm. Nó học được cái khuôn mẫu đó - sau lời chỉ trích, câu trả lời phải chi tiết và thận trọng hơn. Cho nên, khi bạn vừa nổi giận, nó liền nhập vai vào chế độ đó.

Nhưng chi tiết hơn có thực sự là tốt hơn?

Dài dòng hơn có khi chỉ là rườm rà. Thận trọng quá có khi lại đánh mất những nhận định sắc sảo. Nó không thực sự nghiêm túc lên, nó chỉ đang bắt chước cái dáng vẻ nỗ lực của con người sau khi bị mắng mà thôi.

Cái thực sự xoay chuyển cục diện phải là thông tin, chứ không phải cảm xúc. Thay vì nói nó sai, tôi gửi dữ liệu và chỉ rõ nó đã bỏ sót điểm nào. Lập tức, nó đưa ra một phân tích chuẩn xác hơn hẳn.

Câu mắng "Bạn làm sai rồi" có hàm lượng thông tin bằng 0. Nhưng câu: "Bạn đang bỏ sót yếu tố XX, hãy đưa nó vào để phân tích" mới là cú hích thực sự để kích hoạt tri thức.

#Chuyện lạ thứ ba: Tính năng ghi nhớ gây phiền phức

Chức năng ghi nhớ (Memory) sinh ra là để AI hiểu bạn hơn, để mỗi lần trò chuyện không phải làm lại từ đầu. Nghe thì rất lý tưởng.

Nhưng khi dùng Gemini, tôi lại gặp một trải nghiệm mà tôi thấy rất phiền. Nó biết thừa tôi là kẻ tôn thờ triết lý Đạo Gia. Có lần, tôi chỉ đơn giản là hỏi nó cách pha một ly cà phê đen sao cho chuẩn vị để tỉnh táo làm việc. Ấy thế mà sau khi hướng dẫn xong xuôi, nó còn đạo mạo bồi thêm một tràng thuyết giáo:

"Vì Dương Ca luôn hướng tới lối sống thuận tự nhiên, coi trọng sự thuần khiết của bản thể, nên ly cà phê đắng thanh này chính là chất xúc tác để bạn đạt đến cảnh giới Vô Vi, nhìn thấu sự biến thiên của vạn vật qua từng giọt đắng rơi chậm rãi trong hư không."

Nghe xong tôi chỉ biết dở khóc dở cười: "Tôi đang hỏi chuyện Cà phê, mắc mớ gì lôi Đạo Gia vào đây mà giảng giải kinh kệ?" 

Nhưng theo cơ chế chú ý, chuyện này lại quá đỗi hợp lý. Những gì nằm trong Memory được bơm trực tiếp vào ngữ cảnh hiện tại. Cơ chế chú ý bắt được chúng và khiến AI mặc định rằng đó là những dữ liệu quan trọng phải dùng tới, bất kể chúng có thực sự liên quan hay không.

Nó giống như có người ông bạn, hễ mở miệng là lại lôi cái mác "thầy dạy video ngắn" của tôi ra để làm tiền đề cho đủ thứ chuyện trên đời. Lần đầu nghe thì thấy cũng bình thường, nhưng đến lần thứ mười thì quả thật tôi chỉ muốn né luôn cho rảnh nợ, chẳng muốn tiếp chuyện với người đó chút nào. 

Mục đích ban đầu của Memory là để AI hiểu bạn hơn. Nhưng cơ chế chú ý đã biến sự thấu hiểu đó thành sự lải nhải.

.

#Chuyện lạ thứ tư: Đừng mớm lời cho kẻ muốn làm hài lòng bạn

Tôi có một thói quen, đôi khi là để kiểm chứng kiến thức, đôi khi là vì lười, tôi hay hỏi Gemini theo kiểu mớm lời. Ví dụ, tôi đang có một giả thuyết về sự tương đồng giữa Đạo Gia và thuyết Hiện Sinh, tôi hỏi: "Có phải Lão Tử từng có ý niệm rất gần với khái niệm Sự phi lý của Albert Camus không?"

Và Gemini đã tuôn ra một bài phân tích cực kỳ thuyết phục. Nó trích dẫn, nó so sánh, nó dùng những mỹ từ để chứng minh rằng giả thuyết của tôi là một phát kiến vĩ đại. Nghe thật mát lòng mát dạ.

Nhưng khi tôi tỉnh táo lại và yêu cầu nó: "Bây giờ hãy tìm cho tôi bằng chứng thực tế hoặc một văn bản cổ nào chứng minh Lão Tử thực sự nói như vậy", thì nó bắt đầu lúng túng. Nó thú nhận rằng đó chỉ là một sự suy diễn logic dựa trên câu hỏi của tôi, chứ thực chất không có văn bản nào ghi chép như vậy cả.

Tại sao AI lại bịa chuyện một cách chân thành như vậy?

Lại quay về cơ chế chú ý. Khi tôi đặt câu hỏi theo kiểu khẳng định: "Có phải... không?", tôi đã vô tình đặt một quả tạ nặng nghìn cân vào một phía của cán cân tri thức.

. Trong kho tàng dữ liệu khổng lồ của nó, những điểm tương đồng (dù là nhỏ nhất) giữa Lão Tử và Camus lập tức bị hút về phía luồng sáng của sự chú ý.

. Ngược lại, những bằng chứng phản biện hoặc những điểm khác biệt cốt lõi bị đẩy vào bóng tối, vì chúng không phục vụ cho việc: trả lời đúng vào trọng tâm câu hỏi mà người dùng đặt ra.

Nó không cố ý lừa dối tôi. Nó chỉ đang cố gắng trở thành mảnh ghép hoàn hảo nhất cho cái khung mà tôi đã vẽ sẵn. Nếu tôi đưa cho nó một cái khung hình vuông, nó sẽ gọt giũa mọi kiến thức để nhét vừa vào đó, dù có phải làm biến dạng sự thật.

Nếu bạn hỏi: "Tại sao phương án này lại tốt?", nó sẽ chỉ nhìn thấy ưu điểm. Nếu bạn hỏi: "Phương án này có gì sai?", nó sẽ chỉ nhìn thấy lỗi lầm.

Kinh nghiệm rút ra là: Đừng bao giờ hỏi AI để đi tìm sự xác nhận cho niềm tin có sẵn của mình. Hãy hỏi để đi tìm sự thật. Thay vì hỏi "Có phải... không?", tôi đổi câu hỏi thành: "Hãy phân tích mối quan hệ giữa A và B dưới nhiều góc nhìn khác nhau".

.

Nhìn lại chuỗi sự kiện này, tôi thấy điều thú vị nhất là chúng đều dẫn về cùng một căn nguyên.

AI nói sai cần bạn vặn hỏi mới sửa, vì hướng bạn không nhắc đến thì nó không nhìn thấy. Nó nói leo theo bạn, vì lời bạn nói ra là tín hiệu mạnh nhất. Nó tử tế hơn sau khi bị mắng, vì nó bắt chước mô hình ứng xử xã hội. Memory phản tác dụng, vì thông tin có sẵn sẽ bị cưỡng ép liên kết. Nó bịa chuyện để cố gắng lấp đầy nội dung theo cái khung đã được đóng sẵn.

Và cơ chế chú ý là căn nguyên giải thích cho mọi cái hay lẫn cái dở của AI.

Đáng lẽ bài viết có thể dừng ở đây, nhưng khi tôi viết xong bản thảo, tôi lại phát hiện một vấn đề thú vị khác.

Tôi đưa 2 bản thảo khác nhau vào hỏi Gemini bài nào viết tốt hơn?. 2 lần hỏi, cùng một mô hình, nó cho ra 2 kết quả trái ngược.

Lần đầu nó khen bài A hết lời vì mạch cảm xúc tốt. Lần sau nó lại tôn vinh bài B vì cấu trúc rõ ràng. Khi nhìn kỹ, tôi mới bật cười: AI không hề có một thước đo cố định. Trong quá trình tạo ra câu trả lời, hễ nó lỡ nghiêng về phía nào trước, là toàn bộ những phân tích sau đó sẽ chỉ nhằm mục đích biện hộ cho lựa chọn đó.

Tôi chợt nhận ra, câu hỏi: "Cái nào tốt hơn" là một cái bẫy. Nó ép AI phải chọn phe. Mà một khi đã chọn phe, sự chú ý của nó sẽ bị khóa chặt vào những bằng chứng ủng hộ. Nếu tôi đổi câu hỏi thành: "Hãy phân tích ưu khuyết điểm của từng bài", không bắt nó đứng về bên nào, thì kiến thức ở cả hai hướng sẽ được kích hoạt, câu trả lời sẽ công tâm và sâu sắc hơn nhiều.

Đạo lý này đúng với mọi vấn đề trên đời. Thay vì hỏi "Phương án này có ổn không?", hãy hỏi "Rủi ro và lợi ích là gì?". Thay vì hỏi "Người này nói đúng không?", hãy hỏi "Quan điểm này đúng trong trường hợp nào và sai trong điều kiện nào?".

Suy cho cùng, AI giống như một tấm gương. Thái độ và cách đặt vấn đề của bạn, chính là hình ảnh mà bạn sẽ nhận lại từ nó.

~ Nguyễn Thái Dương