Trong phần trước, nội dung chủ yếu tập trung vào điều kiện học tập, cụ thể là điều kiện hóa cổ điển. Nên nhớ, trong điều kiện hóa cổ điển, một phản xạ tự động xuất hiện với tác nhân từ môi trường, những nhà nghiên cứu huấn luyện chủ thể phản ứng với những yếu tố kích thích khác nhau. Trong chương này, chúng ta sẽ tìm hiểu về một loại điều kiện học tập khác, điều kiện hóa tạo tác. Đây là một quá trình nghiên cứu các chủ thể khác nhau về sự liên kết giữa một hành vi và hệ quả của nó (Bảng 1). Một hệ quả tốt có thể là điều kiện để hành vi đó được lặp lại trong tương lai. Ví dụ, ở Thủy cung Quốc gia ở Baltimore, mỗi khi cá heo Spirit thực hiện một cú nhảy lên không trung khi nghe tiếng huýt còi từ huấn luyện viên, cá heo sẽ được một con cá.
Bảng 1: Classical and Operant Conditioning Compared | ||
---|---|---|
Classical Conditioning | Operant Conditioning | |
Conditioning approach | An unconditioned stimulus (such as food) is paired with a neutral stimulus (such as a bell). The neutral stimulus eventually becomes the conditioned stimulus, which brings about the conditioned response (salivation). | The target behavior is followed by reinforcement or punishment to either strengthen or weaken it, so that the learner is more likely to exhibit the desired behavior in the future. |
Stimulus timing | The stimulus occurs immediately before the response. | The stimulus (either reinforcement or punishment) occurs soon after the response. |
Nhà tâm lý học B.F. Skinner nhìn thấy mặt hạn chế điều kiện hóa cổ điển với một vài kiểu hành vi chỉ mang tính phản xạ, không tạo thành kiểu hành vi mới, như chạy xe đạp. Một giả thuyết được đưa ra làm thế nào hình thành những hành vi như thế. Skinner tin rằng hệ quả là động cơ thúc đẩy hình thành hành vi, cũng là điều ta nhận được khi thực hiện: sự củng cố và sự trừng phạt. Ý tưởng này dựa trên định luật về hiệu quả của tâm lý gia Edward Thorndike. Theo đó, dạng hành vi mang lại sự thỏa mãn cho chủ thể thì có khả năng được lặp lại, ngược lại, dạng hành vi mang lại hệ quả cảm xúc không hay có thể không được lặp lại (Thorndike, 1911). Hơn thế, khi chủ thể thực hiện một điều mang lại kết quả đáng mong đợi, chủ thể sẽ dễ lặp lại hành vi đó. Hay nếu, chủ thể thực hiện một điều mang lại kết quả không đáng mong đợi, chủ thể sẽ không lặp lại hành vi đó. Ví dụ cụ thể, khi đi làm, một trong những lý do chính, chúng ta đến cơ quan để làm việc là tiền lương. Nếu chúng ta không được trả lương nữa, có thể chúng ta sẽ dừng đến cơ quan, dù đôi khi chúng ta yêu công việc đó.
Dựa trên nền lý thuyết về định luật hiệu quả của Thorndike, Skinner bắt đầu thí nghiệm trên động vật (chủ yếu là chuột và chim bồ câu), để tìm hiểu xem làm thế nào chủ thể có thể học tập qua điều kiện hóa tạo tác (Skinner, 1938). Ông để các con vật vào trong một căn phòng được điều kiện hóa tạo tác, được biết với tên Chiếc hộp Skinner (Hình 1). Trong hộp chứa một cái đòn bẩy (cho chuột) và một cái đĩa (cho chim bồ câu), các con vật có thể đạp hoặc mổ để lấy thức ăn. Ngoài ra, loa và đèn chiếu cùng kết hợp. Một chiếc máy thu số liệu để đếm số lần các con vật phản ứng.
Khi bàn luận về điều kiện hóa tạo tác, chúng ta thường sử dụng các từ, tích cực/tiêu cực, củng cố và trừng phạt - được hiểu theo nghĩa chuyên môn hóa. Trong điều kiện hóa tạo tác, tích cực và tiêu cực không mang ý nghĩa tốt hay xấu. Tích cực có nghĩa thêm vào một điều, tiêu cực là lấy mất đi. Củng cổ mang nghĩa gia tăng một hành vi và trừng phạt là làm giảm một hành vi. Củng cố và trừng phạt đều có thể mang tính tích cực hoặc tiêu cực. Mọi dạng củng cố (tính cực/tiêu cực) đều gia tăng phản ứng. Mọi dạng trừng phạt (tích cực/tiêu cực) đều làm giảm một phản ứng. Vậy nên, chúng ta có 4 thuật ngữ sau: củng cố tích cực, củng cố tiêu cực, trừng phạt tích cực và trừng phạt tiêu cực (Bảng 2).
Bảng 2: Positive and Negative Reinforcement and Punishment | ||
---|---|---|
Reinforcement | Punishment | |
Positive | Something is added to increase the likelihood of a behavior. | Something is added to decrease the likelihood of a behavior. |
Negative | Something is removed to increase the likelihood of a behavior. | Something is removed to decrease the likelihood of a behavior. |
Củng cố
Củng cố tích cực có thể là cách hữu hiệu nhất để dạy hành vi mới cho một người hoặc một con vật. Trong đó, một kích thích mang lại thích thú (cho người/vật) được thêm vào nhằm gia tăng hành vi.
Hãy tưởng tượng rằng một người mẹ bảo cậu con trai 5 tuổi tên là Jerome rằng nếu cậu dọn dẹp phòng của mình, cậu sẽ có một món đồ chơi mới. Ngay sau đó, Jerome đã dọn dẹp xong bởi vì cậu mong muốn có một bộ dụng cụ vẽ mới. Vài người sẽ thắc mắc: “Vì sao phải thưởng khi cậu con trai đáng lẽ phải làm chuyện đó?” Trong thực tế cuộc sống, chúng ta luôn được nhận quà, được thưởng. Đó là khi ta nhận được tiền lương mỗi tháng; khi đạt điểm số cao và đỗ vào trường mình mong đợi; khi hoàn thành tốt một công việc và được khen hay đậu bằng lái xe. Củng cố tích cực trở thành một phương thức dạy cực hữu hiệu. Trong một nghiên cứu ở thành phố Dallas, nhằm thúc đẩy khả năng đọc dưới mức trung bình của các em học sinh, họ áp dụng cách thưởng tiền, 2$ cho mỗi lần đọc một quyển sách và thực hiện một bài kiểm tra ngắn về nội dung quyển sách đó. Kết quả thật kinh ngạc khi khả năng đọc hiểu của các em học sinh tăng đột biến (Fryer, 2010). Bạn nghĩ thế nào về chương trình như thế? Skinner sẽ cho rằng đó là một ý kiến tuyệt vời nếu ông còn sống. Nhằm nâng cao hành vi học tập của học sinh ở trường học, Skinner thúc đẩy áp dụng các nguyên lý trong điều kiện học tập thao tác. Ngoài “chiếc hộp Skinner”, một phát minh khác của ông gọi là chiếc máy học tập, được thiết kế nhằm trao thưởng cho mỗi bước trong quá trình học tập (Skinner, 1961) - đây cũng được xem như khởi xướng cho việc học tập bằng máy tính. Học sinh sẽ đưa ra đáp án cho những câu hỏi về các môn học ở trường, chiếc máy này sẽ giúp kiểm tra kiến thức. Nếu học sinh trả lời đúng, chúng được nhận được củng cố tích cực ngay lập tức và tiếp tục. Ngược lại, nếu trả lời sai, chúng sẽ không nhận được củng cố nào. Mục đích ý tưởng chiếc máy học tập là để các bạn học sinh dành thời gian tìm tòi để hiểu cách và gia tăng số lần được củng cố (Skinner, 1961).
Về củng cố tiêu cực, một kích thích không mang lại thích thú được loại bỏ nhằm gia tăng hành vi. Ví dụ, các hãng xe áp dụng nguyên lý của củng cố tiêu cực trong hệ thống dây an toàn, khi người lái xe đeo dây an toàn thì tiếng bíp, gây khó chịu kia sẽ ngừng lại, điều này cho thấy tỷ lệ hành vi đeo dây an toàn dễ dàng gia tăng. Trong huấn luyện ngựa, để giảm lực kéo từ dây cương của người kỵ mã, ngựa phải tăng tốc hoặc rẽ hướng. Lực kéo được xem là kích thích tiêu cực và các chú ngựa không thích, muốn loại bỏ.
Trừng phạt
Trong điều kiện hóa tạo tác, nhiều người nhầm lẫn giữa củng cố tiêu cực và trừng phạt, thực tế chúng có cách thức vận hành khác nhau. Hãy nhớ rằng, mục đích của củng cố là gia tăng hành vi. Ngược lại, mục đích của trừng phạt là giảm hành vi. Trong trừng phạt tích cực, thêm vào yếu tố kích thích không mang lại thích thú nhằm giảm một hành vi. Ví dụ, trong lớp học, để học sinh ngừng nhắn tin (hành vi cần được giảm), la mắng hay khiển trách (yếu tố kích thích) là cách trừng phạt tích cực. Trong trừng phạt tiêu cực, loại bỏ yếu tố kích thích mang lại thích thú để giảm hành vi. Ví dụ, khi trẻ trở nên hư (hành vì cần được giảm), ba mẹ sẽ lấy đi món đồ chơi yêu thích (yếu tố kích thích).
Sự trừng phạt mang tính tức thì là một cách để giảm hành vi không mong muốn. Thử hình dung, khi một đứa trẻ 4 tuổi tên là Brandon, đánh cậu em trai, người mẹ đưa ra hình phạt là chép phạt 100 lần câu “Con sẽ không đánh em nữa” (trừng phạt tích cực). Brandon có lẽ sẽ không lặp lại hành vi đánh em. Đây là một trong những chiến thuật khá thông dụng trong cuộc sống ngày nay, tuy nhiên, trong quá khứ, trẻ em thường phải đối mặt với hình phạt thể lý, ví dụ như đánh đòn. Hãy cẩn trọng với kiểu phạt như thế bởi chúng đi kèm những trở ngại. Đầu tiên, đây là mọi hình thức phạt đều có thể dẫn đến nỗi sợ. Cậu bé Brandon có thể trở nên sợ với đường phố và cũng như người đánh cậu - ông bố hoặc bà mẹ. Một cách dễ thấy, học sinh khi bị giáo viên khiển trách và đánh phạt sẽ trở nên sợ hãi người giáo viên và tìm cách trốn học (Gershoff et al., 2010). Vì thế, tại Mỹ, hầu hết các trường đều nghiêm cấm mọi hình thức phạt liên quan đến cơ thể. Thứ hai, đây là hình phạt dễ dẫn đến sự gây hấn và hành vi chống đối xã hội hay hành vi phạm pháp (Gershoff, 2002). Những đứa trẻ nhận ra rằng cách ba mẹ đánh đòn khi họ tức giận và khó chịu, thế nên, chúng sẽ học theo cách đó, đánh nhau mỗi khi chúng tức giận và khó chịu. Ví dụ, khi người mẹ tức giận đánh trẻ khi chúng biểu hiện không tốt, trẻ sẽ có thể bắt đầu đánh bạn khi không được chia sẻ đồ chơi.
Dù rằng trừng phạt tích cực có tính hiệu quả trong vài trường hợp, Skinner cho rằng khi áp dụng cần cân nhắc và xem xét kỹ càng với hệ quả tiêu cực (nếu có). Ngày nay, tâm lý gia và chuyên gia về nuôi dạy con hướng đến cách thức củng cố hơn là trừng phạt - họ cho rằng khi con trẻ làm được điều tốt, phụ huynh nên trao thưởng.
Trong thí nghiệm điều kiện hóa tạo tác, Skinner thường sử dụng một cách tiếp cận, gọi là định hình. Nghĩa là, không chỉ trao thưởng với mỗi hành vi mang tính mục tiêu, định hình thì còn thưởng cho các hành vi có mục tiêu gần đúng liên tiếp, với mỗi lần thành công thì sẽ trao thưởng. Sự định hình là cần thiết bởi để có thể ứng dụng nguyên lý củng cố, đầu tiên chủ thể cần biểu hiện hành vi. Điều xuất hiện trước tiên sẽ là những hành vi mang tính ngẫu nhiên từ chủ thể và từ đây sự định hình bắt đầu. Đây là một quá trình, hành vi được chia nhỏ ra thành từng bước, dễ dàng đạt được. Cách thức cụ thể như sau:
- Đầu tiên, củng cố với tất cả dạng phản hồi có tính tương đồng với hành vi mong đợi.
- Tiếp theo, củng cố với dạng phản hồi có tính tương đồng cao hơn với hành vi mong đợi. Không tiếp tục củng cố với những phản hồi trong bước đầu.
- Sau đó, củng cố với dạng phản hồi có tính tương đồng cao hơn bước 2. Không củng cố với phản hồi ở bước 2.
- Cuối cùng, chỉ củng cố với hành vi mong đợi.
Khi huấn luyện hay dạy hành vi mang tính phức tạp hoặc chuỗi hành vi, định hình thường được áp dụng. Skinner sử dụng cách thức này để huấn luyện chim bồ câu, không chỉ biết cách lấy thức ăn trong chiếc hộp Skinner, mà còn có những hành vi mang tính giải trí khác, như xoay tròn, đi vòng quanh số 8 hay chơi ping pong. Thực tế, hiện nay khi huấn luyện động vật, con người áp dụng cách thức này. Một yếu tố quan trọng trong quá trình định hình là khả năng phân biệt các yếu tố kích thích. Nhắc lại thí nghiệm chú chó của Pavlov, ông đã huấn luyện các chú chó với nhiều tiếng chuông khác nhau, không sử dụng một tiếng chuông đặc hiệu nào. Khả năng phân biệt này cũng là một yếu tố quan trọng trong quá trình điều kiện hóa tạo tác và định hình hành vi.
Dễ dàng nhận thấy tính hiệu quả của sự định hình trong việc huấn luyện động vật, vậy với loài người thì sao? Với các bậc cha mẹ mong muốn con mình sẽ dọn dẹp căn phòng của bé, họ áp dụng cách thức định hình này, giúp đỡ trẻ trong từng bước nhỏ để đạt được hành vi. Thay vì phải làm tất tần tật trong một lần, họ chia nhỏ các bước và củng cố mỗi bước. Đầu tiền, trẻ lau dọn một món đồ chơi. Sau đó sẽ là năm món đồ chơi. Tiếp đến, trẻ được chọn giữa việc lau dọn mười món đồ chơi hoặc dọn dẹp sách và quần áo. Sau đó, trẻ sẽ dọn tất trừ hai món đồ chơi. Cuối cùng, trẻ sẽ dọn tất cả trong phòng.
Củng cố sơ cấp và củng cố thứ cấp
Trong học tập, phần thưởng thường là tem dán, lời khen, tiền, đồ chơi hay các vật khác nữa. Quay lại với thí nghiệm con chuột của Skinner, làm sao chú chuột có thể học cách dẫm lên đòn bẩy trong chiếc hộp Skinner? Nó sẽ được ăn mỗi khi dẫm. Với động vật, thức ăn hiển nhiên là yếu tố khích lệ.
Vậy thì với loài người, đâu là yếu tố khích lệ? Ví dụ như với cậu bé tên Chris, lời hứa một món đồ chơi khi dọn phòng; hay cậu Sydney, một cầu thủ bóng đá nhỏ tuổi, nếu thưởng cậu kẹo mỗi khi ghi bàn, nghĩa là ta đang sử dụng củng cố sơ cấp. Đây là dạng là những củng cố tác động đến hành vi mà không cần phải học tập: thức ăn, nước uống, tình dục. Đó là những củng cố tự nhiên. Cảm thấy dễ chịu cũng là một dạng củng cố sơ cấp. Chủ thể sẽ không đánh mất ý thức để đạt được những củng cố sơ cấp. Ví dụ, với hầu hết mọi người, vào những ngày nắng nóng, nhảy vào ao hồ là một dạng củng cố vì tính mát lạnh từ nguồn nước sẽ giúp giảm nhiệt (điều cơ thể cần) và làm con người cảm thấy dễ chịu.
Một dạng củng cố thứ hai, bản chất không mang giá trị và chỉ có tính củng cố khi kết nối với củng cố sơ cấp. Lời khen, liên kết với cảm xúc, là dạng củng cố thứ cấp, như khi ta thét lớn “Hay lắm, Sydney!” mỗi khi cậu ghi bàn. Một ví dụ khác như tiền, chỉ có lợi khi ta có thể dùng chúng mua đồ, đó có thể là những thể để thỏa mãn nhu cầu cơ bản (nước uống, đồ ăn,.. - những củng cố sơ cấp), hay những củng cố thứ phát khác. Giả sử, bạn đang ở trên một hòn đảo giữa Thái Bình Dương, một đống tiền không thể giúp được gì cả. Vây những tem dán được đề cập trong bảng hành vi là gì? Chúng cũng là củng cố thứ cấp.
Đôi khi, ta có thể sử dụng token (một dạng mã hóa có giá trị quy đổi) thay cho những nhãn dán trên biểu đồ ghi chú. Tokens, là củng cố thứ phát, có thể quy đổi ra phần thưởng. Hiện nay, một hệ thống điều chỉnh hành vi, được biết với tên gọi phương pháp quy đổi mang tính kinh tế [token economies], mang tính hiệu quả cao trong việc điều chỉnh hành vi trong nhiều môi trường như học tập, nhà lao hay bệnh viện tâm thần. Trong một nghiên cứu với Cangi và Daly (2013) đã tìm thấy phương thức quy đổi kinh tế làm gia tăng hành vi thích ứng xã hội và làm giảm hành vi kém thích ứng ở nhóm trẻ tự kỷ tại trường học. Trẻ rối loạn phổ tự kỷ thường có hành vi mang tính phá hoại như nhéo hay đánh đập. Vì thế, áp dụng phương thức token, khi trẻ biểu hiện hành vi thích ứng tốt (không nhéo/đánh), trẻ sẽ được trao thưởng token “bàn tay im lặng” [quiet hands]. Khi trẻ đánh hoặc nhéo, trẻ sẽ bị lấy đi token. Những token được quy đổi thành thời gian chơi.
Lịch trình củng cố
Củng cố tích cực là cách tốt nhất để dạy hoặc thúc đẩy hành vi cho một người hay một con vật. Trong thí nghiệm của Skinner, ông sử dụng củng cố tích cực để dạy chuột dẫm đòn bẩy để lấy thức ăn. Đầu tiền, chuột ngẫu nhiên dẫm lên đòn bẩy khi khám phá chiếc hộp, và đột nhiên miếng đồ ăn xuất hiện. Ngay sau khi ăn, chuột sẽ làm gì nữa? Hiển nhiên, nó sẽ tiếp tục dẫm lên đòn bẩy để lấy thức ăn. Củng cố hành vi chủ thể mỗi khi thực hiện hành vi, gọi là quá trình củng cố liên tiếp. Khi dạy một hành vi, đặc biệt một hành vi hoàn toàn mới, cách nhanh nhất để dạy là theo phương pháp củng cố có lịch trình. Thử xem xét về ví dụ cách dạy con chó ngồi, mỗi khi nó vừa ngồi, người chủ sẽ thưởng. Thời điểm là một yếu tố quan trọng: ngay khi chó vừa ngồi, người chủ ngay tức thì thưởng thì khả năng dạy thành công cao. Vì như thế, con chó sẽ liên kết giữa hành vi mục tiêu (ngồi) và hệ quả (được thưởng).
Ngay khi hành vi đã được dạy, nhà nghiên cứu hoặc huấn luyện viên sẽ đổi lịch trình củng cố khác, đó là củng cố theo tỷ lệ. Đây cũng có thể xem là củng cố gián đoạn, nghĩa là người được dạy hoặc con vật đang được huấn luyện sẽ không nhận thưởng sau mỗi lần thực hiện hành vi. Theo bảng 6.3, có nhiều loại khác nhau trong lịch trình củng cố theo tỷ lệ. Quá trình này có thể cố định hoặc linh hoạt, có thể củng cố theo tỷ lệ hoặc theo quãng thời gian. Lịch trình cố định củng cố nghĩa là số lần thực hiện được hành vi để được thưởng đã đề ra và không thay đổi. Lịch trình củng cố linh hoạt nghĩa là số lần thực hiện được hành vi được thưởng đã đề ra và có thể thay đổi. Thời gian giữa những lần củng cố gọi là quãng, số lần thực hiện được hành vi giữa những lần củng cố gọi là tỷ lệ.
Khi kết hợp các yếu tố trên, ta có: lịch trình củng cố cố định theo quãng thời gian, nghĩa là sau một quãng thời gian thực hiện hành vi thì được thưởng. Ví dụ, June vừa trải qua một cuộc đại phẫu ở bệnh viện. Trong quá trình hồi phục, cơn đau nhức là một điều khó tránh, thế nên bác sĩ kê thêm thuốc giảm đau bằng cách truyền dịch với hệ thống nút bấm do bệnh nhân điều khiển. Bác sĩ sẽ kê toa một liều lượng cho một tiếng. Mỗi khi cơn đau ập đến, June sẽ nhấn nút và thuốc sẽ được tiêm vào. Bởi vì thuốc giảm đau chỉ diễn ra trong một quãng cố định, thế nên không có ý nghĩa gì để thực hiện hành vi khi nó không được thưởng.
Với lịch trình củng cố linh hoạt theo quãng thời gian, chủ thể sẽ được thưởng tùy lúc, không thể đoán trước. Ví dụ như Manuel là quản lý một nhà hàng thức ăn nhanh. Thỉnh thoảng sẽ có người từ bộ phận kiểm định đến kiểm tra chất lượng nhà hàng. Nếu cơ sở vật chất sạch sẽ và chất lượng phục vụ nhanh gọn, mọi người sẽ được thưởng thêm 20$. Manuel chẳng bao giờ biết trước khi nào người đó sẽ đến, nên anh luôn cố gắng giữ vệ sinh cơ sở cũng như chất lượng phục vụ tốt. Vì anh muốn cả tập thể được nhận thưởng nên kiên trì và năng suất trong chất lượng dịch vụ và giữ vệ sinh nhà hàng.
Với lịch trình củng cố cố định theo tỷ lệ, nghĩa là khi chủ thể thành công thực hiện hành vi sau một số lần thì được thưởng. Như cô gái bán mắt kính tại cửa hàng kính, Carla, mỗi khi doanh thu đạt chỉ tiêu cô sẽ được hoa hồng. Cô cố gắng bán nhiều kính hơn, bằng cách bán cùng với kính mát phân cực hay cặp kính phụ, vì thế cô có thể hưởng hoa hồng. Cô không quan tâm liệu khách hàng có thật sự cần kính mát phân cực không, cô chỉ hướng đến số tiền thưởng. Chất lượng của mắt kính không quan trọng, bởi vì tiền hoa hồng không dựa trên chất lượng mà là số lượng được bán ra. Vì thế, trong tùy trường hợp cần chất lượng hay số lượng, cần chọn cách củng cố để phù hợp. Lịch trình tỷ lệ cố định hướng đến số lượng đầu ra, còn lịch trình quãng thời gian cố định hướng đến chất lượng đầu ra.
Với lịch trình củng cố tỷ lệ linh hoạt, số lần thực hiện hành vi để được thưởng có thể thay đổi. Đây được xem như là một cách củng cố mạnh mẽ nhất. Ví dụ điển hình trong đánh bài. Ví dụ rằng, Sarah, một cô gái thông minh, chu toàn trong cách tiêu tiền. Cô đến chơi thành phố Las Vegas. Đây là lần đầu tiên cô đến đây, cô không phải người chơi cờ bạc chuyên nghiệp, tuy nhiên, sự tò mò đã dẫn dắt cô đưa vào chiếc máy đánh bạc đồng xu 15 cent, cứ tiếp tục mỗi lần 15 cent như vậy. Không có điều gì xảy ra, cho đến khi số tiền cho vào là 2$ và 15 cent, sự tò mò của cô đang dần tan biến, cô chuẩn bị từ bỏ. Bất thình lình, chiếc đèn từ cái máy phát sáng, tiếng chuông vang lên và Sarah thắng được 50 cent. Quá phấn khích, cô tiếp tục cho đồng xu, cho đến khi tổng số tiền cô đưa vào là 10$. Quả thật, thời điểm này nếu dừng lại thật đáng tiếc, bởi cô nghĩ rằng có thể lần thưởng tiếp theo sẽ đến. Với ý nghĩ, với mỗi đồng xu 25 cent đang bỏ vào, cô có thể thắng 50$ hay thậm chí 100$ hoặc hơn cả thế. Trong cờ bạc, lịch trình củng cố tỷ lệ linh hoạt là một phương thức thường xuyên được áp dụng, người chơi tiếp tục thử và hy vọng cho lần thắng tiếp theo. Thế nên cờ bạc dễ dàng gây nghiện, rất khó dập tắt hành vi này.
Trong quá trình điều kiện hóa tạo tác, khi sự dập tắt hành vi diễn ra ngay khi quá trình củng cố ngừng lại, điều này tùy thuộc vào lịch trình củng cố. Với dạng tỷ lệ củng cố hành vi có thay đổi, sự dập tắt diễn ra rất chậm. Nhưng với những dạng lịch trình khác, sự dập tắt có thể diễn ra khá nhanh. Ví dụ, như trường hợp của June, nếu cô nhấn nút trước thời điểm bác sĩ yêu cầu thì sẽ không có thuốc được tiêm vào. Đây là dạng củng cố theo quãng gián đoạn cố định (1 liều/giờ), nên sự dập tắt ngay tức thì diễn ra khi sự củng cố không xuất hiện. Trong các dạng lịch trình củng cố, dạng tỷ lệ linh hoạt hiệu quả nhất và rất khó sự dập tắt xảy ra. Dạng theo quãng gián đoạn cố định ít hiệu quả và dễ dàng biến mất.
Nhận thức và học ngầm ẩn
Những nhà thuần hành vi học như Watson and Skinner nghiêng về nghiên cứu hành vi hơn nhận thức (suy nghĩ hay mong đợi, chẳng hạn). Skinner có niềm tin cứng nhắc rằng nhận thức chẳng đóng vai trò gì, ý tưởng của ông chỉ thuần túy hành vi. Ông ví tâm trí là một “chiếc hộp đen” - một điều nằm ngoài khả năng hiểu biết - và vì thế không nên nghiên cứu. Tuy nhiên, nhà hành vi học khác, Edward C.Tolman đưa ra quan điểm khác. Trong thí nghiệm của Tolman với chuột đã cho thấy dù chưa xuất hiện củng cố tức thì, chủ thể vẫn có thể học được hành vi ((Tolman & Honzik, 1930; Tolman, Ritchie, & Kalish, 1946). Vì kết quả cho thấy sự mâu thuẫn với những quan điểm trước đó, nên có nhiều gợi ý nghiên cứu về khía cạnh nhận thức trong quá trình học tập.
Cuộc thí nghiệm của Tolman được tiến hành với những con chuột đang đói, ông thả chúng vào một mê cung, không để phần thưởng nào ở lối ra. Trong nhóm đối chứng khác, ông có thể phần thưởng (thức ăn) ở lối ra. Với nhóm không được củng cố khi khám phá mê cung, trong tâm trí hình thành một sơ đồ: hình ảnh ghi nhớ về đường lối mê cung (Hình 3). Sau 10 lần vào mê cung không có củng cố, cuối cùng thức ăn cũng được đặt ở lối ra. Ngay khi ngửi được mùi thức ăn, chúng có thể tìm được lối ra nhanh như nhóm đối chứng. Đây được gọi là quá trình học tập ngầm ẩn [latent learning]: kiến thức được học không được quan sát thấy, chỉ để khi có mục đích cụ thể mới sử dụng.
Ở loài người cũng thế. Trẻ nhỏ khi xem những hành vi của bố mẹ, chúng có thể học được và biểu hiện trong một thời điểm ở tương lai khi cần thiết. Ví dụ, bố của Ravi thường đưa cậu đến trường mỗi ngày bằng xe hơi. Ravi nhớ con đường từ nhà đến trường, nhưng cậu chưa bao giờ tự đến trường, nên chưa thấy được khả năng nhớ này. Một sáng nọ, bố Ravi phải rời đi sớm vì cuộc họp, ông không thể đưa cậu đến trường, thế là cậu chạy xe đạp theo con đường trong trí nhớ. Đây là một ví dụ cho quá trình học tập ngầm ẩn. Ravi đã học được con đường từ nhà đến trường nhưng chỉ đến khi nhu cầu xuất hiện, kiến thức này mới được sử dụng.
0 nhận xét:
Đăng nhận xét