操作条件反射,由美国心理学家斯金纳命名,是一种由刺激引起的行为改变。操作条件反射与经典条件反射不同,操作条件反射与自愿行为有关,而巴甫洛夫条件反射与非自愿行为有关。
操作条件反射,有时称为工具条件反射或工具学习,第一位研究者是桑代克 (1874-1949),他观察猫试图逃出迷箱的行为。第一次猫花了很长时间才逃出来。 有了经验以后,无效的行为逐渐减少而成功的反应逐渐增加,猫成功逃出迷箱所用的时间也越来越少。桑代克的效果律解释:成功的反应产生满意的结果,被经验 被"stamped in",出现也更频繁。不成功的反应,产生讨厌的结果, 被stamped out,出现频次下降。一些结果增强行为,而一些结果减弱 行为。斯金纳 (1904-1990)在桑代克观点的基础上建立了基于强化和惩罚的更详细的操作条件反射理论。
强化和惩罚
强化和惩罚是操作条件反射的核心思想,既有正向的(加给有机体环境刺激),也有负向的(从有机体环境中取走刺激)。共产生4种基本结果,加上没有结果(什么也没有发生)。
- 强化结果是引起行为出现频次大幅增加。
- 惩罚结果是引起行为出现频次减少。根据斯金纳的操作条件反射理论,有2种减少行为或反应的方法:惩罚或extinction。
操作条件反射的4个来龙去脉:
这里的"正向"和"负向"并非通常的用法,而是: "正向"指增加, 而"负向"指减少。增加或减少的既有强化也有惩罚。正向惩罚有时被混淆,它表示惩罚(如拍打或电击)的增加,虽然可能让人有非常负向的错觉。有4种情况:
-
- 正向强化指在出现一个行为(反应)后给予欲望(通常是愉快的)刺激,以增加该行为。在斯金纳箱实验中,当猫按下杠杆,就给予刺激如食物或糖。
- 负向强化指在出现一个行为(反应)后取走讨厌的(通常是不愉快的)刺激物,以增加该行为。在斯金纳箱实验中,负向强化是在猫笼里持续播放噪音,直到它按下 杠杆,于是噪音停止。
- 正向惩罚指在出现一个行为(反应)后给予讨厌的刺激,如电击或噪音,以减少该行为。
- 负向惩罚指在出现一个行为(反应)后取走欲望刺激,如拿走孩子的玩具,以减少该行为。
回避学习
双过程回避理论
参见
- 动物训练:A task that typically (并不总是) requires 操作条件反射。
- 行为改变
- 行为主义:用external events解释行为的理论。这是under 操作条件反射 falls的理论。
- 经典条件反射
- 认知主义:用invoking internal mental representations和operations解释行为的理论,该理论与行为主义直接相对。
- 教育技术学
- 强化
参考
- 斯金纳(1938). 有机体的行为: 实验分析. Acton, MA: Copley.
- 斯金纳(1953). 科学和人类行为纽约. Macmillan.
- 斯金纳(1957). Verbal 行为 Englewood Cliffs, NJ: Prentice Hall.
- 桑代克(1901).动物智力:动物联结过程实验研究,Psychological Review Monograph Supplement, 2, 1-109.
- Keller and Marian Breland (1961), "有机体的不正当行为" 美国心理学家.
外部链接
学习 | 认知心理学
Konditionierung | Operant conditioning | Conditionnement opérant | התניה אופרנטית | Warunkowanie instrumentalne