운영자 컨디셔닝이란 무엇이며 어떻게 작동합니까?

by 켄드라 체리; Steven Gans, MD 검토

강화와 처벌이 행동을 수정하는 방법

Operant conditioning (때때로 instrumental conditioning 이라고도 함)은 행동에 대한 보상과 처벌을 통해 발생하는 학습 방법입니다. operant conditioning을 통해, 행동은 그 행동에 대한 결과와 연관성을 갖습니다.

예를 들어, 실험실 쥐가 파란색 버튼을 누르면 음식 펠렛을 보상으로 받지만 빨간 버튼을 누르면 약한 감전을받습니다.

결과적으로 그는 파란색 버튼을 누르고 빨간색 버튼을 피하는 법을 배웁니다.

그러나 operant conditioning은 실험실 동물을 훈련하는 동안 실험 설정에서 이루어지는 것만이 아닙니다. 그것은 또한 일상 학습에서 강력한 역할을합니다. 보강과 처벌은 거의 매일 자연 환경 에서뿐만 아니라 교실이나 치료 세션과 같은보다 구조화 된 환경에서 이루어집니다.

operant 컨디셔닝이 어떻게 발견되었는지, 그것이 심리학에 미친 영향 및 이전 행동을 바꾸고 새로운 행동을 가르치는 데 어떻게 사용되는지 자세히 살펴 보겠습니다.

운영자 컨디셔닝의 역사

Operant conditioning은 행동 주의자 인 BF Skinner에 의해 만들어 졌는데, Skinnerian 컨디셔닝이라고 불리는 경우가 종종 있습니다. 행동 주의자 인 Skinner는 행동을 설명하기 위해 내면의 생각과 동기를 조사 할 필요가 없다고 생각했습니다. 대신 그는 인간 행동의 외부적이고 관찰 가능한 원인을 조사해야한다고 제안했다.

20 세기의 첫 번째 부분을 통해 행동주의는 심리학에서 주요한 힘이되었다. 존 B. 왓슨 (John B. Watson) 의 생각은 초기에이 사상 학교를 지배했습니다. 왓슨은 고전 컨디셔닝 의 원리에 중점을 두었습니다. 그는 일단 자신의 배경에 관계없이 어떤 사람이라도 취할 수 있고 그가 선택한 무엇이든 훈련 할 수 있다고 제안했습니다.

초기 행동 주의자들이 연상 학습에 관심을 집중시킨 곳에서 Skinner는 사람들 행동의 결과 가 어떻게 행동에 영향을 주 었는지에 더 관심이있었습니다.

Skinner는 operant 라는 용어를 사용하여 환경에 영향을 미치는 활동적인 행동을 나타냅니다. 다시 말해, Skinner의 이론은 우리가 매일 보여주는 학습 된 행동의 범위를 어떻게 획득하는지 설명했습니다.

그의 이론은 효과 법칙을 제안한 심리학자 Edward Thorndike 의 연구에 크게 영향을 받았습니다. 이 원칙에 따르면 바람직한 결과가 뒤 따르는 행동은 반복 될 가능성이 높으며 바람직하지 않은 결과가 뒤 따르는 행동은 반복 될 가능성이 적습니다.

운전자 컨디셔닝은 상당히 단순한 전제에 의존합니다. 보강 조치가 강화되고 향후에 다시 발생할 가능성이 높아집니다. 수업에서 재미있는 이야기를하면 모두들 웃게 될 것입니다. 앞으로는 다시 이야기 할 가능성이 높습니다. 질문을하기 위해 손을 들어 선생님이 예의 바른 행동을 칭찬하면 다음에 질문이나 의견이있을 때 손을 들어 올릴 가능성이 커집니다.

그 행동이 보강되었거나 바람직한 결과가 있었기 때문에 앞의 행동이 강화되었습니다.

반대로, 처벌이나 바람직하지 않은 결과를 초래하는 행동은 앞으로 약화되고 다시는 발생할 가능성이 낮습니다. 다른 수업에서 같은 이야기를 다시 말하면 아무도이 시간을 웃지 않는다면, 미래에 이야기를 다시 반복 할 확률이 줄어 듭니다. 수업에서 답을 외쳐 선생님이 당신을 꾸짖다면, 수업을 다시 방해 할 가능성이 적습니다.

행동 유형

스키너는 두 가지 유형의 행동을 구분했습니다.

응답자의 행동 은 의사가 무릎을 두들 기 때 뜨거운 난로에서 손을 떼거나 다리를 경련시키는 것과 같이 자동으로 반사적으로 발생하는 행동 입니다. 당신은 이러한 행동을 배울 필요가 없으며 단순히 자동적으로 그리고 무의식적으로 발생합니다.
반면에 운 조작자의 행동 은 우리의 의식 하에있는 행동 입니다. 어떤 것은 자발적으로 그리고 다른 일부는 의도적으로 발생할 수 있지만, 이러한 행동의 결과는 미래에 다시 발생할지 여부에 영향을 미칩니다. 환경에 대한 우리의 행동과 그 행동의 결과는 학습 과정 에서 중요한 부분을 차지합니다.

고전적인 조절이 응답자의 행동을 설명 할 수 있지만 Skinner는 많은 학습을 설명 할 수 없다는 것을 깨달았습니다. 대신, Skinner는 operant conditioning이 훨씬 더 중요하다고 제안했다.

Skinner는 소년 시절에 여러 가지 장치를 발명했으며,이 기술을 operant conditioning에 관한 연구 중에 작동 시켰습니다.

그는 operant conditioning chamber로 알려진 장치를 만들었는데, 오늘날에는 스키너 상자 라고도합니다. 챔버는 근본적으로 쥐나 비둘기와 같은 작은 동물을 수용 할 수있는 박스였습니다. 상자에는 보상을 받기 위해 동물이 누를 수있는 막대 또는 키가 포함되어 있습니다.

응답을 추적하기 위해 Skinner는 누적 레코더라고하는 장치도 개발했습니다. 이 장치는 응답을 회선의 상향 이동으로 기록하여 회선의 기울기를보고 응답 속도를 읽을 수있었습니다.

운영자 컨디셔닝의 구성 요소

operant conditioning에는 몇 가지 핵심 개념이 있습니다.

Operant Conditioning의 보강

보강 은 다음 행동을 강화하거나 증가시키는 모든 사건입니다. 강화제에는 두 가지 종류가 있습니다.

긍정적 인 강화제 는 행동 후에 발표되는 유리한 사건이나 결과입니다. 긍정적 인 강화를 반영하는 상황에서 칭찬이나 직접적인 보상과 같은 무언가를 추가함으로써 반응이나 행동이 강화됩니다. 예를 들어 직장에서 잘하고 관리자가 보너스를받는 경우.
부정적인 보강 은 행동의 표시 후 바람직하지 못한 사건이나 결과의 제거를 포함합니다. 이러한 상황에서는 불쾌하다고 여겨지는 것을 제거함으로써 대응이 강화됩니다. 예를 들어, 자녀가 식료품 점 중간에서 비명을 지르지 만 치료를 받으면 중지합니다. 다음에 비명을 지르면 치료할 가능성이 커집니다. 당신의 행동은 불쾌한 상태 (아이가 소리 지르는 것)를 제거하고, 당신의 행동을 부정적으로 강화시킵니다.

이러한 보강의 경우 모두 행동이 증가합니다.

Operant Conditioning의 처벌

처벌 은 다음과 같은 행동을 감소시키는 이상 반응이나 결과의 제시입니다. 처벌에는 두 가지 종류가 있습니다.

긍정적 인 처벌 은 때로는 신청에 의한 처벌이라고도 불리우며, 뒤 따르는 반응을 약화시키기 위해 바람직하지 못한 사건이나 결과를 나타냅니다. 비행에 대한 욕심쟁이는 응용 프로그램에 의한 처벌의 한 예입니다.
제거에 의한 처벌이라고도하는 부정적인 처벌 은 행동이 일어난 후 유리한 사건이나 결과가 제거 될 때 발생합니다. 잘못을 저지른 후에 비디오 게임을 빼앗는 것은 부정적 처벌의 한 예입니다.

이러한 처벌의 경우 모두 행동이 감소합니다.

보강 일정

강화는 반드시 간단한 과정이 아니며, 새로운 것들이 얼마나 빨리 그리고 얼마나 잘 배워 졌는지에 영향을 미칠 수있는 많은 요소가 있습니다. Skinner는 행동이 강화 된 시기 와 빈도 가 획득의 속도와 강도에서 중요한 역할을한다는 것을 발견했습니다. 바꾸어 말하면, 보강의 타이밍과 빈도는 새로운 행동이 어떻게 배워 졌는지, 그리고 얼마나 오래된 행동이 수정되었는지에 영향을 미쳤다.

Skinner는 operant conditioning 과정에 영향을 미치는 여러 가지 보강 일정을 확인했습니다.

지속적인 보강 은 반응이 발생할 때마다 강화 를 전달하는 것을 포함합니다. 학습은 상대적으로 빠르게 발생하는 경향이 있지만 응답률은 매우 낮습니다. 보강이 중지되면 소멸 또한 매우 빠르게 일어난다.
고정 비율 일정 은 부분 보강의 한 유형입니다. 응답은 특정 횟수의 응답이 발생한 후에 만 강화됩니다. 이것은 전형적으로 비교적 안정적인 응답률을 유도합니다.
고정 간격 일정 은 부분 보강의 또 다른 형태입니다. 보강은 특정 시간 간격이 경과 한 후에 만 발생합니다. 응답 속도는 상당히 안정적이며 보강 시간이 가까워지면 증가하기 시작하지만 보강이 전달 된 직후에는 느려집니다.
가변 비율 스케줄 은 다양한 응답 횟수 후에 보강 동작을 포함하는 부분 보강 유형입니다. 이것은 높은 응답 속도와 느린 멸종 속도를 초래합니다.
가변 간격 일정 은 Skinner가 설명한 부분 보강의 최종 형태입니다. 이 일정에는 일정한 시간이 경과 한 후 보강 조치가 포함됩니다. 이것은 또한 빠른 응답 속도와 느린 소멸 속도로 이어지는 경향이 있습니다.

운영자 컨디셔닝의 예

우리는 우리 주변의 모든 곳에서 operant conditioning의 예를 발견 할 수 있습니다. 부모 나 교사로부터 보상을 얻기 위해 숙제를 마친 아이들이나 칭찬이나 판촉을 받기 위해 프로젝트를 마친 직원을 생각해보십시오.

실제 operant 컨디셔닝의 몇 가지 예 :

귀하의 자녀가 쇼핑 여행을하는 동안 행동을한다면, 당신은 그에게 조용하게 해주는 대접을 제공 할 것입니다. 당신이 잘못을 적극적으로 강화했기 때문에, 그는 다른 치료를 받기 위해 앞으로도 다시 행동 할 가능성이 더 높습니다.
커뮤니티 극장에서 공연을 한 후 관객에게 박수 갈채를받습니다. 이것은 당신이 더 많은 역할 수행을 시도하도록 고무하는 긍정적 인 강화제 역할을합니다.
그가 제대로 행동을 수행 할 때마다 머리에 그에게 칭찬과 팻 (pat)을 제공하여 가져 오기 위해 개를 훈련시킵니다.
교수는 학생들에게 한 학기 내내 완벽한 출석을한다면 최종 종합 시험을 치룰 필요가 없다고 말합니다. 불쾌한 자극을 제거함으로써 (최종 시험) 학생들은 정기적으로 수업에 참여하기 위해 부정적으로 강화됩니다.
정시에 프로젝트를 제출하지 않으면 상사가 화를 내며 동료 앞에서 자신의 업무 수행을 단념시킵니다. 이것은 긍정적 인 처벌 자의 역할을하여 나중에 프로젝트를 늦게 끝낼 가능성을 줄입니다.
사춘기 소녀는 묻는대로 방을 청소하지 않으므로 부모님은 남은 시간 동안 전화를 가져갑니다. 이것은 긍정적 인 자극이 제거되는 부정적인 처벌의 한 예입니다.

이 예들 중 일부에서는 보상의 약속 또는 가능성으로 인해 행동이 증가하지만, operant conditioning을 사용하여 행동을 감소시킬 수도 있습니다. 바람직한 결과 또는 부정적인 결과 적용을 제거하면 바람직하지 않은 행동을 줄이거 나 예방하는 데 사용할 수 있습니다. 예를 들어, 수업 중 교실에서 교대로 말할 경우 휴회 특권을 잃게 될 것이라고 어린이에게 이야기 할 수 있습니다. 이러한 처벌의 가능성은 파괴적인 행동을 감소시킬 수 있습니다.

한 단어

행동주의는 20 세기 초반에 지배적이었던 부분을 잃어 버렸지 만, 조작 적 조절은 배우기와 행동 수정 과정에서 중요하고 자주 사용되는 도구로 남아 있습니다. 때때로 자연스러운 결과는 우리 행동의 변화를 가져옵니다. 다른 경우에는 보상을 만들기 위해 의식적으로 보상과 처벌을 내릴 수 있습니다.

Operant conditioning은 아이들에게 좋은 행동을 가르치는 접근법이든, 또는 좋아하는 슬리퍼에서 씹는 것을 멈추기 위해 가족 개를 훈련시키는 것이 든, 자신의 삶에서 즉시 인식 할 수있는 것입니다. 기억해야 할 중요한 점은 모든 유형의 학습을 통해 때로는 시간이 걸릴 수 있다는 것입니다. 자신의 상황에 가장 적합한 보강 또는 처벌 유형을 고려하고 어떤 유형의 보강 일정이 최상의 결과를 가져올 지 평가하십시오.

> 출처 :

> Coon, D & Mitterer, JO. 심리학 : 여행. 벨몬트, 캘리포니아 : 워즈 워드; 2014 년

> Domjan, M. 학습과 행동의 원리, 제 7 판. Stamford, CT; Cengage 학습; 2015.

운영자 컨디셔닝의 역사

행동 유형

운영자 컨디셔닝의 구성 요소

운영자 컨디셔닝의 예

한 단어

Related Content

Fresh articles

Intresting articles