본문 바로가기
이야기가 있는 정원, 성격심리

✔조작적 조건화 이론③(강화계획의 종류, 강화 스케줄, 차별강화, 강화물의 유형, 프리맥의 원리, 유관학습과 유관강화)

by 이야기가 있는 정원 2021. 6. 11.
728x90
반응형
728x170

 

 

 

 

 

 

 

 

◆ 저번 시간에 이어서 오늘도 조작적 조건화 이론, 또는 조작적 조건 형성에 대해서 알아보도록 하겠다. 이론의 주요개념, 정적 강화, 부적 강화, 정적 처벌, 부적 처벌 등의 강화와 처벌의 유형 등에 대해 궁금하신 분은 아래의 글을 참조하시길 바란다.

 

 

 

✔조작적 조건화 이론②(유관성 또는 수반성, 강화, 처벌, 소거, 자발적 회복, 정적 강화, 부적 강

■ 저번 시간에 이어서 조작적 조건화, 혹은 조작적 조건형성에 대해서 계속 알아보도록 하겠다. 이론의 개요, 손다이크의 고양이 실험(시행착오설), 스키너의 쥐 실험(조작적 강화이론), 그리고

narrare3.tistory.com

 

 

(4) 강화계획 또는 강화스케줄 : 

 

① 계속적 강화계획(Continuous Reinforcement Schedule) : 

 

㉮ 계속적 강화계획이란 반응의 횟수나 시간에 관계없이 기대하는 반응이 나타날 때마다 강화를 부여하는 것이다. 

 

㉯ 학습 초기단계에는 효과적이지만, 일단 강화가 중지되는 경우에는 행동이 소거될 가능성도 있다.

 

㉰ 즉, 강화요인의 연속적인 적용으로 인해 강화요인의 유인가치가 감소하는 '포만효과(Satiation Effect)'의 부작용이 발생할 수 있다는 것이다. 

 

㉱ 따라서, 일상생활에서보다는 실험실 등에서 적용 가능한 방법에 해당한다. 

 

 

② 간헐적(부분적) 강화계획(Intermitten (or Partial) Reinforcement Schedule) : 

 

㉮ 이것은 반응의 횟수나 시간을 고려하여 간헐적 또는 주기적으로 강화를 부여하는 방법이다.

 

㉯ 계속적 강화계획과 비교해볼 때, 상대적으로 학습된 행동을 유지하는 데 효과적인 방법인데, 이는 연속적으로 강화된 행동에 비해 간헐적으로 강화된 행동이 소거되기 어렵기 때문이다

 

㉰ 간헐적 강화계획의 종류로는 시간의 간격을 기준으로 '고정간격계획', '가변(변동)간격계획', '고정비율계획', '가변(변동)비율계획' 등이 있다.

 

㉱ 반응률이 높은 강화계획의 순서로는 '가변비율계획(VR)' > 고정비율계획(FR) > 가변간격계획(VI) > 고정간격계획(FI)' 순이다. 

 

㉲ 강화계획 중 학습속도는 느리지만 소거에 대한 저항이 가장 큰 것은 가변(변동)비율계획이다. 

 

 

728x90

 

 

고정간격계획
(Fixed - interval Schedule)
* 요구되는 행동의 발생빈도에 상관없이 일정한 시간 간격에 따라 강화를 부여한다.

* 지속성이 거의 없으며, 강화시간이 다가오면서 반응률이 증가하는 반면, 강화 후에는 떨어진다는 특성이 있다. 

예) 주급, 월급, 일당, 정기적 시험 등
가변(변동)간격계획
(Variable - interval Schedule)
* 일정한 시간 간격을 두지 않은 채 평균적으로 확인할 수 있는 시간 간격이 지난 후에 강화를 부여한다.

* 느리고 완만한 반응률을 보이며, 강화 후에도 거의 쉬지 않는다는 특성이 있다.

예) 1시간에 3차례의 강화를 부여할 경우, 25분/45분/60분으로 나누어 강화를 부여한다.
고정비율계획
(Fixed - ratio Schedule)
* 행동중심적 강화방법으로서, 일정한 횟수의 바람직한 반응이 나타난 다음에 강화를 부여한다.

* 빠른 반응률을 보이지만 지속성은 약하다.

예) 옷 공장에서 옷 100벌을 만들 때마다 1인당 100만원의 성과급을 지불한다.
가변(변동)비율계획
(Variable -ratio Schedule)
* 반응행동에 변동적인 비율을 적용하여 불규칙한 횟수의 바람직한 행동이 나타난 후 강화를 부여한다.

* 반응률이 높게 유지되며, 지속성도 높다.

예) 카지노의 슬롯머신, 복권 등

* 출처 : [성격심리학], 행동주의적 관점, 핵심이론

 

 

 

 

 

(5) 차별강화(Differential Reinforcement) : 

 

① 차별강화는 강화와 소거에 의해 대안적 행동을 증가시키는 동시에, 문제 행동을 감소시키는 방법이다.

 

② 특히 부적응 행동을 줄이기 위해 널리 사용되는 방법으로, 감소 표적행동 대신 증가 표적행동을 강화할 수 있다고 본다. 일테면, 타인을 비난하는 습관을 가진 내담자의 경우 비난하는 행동을 줄이기 위해 타인을 칭찬하는 행동에 강화를 부여한다. 

 

③ 차별강화는 간접적으로 바람직하지 못한 행동을 감소시키는 전략으로서 그 형태는 다양하며, 그 중 널리 알려진 유형은 아래와 같다. 

 

저율 차별강화
(DRL)
* '낮은 비율 차별강화(Differential Reinforcement of Low Rates)'라고도 부른다.

* 행동이 너무 자주 또는 너무 빨리 일어나는 경우 부적절한 행동의 비율을 감소시키기 위해, 일정 기간에 일정 횟수 이상의 행동이 나타나지 않을 때에만 강화를 제공하는 것이다.

예) 쥐가 너무 자주 지렛대를 눌러 먹이를 취하는 경우, 어느 정도 시간 간격이 지난 후 지렛대를 눌러야만 먹이가 나오도록 조절할 수 있다.
고율차별강화
(DRH)
* '높은 비율 차별강화(Differential Reinforcement of High Rates)'라고도 부른다.

* 행동이 너무 적게 또는 너무 느리게 일어나는 경우 적절한 행동의 발생비율을 높이기 위해, 일정 기간에 일정 횟수 이상의 행동이 나타나는 때에만 강화를 제공하는 것이다.

예) 쥐가 너무 적게 지렛대를 눌러 낮은 반응 빈도를 보이는 경우, 10초 동안 5번 이상 지렛대를 눌러야만 먹이가 나오도록 할 수 있다.
무반응 차별강화
(DRO)
* '다른 행동 차별강화(Differential Reinforcement of Other Behavior)'라고도 부른다.

* 표적행동이 일정 기간 동안 전혀 발생하지 않는 경우 다른 행동에 대해 강화를 제공하는 것이다.

예) 항상 욕을 섞어가면서 말하는 아이에게 5분 동안 말하는 도중 욕을 하지 않을 경우 그 보상으로 먹을 것을 준다.
상반행동 차별강화
(DRI)
* '양립 불가능한 반응 차별강화(Differential Reinforcement of Incompatible Responding)'라고도 부른다.

* 표적행동과 양립할 수 없는 상반된 행동을 강화하는 것이다.

예) 공공장소에서 뛰어다니는 아이에게 5분 동안 자리에 앉아 있도록 요구한 다음, 정확하게 5분이 지났을 때 그 보상으로 먹을 것(사탕 등)을 준다.
대안행동 차별강화
(DRA)
* '대처행동 차별강화(Differential Reinforcement of Alternative Behavior)'라고도 부른다.

* 표적행동에 대해 대체행동을 강화한다. 다만, 이 경우 상반행동 차별강화와 같이 대체행동이 꼭 표적행동과 양립 불가능한 행동이어야 할 필요는 없다. 

예) 기괴한 말을 하는 정신병 환자에게 그가 의미있는 말을 할 때에는 관심을 기울이고 적절한 대답을 해주는 반면, 기괴한 말을 할 때에는 이를 외면하고 침묵한다. 

* 출처 : [성격심리학], 행동주의적 관점, 핵심이론

 

 

300x250

 

(6) 강화물의 유형 : 

 

① 일차적 강화물(Primary Reinforcer) : 

 

다른 강화물과 연합하지 않은 보상 그 자체로서의 강화물을 말한다. 

 

㉯ 이는 무조건 강화 자극에 해당하는 것으로, 학습에 의지하지 않고도 강화의 효과를 가지는 자극을 의미한다.

 

㉰ 따라서 상대적으로 강력할 수 있으나 그 가짓수가 적으며, 인간의 학습에서는 제한된 역할만을 하는 것으로 알려져 있다. 즉, 물이나 음식, 과자, 장난감, 성행위 등과 같이 일반적으로 귀중한 것으로 간주되는 대상 또는 활동을 예로 들 수 있다. 

 

② 이차적 강화물(Secondary Reinforcer) : 

 

일차적 강화물과의 연합을 통해 그 가치를 지니는 강화물로서, '조건 강화물(Conditioned Reinforcer)'이라고도 한다. 

 

조건 강화 자극에 해당하는 것으로, 본래 중성 자극이었던 것이 강화 능력을 가진 다른 자극과 연결됨으로써 강화의 속성을 가지게 된 자극을 말한다. 

 

㉰ 이차적 강화물의 효과는 궁극적으로 일차적 강화물에 직접적 또는 간접적으로 의존한다. 일테면 돈은 그 자체로는 종이에 불과하지만 신체적 편안함, 음식, 의복 등과 연합되므로 이차적 강화물로 볼 수 있는 것이다. 

 

㉱ 특히 사회적 자극으로서 미소, 칭찬, 토큰, 점수 등은 이차적 강화물에 해당된다. 

 

(7) 프리맥의 원리(Premack's Principle) : 

 

㉮ 데이비드 프리맥(David Premack)에 의해 제시된 이론으로, 그는 모든 반응이 그 자체로 잠재적인 강화인자가 되므로, 어느 한 행동이 다른 행동보다 더 자주 일어날 경우, 이를 덜 자주 일어나는 행위를 강화하기 위한 강화제로 사용할 수 있다고 주장하였다. 

 

㉯ 즉, 높은 빈도의 행동(선호하는 행동)은 낮은 빈도의 행동(덜 선호하는 행동)에 대해 효과적인 강화인자가 될 수 있다고 본 것이다. 

 

㉰ 일테면 아이가 숙제를 하는 것보다 TV를 시청하는 것을 더 좋아하는 경우, 부모는 아이에게 우선 숙제를 마쳐야만 TV를 볼 수 있다고 말함으로써 아이로 하여금 숙제를 하도록 유도할 수 있다. 

 

㉱ 하지만 강화물의 효과성은 사람마다 다를 수 있다. 다시 말해 아이가 TV를 보는 것보다 숙제를 하는 것을 더 좋아한다면, 강화물의 효과성은 역전될 것이다. 즉, 어떠한 자극 또는 사건에 대한 강화의 효과성 여부를 결정하기 위해서는 우선 개인에 따른 행동의 위계를 설정할 필요가 있다. 

 

㉲ 따라서 프리맥의 원리가 효과적이기 위해서는 낮은 빈도의 행동(덜 선호하는 행동)이 먼저 일어나야 한다.

 

 

 

프리맥 원리

심리학 용어로, 높은 확률로 일어나는 행동을 강화물로 사용하여 일어날 확률이 적은 행동을 하도록 촉진하는 기법을 의미한다. 1965년 데이비드 프리맥(David Premack)에 의해 소개된 개념으로, 상

terms.naver.com

 

 

(8) 유관학습과 유관강화 : 

 

① 파블로프는 고전적 조건형성을 통해 조건 자극(CS)과 무조건 자극(UCS)의 시간적 근접성을 조건화의 핵심으로 보았다. 즉, 먹이와 조건화된 종소리 간의 시간적 간격이 짧을수록 조건형성이 잘 이루어지는 반면, 그 간격이 길수록 조건형성이 잘 이루어지지 않는다고 주장한 것이다. 

 

② 그러나 레스콜라(Rescorla)는 파블로프의 이러한 주장을 반박하면서 학습이 단순히 조건 자극과 무조건 자극이 근접했기 때문이 아닌 무조건 자극이 조건 자극에 수반(유관)된 것이기에 학습(조건화)이 이루어진 것이라고 주장하였다. 

 

③ 실제로 개에게 무조건 자극으로서 먹이를 줄 때 종소리 이외에도 다양한 자극들이 결합될 수 있다(일테면 실험자의 발소리, 문 여는 소리 등등). 그럼에도 불구하고 조건형성이 종소리와 먹이 사이에만 이루어진 것은 개가 두 자극 사이에서만 '유관'을 인지한 것이기 때문이다. 

 

 

반응형

 

④ 행동주의 학습에서 '처벌(Punishment)'은 어떤 부적응적인 방식으로 행동하는 경향을 감소시키기 위해 그 행동에 대해 부적 결과를 유관시키는 결과로 볼 수 있다. 즉, 욕설을 하지 않게 하기 위해 욕을 할 때마다 화장실 청소를 시키는 '정적 처벌'의 예에서는, 욕을 하는 행동과 화장실을 청소히는 행동 간의 '유관'이 이루어진 것이다. 

 

⑤ 조작적 조건형성에 있어서도 이와 같은 유관이 필요하다. 즉, 스키너 상자의 쥐가 지렛대를 누르는 반응 뒤에 보상이 주어지는 것을 통해 '강화'가 일어난 것이다. 

 

따라서 유관은 반응과 보상이
연결되어 있는 것을 의미하며,

이는 곧 '유관강화
(Contingent Reinforcement)'
에 해당한다.



■ 다음 시간에 계속, 조작적 조건화 이론에 대해서 알아보도록 하겠다. 

 

* 출처 및 참조 : [성격심리학], 행동주의적 관점, 핵심이론

 

 

 

 

 

728x90
반응형
그리드형

댓글