강화 (심리학)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

강화는 행동주의 이론에서 특정 행동의 빈도를 증가시키는 과정으로, 보상이나 혐오 자극의 제거를 통해 이루어진다. 긍정적 강화는 쾌적한 자극을 추가하여 행동을 증가시키고, 부정적 강화는 불쾌한 자극을 제거하거나 회피하게 하여 행동을 증가시킨다. 강화는 B.F. 스키너의 조작적 조건형성을 통해 연구되었으며, 긍정적 강화가 처벌보다 효과적이라는 주장이 제기되었다. 강화는 중독, 동물 훈련, 부모 교육, 경제학, 도박, 칭찬 등 다양한 분야에 응용되며, 긍정적 및 부정적 강화, 일차 및 이차 강화, 자연적 및 인위적 강화 등으로 분류된다. 강화의 정의가 순환적이라는 비판과 함께, 강화제의 신호 효과에 대한 새로운 관점이 제시되고 있으며, 수학적 모델을 통한 연구도 진행되고 있다.

2. 강화의 정의 및 기본 원리

강화는 특정 행동의 빈도를 증가시키는 결과를 초래하는 모든 자극 또는 사건을 의미한다. B.F. 스키너는 행동주의 이론에서 강화를 반응 강도(반응률)의 변화에 따라 정의하여, 강화를 명확히 설명했다. 즉, 즐겁거나 기분 좋은 활동, 음식 등이 반드시 강화적인 것은 아니며(이전에 일어난 반응의 증가를 유발하지 않기 때문에), 잠재적인 강화제 직전에 발생하는 행동이 미래의 유사한 상황에서 증가하는 경우에만 강화제의 정의에 부합한다.

예를 들어, 과자를 달라고 요청했을 때 과자를 받는 아이가 "과자 요청 행동"의 빈도가 증가하면 과자는 "과자 요청 행동"을 강화하는 것으로 볼 수 있다. 그러나 "과자 요청 행동"이 증가하지 않으면 과자는 강화제로 간주될 수 없다.

강화 연구는 재현 가능한 실험 결과를 통해 특수 교육, 응용 행동 분석, 행동의 실험적 분석의 핵심 개념으로 자리 잡았으며, 일부 의학 및 정신약리학 모델, 특히 중독, 의존 및 강박에도 영향을 미치고 있다.

B. F. 스키너는 실험에서 유기체가 환경에 자유롭게 작용할 수 있음을 나타내는 "조작적 조건화"라는 용어를 도입했다. 조작적 조건화에서 실험자는 바람직한 반응을 유발할 수 없고, 반응이 발생하기를 기다린 다음 잠재적 강화물을 제공한다. 반면, 고전적 조건화에서는 실험자가 반사 반응을 유발하는 자극("무조건 자극"(UCS))을 제시하여 바람직한 반응을 유발하며, 이는 중립 자극인 "조건 자극"(CS)과 짝을 이룬다.

"강화"는 조작적 조건화의 기본 용어이며, 행동을 감소시키는 "약화"와 대응된다. 조작적 조건화의 처벌 측면에 대해서는 처벌 (심리학)을 참조한다.

2. 1. 긍정적 강화와 부정적 강화

긍정적 강화와 부정적 강화는 모두 특정 행동의 빈도를 증가시킨다는 공통점을 갖는다.

긍정적 강화(Positive reinforcement): 어떤 행동을 했을 때 보상과 같이 즐거운 자극을 제공함으로써 그 행동을 더 자주 하도록 만드는 것이다.^[7] 예를 들어, 책을 읽는 것이 재미있어서(즐거운 자극) 더 많은 책을 읽게 되는 것(행동 빈도 증가)이 긍정적 강화에 해당한다.
부정적 강화(Negative reinforcement): 어떤 행동을 했을 때 혐오 자극을 제거하거나 피하게 해 줌으로써 그 행동을 더 자주 하도록 만드는 것이다.^[7] 예를 들어, 불행한 감정(혐오 자극)을 없애기 위해 책을 읽는 행동(회피 행동)을 더 자주 하게 되는 것(행동 빈도 증가)이 부정적 강화에 해당한다.

하지만, 행동이 다시 일어나지 않도록 하기 위해 사람들에게 불쾌한 일을 하는 것은 부정 강화가 아니라 ''처벌''이다.^[7] 강화는 항상 행동의 가능성을 증가시키는 반면, 처벌은 그 가능성을 감소시킨다.

강화와 처벌(약화)의 관계는 아래 표와 같이 정리할 수 있다.^[8]

정적 강화와 부적 강화를 구분하는 것은 어려울 수 있으며, 무엇이 제거되거나 추가되는지, 그리고 그것이 행동에 어떤 영향을 미치는지에 집중하는 것이 더 도움이 될 수 있다. 또한, 어떤 사람에게는 처벌로 작용하는 사건이 다른 사람에게는 행동을 강화할 수 있다는 점도 유의해야 한다. 예를 들어, 마약 중독자는 행복감(정적 강화)을 얻기 위해, 그리고 금단 증상(부정적 강화)을 없애기 위해 약물을 복용할 수 있다.

비즈니스 세계에서 강화는 생산성을 높이는 데 중요한 역할을 한다. 직원들은 승진이나 보너스와 같은 긍정적인 자극을 받을 수 있는 능력에 끊임없이 동기 부여를 받는다. 또한, 직원들은 불쾌한 작업을 제거하는 것과 같은 부적 강화에 의해서도 동기 부여를 받을 수 있다. 하지만, 부적 강화에 지나치게 의존하면 장기적으로 근로자의 창의성과 참여를 저해할 수 있다.^[9]

2. 2. 강화와 처벌 (약화)

행동주의 이론에서 강화는 보상을 통해 특정 행동의 형성을 유도하거나 행동수정으로 이어질 수 있으며, 보상시스템과 밀접한 관련이 있다. 강화는 행동을 증가시키는 반면, 처벌(약화)은 행동을 감소시킨다.^[8]

"긍정적" 및 "부정적"이라는 용어는 조작자의 행동에 대한 응답자의 평가가 아닌, 조작자가 수행한 행동의 본질을 의미한다. "긍정적" 행동은 환경에 요소를 추가하는 행동이며, "부정적" 행동은 요소를 제거하거나 보류하는 행동이다. "강화"는 보상 기반 조건화만을 의미하며, 불쾌한 요소의 도입과 쾌적한 요소의 제거는 "처벌"이라고 한다.

따라서 "정적 강화"는 쾌적한 요소의 추가, "정적 처벌"은 불쾌한 요소의 추가, "부정적 강화"는 불쾌한 요소의 제거, "부정적 처벌"은 쾌적한 요소의 제거를 의미한다.

강화와 처벌(약화)에 대한 자극(유쾌하거나 혐오스러운)의 추가 및 제거는 아래 표와 같다.

"강화"는 조작적 조건형성의 기본 용어이며, "약화"는 행동을 감소시키는 역할을 한다. 정적 강화물은 동물이 얻으려고 노력하는 자극이며, 부적 강화물은 동물이 피하거나 끝내려고 노력하는 자극이다.^[57]

3. 강화의 역사

강화에 대한 연구는 에드워드 손다이크의 고양이 퍼즐 상자 실험에서 시작된 것으로 알려져 있다.^[3] B. F. 스키너를 비롯한 많은 사람들이 이 연구를 이어갔으며, 스키너는 1938년 ''유기체의 행동''이라는 중요한 저서를 출판했고, 이후 여러 출판물을 통해 이 연구를 발전시켰다.^[4] 특히 스키너는 긍정적 강화가 행동을 형성하는 데 있어 처벌보다 우월하다고 주장했다.^[5] 그는 긍정적 강화가 지속적인 행동 수정(장기적)을 가져오는 반면, 처벌은 행동을 일시적으로만 변화시키고(단기적) 많은 부작용을 낳는다고 말했다.

이후 많은 연구자들이 강화에 대한 이해를 넓히고 스키너의 일부 결론에 이의를 제기했다. 예를 들어, 아즈린과 홀츠는 처벌을 "그 행동의 미래 확률을 감소시키는 행동의 결과"로 정의했으며,^[6] 일부 연구에서는 긍정적 강화와 처벌이 행동을 수정하는 데 동일하게 효과적임을 보여주었다. 긍정적 강화, 부정적 강화 및 처벌의 효과에 대한 연구는 오늘날에도 계속되고 있으며, 이러한 개념은 학습 이론의 기본이며 그 이론의 많은 실제 적용 분야에 적용된다.

조작적 조건형성(operant conditioning)은 B. F. 스키너가 도입한 경험적 패러다임으로, 이는 동물이 환경에 기반하여 자유롭게 조작할 수 있다는 이론이다.

4. 강화 이론

행동주의 이론에서 강화는 특정 행동과 결과 간의 연관성을 학습하는 과정으로, 보상을 통해 특정 행동을 유도하거나 행동수정으로 이어질 수 있으며 보상시스템(Reward system)과 밀접하게 관련되어 있다.^[3] B.F. 스키너는 반응 강도의 변화에 따라 강화를 정의했으며, 이는 즐거움이나 가치와 같은 주관적인 기준이 아닌 행동의 확률 변화를 기준으로 한다. 예를 들어, 과자를 달라고 요청했을 때 과자를 받는 아이의 "과자 요청 행동" 빈도가 증가하면 과자는 강화제로 간주될 수 있다.

강화 연구는 재현 가능한 실험 결과를 통해 특수 교육, 응용 행동 분석, 행동의 실험적 분석 등 다양한 분야에 적용되고 있다.^[5] 또한, 강화는 중독, 의존 및 강박과 같은 의학 및 정신약리학 모델의 핵심 개념이기도 하다.

"긍정적" 및 "부정적"이라는 용어는 조작자의 행동에 대한 응답자의 평가가 아닌, 조작자가 수행한 행동의 본질을 의미한다. "정적 강화"는 쾌적한 요소의 추가, "부적 강화"는 불쾌한 요소의 제거를 의미한다. 예를 들어, 마틴 셀리그만의 개들이 전기 충격을 피하는 법을 배우는 실험은 부적 강화의 예시이다.^[7]

스키너는 긍정적 강화가 행동 형성에 있어 처벌보다 우월하다고 주장했지만,^[5] 이후 연구들은 긍정적 강화와 처벌이 행동 수정에 동일하게 효과적일 수 있음을 보여주었다.

4. 1. 조작적 조건형성

B.F. 스키너가 도입한 "조작적 조건화"라는 용어는 유기체가 환경에 자유롭게 작용할 수 있음을 나타낸다. 이 실험 패러다임에서 실험자는 바람직한 반응을 유발할 수 없고, 유기체가 반응을 보일 때까지 기다린 후 잠재적 강화물을 제공한다. 이는 실험자가 무조건 자극(UCS)과 조건 자극(CS)을 제시하여 반사 반응을 유발하는 고전적 조건화와는 다르다.^[3]

강화는 조작적 조건형성의 핵심 용어이다.

4. 2. 사회학습이론

인지주의 이론과 행동주의 이론을 결합 및 활용하는 앨버트 밴두라의 사회학습이론은 인간의 행동이 인지 능력과 어떻게 연관되는지를 잘 보여준다.

4. 3. 차등 강화

차등 강화(Differential Reinforcement)는 특정 행동 이외의 모든 행동에 대해 강화를 제공하는 절차이다.

5. 강화 계획

조작적 조건형성에서 강화 계획은 행동과 강화 간의 관계를 조절하는 규칙이다.^[17] 이러한 규칙은 수반성과 행동의 관계가 복잡한 환경이라는 변수로 나타남으로써 도박 행동, 협동 시 꾀병 등 다양한 반응을 이해하는 원리를 제공한다. 강화 계획은 강화의 가변적인 일관성과 예측 가능성에 따라 작동 방식이 달라진다. B.F. 스키너는 비둘기를 사용하여 다양하고 복잡한 강화 계획을 오랫동안 연구했다.

5. 1. 연속 강화와 간헐적 강화

연속 강화는 모든 행동에 대해 강화를 제공하는 것이다. 반면 간헐적 강화는 특정 규칙에 따라 강화를 제공하는 것이다. 간헐적 강화는 불규칙적일수록 소거 저항이 강해진다. (변동 비율 강화)^[17]

간헐적 강화(間歇的強化)는 심리학에서 규칙에 의하여 강화 자극을 제시함으로써 조건 형성의 속도와 후속하는 소멸의 속도를 높이거나 낮추는 실험 절차이다. 강화 자극을 제시하는 규칙은 일정한 수의 반응 발생과 일정한 시간 경과에 따르며, 이러한 규칙을 변동 간격 스케줄(variable- interval schedule)이라고 정의한다. 이에 따라서 조건 형성에 의한 반응의 강도가 특징적인 곡선을 그린다. 그러나 간헐적 강화에서 비규칙성이 강할수록, 예를 들어 비규칙적인 시간 간격, 반응에 대한 보상의 양, 반응 횟수에 대한 보상 비율 등이 불규칙할수록 더욱 강화되고 소거하기 어려워지는 결과를 보인다. 이러한 간헐적 강화를 변동 비율 스케줄(variable-ratio schedule)라고 정의할 수 있다.^[17]

강화 계획의 종류는 다음과 같다.

고정 비율: 강화가 제공된 후 활동이 느려지고, 다음 강화가 제공될 때까지 반응률이 증가한다(강화 후 일시 중지).^[17]
변동 비율: 빠르고 꾸준한 반응률; 소거에 가장 잘 견딘다.^[17]
고정 간격: 간격의 끝으로 갈수록 반응이 증가한다; 소거에 대한 저항이 낮다.^[17]
변동 간격: 꾸준한 활동이 나타나며, 소거에 대한 저항이 좋다.^[17]

강화율이 비슷할 경우, 비율 계획은 간격 계획보다 더 높은 반응률을 생성한다. 변동 계획은 대부분의 고정 계획보다 더 높은 반응률과 더 큰 소거 저항을 생성한다. 이는 부분 강화 소거 효과(PREE)라고도 한다. 변동 비율 계획은 가장 높은 반응률과 소거에 대한 가장 큰 저항력을 모두 생성한다(예: 도박꾼의 슬롯 머신 행동).^[17]

5. 2. 단순 강화 계획

조작적 조건형성에서 단순 강화 계획은 보상이 특정 반응에 대해 언제 제공되는지를 결정하는 규칙이다. 여러 가지 단순 강화 계획이 존재한다.

'''고정 비율 (FR) 계획'''은 정해진 ''n''번째 반응 후에 보상을 제공한다.^[11] 예를 들어, FR 1 계획은 모든 반응을 강화하는 계속 강화(CRF) 계획과 같다.
'''변동 비율 (VR) 계획'''은 평균적으로 매 ''n''번째 반응마다 보상하지만, 항상 ''n''번째 반응마다 보상하는 것은 아니다.^[11]
'''고정 간격 (FI) 계획'''은 ''n''시간이 지난 후에 보상을 제공한다.^[11]
'''변동 간격 (VI) 계획'''은 평균적으로 ''n''시간마다 보상하지만, 항상 정확히 ''n''시간마다 보상하는 것은 아니다.^[11]
'''고정 시간 (FT) 계획'''은 반응 여부와 관계없이, 마지막 보상 이후 고정된 시간에 강화 자극을 제공한다.
'''변동 시간 (VT) 계획'''은 반응 여부와 관계없이, 마지막 보상 이후 평균 변동 시간에 보상을 제공한다.

이러한 단순 계획들은 다양한 행동 패턴을 유도하며, 여러 종에 걸쳐 적용된다.

고정 비율 계획에서는 강화 후 활동이 느려지고, 다음 강화가 제공될 때까지 반응률이 증가한다(강화 후 일시 중지).
변동 비율 계획은 빠르고 꾸준한 반응률을 보이며, 소거에 가장 잘 견딘다.
고정 간격 계획에서는 간격의 끝으로 갈수록 반응이 증가하며, 소거에 대한 저항이 낮다.
변동 간격 계획은 꾸준한 활동을 보이며, 소거에 대한 저항이 좋다.

일반적으로 강화율이 비슷할 때, 비율 계획은 간격 계획보다 더 높은 반응률을 생성한다. 변동 계획은 고정 계획보다 더 높은 반응률과 더 큰 소거 저항을 생성하며, 이를 부분 강화 소거 효과(PREE)라고도 한다. 특히 변동 비율 계획은 가장 높은 반응률과 소거에 대한 가장 큰 저항력을 가진다(예: 도박꾼의 슬롯 머신 행동). 고정 계획은 강화 직후 반응이 잠시 멈추는 "강화 후 일시 중지"(PRP)를 보이며, 고정 간격 계획의 PRP는 종종 "조개 껍질 모양"의 가속 반응률로 이어지는 반면, 고정 비율 계획은 더 "각진" 반응을 생성한다.

강화 계획이 "얇아지면"(더 많은 반응이나 더 긴 대기 시간을 요구) 유기체는 너무 빨리 얇아질 경우 "비율 긴장"을 경험할 수 있는데, 이는 소거 동안 관찰되는 행동과 유사하다. 부분 강화 계획은 지속적인 강화 계획보다 소거에 더 잘 저항하며, 비율 계획은 간격 계획보다, 변동 계획은 고정 계획보다 더 잘 저항한다.

5. 3. 복합 강화 계획

복합 스케줄은 동일한 행동에 대해 동일한 강화제를 사용하여 두 개 이상의 서로 다른 단순 스케줄을 결합하는 방식이다. 여러 가지 복합 스케줄이 존재하며, 주요 유형은 다음과 같다.

대체 스케줄: 두 개 이상의 단순 스케줄이 유효하며, 먼저 완료된 스케줄이 강화를 초래한다.^[19]
결합 스케줄: 두 개 이상의 단순 스케줄이 서로 독립적으로 유효하며, 강화를 위해서는 모든 단순 스케줄의 요구 사항이 충족되어야 한다.
다중 스케줄: 두 개 이상의 스케줄이 시간 경과에 따라 번갈아 나타나며, 어떤 스케줄이 유효한지 나타내는 자극이 있다. 스케줄이 유효한 동안 반응 요구 사항이 충족되면 강화가 제공된다.
혼합 스케줄: 두 개 이상의 스케줄 중 하나가 유효하며, 어떤 스케줄이 유효한지 나타내는 자극이 없다. 스케줄이 유효한 동안 반응 요구 사항이 충족되면 강화가 제공된다.
동시 스케줄: 참가자가 동시에 사용할 수 있는 두 개 이상의 단순 강화 스케줄 중 하나를 선택할 수 있다. 유기체는 언제든지 반응 대안을 자유롭게 전환할 수 있다.
동시 연쇄 강화 스케줄: 참가자가 첫 번째 링크에서 여러 단순 강화 스케줄 중 두 번째 링크에서 유효할 스케줄을 선택할 수 있다. 일단 선택이 이루어지면, 거부된 대안은 다음 시행이 시작될 때까지 사용할 수 없게 된다.
연동 스케줄: 한 구성 요소의 진행이 다른 구성 요소의 진행에 영향을 미치는 두 개의 구성 요소가 있는 단일 스케줄이다.
연쇄 스케줄: 두 개 이상의 연속적인 스케줄이 완료된 후에 강화가 발생하며, 한 스케줄이 완료되고 다음 스케줄이 시작되었음을 나타내는 자극이 있다.
탠덤 스케줄: 두 개 이상의 연속적인 스케줄 요구 사항이 완료되면 강화가 발생하며, 스케줄이 완료되고 다음 스케줄이 시작되었음을 나타내는 자극이 없다.
고차 스케줄: 하나의 스케줄 완료가 두 번째 스케줄에 따라 강화된다.

B.F. 스키너와 그의 동료들은 단순 강화 계획에 대한 초기 연구에서 복합 계획을 발전시켰다.

6. 강화의 종류

강화는 자극의 종류, 제공 방식, 조건 등에 따라 다양하게 분류된다. 강화는 행동을 증가시키는 반면, 처벌은 행동을 감소시킨다. 정적 강화는 대상이 얻으려고 노력하는 자극이며, 부적 강화는 대상이 제거하거나 끝내려고 노력하는 자극이다.^[8]

강화와 처벌에 따른 자극의 추가 및 제거는 아래 표와 같다.

6. 1. 일차 강화물과 이차 강화물

일차 강화물은 '''무조건적 강화물'''이라고도 하며, 다른 자극과의 연합 없이도 강화물로 기능하는 자극이다. 이는 진화와 종의 생존에 중요한 역할을 통해 얻어졌을 가능성이 높다.^[10] 음식, 물, 성행위 등이 일차 강화물의 예시이다.^[10] 특정 약물은 다른 일차 강화물의 효과를 모방하기도 한다. 일차 강화물은 일생 동안, 그리고 개인 간에 비교적 안정적이지만, 유전이나 경험과 같은 요인에 따라 강화 가치가 달라질 수 있다. 예를 들어, 어떤 사람은 특정 음식을 선호하고 다른 사람은 피할 수 있으며, 음식 섭취량도 개인마다 다를 수 있다.

'''이차 강화물'''은 '''조건적 강화물'''이라고도 하며, 강화물로 기능하는 자극과의 연합을 통해 강화 기능을 획득한 자극이나 상황을 의미한다. 이 자극은 일차 강화물이거나 다른 조건적 강화물(예: 돈)일 수 있다.

"동굴인 테스트"를 통해 일차 강화물과 이차 강화물을 구별할 수 있다. 동굴인이 자연스럽게 바람직하다고 생각하는 것(예: 사탕)은 일차 강화물이고, 그렇지 않은 것(예: 1달러 지폐)은 이차 강화물이다. 일차 강화물과 마찬가지로, 유기체는 이차 강화물에 대해서도 만족감과 결핍을 경험할 수 있다.

'''일반화된 강화'''는 여러 강화물과 연결되어 강화 기능을 획득하고 다양한 동기 조작에서 강화물 역할을 하는 조건화된 강화물이다. 돈은 많은 다른 강화물과 연결되어 있기 때문에 일반화된 강화의 예시이다.^[11]

6. 2. 자연적 강화와 인위적 강화

찰스 페르스터는 1967년 논문 "임의적 강화와 자연적 강화"에서 강화 현상을 다음과 같이 분류했다.^[14]

자연적 강화: 행동 자체의 자연스러운 결과로 작동적 행동의 빈도를 증가시키는 사건
인위적 강화: 토큰 경제에서 치료사가 특정 행동에 대해 보상을 주는 것과 같이 인간의 중재가 필요한 사건

1970년, 베어와 울프는 "행동 함정" 개념을 개발했다. 행동 함정은 들어가기 위해 간단한 반응만 필요하지만, 일단 들어가면 일반적인 행동 변화를 저항하기 어렵게 만든다. 이는 행동의 자연적 강화가 발생하도록 유도하여 개인의 행동 목록을 늘리는 방식으로 활용된다. 행동 함정은 다음 네 가지 특징을 갖는다.^[14]

인위적 강화는 일반화 가능한 기술을 구축하거나 개발하는 데 사용될 수 있으며, 궁극적으로 자연 발생적인 강화로 전환하여 행동을 유지하거나 증가시킬 수 있다. 또 다른 예시는 특정 기준을 충족한 후 특정 행동의 결과로 일반적으로 나타나는 사회적 상황이다.

7. 강화의 응용

강화는 행동주의 이론에서 보상을 통해 특정 행동을 유도하거나 행동수정으로 이어질 수 있으며, 보상시스템(Reward system)과 밀접하게 관련되어 있다. 강화와 처벌은 인간의 사회적 상호 작용에서 널리 사용되며, 조작적 조건화 원리를 적용한 많은 사례가 제안되고 실행되어 왔다.

중독 및 약물 의존: 긍정적 강화와 부정적 강화는 중독과 약물 의존의 발달과 유지에 중요한 역할을 한다. 중독성 약물은 1차 긍정 강화 요인으로 작용하며, 약물 관련 자극은 조건화된 긍정 강화 요인이 되어 갈망을 유발한다. 약물 의존은 신체적, 심리적 의존 증상을 완화하기 위해 부정적 강화를 유발한다.^[28]^[29]^[30]
동물 훈련: 조작적 조건화의 원리를 명확하게 보여주는 예시이다. 즉시성, 우발성, 이차적 강화, 조형, 간헐적 강화, 연쇄화 등의 개념이 활용된다.^[31]
부모 관리 훈련: 자녀의 적절한 행동에 대한 긍정적 강화가 핵심이다. 칭찬, 미소, 포옹과 같은 사회적 보상이나 구체적인 보상을 사용하며, 점진적 근사, 진척도 차트 활용 등의 방법이 사용된다.^[32]
경제학: 조작적 조건화는 시장에서 인간의 행동, 특히 상품 가격 변화에 따른 소비자 수요 변화("수요의 가격 탄력성")를 분석하는 데 적용된다.^[34]
도박: 슬롯 머신은 변동 비율 강화 계획의 대표적인 예시로, 도박 중독의 주요 원인 중 하나로 여겨진다.^[35]
칭찬: B.F. 스키너의 조작적 조건 형성 모델에 따르면, 칭찬은 긍정적 강화 수단으로, 특정 행동의 발생 가능성을 높인다.^[36]^[37]^[38]
외상적 유대: 간헐적인 보상과 처벌로 인해 형성되는 강한 정서적 유대감으로, 학대 사이클의 지속으로 이어진다.^[44]^[45]
비디오 게임: 많은 비디오 게임은 변동 비율 강화 계획을 통해 긍정적 강화를 제공하여 플레이어가 계속 게임을 하도록 유도하며, 이는 비디오 게임 중독으로 이어질 수 있다. 전리품 상자와 같은 일부 수익 창출 방식은 도박과 유사하다는 비판을 받는다.^[47]

7. 1. 중독 및 의존

긍정적 강화와 부정적 강화는 중독과 약물 의존의 발달과 유지에 핵심적인 역할을 한다. 중독성 약물은 보상 시스템에 의해 본질적으로 보상을 받는다. 즉, 약물 사용에 대한 1차 긍정 강화 요인으로 작용한다. 뇌의 보상 시스템은 약물에 인센티브 현저성(예: "원하는" 또는 "갈망하는")을 부여한다.^[28]^[29]^[30] 따라서 중독이 진행됨에 따라 약물을 박탈하면 갈망이 생긴다. 또한, 주사기, 사용 장소 등 약물 사용과 관련된 자극은 약물에 의해 유도되는 강렬한 강화와 연관된다.^[28]^[29]^[30] 이러한 이전에 중립적이었던 자극은 몇 가지 특성을 얻는다. 즉, 그 모습은 갈망을 유발할 수 있으며, 지속적인 사용에 대한 조건화된 긍정 강화 요인이 될 수 있다.^[28]^[29]^[30] 따라서 중독된 개인이 이러한 약물 신호 중 하나에 직면하면 관련된 약물에 대한 갈망이 다시 나타날 수 있다. 예를 들어, 이전에는 반(反) 약물 기관에서 약물 관련 도구의 이미지를 사용하여 약물 사용의 위험성을 보여주려 했다. 그러나 이러한 포스터는 더 이상 사용되지 않는데, 이는 포스터에 묘사된 자극을 보면 재발을 유발하는 인센티브 현저성의 영향 때문이다.

약물 의존 개인의 경우, 약물이 자가 투여되어 신체적 의존의 증상(예: 진전 및 발한) 및/또는 약물 금단 상태에서 발생하는 쾌락 상실증, 불안감, 과민성 및 불안과 같은 심리적 의존의 증상을 완화하거나 "탈출"하기 위해 부정적 강화가 발생한다.^[28]

7. 2. 동물 훈련

동물 훈련사와 애완동물 주인들은 조작적 조건화의 원리와 실천을 오래전부터 적용해 왔다. 동물 훈련은 조작적 통제의 가장 명확하고 설득력 있는 예시를 제공한다.^[31]

동물 훈련에서 활용되는 주요 개념과 절차는 다음과 같다:

즉시성: 즉각적인 강화가 효과적이다 (예: 항상 준비된 강아지 간식 가방).^[31]
우발성: 강화가 원하는 행동 다음에 오도록 하고, 다른 행동에는 따르지 않도록 하는 것이 중요하다.^[31]
이차적 강화: 원하는 반응 직후에 클리커를 울리는 것과 같이 이차적 강화를 사용한다.^[31]
조형: 원하는 행동에 점진적으로 근접하도록 강화한다 (예: 점진적으로 개가 더 높이 점프하도록 하는 것).^[31]
간헐적 강화: 포만감 없이 지속적인 행동을 유도하기 위해 간식 빈도를 줄인다.^[31]
연쇄화: 복잡한 행동을 점차적으로 조합한다.^[31]

7. 3. 부모 관리 훈련

부모 관리 훈련에서 핵심은 적절한 아동 행동에 대한 긍정적 강화이다. 부모는 보통 칭찬, 미소, 포옹과 같은 사회적 보상이나, 스티커 또는 아이와 함께 만든 인센티브 시스템의 일부로 더 큰 보상을 위한 포인트와 같은 구체적인 보상을 통해 적절한 행동에 보상하는 법을 배운다.^[32] 또한, 부모는 초기 목표로 간단한 행동을 선택하고 아이가 더 큰 목표를 달성하기 위해 각 단계를 달성할 때마다 보상하는 법을 배운다. 이 개념을 "점진적 근사"라고 한다.^[32]^[33] 부모는 진척도 차트를 통해 간접적인 보상을 활용할 수도 있다. 교실에서 긍정적인 강화를 제공하면 학생의 성공에 도움이 될 수 있다. 학생에게 긍정적 강화를 적용할 때는 학생의 필요에 맞게 개별화하는 것이 중요하다. 이렇게 하면 학생은 칭찬받는 이유를 이해하고 받아들이며, 결국 긍정적 강화로 얻은 행동을 계속하도록 배울 수 있다. 예를 들어, 보상이나 추가 휴식 시간은 일부 학생에게 더 효과적일 수 있지만, 다른 학생은 칭찬을 나타내는 스티커나 체크 표시를 받음으로써 강화를 받아들일 수 있다.

7. 4. 경제학

심리학자와 경제학자 모두 시장에서 인간의 행동에 조작적 개념과 연구 결과를 적용하는 데 관심을 갖게 되었다. 한 가지 예는 구매하는 상품의 양으로 표시되는 소비자 수요 분석이다. 경제학에서 가격이 소비에 미치는 정도를 "수요의 가격 탄력성"이라고 한다. 특정 상품은 다른 상품보다 더 탄력적이다. 예를 들어, 특정 식품의 가격 변화는 구매량에 큰 영향을 미칠 수 있지만, 휘발유 및 기타 필수품은 가격 변화의 영향을 덜 받을 수 있다. 조작적 분석 측면에서, 이러한 효과는 소비자의 동기 부여와 상품의 상대적 가치를 강화 인자로서 해석할 수 있다.^[34]

7. 5. 도박

조작적 조건형성에서 변동 비율 강화 계획은 예측할 수 없는 횟수의 반응 후에 강화가 주어지는 방식이다. 이러한 방식은 빠르고 꾸준한 반응을 유도한다. 슬롯 머신은 변동 비율 강화 계획의 대표적인 예시이며, 도박꾼들이 계속해서 레버를 당기게 만든다.^[35] 그러나 슬롯 머신은 투입된 돈보다 적은 돈을 지급하도록 설계되어 있어, 장기적으로는 사용자가 손해를 보게 된다.^[35] 이러한 이유로 슬롯 머신과 변동 비율 강화는 도박 중독의 주요 원인으로 여겨진다.^[35]

7. 6. 칭찬

B.F. 스키너의 조작적 조건 형성 모델은 칭찬 개념의 뿌리가 된다. 이러한 관점에서 칭찬은 긍정적 강화의 한 수단으로, 관찰된 행동에 대해 칭찬을 함으로써 해당 행동이 일어날 가능성을 높이는 것이다.^[36] 칭찬이 긍정적인 행동을 촉진하는 데 효과적임은 수백 건의 연구를 통해 입증되었으며, 특히 교사와 부모가 자녀의 행동 개선 및 학업 성취도를 높이기 위해 칭찬을 사용하는 연구^[37]^[43]와 작업 성과 연구에서 두드러지게 나타났다.^[38] 또한 칭찬은 간접 강화(예: 칭찬을 받는 사람의 급우)를 통해 칭찬을 받지 않은 주변 개인의 긍정적인 행동을 강화하는 것으로 나타났다.^[39] 칭찬은 형태, 내용 및 전달 방식에 따라 행동 변화에 더 효과적이거나 덜 효과적일 수 있다. 칭찬이 긍정적인 행동 변화를 일으키려면 긍정적인 행동에 따라야 하고(즉, 목표 행동이 실행된 후에만 제공), 강화하려는 행동의 세부 사항을 구체적으로 명시해야 하며, 진솔하고 믿을 수 있게 전달해야 한다.^[40]

칭찬은 긍정적 강화 전략으로서 효과가 인정되어, 수많은 행동 및 인지 행동 중재에 칭찬 사용이 포함되었다.^[41]^[42] 칭찬의 전략적 사용은 교실 관리^[41] 및 양육 훈련 중재에서 증거 기반 실천으로 인정받고 있지만, 칭찬은 종종 전략적 주의 기울이기 및 행동 보상과 같은 전략을 포함하는 보다 광범위한 긍정적 강화 범주로 중재 연구에 흡수된다.

7. 7. 외상적 유대

외상적 유대는 보상과 처벌이 간헐적으로 반복되면서 형성되는 강한 정서적 유대감을 말하며, 이는 학대 사이클의 지속적인 반복으로 인해 변화에 대한 저항성을 띄게 된다.^[44]^[45]

외상적 유대가 발생하기 위해서는 한 사람이 다른 사람을 지배하고, 학대의 정도가 심해졌다가 잦아드는 상황이 반복되어야 한다.^[46] 이러한 관계는 지배하는 사람이 허용적이거나, 자비롭거나, 심지어 애정 어린 행동을 보이는 기간과 격렬한 학대가 간헐적으로 발생하는 에피소드로 특징지어진다. 가해자는 우위를 유지하기 위해 피해자의 행동을 조작하고 선택을 제한하여 권력 불균형을 영속화한다. 지배와 복종의 균형에 위협이 가해지면 격렬한 협박에서부터 폭력적인 발작에 이르기까지 처벌의 강도가 점차 높아지는 사이클이 발생할 수 있다. 또한, 가해자는 피해자를 다른 지원으로부터 격리시켜 개입 가능성을 줄이고, 피해자가 객관적인 피드백을 받기 어렵게 만들며, 일방적인 의존감을 강화한다. 이러한 학대적인 관계는 피해자의 자기 평가 능력을 손상시키고, 개인적인 부적절감과 지배적인 사람에 대한 종속적인 의존감을 야기하는 외상적 영향을 미칠 수 있다. 피해자는 공격적인 행위를 한 사람과 정서적, 행동적으로 제휴하게 되어, 심지어 자신이 공격받은 경우에도 다양한 사회적, 법적 불이익을 겪을 수 있다.^[46]

7. 8. 비디오 게임

대부분의 비디오 게임은 일종의 강박 루프를 중심으로 설계되어 있으며, 변동 비율 계획을 통해 일종의 긍정적 강화를 추가하여 플레이어가 게임을 계속하도록 한다. 그러나 이는 비디오 게임 중독으로 이어질 수도 있다.^[47]

2010년대 비디오 게임 수익 창출의 경향 중 하나로, 일부 게임은 희귀도에 따라 무작위로 게임 내 아이템을 제공하는 "전리품 상자"를 보상으로 제공하거나 실제 현금으로 구매할 수 있도록 했다. 이 관행은 슬롯 머신 및 기타 도박 기기가 보상을 제공하는 것과 동일한 방법과 관련이 있으며, 변동 비율 계획을 따른다. 전리품 상자가 도박의 한 형태라는 일반적인 인식과 달리, 이 관행은 일부 국가에서만 도박으로 분류되며, 그 외에는 합법이다. 그러나 해당 아이템을 온라인 도박이나 실제 현금 거래를 위한 가상 화폐로 사용하는 방법은 법적 평가를 받고 있는 스킨 도박 시장을 창출했다.^[48]

8. 강화에 대한 비판

행동 강화에 대한 표준 정의는 순환적이라는 비판을 받아왔다. 이는 강화에 의해 반응 강도가 증가한다고 주장하는 것처럼 보이며, 강화를 반응 강도를 증가시키는 것으로 정의하기 때문이다(즉, 반응 강도는 반응 강도를 증가시키는 것에 의해 증가한다). 그러나 강화의 올바른 사용법^[49]은 어떤 것이 행동에 미치는 영향 ''때문에'' 강화제인 것이지, 그 반대가 아니다. 특정 자극이 행동을 강화하는 이유는 그것이 강화제이기 때문이라고 말하면서, 자극이 왜 행동에 그러한 영향을 미치는지 설명하지 않는다면 순환적이 된다. F.D. 셰필드의 "반응에 따른 소비 행동"과 같은 다른 정의들이 제안되었지만, 이것들은 심리학에서 널리 사용되지 않는다.^[50]

점점 더 강화제가 수행하는 역할에 대한 이해는 "강화" 효과에서 "신호" 효과로 이동하고 있다.^[51] 즉, 강화제가 강화로 이어질 가능성이 있는 행동을 신호하기 때문에 반응을 증가시킨다는 관점이다. 대부분의 실질적인 적용에서 주어진 강화제의 효과는 강화제가 신호를 보내든 강화를 하든 동일하겠지만, 이러한 접근 방식은 간헐적 강화 계획(고정 간격 조개 모양) 및 차별적 결과 효과에 대한 반응 패턴을 포함한 여러 행동 현상을 설명하는 데 도움이 된다.^[52]

9. 강화의 수학적 모델

강화에 대한 수학적 모델을 구축하려는 연구가 진행되어 왔다. 이 모델은 MPR(Reinforcement의 수학적 원리, 수학적 강화 원리)로 알려져 있다. 피터 킬린(Peter Killeen)은 비둘기에 대한 연구를 통해 이 분야에서 중요한 발견을 했다.^[27]

참조

_[1] 웹사이트 Definition of reinforcement from the American Psychological Association https://dictionary.a[...] 2024-01-30
_[2] 논문 Neuronal Reward and Decision Signals: From Theories to Data 2015-07
_[3] 논문 Some Experiments on Animal Intelligence https://zenodo.org/r[...] 1898-06
_[4] 서적 The Behavior of Organisms: An Experimental Analysis https://books.google[...] Appleton-Century-Crofts 1938
_[5] 서적 Walden Two https://archive.org/[...] The Macmillan Company
_[6] 서적 Operant Behavior: Areas of Research and Application http://psycnet.apa.o[...] Meredith Publishing Company
_[7] 서적 The Power of Reinforcement State University of New York Press
_[8] 서적 Learning Processes: Instrumental Conditioning The Macmillan Company
_[9] 서적 Well-Being in the Workplace and its Relationship to Business Outcomes: A Review of the Gallup Studies http://media.gallup.[...] American Psychological Association
_[10] 서적 About Behaviorism 1974
_[11] 서적 Behavioral Modification: Principles and Procedures Thomson/Wadsworth 2008
_[12] 논문 Use of noncontingent reinforcement in the treatment of challenging behavior. A review and clinical guide 1998-10
_[13] 서적 The Use of Resealed Erythrocytes as Carriers and Bioreactors
_[14] 서적 Control of human behavior Scott Foresman
_[15] 논문 Toward a technology of generalization: The identification of natural contingencies of reinforcement
_[16] 논문 Differential reinforcement as treatment for behavior disorders: procedural and functional variations 1992
_[17] 논문 Within Session FR Pausing. 2007
_[18] 논문 Dynamic changes in reinforcer value: Some misconceptions and why you should care. 2001
_[19] 서적 Experimental Analysis of Behavior https://books.google[...] Elsevier 1991
_[20] 논문 On Choice, Preference, and Preference For Choice.
_[21] 서적 Psychology Worth Publishers
_[22] 논문 Shaping complex functional communication responses http://dx.doi.org/10[...] 2018-05-14
_[23] 서적 Treating Feeding Challenges in Autism Academic Press
_[24] 논문 Response Shaping to Improve Food Acceptance for Children with Autism: Effects of Small and Large Food Sets 2020
_[25] 논문 CORRIGENDUM to "Further Evaluations of Functional Communication Training and Chained Schedules of Reinforcement to Treat Multiple Functions of Challenging Behavior" 2020-07-24
_[26] 논문 Functional Communication Training and Chained Schedules of Reinforcement to Treat Challenging Behavior Maintained by Terminations of Activity Interruptions http://dx.doi.org/10[...] 2012-02-09
_[27] 논문 Mathematical principles of reinforcement http://cogprints.org[...] 2010-02-04
_[28] 서적 Neuroscience for Addiction Medicine: From Prevention to Rehabilitation - Constructs and Drugs
_[29] 논문 From prediction error to incentive salience: mesolimbic computation of reward motivation 2012-04
_[30] 논문 Pleasure systems in the brain 2015-05
_[31] 서적 Carrots and sticks: principles of animal training Cambridge University Press 2007
_[32] 서적 Problem-solving skills training and parent management training for oppositional defiant disorder and conduct disorder. https://books.google[...] Guilford Press 2010
_[33] 서적 Parent management training — Oregon model: An intervention for antisocial behavior in children and adolescents. https://books.google[...] Guilford Press 2010
_[34] 서적 The Principles of Learning and Behavior Wadsworth Publishing Company 2009
_[35] 논문 Impulsivity, intelligence, and discriminating reinforcement contingencies in a fixed-ratio 3 schedule 2012-11
_[36] 서적 History of behavior modification: Experimental foundations of contemporary research https://archive.org/[...] University Park Press 1978
_[37] 논문 Superior vena cava syndrome: etiology, diagnosis, and treatment
_[38] 논문 Task clarification, performance feedback, and social praise: Procedures for improving the customer service of bank tellers 1988
_[39] 논문 Adenoid cystic carcinoma of the external auditory canal
_[40] 논문 On praising effectively 1981
_[41] 논문 Evidence-based Practices in Classroom Management: Considerations for Research to Practice 2008
_[42] 서적 Evidence-based psychotherapies for children and adolescents https://books.google[...] Guilford Press 2010
_[43] 논문 Identifying common elements of evidence-based psychosocial treatments for children's disruptive behavior problems 2008-05
_[44] 논문 Traumatic Bonding: The development of emotional attachments in battered women and other relationships of intermittent abuse 1981
_[45] 서적 Counselling Survivors of Domestic Abuse https://books.google[...] Jessica Kingsley Publishers 2008-06-15
_[46] 웹사이트 Traumatic Bonding {{!}} Encyclopedia.com http://www.encyclope[...]
_[47] 웹사이트 Behavioral Game Design http://www.gamasutra[...] 2001-04-27
_[48] 웹사이트 Are loot boxes gambling? http://www.eurogamer[...] 2017-10-12
_[49] 서적 Skinner for the classroom : selected papers https://archive.org/[...] Research Press 1982
_[50] 서적 Contemporary learning theories Lawrence Erlbaum Associates 1989
_[51] 논문 Reinforcement: food signals the time and location of future food 2011-07
_[52] 논문 The differential outcomes effect in children with autism 2017-06
_[53] 논문 Developing and Implementing a Positive Behavioral Reinforcement Intervention in Prison-Based Drug Treatment: Project BRITE 2011-09-07
_[54] 서적 The Power of Reinforcement State University of New York Press
_[55] 문서 Behavioral and Neural Plasticity
_[56] 문서 Behavioral and Neural Plasticity
_[57] 서적 Learning Processes: Instrumental Conditioning The Macmillan Company
_[58] 저널 Cellular basis of memory for addiction 2013-12
_[59] 서적 Molecular Neuropharmacology: A Foundation for Clinical Neuroscience McGraw-Hill Medical
_[60] 서적 Molecular Neuropharmacology: A Foundation for Clinical Neuroscience McGraw-Hill Medical
_[61] 저널 Cellular basis of memory for addiction 2013-12
_[62] 웹인용 Glossary of Terms http://neuroscience.[...] Department of Neuroscience 2015-02-09
_[63] 저널 Neurobiologic Advances from the Brain Disease Model of Addiction 2016-01

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

	보상 (유쾌한) 자극	혐오 (불쾌한) 자극
추가/제공	정적 강화 (예: 재미있고 흥미롭기 때문에 책을 읽는 것)	정적 처벌 (예: 체벌, 아이를 엉덩이 때리기)
제거/없앰	부적 처벌 (예: 규칙을 어길 경우 특권 상실, 스크린 타임 또는 원하는 행사에 참석할 수 있는 허가)	부적 강화 (예: 지루함이나 불행감을 벗어날 수 있기 때문에 책을 읽는 것)

	보상 (유쾌한) 자극	혐오 (불쾌한) 자극
추가/제공	정적 강화 (예: 재미있고 흥미롭기 때문에 책을 읽는 것)	정적 처벌 (예: 체벌, 아이를 엉덩이 때리기)
제거/없앰	부적 처벌 (예: 규칙을 어길 경우 특권 상실 - 스크린 타임 또는 원하는 행사에 참석할 수 있는 허가)	부적 강화 (예: 지루함이나 불행감을 벗어날 수 있기 때문에 책을 읽는 것)

	보상 (유쾌한) 자극	혐오 (불쾌한) 자극
추가/제공	정적 강화 예: 재미있고 흥미롭기 때문에 책을 읽는 것	정적 처벌 예: 체벌, 예를 들어 아이를 엉덩이 때리기
제거/없앰	부적 처벌 예: 규칙을 어길 경우 특권 상실 (예: 스크린 타임 또는 원하는 행사에 참석할 수 있는 허가)	부적 강화 예: 지루함이나 불행감을 벗어날 수 있기 때문에 책을 읽는 것

특징	설명
미끼	학생을 함정으로 "유인"하는 바람직한 강화제
낮은 노력	함정에 들어가기 위해 이미 레퍼토리에 있는 낮은 노력의 반응만 필요
상호 관련된 강화	함정 내 상호 관련된 강화의 우발성은 개인이 목표 기술을 습득, 확장, 유지하도록 동기를 부여한다.^[15]
지속성	개인이 포만 효과를 거의 또는 전혀 보이지 않아 오랫동안 효과 유지

구분	내용
조작적 조건형성	B. F. 스키너가 제시한 개념으로, 유기체가 환경에 작용하여 스스로 행동을 조작하고 그 결과에 따라 행동이 변화하는 과정이다.
고전적 조건형성	실험자가 무조건 자극(UCS)과 조건 자극(CS)을 제시하여 반사 반응을 유발한다.