सक्रिय अनुबन्धन का सिद्धान्त(Theory of Operant Conditioning)
अधिगम के सिद्धान्तों में सक्रिय अनुबन्धन के नाम से जाने वाले सिद्धान्त के प्रतिपादक अमेरिकन मनोवैज्ञानिक बी. एफ. स्किनर हैं।इन्होंने अपने इस सिद्धान्त की रचना के लिए चूहे,कबूतर आदि प्राणियों पर काफ़ी महत्त्वपूर्ण प्रयोग किए।
स्किनर द्वारा किये गये प्रयोग(Experiments done by Skinner)
चूहों पर प्रयोग करने के लिये स्किनर महोदय ने एक विशेष संयन्त्र बनाया।यह संयन्त्र स्किनर बाक्स के नाम से प्रसिद्ध है। थोर्नडाइक ने बिल्लियों के साथ किए जाने वाले प्रयोगों में उलझन पेटी(Puzzle Box)का उपयोग किया था।स्किनर बाक्स को उसी का एक यथानुकूल संशोधित रूप समझा जा सकता है।स्किनर के द्वारा किए गए एक प्रयोग में विशेष रूप से अंधकार युक्त एवं शब्द विहीन इस बाक्स में भूखे चूहे को ग्रिल युक्त संकरे रास्ते से गुज़र कर लक्ष्य तक पहुंचना होता था।प्रयोग प्रारम्भ करने से पूर्व चूहे को निश्चित दिनों तक भूखा रख कर उसे भोजन प्राप्त करने के लिये सक्रिय रहने का प्रबन्ध कर लिया जाता था।व्यवस्था ऐसी की गई थी कि जैसे ही चूहा उपयुक्त मार्ग पर अग्रसर होता,लीवर पर चूहे का पैर पड़ता था,खद् की आवाज होती थी(अथवा प्रकाश युक्त बल्ब जलता था)और उसे प्याले में कुछ खाना प्राप्त हो जाता था।लीवर को दबाने से होने वाली आवाज़ और प्राप्त हुआ भोजन पुनर्बलन (Reinforcement) का कार्य करता था।इस प्रकार चूहे द्वारा लक्ष्य प्राप्ति के लिए किए जाने वाले हर सही व्यवहार अथवा अनुक्रिया का लीवर दबाने से उत्पन्न आवाज़ और प्याले में उपस्थित थोड़े से खाने द्वारा पुनर्बलन होने का प्रयास इस प्रयोग में किया गया।चूहे द्वारा सक्रिय रह कर जैसे-जैसे पुनर्बलन मिलता चला गया,वैसे-वैसे ही सही अनुक्रिया करने और लक्ष्य तक पहुंचने की प्रक्रिया में तीव्रता आती चली गई।कबूतरों पर प्रयोग करने के लिए स्किनर ने एक अन्य विशेष संयन्त्र,जिसे कबूतर पेटिका (Pigeon Box) कहा जाता है,का उपयोग किया। कबूतरों के साथ किये जाने वाले अपने एक प्रयोग में स्किनर ने यह लक्ष्य सामने रखा कि कबूतर दाहिनी ओर एक पूरा चक्कर लगा कर एक सुनिश्चित स्थान पर चोंच मारना सीख जाए।इस प्रयोग में कबूतर पेटिका में बंद भूखा कबूतर ने जैसे ही दाहिनी ओर घूम कर सुनिश्चित स्थान पर चोंच मारी,उसे अनाज का एक दाना प्राप्त हुआ।इस दाने द्वारा कबूतर को अपने सही व्यवहार की पुनरावृत्ति के लिये पुनर्बलन प्राप्त हुआ।और उसने फिर दाहिनी और घूम कर चोंच मारने की अनुक्रिया की।परिणामस्वरूप उसे फिर अनाज का एक दाना प्राप्त हुआ।इस प्रकार धीरे-धीरे कबूतर ने दाहिनी ओर सर घुमा कर चोंच मारने की क्रिया द्वारा पुनर्बलन प्राप्त करने का ढंग सीख लिया।
अपने इसी प्रकार के प्रयोगों द्वारा स्किनर ने अधिगम के क्षेत्र में एक नए सिद्धान्त सक्रिय अनुबन्धन को जन्म दिया। उसने निष्कर्ष निकाला कि हमारे सीखने सम्बन्धी व्यवहार को सक्रिय अनुबन्धन संचालित करता है।हमारा व्यवहार और अनुक्रिया बहुत कुछ सीमा तक सक्रिय व्यवहार का ही रूप होती है।
सक्रिय व्यवहार(Operant Behaviour)
अधिगम के क्षेत्र में स्किनर से पूर्व के मनोवैज्ञानिकों की यह धारणा थी कि अनुक्रिया या व्यवहार के मूल में अवश्य ही कोई न कोई ज्ञात उद्दीपन (Known Stimulus) होता है। स्किनर में अपने प्रयोगों के आधार पर यह सिद्ध किया कि बहुत सी अनुक्रियाएं ऐसी होती हैं जिनको हम ज्ञात उद्दीपन से नहीं जोड़ सकते।इस आधार पर उसने दो प्रकार की अनुक्रियाओं या व्यवहारों की चर्चा की ।ऐसे सभी व्यवहार अथवा अनुक्रियाओं को जो किसी ज्ञात उद्दीपन के कारण होती हैं, उसने अनुक्रिया व्यवहार(Respondent Behaviour) की संज्ञा दी तथा उन व्यवहार अथवा अनुक्रियाओं को जो किसी ज्ञात उद्दीपन के कारण नहीं होती,इन्हें सक्रिय व्यवहार (Operant Behaviour) का नाम दिया।
अनुक्रिया व्यवहार के उदाहरण के रूप में सभी प्रकार के सहज व्यवहार (Reflexive Behaviour) जैसे पिन चुभने पर हाथ का तुरन्त खींचना,खाना दिखाई देने पर लार आना और तीव्र प्रकाश में आंखों की पुतलियों का गिरना आदि का नाम लिया जा सकता है जबकि सक्रिय व्यवहार में बच्चे द्वारा एक खिलौने को छोड़ कर दूसरे को खेलने के लिए लेना, किसी व्यक्ति द्वारा अपने हाथ या पांव को यूं ही इधर-उधर हिलाना,खड़े होकर इधर उधर चहल कदमी करना,कुछ खाना,लिखना पढ़ना आदि,इस प्रकार के व्यवहार शामिल हैं जिनके लिये कोई ज्ञात कारण या उद्दीपन नज़र नहीं आता ।
इस तरह से अनुक्रिया व्यवहार में अनुक्रिया के लिये उत्तरदायी उद्दीपन की महत्त्वपूर्ण भूमिका रहती है जबकि सक्रिय व्यवहार में कोई भी ज्ञात उद्दीपन व्यवहार का कारण नहीं बनता।यहां व्यवहार की कुंजी उद्दीपन के हाथ में न हो कर अनुक्रिया या व्यवहार द्वारा उत्पन्न परिणामों के पास होती है।इस तरह सक्रिय व्यवहार उद्दीपन पर आधारित न हो कर अनुक्रिया अथवा व्यवहार पर निर्भर करता है। यहां व्यक्ति को पहले कुछ न कुछ करना होता है।इसके पश्चात् ही उसे परिणाम के रूप में कुछ न कुछ प्रकार की प्राप्ति होती है और उसके व्यवहार को पुनर्बलन मिलता है ।
सक्रिय अनुबन्धन क्या है ? (Operant Conditioning)
स्किनर के अनुसार सक्रिय अनुबन्धन से अभिप्रायः एक ऐसी अधिगम प्रक्रिया से है जिसके द्वारा सक्रिय व्यवहार की सुनियोजित पुनर्बलन (Planned Reinforcement Schedules) द्वारा पर्याप्त बल मिल जाने के कारण वांछित रूप में जल्दी-जल्दी पुनरावृत्ति होती रहती है और सीखने वाला अंत में जैसा व्यवहार सिखाने वाला चाहता है,वैसा सीखने में समर्थ हो जाता है।
अधिगम की इस प्रक्रिया में सीखने वाले को पहले कोई न कोई क्रिया करनी पड़ती है जैसे चूहे द्वारा लीवर दबाने या कबूतर द्वारा दाहिनी और घूम कर निश्चित स्थान पर चोंच मारने की क्रिया यहीं व्यवहार (Operant behaviour) पुनर्बलन (Reinforcement) उत्पन्न करने में माध्यम (Instrumental) का कार्य करता है।भोजन,पानी आदि के रूप में पुरस्कार की प्राप्ति होने पर सीखने वाला उसी व्यवहार की पुनरावृत्ति करता है जिसके परिणामस्वरूप उसे पुरस्कार अथवा पुनर्बलन प्राप्त हुआ था।व्यवहार की यह पुनरावृत्ति उसे फिर पुरस्कार पुनर्बलन प्राप्त कराती है और फिर वह अधिक गति से अपने व्यवहार की पुनरावृत्ति करता है।इस तरह से अंत में सीखने वाला वांछित व्यवहार सीख लेता है।कई बार यह आवश्यक नहीं होता कि जिस तरह के व्यवहार को हम सिखाना चाहते हैं और उसे पुनर्बलन प्रदान करना चाहते हैं वैसा ही अपेक्षित व्यवहार सीखने वाला शुरू से करना प्रारम्भ कर दे उस दिशा में सक्रिय अनुबंधन की प्रक्रिया के पहले चरण में उचित पुनर्बलन द्वारा सीखने वाले को वांछित व्यवहार करने की दिशा में धीरे-धीरे मोड़ा जाता है।इसे मनोविज्ञान की भाषा में व्यवहार का रूपण (Shaping of Behaviour) कहते हैं। उदाहरण के लिए स्किनर के कबूतर वाले प्रयोग को ही लेते हैं।लक्ष्य है कबूतर को दाहिनी ओर पूरा चक्कर लगाकर सुनिश्चित स्थान पर चोंच मारना सिखाना।इस प्रकार का वांछित व्यवहार कबूतर जब करेगा तभी उसे अनाज के दाने द्वारा पुनर्बलन दिया जायेगा,ऐसा सोचना भूल होगी जैसे ही वह निश्चित स्थान के थोड़ा भी निकट आता दिखाई दे,दाहिनी ओर घूमने का प्रयत्न करे अथवा सही चोंच मारने की क्रिया के निकट हो,उसे अपने इस प्रकार के सभी प्रयत्नों और व्यवहारों के लिए क्रमशः पुनबर्लन प्राप्त होता रहना चाहिए ताकि वह पहली बार वांछित व्यवहार करने में सफल हो सके।चूहे को भी सही रास्ते का चुनाव करने,लीवर दबाने का प्रयास करने आदि सम्बन्धित प्रथम वांछित व्यवहार करने के लिये धीरे-धीरे पुनर्बलन द्वारा सही मोड़ प्रदान किया जा सकता है।
सक्रिय व्यवहार एवं पुनर्बलन(Operant Conditioning and Reinforcement)
पुनर्बलन सक्रिय व्यवहार को बल प्रदान करके वांछित व्यवहार के रूप में सीखने के कार्य में भरपूर सहायता देता है । व्यवहार अथवा अनुक्रिया के घटने के पश्चात् उसे पुनर्बलन प्रदान करने से तात्पर्य कुछ इस प्रकार के आयोजन से है जिसके द्वारा उस प्रकार की अनुक्रिया अथवा व्यवहार के पुनः घटित होने की सम्भावना को बढ़ा दिया जाए। किसी भी प्राणी द्वारा की गई किसी अनुक्रिया अथवा व्यवहार को हम दो प्रकार से पुनर्बलित कर सकते हैं। कुछ देकर जिसे पाना उसे अच्छा लगे अथवा उसके पास से कुछ हट कर जिसका हटना उसे अच्छा लगे। पहले प्रकार के पुनर्बलन को घनात्मक पुनर्बलन (Positive Reinforcer) कहते हैं जैसे भोजन, पानी, लैंगिक सम्पर्क, धन-दौलत, मान सम्मान, प्रशंसा एवं सामाजिक स्वीकृति आदि की प्राप्ति । दूसरे प्रकार का पुनर्बलन ऋणात्मक पुनर्बलन (Negative Reinforcer) कहलाता है। बिजली के आघात, डरावनी आवाज, अपमान एवं डांट फटकार आदि से बचना दूसरे पुनर्बलन के उदाहरण हैं ।
सक्रिय अनुबन्धन द्वारा प्राणी को वांछित व्यवहार सिखाने की दिशा में पुनर्बलन अपनी भूमिका अच्छी तरह तभी निभा सकता है यदि उसे यथोचित रूप में दिया जा सके। उस दिशा में मुख्य रूप से निम्न चार प्रकार का पुनर्बलन आयोजन (Reinforcement Schedule) प्रयोग में लाया जाता है :
1. सतत पुनर्बलन आयोजन (Continuous Reinforcement Schedule)- यह शत प्रतिशत पुनर्बलन आयोजन है जिसमें सीखने वाले की प्रत्येक सही अनुक्रिया या व्यवहार को पुनर्बलित (पुरस्कृत) किया जाता है
2.निश्चित अन्तराल पुनर्बलन आयोजन (Fixed Interval Reinforcement Schedule) इस आयोजन में सीखने वाले को एक निश्चित समय के पश्चात् पुनर्बलन दिया जाता है।जैसे किसी प्रयोग में चूहे को 3 मिनट के बाद भोजन का कुछ अंश प्रदान करना,किसी नौकर को एक सप्ताह के बाद वेतन देना आदि।
3. निश्चित अनुपात पुनर्बलन आयोजन (Fixed Ratio Reinforcement Schedule)-इस आयोजन में यह निश्चित करके पुनर्बलन प्रदान किया जाता है कि कितनी बार सही अनुक्रिया करने पर पुनर्बलन दिया जाए।उदाहरण के लिए कबूतर को 50 बार सही चोंच मारने पर एक दाना देना,पूछे जाने वाले प्रश्नों में प्रत्येक तीन के ठीक उत्तर देने पर पुरस्कार देना आदि ।
4.परिवर्तनशील पुनर्बलन आयोजन (Variable Reinforcement Schedule)-कई बार पुनर्बलन प्रदान करने में निश्चित अन्तराल और अनुक्रियाओं के निश्चित अनुपात को ध्यान में नहीं रखा जाता बल्कि उसे किसी भी समय कितनी भी अनुक्रियाओं के पश्चात् प्रदान कर दिया जाता है।इस प्रकार के पुनर्बलन आयोजन को परिवर्तनशील पुनर्बलन आयोजन का नाम दिया जाता है।
पुनर्बलन आयोजन के उपरोक्त प्रकारों की उपयुक्तता के बारे में अगर सोचा जाए तो सतत या अविछिन्न पुनर्बलन (Continuous Reinforcement) द्वारा जितनी शीघ्रता से व्यवहार को पुनबर्लित किया जाता है,उतनी ही शीघ्रता से पुनर्बलित न करने पर व्यवहार के विलुप्तिकरण (Extinction) की सम्भावना बढ़ जाती है।सीखे हुए वांछित व्यवहार को कम से कम भूलने अथवा उसके विलुप्तिकरण की सम्भावना को कम करने की दिशा में परिवर्तनशील पुनर्बलन (Variable Reinforcement) आयोजन सबसे अधिक उपयुक्त रहता है।इस तरह से पुनर्बलन के आयोजन में शुरुआत शत प्रतिशत पुनर्बलन द्वारा की जानी चाहिए।इसके पश्चात् निश्चित अन्तराल अथवा निश्चित अनुपात पुनर्बलन का प्रयोग किया जाना चाहिए तथा अन्त में सीखे हुए वांछित व्यवहार को स्थायी रूप प्रदान करने की दिशा में परिवर्तनशील पुनर्बलन का प्रयोग किया जाना चाहिए।
सक्रिय अनुबंधन सिद्धान्त की शैक्षणिक उपयोगिता (Educational Implications of Theory of Operant Conditioning)
सक्रिय अनुबंधन सिद्धान्त रचनात्मक उपयोग की दृष्टि से,शैक्षणिक जगत में काफ़ी महत्त्वपूर्ण स्थान रखता है।शैक्षणिक उपयोग के सदंर्भ में मोटे तौर पर कुछ निम्न बातें अच्छी तरह कही जा सकती हैं:
1.सक्रिय अनुबंधन सिद्धान्त अच्छे परिक्रमों की दृष्टि से एक अध्यापक से यह अपेक्षा करता है कि वह सीखने की प्रक्रिया और परिस्थितियों को इस प्रकार नियंत्रित और आयोजित करे कि सीखने वाला उचित पुनर्बलन द्वारा निरन्तर आगे बढ़ने को प्रोत्साहित होता रहे तथा उसे सीखने में कम से कम असफलता और निराशा का सामना करना पड़े ।
2.सक्रिय अनुबंधन सिद्धान्त का उपयोग व्यवहार परिमार्जन (Behaviour Modification) कार्य में बहुत अच्छी तरह से किया जा सकता है।जिस बच्चे के व्यवहार में अपेक्षित परिवर्तन लाना है उसके बारे में पहले तो यह पता लगाया जाना चाहिए कि उसके लिए क्या कुछ एक अच्छे पुनर्बलन का कार्य कर सकता है। जैसे ही अपेक्षित व्यवहार की ओर बच्चे के कदम पड़ें,तुरन्त ही उपयुक्त पुनर्बलन द्वारा इस व्यवहार को प्रोत्साहित किया जाना चाहिए।ऐसा करने से बच्चे द्वारा अपेक्षित व्यवहार की पुनरावृत्ति अवश्य होगी। इसे पुनर्बलन दिया जाएगा।परिणामस्वरूप बच्चा अपेक्षित व्यवहार की ओर तेजी से अग्रसर होगा और पुनर्बलन के संतुलित उपयोग द्वारा अच्छी तरह से अपेक्षित व्यवहार को सीखने में समर्थ हो जायेगा।
3.व्यक्तित्व के समुचित विकास के लिए सक्रिय अनुबन्धन सिद्धान्त का अच्छी तरह उपयोग किया जा सकता है।हेरगनहॉन (Hergenhahn) के अनुसार, "हम अपने आप में वही होते हैं जिसके लिये हमें प्रोत्साहित या पुरस्कृत किया जाता है। जिसे हम व्यक्तित्व कहते हैं वह और कुछ नहीं बल्कि समय-समय पर प्राप्त उन पुनर्बलनों का परिणाम है जिससे हम और हमारा व्यवहार एक निश्चित सांधे में ढल जाता है । उदाहरण के लिये एक अंग्रेज बच्चा छोटी आयु में ही अंग्रेजी अच्छी इसलिए सीख जाता है क्योंकि जब पहली बार उसने अंग्रेजी भाषा जैसी ध्वनियां निकाली होंगी तो उसके प्रयत्नों को पूरा प्रोत्साहन मिला होगा।अगर यही बच्चा किसी जापानी या रूसी परिवार में पैदा होता तो फिर अंग्रेजी का स्थान जापानी या रूसी भाषा ने ले लिया होता क्योंकि इस अवस्था में उसे वैसा प्रयास करने पर अपने परिवेश द्वारा पुनर्बलन या प्रोत्साहन मिलता है।
4.सक्रिय अनुबन्धन सिद्धान्त के अनुसार अनुक्रिया की उपयुक्तता एवं कार्य की सफलता अभिप्रेरणा का सबसे अच्छा स्रोत है।चूहे और कबूतर को भोजन की प्राप्ति एक अच्छा अभिप्रेरक है और विद्यार्थी को अपने सही उत्तर की जानकारी सीखने के कार्य में एक सशक्त पुनर्बलन का कार्य करती है।प्रशंसा के दो शब्द,अध्यापक के प्रोत्साहित करने वाले हाव-भाव, सफलता की अनुभूति, अधिक अंक और पुरस्कार, इच्छित कार्य करने की स्वतन्त्रता आदि सभी ऐसे पुनर्बलन हैं जिनके द्वारा विद्यार्थी पूरी तरह अनुप्रेरित हो कर अधिक उत्साह से सीखने की ओर अग्रसर हो सकता है। इस तरह सक्रिय अनुबन्धन ने अभिप्रेरणा के लिए वांछित अनुक्रिया और उपयुक्त पुनर्बलन को स्थान देकर अभिप्रेरणा के क्षेत्र में आंतरिक अभिप्रेरणा की अपेक्षा बाह्य अभिप्रेरकों को महत्त्वपूर्ण स्थान दिलाने का प्रयत्न किया है।
5.सक्रिय अनुबंधन सिद्धान्त के अनुसार ताड़ना या दंड (Punishment)न तो वांछित व्यवहार को सीखने में मदद कर सकता है और न बुरी आदतों अथवा व्यवहार को त्यागने में।दंड के द्वारा कुछ समय के लिये बच्चा ग़लत व्यवहार करना छोड़ सकता है,परन्तु जैसे ही दंड का भय अथवा उसका प्रभाव समाप्त होता है,बुरे व्यवहार की पुनरावृत्ति होने लगती है।इसलिए सक्रिय अनुबन्धन दंड के स्थान पर वांछित व्यवहार को पुनर्बलन प्रदान कर सुदृढ़ करने और अवांछनीय व्यवहार की उपेक्षा कर उसे विलुप्त (Extinguish) करने का विकल्प प्रस्तुत करता है।
6. सक्रिय अनुबन्धन सिद्धान्त के अनुसार अधिगम में अधिक से अधिक सफलता तभी मिल सकती है जबकि(a) सीखने की सामग्री को इस तरह आयोजित किया जाए कि सीखने वाले को अधिक से अधिक सफलता और कम से कम असफलता का सामना करना पड़े।(b) सही अनुक्रिया अथवा उत्तरों के लिये उसे तेजी से पुनर्बलन प्राप्त होता रहे।(c) सीखने वाले को स्वयं उसकी अपनी गति से सीखने का अवसर मिले ।
उपरोक्त सभी बातों को सक्रिय अनुबन्धन सिद्धान्त ने ही जन्म दिया है और इसके परिणामस्वरूप आज शैक्षणिक जगत में अभिक्रमित अनुदेशन (Programmed Learning), शिक्षण मशीनों (Teaching Machines) और कम्प्यूटर निदेशित शिक्षण (Computer Assisted Instructions) ने अपनी जड़ें गहरी करनी प्रारम्भ कर दी हैं ।