January 22, 2025

source: http://goo.gl/uMmQyP

আমাদের নির্বাচন ব্যবস্থা কতটা নির্ভরযোগ্য?-ঢাকা সিটি নির্বাচনের উপাত্তের একটি প্রামান্য বিশ্লেষণ। 1

সফল গনতন্ত্রের জন্য নির্ভরযোগ্য নির্বাচনি ব্যবস্থা চাই। তাই সব সময়েই নিরপেক্ষ নির্বাচন নাগরিকের জন্য একটু গুরুত্বপুর্ণ চাওয়া হিসাবে বিবেচিত হয়েছে। সম্প্রতি সমাপ্ত ঢাকা উত্তর সিটি কর্পোরেশন,ঢাকা দক্ষিণ সিটি কর্পোরেশন এবং চট্রগ্রাম সিটি কর্পোরেশানের নির্বাচনে কারচুপির অভিযোগ করেছেন অনেকে। নির্বাচনে কারচুপি হলে বা কারচুপি হয়েছে বলে জনমনে আশংকা জন্মালে রাজনৈতিক অনাস্থার জন্ম দেয়। নাগরিকের মতামতের প্রতিফলন না ঘটলে জনপ্রতিনিধি গুণগতভাবে জনপ্রতিনিধি থাকেন না। যারা কারচুপিতে সহায়তা করে তাদের ক্ষমতায় বসান তাদের প্রতি তিনি দায়বদ্ধ থাকেন। এছাড়া, রাষ্ট্র নাগরিককে ভোটের অধিকার দেবে বলে অঙ্গিকারবদ্ধ। ফলে কারচুপি হলে চুক্তি ভঙ্গজনিত হতাশার সৃষ্টি হয়। তবে কারচুপি না হলেও যদি কারচুপি হয়েছে বলে ধারনা জনমনে তৈরি হয় সেটাও আস্থার সংকট তৈরি করতে পারে। তাই সত্যাসত্য বোঝার উদ্দেশ্যে এই লেখাতে নির্বাচনের তথ্য উপাত্তের উপর কিছু গনণাভিত্তিক নিরীক্ষা করা হয়েছে।

কারচুপি কীভাবে বোঝা যাবে?
সাধারণত কারচুপি হলে ভোটের উপাত্তে কিছু নিদর্শন থেকে যায়। একজন দক্ষ পরিসংখ্যানবিদ যথেষ্ট সময় ও সুযোগ পেলে এরকম অনেক প্রমান উপাত্ত ঘেটে বের করে আনতে পারেন। হয়ত কতটা কারচুপি হয়েছে সে সম্পর্কেও একটা ধারনা দিতে পারেন। তবে এখানে যেই বিশ্লেষণটি দেখানো হবে তাতে কিছু সাধারণ পদ্ধতি প্রয়োগ করে কারচুপি হয়েছে কিনা তা বোঝার চেষ্টা করে হবে। কারচুপি হলে এই ভোটের উপাত্তে প্রধানত দুইটি বিষয় পরীক্ষনীয়। প্রথমত, নির্বাচন নিরপেক্ষ হলে ভোটার উপস্থিতি যেসব কেন্দ্রে বেশি সেখানে প্রার্থী অনুযায়ি ভোটের যেই অনুপাত সেটা কম ভোটার উপস্থিতির কেন্দ্র থেকে আলাদা হবার কথা নয়। কিন্তু যেই প্রার্থী জিতবেন তাকে জেতানোর জন্য যদি বেশী ভোট বাক্সে ভরা হয় তাহলে দেখা যাবে সেসব কেন্দ্রে ক্ষমতাসীন দলের প্রার্থীর (অথবা যার হয়ে কারচুপি করা হবে) তার ভোটের আনুপাতিক হার বেশী হবে। আর জাল বা কারচুপি হলে বাতিল ভোটের হারও কমে আসে। কেননা একই দক্ষতায় সিল মারতে থাকলে গড়ে বাতিল ভোটের যে সংখ্যা তা অনেক কমে যাবার কথা।
এই বিষয়টিকে নিচের তিনটি ভিন্ন উপায়ে ব্যাখ্যা করা হল। প্রথমে দুইটি যৌগিক চলক ব্যবহার করে কারচুপির অস্তিত্ব সম্পর্কে একটি সাধারণ নিরীক্ষা দেখানো হয়েছে। পরের অংশে কিছু কিছু রেখাচিত্রের মাধ্যমে ভোটের উপাত্তের কিছু ভেতরগত কাঠামোকে চলমান গড় (moving average/mean) এর মাধ্যমে রেখাচিত্রে উপস্থাপন করা হয়েছে। তৃতীয় ভাবে একটি সহগমন নিরীক্ষা সম্পাদন করা হয়েছে। বলে রাখা ভাল এই উপাত্ত নিয়ে যত ধরনের বিশ্লেষণ করা সম্ভব এখানে তার কিছু প্রাথমিক বিশ্লেষন মাত্র করা হয়েছে।
প্রাথমিক নিরীক্ষা
চলকের বিবরণ:
প্রথম দুইটি চলক ব্যবহার করা হয়েছে

চলক ১: ভোটার উপস্থিতির হার (turnout rate) দেবার হার, c = (কেন্দ্রে সর্বমোট যতগুলো বৈধ ভোট পড়েছে)/ (কেন্দ্রে মোট ভোটারের সংখ্যা)

চলক ২: নির্বাচিত ও দ্বিতীয় সর্বোচ্চ ভোট পাওয়া মেয়রের ভোটের অনুপাত, p = (নির্বাচিত প্রার্থীর প্রাপ্ত ভোট)/(দ্বিতীয় সর্বাধিক ভোট পাওয়া প্রার্থীর প্রাপ্ত ভোট)

পদ্ধতিগুলোর বিশদ বিবরণ ঢাকা উত্তরের নির্বাচনি উপাত্ত ব্যবহার করা দেয়া হল। ঢাকা উত্তরে সব মিলিয়ে ১০৯৩ টি ভোট কেন্দ্রের উপাত্ত এই নিরীক্ষায় ব্যবহার করা হয়েছে। তবে অনির্ণেয় উপাত্ত (শুন্য দিয়ে ভাগ) এবং অস্বাভাবিক মানজনিত (outlier) সমস্যার সমাধানে কিছু বিশ্লেষনে দুইটি কেন্দ্রের উপাত্ত বাদ দিয়ে বিশ্লেষনটি সম্পাদন করা হয়েছে।

গুচ্ছকৃত উপাত্ত (grouped/aggregated)বিশ্লেষণ
কোন কেন্দ্রে মোট ভোটারের কতভাগ ভোট পড়েছে সেটার হার পর্যবেক্ষণ করলে দেখব সবচাইতে বেশি ভোট পড়েছে একটি কেন্দ্রে যাতে বৈধ ভোট মোট ভোটারের সংখ্যার ৯৬%। আর সর্বনিন্ম যেই কেন্দ্রে ভোট পড়েছে তাতে ভোট পড়েছে মোট ভোটারের ৪%। আমরা দেখতে চাই যেসব কেন্দ্রে বেশি ভোট পড়েছে সেখানে আনিসুল হক ও তাবিথ আউয়াল এবং ভোটের অনুপাত সবচাইতে কম কি না, আর যেখানে ভোট পড়ার হার কম সেখানে এই অনুপাত ভিন্ন ধরনের কি না (অর্থাৎ কম কি না)। কাজেই আমরা প্রথমে আমাদের উপাত্তকে ভোটের শতকরা হারের ক্রমানুসারে সাজিয়ে নিয়েছি। এর পর এই কেন্দ্রেওগুলোকে এই ক্রমের মধ্যে নতুন ভাবে ক্রমিক নম্বর দিয়েছি। ফলে ক্রম বাড়ার সাথে সাথে ভোট পড়ার হার কমতে থাকে। এভাবে ১ম কেন্দ্রে ৯৬% এবং ১০৯২তম কেন্দ্রে ৪% ভোট পড়েছে। এরপর এই উপাত্তকে প্রতি ৫০ টি কেন্দ্রকে একটি করে গ্রুপ হিসাবে নিয়েছি। এতে ১০৯২ টি কেন্দ্রকে ২২ টি গ্রুপে ভাগ করা হল। একসাথে ৫০টি কেন্দ্র বিবেচনা করায় মোটামুটি স্থুল একটা চিত্র এখান থেকে আমরা পাই। এরপর এই প্রতিটি গ্রুপের জন্য দুই প্রার্থীর প্রাপ্ত ভোটের অনুপাতের গড়ও নেয়া হল এবং এগুলোকে পাশাপাশি নিচের রেখাচিত্রে দেখান হল।

রেখাচিত্র ১: কেন্দ্রে ভোট জমা পড়ার হার এবং দুই অগ্রগামী প্রার্থীর ভোটের অনুপাত
রেখাচিত্র ১: কেন্দ্রে ভোট জমা পড়ার হার এবং দুই অগ্রগামী প্রার্থীর ভোটের অনুপাত

যেহেতু কারচুপি না হলে ভোটার ঊপস্থিতির হার (Turnout) এবং দুই প্রার্থীর অনুপাতের ভেতরে সহগমনের প্রবনতা থাকার কথা নয়, গড় হিসাবে নেয়া এই রেখাচিত্রে বারগুলোর উচ্চতায় খুব বেশী তারতম্য চোখে পড়ার কথা ছিল না। কিন্তু সর্বডানের ৩টি গ্রুপ অর্থাৎ ১ম থেকে ১৫০ তম কেন্দ্রের বেলাতে আমরা দেখি আনিসুল হক আর তাবিথ আউয়ালের প্রাপ্ত ভোটের অনুপাত পরবর্তি ১৯টি গ্রুপের বাকি কেন্দ্রগুলো থেকে লক্ষ্যনীয়ভাবে বেশি। এছাড়া এসব কেন্দ্রে অস্বাভাবিক রকম বেশি ভোট পড়ার কারণে আমরা নিরাপদেই ধরে নিতে পারি এখানে কারচুপি হয়েছে। উপরে লাল রেখায় ঘেরা তিনটি গ্রুপের কেন্দ্রে যেখানে ৪৮%-৯৬% পর্যন্ত ভোট পড়েছে এগুলোকে স্বাভাবিক ভাবেই আলাদা বৈশেষ্ট্যের হিসাবে দেখা যায়। এখানে বলে রাখা ভাল, যেহেতু একটা একটি গড় প্রক্রিয়া, কাজেই এই সিদ্ধান্ত নির্দিষ্ট কোন কেন্দ্রের উপরে প্রযোজ্য নাও হতে পারে। কিন্তু এই তালিকার বেশির ভাগ কেন্দ্রেই কারচুপি হয়েছে এটা নিশ্চিত ভাবে বলা যায়। কেন্দ্রগুলোতে বেপরোয়া ভাবে জাল ভোট দিয়ে আনিসুল হক এবং তাবিথ আউয়ালের ভোটের অনুপাতকে অন্য কেন্দ্রগুলোর গর অনুপাতের চাইতে অনেক বেশী পৃথক করা না হলে এমন কৃত্রিম একটি রূপ আমরা পেতাম না। অন্য কেন্দ্রগুলোতে কারচুপি হয়েছি বা হয়নি সেটা নিশ্চিত বলা না গেলেও এখানে যে বেপরোয়া ধরনের কারচুপি হয়েছে তা বোঝা যাচ্ছে। তবে এ থেকে কেউ এমন সম্ভাবনাও মনে রাখতে পারেন যে অন্য কেন্দ্রগুলোতে সতর্কভাবে পরিমিত কারচুপি করে হয়ে থাকতে পারে। কিন্তু সেরকঅম কিছু হয়েছে কিনা সেটা নির্ধারণে আরো জটিল বিশ্লেষণ করা প্রয়োজন। সেটা এই লেখার বিষয়বস্তু নয়।

এই ১৫০টির মত কেন্দ্র, যেখানে কারচুপির বিষয়ে সিদ্ধান্তে আসা যাচ্ছে সেখানে দুই প্রার্থীর মধ্যে ভোটের ব্যবধান কত হচ্ছে? আর সর্বোমোট যত ভোট এই দুই প্রার্থী পেয়েছেন তার কত শতাংশ এই কেন্দ্রগুলো থেকে পাচ্ছেন? এই প্রশ্নগুলো গুরুত্বপূর্ণ।

সারনী ১: সার্বিক ফলাফলে ১৫০ টি ভোট কেন্দ্রের প্রভাব ও তুলনামূলক চিত্র

মোট ভোটার(ভোটারের % ভাগ) মোট যত ভোট পড়েছে(সর্বমোট ভোটের % ভাগ) আনিসুল হক (সর্বমোট প্রাপ্ত ভোটের % ভাগ) তাবিথ আউয়াল(সর্বমোট প্রাপ্ত ভোটের % ভাগ) দুই প্রার্থীর ভোটের পার্থক্য (মোট পার্থক্যের % ভাগ)
১৫০ কেন্দ্র (১৩.৭২%) ৩,২০,০৮৩(১৩.৬৫%) ১,৮৮,৫৫৮(২১.৫৬%) ১,২৬,৩২০(২৭.৪৫%) ৫০,১০৪(১৫.৪১%) ৭৬,২১৬(৫৬.৪৪%)
বাকি ৯৪৩ কেন্দ্র(৮৬.২৮%) ২০,২৪,৮১৭(৮৬.৩৫%) ৬,৮৬,০২৩(৭৮.৪৪%) ৩,৩৩,৭৯৩(৭২.৫৪%) ২,৭৪,৯৭৬(৮৪.৫৯%) ৫৮,৮২১(৪৩.৫৬%)
১০৯৩ (১০০%) ২৩,৪৪,৯০০(১০০%) ৮৭৪৫৮১(১০০%) ৪,৬০,১১৭(১০০%) ৩,২৫,০৮০(১০০%) ১,৩৫,০৩৭(১০০%)

দুই প্রধান প্রার্থীর ভোটের অনুপাত নিয়ে আমাদের নিরীক্ষা শুরু করেছিলাম এই পর্যায়ে উপরোক্ত সারনীর দিকে তাকালে আরো কিছু বাড়তি প্যাটার্ণ আমাদের দৃষ্টিগোচর হয়। উপরের সারনীতে আমরা প্রধানত দু’টি অসঙ্গতি দেখতে পাই।

প্রথমটি হল, যদিও ১৫০ টি কেন্দ্রে আনিসুল হক তার সর্বমোট প্রাপ্ত ভোটের ২৭% ভোট পেয়েছেন দেখা যাচ্ছে তাবিথ আউয়ালের সাথে তার ভোটের যে সার্বিক ব্যবধান সুচীত হয়েছে তার অর্ধেকেরও বেশী (৫৬.৪৪%) এই কেন্দ্রগুলোর অবদান। আর বাকি ৯৪৩টি কেন্দ্রের অবদান মাত্র ৪৩.৫৬%। কিন্তু পরিসংখ্যানগত ভাবে এরকম ঘটা প্রায় অসম্ভব। যেটা আমরা আমাদের নিরীক্ষার পরের অংশটিতে দেখব।

দ্বিতীয় অসঙ্গতিটি হল, স্বাভাবিক ভাবে ভোটের অনুপাত বিষয়ক। কারচুপি না হলে ১৫০ টি কেন্দ্রে মোট ভোটের যতভাগ ভোট পড়েছে প্রার্থীদের নিজেদের প্রাপ্ত ভোটের ঠিক কাছাকাছি অনুপাতে ভোট তাদের ঐ কেন্দ্র গুলোতে পাওয়ার কথা। অর্থাৎ ১৫০ টি কেন্দ্রে যেহেতু ১০৯৩ কেন্দ্রের ২১% ভোট পড়েছে কাজেই অনিসুল হক বা তাবিথ তাদের নিজেদের ভোটের অনুরূপ শতাংশ এইসব কেন্দ্রেই পাওয়ার কথা। বিচ্যুতি হয়ত ১-২% এর মত হতে পারে (যদি না কৃত্রিম ভাবে একজন প্রার্থীকে এই সব কেন্দ্রে বেশি ভোট পাইয়ে দেয়া হয়)। কিন্তু আমরা দেখেছি আনিসুল হকের বেলাতে এই হার ২৭% এবং তাবিথ আউয়ালের বেলায় এই হার ১৫% যেটা অস্বাভাবিক। কাজেই এখন স্বাভাবিক ভাবেই কৌতুহল জাগতে পারে অন্য প্রার্থীদের বেলাতেও কি এই হারগুলো কম নাকি সেগুলো সঙ্গতিপূর্ণ? সেটা তুলনার জন্য আমরা নিচের সারনীটি দেখব। এই সারনীতে আমরা ভোটের হিসাবে সর্বোচ্চ পাঁচজন প্রার্থীর ভোটের পরিসংখ্যান দেখব। সংখ্যাগুলো উপরে বলা আশংকাটিকেই সত্য প্রমান করছে। অর্থাৎ বাকিদের বেলাতেও এই হারগুলো অস্বভাবিক রকম কম।

এখানে তুলনা করতে গিয়ে আরেকটি মজার বিষয় চোখে পড়ে গেল। সেটা হোচ্ছে বাতিল হওয়া ভোটের সংখ্যা। সাধারণ অবস্থায় যখন ভোট অনুষ্ঠিত হবে সেখানে বাতিল হওয়া ভোটের সংখ্যা হবে একটি দৈব প্রক্রিয়া। ফলে নমুনা বেশী হলে (এই ক্ষেত্রে যথেষ্ট সংখ্যক ভোট কেন্দ্র নেয়া হলে) আমরা দেখব বাতিল ভোট জমা পড়া ভোটের সংখ্যার সমানুপাতিক হবে। কিন্তু যদি নিয়ন্ত্রিত ব্যবস্থায় ভোট পড়ে (যেমন কারচুপি) তাহলে ভোট বাতিল হবার সম্ভাবনা কমে যাবে।

সারনী ২: ১৫০ টি কেন্দ্রে প্রাপ্ত ভোটের তুলনা

আনিসুল হক (সর্বমোট প্রাপ্ত ভোটের % ভাগ) তাবিথ আউয়াল(সর্বমোট প্রাপ্ত ভোটের % ভাগ) ফজলে বারী মাসুদ(সর্বমোট প্রাপ্ত ভোটের % ভাগ) মাহী বদরুদ্দোজা চৌধুরী(সর্বমোট প্রাপ্ত ভোটের % ভাগ) জোনায়েদ আব্দুর রহীম সাকি(সর্বমোট প্রাপ্ত ভোটের % ভাগ) বাতিল ভোট(%)
১৫০ কেন্দ্র ১,২৬,৩২০(২৭.৪৫%) ৫০,১০৪(১৫.৪১%) ২,০২৩(১১.২০%) ২০৩১(১৫.১৪%) ১,১০৬(১৫.০১%) ৪,৫৬৩(১৩.৫৯%)
বাকি ৯৪৩ কেন্দ্র ৩,৩৩,৭৯৩(৭২.৫৪%) ২,৭৪,৯৭৬(৮৪.৫৯%) ১৬,০২৭(৮৮.৭৯%) ১১৩৭৬(৮৪.৮৫%) ৬,২৬৪(৮৪.৯৯%) ২৯,০১৮(৮৬.৪১%)
১০৯৩ কেন্দ্রে মোট ৪,৬০,১১৭(১০০%) ৩,২৫,০৮০(১০০%) ১৮০৫০(১০০%) ১৩৪০৭(১০০%) ৭৩৭০(১০০%) ৩৩,৫৮১(১০০%)

রেখাচিত্র ও সহগমন (correlation) নিরীক্ষা
এই অংশে ব্যবহারের জন্য আরো কয়েকটি বাড়তি চলক হিসাব করা হয়েছে। এখানে গণনা ও হিসাবের জন্য পরিসংখ্যান বিষয়ক সফটওয়ার R 2 ব্যবহার করা হয়েছে।

চলক ৩: উপস্থিত ভোটারের মধ্যে নির্বাচিত প্রার্থী (আনিসুল হক)-এর প্রাপ্ত ভোটের অনুপাত, a
চলক ৪: উপস্থিত ভোটারের মধ্যে দ্বিতীয় সর্বোচ্চ ভোট পাওয়া প্রার্থী (তাবিথ আউয়াল)-এর প্রাপ্ত ভোটের অনুপাত, t
চলক ৫: উপস্থিত ভোটারের মধ্যে তৃতীয় সর্বোচ্চ ভোট পাওয়া প্রার্থী (ফজলে বারি)-এর প্রাপ্ত ভোটের অনুপাত, f
চলক ৬: উপস্থিত ভোটারের মধ্যে চতুর্থ সর্বোচ্চ ভোট পাওয়া প্রার্থী (মাহি বি চৌধুরী)-এর প্রাপ্ত ভোটের অনুপাত, m
চলক ৭: উপস্থিত ভোটারের মধ্যে পঞ্চম সর্বোচ্চ ভোট পাওয়া প্রার্থী (জোনায়েদ সাকি)-এর প্রাপ্ত ভোটের অনুপাত, z
চলক ৮: ভোটার উপস্থিতির বিপরীতে বাতিল হয়ে যাওয়া ভোটের অনুপাত, c
কার্যত যেসব প্রার্থীরা পরিসংখ্যানের বিবেচনায় উল্লেখযোগ্য পরিমান ভোট পেয়েছেন তাদের বেলাতে আমরা ভাবতে পারি এই গড় অনুপাত ভোটার উপস্থিতির দ্বারা প্রভাবিত হবে না। কিন্তু যদি কোন প্রার্থীকে জেতানোর জন্য কারচুপি করা হয় তাহলে এই গড় সেই প্রার্থী বা প্রার্থীদের বেলাতে ভোটার উপস্থিতির হার বাড়ার সাথে সাথে বাড়তে থাকবে। আর উক্ত অস্বাভাবিক ভোটের কারনে অন্য প্রার্থীদের গড় ভোটের ধারা (trend)এর উপরও তার একটা প্রভাব পড়বে। অর্থাৎ ভোটার উপস্থিতি বাড়ার সাথে সাথে তাদের ভোট প্রাপ্তির হার কমতে থাকবে। বলে রাখা ভাল এখানে ভোটার উপস্থিতি বলতে উপাত্তের নির্দেশিত ভোটার বোঝচ্ছি। তারা সবাই বাস্তবের ভোটার না হলেই কেবল এই সব ট্রেন্ডগুলো উঠে আসবে। উপাত্তগুলো রেখাচিত্রে তুলে ধরে সেখানে রেখাচিত্রের মাধ্যমে ট্রেন্ডলাইন টেনে আমরা এই প্যাটার্ণগুলো বুঝতে পারি।

নিচের ছয়টি রেখাচিত্রে আমরা উপরের ছয়টি চলকের মান ভোটার উপস্থিতির বিপরীতে প্লট করে আশঙ্কাকেই সত্যি হতে দেখি। কেবল মাত্র বিজয়ি প্রার্থী ছাড়া আর সব প্রার্থীর বেলাতেই আমরা দেখি ভোটার উপস্থিতি বাড়ার সাথে সাথে তাদের শতকরা প্রাপ্ত ভোটের হার (এবং বাতিল ভোটের হার) কমেছে।

ভোটার উপস্থিতির সাথে প্রার্থীদের শতকরা প্রাপ্ত ভোটের (এবং বাতিল ভোটের) সহগমন
ভোটার উপস্থিতির সাথে প্রার্থীদের শতকরা প্রাপ্ত ভোটের (এবং বাতিল ভোটের) সহগমন

দেখার বিষয় হচ্ছে বাতিল হওয়া ভোটের শতকরা হার বাড়ার সাথে সাথে প্রথম থেকেই কমতে শুরু করে। যেটা থেকে আমরা যৌক্তিক ভাবে আশংকা করতে পারি কেবল উচ্চ উপস্থিতির কেন্দ্রেই নয়। মাঝারি ভোটার উপস্থিতির কেন্দ্রেও হয়ত কারচুপির ঘটনা ঘটেছে।

সহগমন নিরীক্ষা:
এই ধাপে পরিসংখ্যানের একটি সাধারণ পরীক্ষার মাধ্যমে নির্ণয় করে দেখা হবে উপরের আলোচিত দু’টি চলকের (ভোটার উপস্থিতি এবং দুই প্রধান প্রার্থীর ভোটের অনুপাত) মধ্যে সহগমন (correlation) আছে কি না। যদি থাকে সেটাও কারচুপির প্রমান বলে বিবেচিত হবে। তবে না থাকলে কারচুপি হয়নি বলা যাবে না। কেননা উপরে যেমন ব্যাখ্যা করেছি, কিছু কিছু কেন্দ্রে কারচুপি করতে গিয়ে যদি অনেক বেশি ভোট দিয়ে ফেলা হয় কেবল তেমন অবস্থাতেই এই ছাকনিতে সেই কারচুপি ধরা পড়বে।
দু’টি চলক (x ও y) এর মধ্যে সহগমন (correlation) থাকলে অর্থাৎ একটির কমা বাড়ার সাথে অন্যটির কমা বাড়ারও যদি সম্পর্কযুক্ত থাকে তাহলে পরিসংখ্যানে হিসাব করে দেখা হয় সার্বিক ভাবে উপাত্তে একটি চলকের কতভাগ কমা বাড়ার সাথে অন্যটির কমা বাড়া (গড়ে) কতটা নির্ভর করে। এই নির্ভরতার সহগ নির্ণোয়ের জন্য পিয়ারসনের নিম্নোক্ত সমীকরণটি বেশ জনপ্রিয়।
pearson2
আমরাও এর মাধ্যমে এই সমীকরণটি ব্যবহার করে আমাদের উপরে আলোচিত চলক দুইটির মধ্যবর্তি সহগামিতা নির্নয় করেছি। হিসাব করে নির্ভরতার সহগের (r) মান পেয়েছি ০.৩২৩৪। এবারে প্রশ্ন আসবে এই সহগের মান পরিসংখ্যানের বিচারে তাৎপর্যপুর্ণ কি না। কেননা উপাত্তে যদি বেশ এলোমেলো হয়, অর্থাৎ এই পারস্পরিক নির্ভরতার মান ক্ষেত্রভেদে অনেক উঠানামা করে সেটাকে উপাত্তের অস্থিতিশীল অবস্থা হিসাবে চিহ্নিত করা হয়, এবং এই ধরনের নির্ভরতা তখত তাৎপর্যহীন (statistically insignificant) হয়ে পড়ে। অন্যদিকে যদি দেখা যায় ক্ষেত্রেভেদে এই সম্পর্ক বেশ স্থিতিশীল, তাহলে সেটাকে তাৎপর্যপূর্ণ (statistically significant) বিবেচনা করা হয়। কাজেই এখানে আমাদের দেখার বিষয় হল এই সম্পর্কটি তাৎপর্য পূর্ণ কিনা। এখানে তার বিশদ পদ্ধতি বর্ণনা না করে স্টাটিস্টিকাল সফওয়্যার R এর মাধ্যমে এই তাৎপর্যের মাত্রাটি নির্ধারণ করেছি। তখন আবার r এর মানটিও যাচাই করা হয়ে যাবে।
সফওয়ারের হিসবেও আমরা r এর একই মান পাই।
এবারে হাইপোথিসিস টেস্টের জন্য উপরের দুইটি চলককে আমরা একটি রিগ্রেশন সমীকরণে বসিয়ে নেই যে দেখতে এরকম

y= α+βx

এখানে গুডনেস অব ফিট বা R2 (আর-স্কয়ারড) এর মান। এখানে এই মান হল ০.১০৪৬ যা উপরে r এর মানকে বর্গ করলেও পাওয়া যায়। ফলে এই সহগটির মানের বিষয়ে হিসাবে কোন গরমিল যে নেই সে বিষয়ে নিশ্চিত হওয়া গেলো। তবে এখানে আমর দেখতে চাইব এটা স্টাটিস্টিকালি সিগনিফিকেন্ট কি না। রিগ্রেশন রেসাল্ট অনুসারে এটা ০.০০১ পর্যায়ে তাৎপর্যপূর্ণ। সাধারণত ০.০৫ এর নিচে গেলেই এই ধরনের ক্ষেত্রে r এর মানকে তাৎপর্যপূর্ণ ধরা হয়। এখানে এই মান অনেক কম। এর মানে হল দৈব ভাবে, অর্থাৎ চলক দু’টির মধ্যে কোনরকম পারস্পরিক সম্পর্ক ছাড়া এইধরনের উপাত্ত পাওয়ার সম্ভাবনা ১০০০ ভাগের একভাগেরও কম।

নিচের রেখাচিত্রে অনুভূমিক অক্ষে ভোট জমা পড়ার হার এবং উলম্ব অক্ষে আনিসুল হক ও তাবিথ আউয়ালের ভোটের অনুপাত প্লট করা হয়েছে। আড়াআড়ি নীল রঙের রেখাটি চলক দুইটির মধ্যকার সম্পর্কের ঢাল (slope) নির্দেশ করছে। লালা ও সবুজ রেখা সনশ্লিষ্ট অক্ষের গড়মান বড়াবড় আকা হয়েছে।
Correl

অনুসৃত পদ্ধতির সীমাবদ্ধতা
নির্বাচন পরবর্তি কারচুপি নিরীক্ষা (post-election forensic)কার্যত বেশ জটিল। কারচুপি অনেক ভাবে এবং অনেক পর্যায়ে হতে পারে। আমরা অভিজ্ঞতায় যা জানি বা শুনে থাকি এমন নানা ধরনের পরিস্থিতি হতে পারে যার নিদর্শন ভোটের উপাত্তে দেখা দিতে পারে, আবার নাও দেখা দিতে পারে। কিন্তু এখানে কিছু সাধারণ কৌশল ব্যবহার করা হয়েছে যেগুলো কেবল বেশ মোটা দাগে এবং বড় মাপের কারচুপি হলেই কেবল একটি সামগ্রিক ধারনা পেতে সহায়তা করবে। কাজেই এই সাধারণ পদ্ধতিগুলো ব্যবহার করে যেহেতু কারচুপি সম্পর্কে ধারনা করা গেছে, আমরা বুঝতে পারছি ঢাকা সিটি (উত্তর) নির্বাচন সুষ্ঠু হয়নি। ফলে ভবিষ্যতে নির্বাচন ব্যবস্থার আরো প্রভুত উন্নয়ন ছাড়া আমাদের দেশে গনতন্ত্রকে কার্যকর করা কঠিন হবে।

থাম্বনেইলের ছবির সূত্র: বিবিসি

Show 2 footnotes

  1. সুশাসনের জন্য নাগরিক (সুজন)-এর ডঃ বদিউল আলম মজুমদারকে আন্তরিক ধন্যবাদ কেন্দ্র পর্যায়ে ভোটের বিশদ উপাত্ত দিয়ে করার জন্য। এছাড়া প্রথম থেকে এই উপাত্ত নিয়ে কাজ করতে উৎসাহ এবং পরামর্শ দিয়ে সাহায্য করায় হাসিব ভাই, রুশাদ ভাই, মাহরুখ আপাকেও আন্তরিক ধন্যবাদ জানাই। তবে লেখায় কোন ত্রুটি থাকলে তার দায় এই লেখকের নিজস্ব।
  2. R Core Team (2014) R: A Language and Environment for Statistical Computation, R Foundation for Statistical Computing, Vienna, Austria, http://www.R-project.org

8 thoughts on “আমাদের নির্বাচন ব্যবস্থা কতটা নির্ভরযোগ্য?-ঢাকা সিটি নির্বাচনের উপাত্তের একটি প্রামান্য বিশ্লেষণ

  1. খুবই ভাল উদ্যোগ! অভিনন্দন! আমার কিছু প্রশ্ন ছিল:

    ১. “প্রথমত, নির্বাচন নিরপেক্ষ হলে ভোটার উপস্থিতি যেসব কেন্দ্রে বেশি সেখানে প্রার্থী অনুযায়ি ভোটের যেই অনুপাত সেটা কম ভোটার উপস্থিতির কেন্দ্র থেকে আলাদা হবার কথা নয়।” – কিন্তু কোন এলাকায় যদি এমন প্রার্থীর ভোটার বেশি থাকে যারা ক্ষমতাসীন দলকে সমর্থন করে না আর তারা যদি ভাবে নির্বাচনে গিয়ে লাভ কি? এটা দুই কারণে হতে পারে – কারচুপি অথবা গুজব ছড়ানো। বাংলাদেশে দুটিই ঘটে।

    ২. ” আর জাল কারচুপি হলে জাল ভোটের হারও কমে আসে। কেননা একই দক্ষতায় সিল মারতে থাকলে গড়ে জাল ভোটের যে সংখ্যা সেটা অনেক কমে যায়।” – এই ব্যাপারটি বুঝতে পারিনি।

    ৩. “বে এ থেকে কেউ এমন সম্ভাবনাও মনে রাখতে পারেন যে অন্য কেন্দ্রগুলোতে সতর্কভাবে পরিমিত কারচুপি করে হয়ে থাকতে পারে। কিন্তু সেরকঅম কিছু হয়েছে কিনা সেটা নির্ধারণে আরো জটিল বিশ্লেষণ করা প্রয়োজন।” – আরো জটিল বিশ্লেষণগুলো কি কি?

    ৪. “দ্বিতীয় অসঙ্গতিটি হল, স্বাভাবিক ভাবে ভোটের অনুপাত বিষয়ক। কারচুপি না হলে ১৫০ টি কেন্দ্রে মোট ভোটের যতভাগ ভোট পড়েছে প্রার্থীদের নিজেদের প্রাপ্ত ভোটের ঠিক কাছাকাছি অনুপাতে ভোট তাদের ঐ কেন্দ্র গুলোতে পাওয়ার কথা।” – এই অনুমানের ভিত্তিটি পরিষ্কার করে বলবেন? আমি যতটুকু শুনেছি সব কেন্দ্রে সব প্রার্থীর ন্যূনতম যে পোলিং এজেন্ট থাকার কথা সেগুলো ছিল না (যারা ছিল তাদের পিটিয়ে বের করে দেয়ার যে অভিযোগ তার আগের কথা বলছি)। একই ভাবে সব কেন্দ্রে প্রার্থী সমান প্রচারণা চালিয়েছে কিনা সেটিও আমরা জানি না। তাহলে আমরা সব কেন্দ্রের হার একই হবে সেটি কেন ধরে নিচ্ছি?

    ৫. “ফলে নমুনা বেশী হলে (এই ক্ষেত্রে যথেষ্ট সংখ্যক ভোট কেন্দ্র নেয়া হলে) আমরা দেখব বাতিল ভোট জমা পড়া ভোটের সংখ্যার সমানুপাতিক হবে। কিন্তু যদি নিয়ন্ত্রিত ব্যবস্থায় ভোট পড়ে (যেমন কারচুপি) তাহলে ভোট বাতিল হবার সম্ভাবনা কমে যাবে।” – আমার কমনসেন্স বলে আপনার অনুমান সঠিক। কিন্তু আসলেই এটি সত্যি কিনা সেটি কোনভাবে যাচাই করা গেলে ভাল হত। লেখাপড়া জানা ঢাকা বিশ্ববিদ্যালয় এলাকার বাতিল ভোটের হার আর রায়েরবাজার বস্তি এলাকার বাতিল ভোটের হার কি আসলেই একই হওয়ার কথা?

    ৬. “রেখাচিত্র ও সহগমন (correlation) নিরীক্ষা” – আপনি শুরুতে ৬টা চলকের কথা বলেছেন কিন্তু গ্রাফে সেই চলকগুলি বসাননি। বসালে আমরা ঠিকমত বুঝতে পারব।

    আরো একবার – খুবই দুর্দান্ত কাজ। আশা করি সাংবাদিকদের চোখে পড়বে। ভাল কথা, নির্বাচন কমিশনে এটি ইমেইল করতে পারেন।

    1. মন্তব্যের জন্য ধন্যবাদ।
      ১) এখানে যেটা অনুমিতির কথা বলেছি সেটা স্বাভাবিক পরিসংখ্যানিয় অনুমিতির কথা। আপনি যেমন বললেন তেমন যে হতে পারে না সেটা কেউ বলতে পারে না। এরকম অনেক কিছুই হতে পারে। কারচুপি ছাড়া আরো অন্যরকম পরিস্থিতিতে উপাত্তের একই ধরনের ফলাফল আসতে পারে। সেগুলো অবশ্যই বিবেচনা করতে হবে। এখানে সে বিবেচনায় দেখার বিষয় হল, অন্যান্য বিষয়গুলো যেমন জাল ভোটের হারের পতন- ইত্যাদি এগুলোতেও কিন্তু উপাত্ত কারচুপির পক্ষেই কথা বলছে। কাজেই নিশ্চিত হবার সার্থে যেসব “অন্য সম্ভাবনা” বিবেচনা করা হচ্ছে সামগ্রিক ভাবে সেগুলো রুলড আউট হবার সম্ভাবনাই জোরালো। তবু বিষয়টি উল্লেখ করে ভাল করেছেন, হয়ত অনেকের মনেই এই প্রশ্নগুলো আসতে পারে।

      ২) রিডান্ডেণ্ট হয়ে গেছে- “জাল কারচুপি” এর পরিবর্তে কারচুপি পড়ুন। পরের শব্দটি “জাল” এর স্থলে বাতিল হবে [মূল লেখায় ঠিক করে দেবার চেষ্টা করছি]। আসলে বাতিল ভোটের প্রসঙ্গটি উপাত্ত নিয়ে নাড়াচাড়ার পরে গিয়ে চোখে পড়েছে। পরে অন্য কিছু স্টাডিতেও এই বিষয়টি দেখলাম — তাই প্রথমে নিয়ে আসি।

      ৩) এই প্রশ্নের কম্প্রিহেন্সিভ উত্তর দেয়া যাবে না — লিটারেচার দেখিনি। সব গুলো ইন্টুইশান লিটারেচারের সাথে না মিলিয়ে আগ বাড়িয়ে বলতে চাইনা। তবে এখানেই বাতিল ভোটের হারে যেই ট্রেণ্ড দেখা যাচ্ছে সেটা একটা উপায়। আর অনুমিত একটি স্বাভাবিক/নিরপেক্ষ ভোটের উপাত্তের সাথে তুলনা করেও কিছু বিষয় বলা যাবে। আশা করি এই প্রসঙ্গ নিয়ে ভবিষ্যতে আলাপের সুযোগ হবে।

      ৪) এটাও প্রাসঙ্গিক প্রশ্ন। ধরে নেবার ক্ষেত্রে পিটিয়ে পোলিং এজেন্ট বের করে দেবার বেলাতে যেটা হবে বা হতে পারে সেটাও কারচুপির সম্ভাবনা বাড়াবে। পোলিং এজেন্টকে বের করে দেবার কারণে যদি সেটা প্রার্থীদের প্রাপ্ত ভোটের অনুপাতে প্রভাব ফেলে সেটা কারচুপির শ্রেণীতেই পড়ছে। কাজেই ধরে নেয়াটা স্বাভাবিক ভোট সিনারিও — আর এই যে উপাত্তে অস্বাভাবিকতা সেখানে আপনি যেই অবস্থাগুলোর কথা বলছেন সেগুলোও অন্তর্ভুক্ত। ফলে আপনার এই মন্তব্য ধরে নেয়ার ভিত্তিটাকেই মজবুত বলে প্রমান করছে। অর্থাৎ আমরা যেটা ধরে নিচ্ছি বাস্তবতা তার থেকে আলাদা, যেই কারণে আলাদা সেটাই নির্বাচন ব্যবস্থার দুর্বলতাকে মনে করিয়ে দিচ্ছে।

      ৫) আপনার আপত্তি যথার্থ। মাল্টিভ্যারিয়েট কন্টেক্সট যেমন হয়, তেমনি আপনি আইডেন্টিফাই করেছেন এমন কিছু ফ্যাক্টর যেগুলো জাল ভোটের হারকে প্রভাবিত করতে পারে। অর্থনীতি/পরিসংখ্যানে Ceteris paribus [অল এলস বিয়িং সেম ] এই কারণেই বারবার বলা হয়। এই ক্ষেত্রে প্রচলিত উত্তর হবে যেহেতু স্যাম্পল সাইজ বড় (কার্যত যেহেতু এটা পপপুলেশান ড্যাটা) এখানে এই প্রভাবগুলো নানাভাবে বাতিল হয়ে যাবে। এখানেও এই ব্যাপারগুলো ঘটবে, প্রয়োজন মনে করলে বিস্তারিত বর্ণনা দিতে পারি, আপাতত কিছুটা ক্লান্ত লাগছে। পরে দেবার চেষ্টা করব।

      ৬) ছয়টি চলকই দিয়েছি, হয়ত বর্ণনা সেগুলো বিস্তৃত করাতে কিছুটা ঘাটতি থেকে গেছে। এখানে স্কেল ইম্প্যাক্ট যাতে না থাকে সে জন্য গ্রাফে প্রতিটি সিরিজকে কার্যত পার্সেন্টে রূপান্তর করা হয়েছে।

      মন্তব্যের জন্য ধন্যবাদ।

  2. Brilliant write up! Thanks for starting a knowledge-based analysis of election in Bangladesh.
    Also, thanks to Mr. Shehab for pointing to some issues that also struck me while reading it. I find writer himself has agreed to some of the scientific doubt raised regarding hypotheses.
    I would suggest to put some examples of generally accepted and appreciated elections in Bangladesh like those in 1991, 1996 and 2001 or any other election from abroad, even maybe from recently held UK general election to support the hypotheses. I myself do not know if required data regarding those elections will be accessible or found; if found please test your hypotheses regarding fake vote, similar ratio of winning and losing candidates throughout the election centres. Then the write up would be more solid.
    However, even if such tests could not be done, I understand and support the basic scientific validity of your findings.

    1. এরপর ইংরেজিতে মন্তব্য করলে অর্থিক জরিমানা করার বিধান করার দাবি জানাব। 🙂
      অন্য নির্বাচনের উপাত্তের সাথে তুলনা করার পরামর্শটি দিয়েছেন অনেকে, এটা বিবেচনায় আছে। যদি সময় সুযোগ করে এটা নিয়ে আবার বসতে পারি অবশ্যই সেই চেষ্টা করব।

      1. ধন্যবাদ। কিন্তু আমি তো আরবী পড়তে পারি, লিখতে পারিনা!

        অন্য নির্বাচনের উপাত্তের সাথে তুলনার অপেক্ষায় রইলাম।

  3. পৃথিবীর বিভিন্ন দেশে নির্বাচনের গ্রহনযোগ্যতার ভিত্তিতে র‍্যাঙ্কিং-এ বাংলাদেশের অবস্থান (Perception of Electoral Integrity) [২০১৪ সালের প্রতিবেদন অনুসারে]:
    Perception of Electoral Integrity

  4. অভিনন্দন! অসাধারন তথ্য সম্বলিত statistical analysis. ধন্যবাদ আপনাকে।
    কিন্তু কিছু কিছু বাংলা শব্দ বুঝতে কষ্ট হচ্ছে। English term গুলো বাংলায় কেমন যেন বুঝতে কষ্ট হচ্ছে। যদি English version থাকে অনুগ্রহ করে দিবেন।

    1. বাংলায় লেখাটা জরুরী হলেও উপযুক্ত বাংলা প্রতিশব্দ পাওয়া বা ব্যবহার করা সহজ কাজ নয়। ফলে লেখাটা দুর্বোধ্য মনে হবার সম্ভাবনা ছিল। ইংরেজিতে লিখিনি এখনো। লিখলে আপনাকে পাঠাবো অবশ্যই। মনে থাকবে। মন্তব্যের জন্য ধন্যবাদ। 🙂

Leave a Reply