খবরে সমীকরণ: সাধারণ দর্শকদের কাছে একটি বহু-স্তরের মডেল অনুবাদ করা


24

নিউইয়র্ক সিটিশিক্ষকদের প্রতিক্রিয়া জানাতে 'মূল্য সংযোজিত' শিক্ষক মূল্যায়ন ব্যবস্থার বিষয়ে নিউইয়র্ক টাইমসের একটি দীর্ঘ মন্তব্য রয়েছে। লেড হ'ল স্কোর গণনা করার জন্য ব্যবহৃত সমীকরণ - প্রসঙ্গ ছাড়াই উপস্থাপন করা। অলঙ্কৃত কৌশলটি অঙ্কের মাধ্যমে ভয় দেখায় বলে মনে হচ্ছে:

বিকল্প পাঠ

নিবন্ধটির সম্পূর্ণ পাঠ্য উপলভ্য: http://www.nytimes.com/2011/03/07/education/07winerip.html

লেখক, মাইকেল উইনারিপ যুক্তি দিয়েছিলেন যে সমীকরণটির অর্থ হ'ল উম, ম্যাট ড্যামন বুঝতে পারা, একজন গড় শিক্ষক ছাড়া অন্য কারও ক্ষমতার বাইরে:

"মিসেস আইজ্যাকসনের ৩.69৯ পূর্বাভাসিত স্কোরের গণনা আরও বেশি ভয়ঙ্কর It এটি 32 টি ভেরিয়েবলের উপর ভিত্তি করে তৈরি করা হয়েছে - যার মধ্যে কোনও শিক্ষার্থী“ প্রিস্টেটের আগে গ্রেডে ধরে রাখা হয়েছিল "এবং কোনও শিক্ষার্থী“ প্রিস্টিটেড বা পোস্ট-টেস্টে শহরে নতুন কিনা? বছর। "

এই 32 টি ভেরিয়েবলগুলিকে একটি পরিসংখ্যানের মডেল হিসাবে যুক্ত করা হয়েছে যা এমন একটি সমীকরণের মতো দেখায় যে "গুড উইল হান্টিং" এ কেবল ম্যাট ড্যামন সমাধান করতে সক্ষম ছিল।

প্রক্রিয়াটি স্বচ্ছ বলে মনে হয় তবে এটি কাদা হিসাবে পরিষ্কার, এমনকি শিক্ষক, অধ্যক্ষ এবং স্মার্ট লেভেল লোকদের জন্যও - আমি এই বলতে দ্বিধা বোধ করি - সাংবাদিকরা।

মিসেস আইজ্যাকসনের দুটি আইভী লীগের ডিগ্রি থাকতে পারে, তবে তিনি হারিয়ে গেছেন। "আমি বুঝতে এটি অসম্ভব বলে মনে করি," তিনি বলেছিলেন।

সরল ইংরেজিতে, বিভাগ তাকে কী বলার চেষ্টা করছে তা সম্পর্কে মিসেস আইজ্যাকসনের সর্বোত্তম অনুমান: যদিও তার students 66 জন শিক্ষার্থীর মধ্যে 65৫ জন রাষ্ট্রীয় পরীক্ষায় দক্ষ হয়েছিলেন, তবুও তার 3s এর বেশি হওয়া উচিত 4 বছর বয়সী।

তবে এটি কেবল অনুমান মাত্র "

আপনি কীভাবে একটি ল্যাপারসনকে মডেলটি ব্যাখ্যা করবেন? এফওয়াইআই, সম্পূর্ণ প্রযুক্তিগত প্রতিবেদনটি এখানে:

http://schools.nyc.gov/NR/rdonlyres/A62750A4-B5F5-43C7-B9A3-F2B55CDF8949/87046/TDINYCTechnicalReportFinal072010.pdf

আপডেট করুন: অ্যান্ড্রু Gelman তার চিন্তা এখানে দিচ্ছে: http://www.stat.columbia.edu/~cook/movabletype/archives/2011/03/its_no_fun_bein.html


1
গেলম্যানের চিন্তাভাবনা এবং তার পোস্টে দেওয়া মন্তব্যগুলি পড়ার পক্ষে উপযুক্ত। স্কোরিং সিস্টেমটি অবশ্যই আবর্জনাযুক্ত: বিবেচনা করুন যে এই শিক্ষকের 95% সিআই । [0%, 52%]
গুং - মনিকা পুনরায়

উত্তর:


12

এখানে একটি সম্ভাবনা।

শিক্ষকদের পারফরম্যান্স মূল্যায়ন করা গতানুগতিকভাবে কঠিন ছিল। এই অসুবিধার একটি অংশ হ'ল বিভিন্ন শিক্ষার্থীর প্রদত্ত বিষয়ে বিভিন্ন স্তরের আগ্রহ রয়েছে। যদি কোনও প্রদত্ত শিক্ষার্থী একটি এ পায়, এর অর্থ অগত্যা এই নয় যে পাঠদানটি দুর্দান্ত ছিল - বরং এটির অর্থ এই হতে পারে যে খুব মেধাবী এবং আগ্রহী শিক্ষার্থী শিক্ষার নিম্নমানের পরেও সাফল্যের জন্য যথাসাধ্য চেষ্টা করেছিল। বিপরীতে, একটি ডি ডিগ্রি লাভকারী কোনও শিক্ষার্থীর অগত্যা এই অর্থটি খারাপ ছিল না - বরং এটির অর্থ এই হতে পারে যে শিক্ষিত এবং অনুপ্রাণিত করার জন্য শিক্ষকের সর্বোত্তম প্রচেষ্টা সত্ত্বেও একজন বিচ্ছিন্ন ছাত্র কোস্ট হয়েছে।

অসুবিধাটি এ কারণে যে শিক্ষার্থীদের বাছাই (এবং তাই শিক্ষার্থীদের আগ্রহের স্তর) এলোমেলোভাবে থেকে দূরে রয়েছে by স্কুলগুলির পক্ষে একটি বিষয় (বা বিষয়গুলির একটি গ্রুপ) অন্যের তুলনায় জোর দেওয়া সাধারণ। উদাহরণস্বরূপ, একটি স্কুল মানবিকতার তুলনায় প্রযুক্তিগত বিষয়ের উপর জোর দিতে পারে। এই জাতীয় বিদ্যালয়ের শিক্ষার্থীরা প্রযুক্তিগত ক্ষেত্রে সম্ভবত এত আগ্রহী যে তারা সবচেয়ে খারাপ শিক্ষকের সাথেও পাসিং গ্রেড পাবে। এইভাবে গণিত পাস করা শিক্ষার্থীদের ভগ্নাংশটি পড়াশোনার একটি ভাল পরিমাপ নয় - আমরা আশা করি যে ভাল শিক্ষাগুলি শিখতে আগ্রহী এমন শিক্ষার্থীদের তুলনায় আরও ভাল কিছু করবে to বিপরীতে, সেই একই শিক্ষার্থীরা চারুকলায় কোনও আগ্রহী নাও হতে পারে। এমনকি সর্বোত্তম শিক্ষকের কাছ থেকেও আশা করা মুশকিল যে সমস্ত শিক্ষার্থী এ পেয়েছে তা নিশ্চিত করা।

আরেকটি অসুবিধা হ'ল কোনও শ্রেণীর সমস্ত সাফল্য সরাসরি সেই শ্রেণীর শিক্ষকের জন্য দায়ী নয়। বরং সাফল্য স্কুল (বা পুরো জেলা) অর্জনের জন্য অনুপ্রেরণা এবং কাঠামো তৈরি করার কারণে হতে পারে।

এই সমস্ত অসুবিধার বিষয়টি বিবেচনায় নেওয়ার জন্য গবেষকরা এমন একটি মডেল তৈরি করেছেন যা শিক্ষকের 'যুক্ত মূল্য' মূল্যায়ন করে। সংক্ষেপে, মডেল প্রতিটি শিক্ষার্থীর অভ্যন্তরীণ বৈশিষ্ট্যগুলি (শিক্ষার ক্ষেত্রে আগ্রহ এবং সাফল্যের সামগ্রিক স্তর) এবং সেইসাথে বিদ্যালয়ের সাফল্যে স্কুল এবং জেলার অবদানগুলি বিবেচনা করে এবং 'গ্রেড' দিয়ে প্রত্যাশিত শিক্ষার্থী গ্রেডের পূর্বাভাস দেয় যে পরিবেশে শিক্ষণ। মডেলটি তখন পূর্বাভাসিতগুলির সাথে প্রকৃত গ্রেডগুলির সাথে তুলনা করে এবং এর ভিত্তিতে সিদ্ধান্ত নেয় যে পড়াশোনা অন্য সমস্ত বিবেচনায় প্রদত্ত পর্যাপ্ত ছিল কিনা পর্যাপ্ততার চেয়ে ভাল, আরও খারাপ। যদিও মডেলটি অ-গণিতবিদকে জটিল মনে হতে পারে তবে এটি আসলে বেশ সহজ এবং মানক। গণিতবিদরা কয়েক দশক ধরে একই রকম (এবং আরও জটিল) মডেল ব্যবহার করে আসছেন।

সংক্ষেপে বলতে গেলে, মিসেস আইজ্যাকসনের অনুমান সঠিক। যদিও তার students 66 জন শিক্ষার্থীর মধ্যে 65৫ জন রাষ্ট্রীয় পরীক্ষায় দক্ষ হয়ে ওঠে, তারা কুকুরের শিক্ষক থাকলেও তারা একই স্কোর করতে পারত। একজন প্রকৃত ভাল শিক্ষক এই শিক্ষার্থীদের নিছক 'দক্ষ' নয়, একই পরীক্ষায় আসলে 'ভাল' অর্জন করতে সক্ষম করবে।


এই মুহুর্তে আমি মডেলটির সাথে আমার কিছু উদ্বেগ উল্লেখ করতে পারি। উদাহরণস্বরূপ, মডেল বিকাশকারীরা দাবি করেন যে এটি শিক্ষার গুণমানের মূল্যায়নে কিছু অসুবিধা সমাধান করে। আমার কি তাদের বিশ্বাস করার যথেষ্ট কারণ আছে? নিম্ন-আয়ের জনসংখ্যার প্রতিবেশী অঞ্চলে 'জেলা' এবং 'স্কুল' স্কোর কম হবে। বলুন কোনও প্রতিবেশীর প্রত্যাশিত স্কোর 2.5 হবে। একজন শিক্ষক যিনি গড়ে 3 জন অর্জন করবেন একটি ভাল মূল্যায়ন পাবেন। এটি শিক্ষকদের 4 বা 5 এর স্কোরের চেয়ে 3 স্কোরের দিকে লক্ষ্য রাখতে প্ররোচিত করতে পারে, অন্য কথায়, শিক্ষকরা সিদ্ধির চেয়ে মধ্যযুগের লক্ষ্য রাখবেন। আমরা কি এটি ঘটতে চাই? পরিশেষে, মডেলটি গাণিতিকভাবে সহজ হলেও এটি মানুষের অন্তর্দৃষ্টি কীভাবে কাজ করে তার থেকে খুব আলাদাভাবে কাজ করে। ফলস্বরূপ, আমাদের কাছে মডেলটির বৈধতা বা বিতর্ক করার কোনও সুস্পষ্ট উপায় নেই ' এর সিদ্ধান্ত। মিসেস আইজ্যাকসনের দুর্ভাগ্যজনক উদাহরণ ব্যাখ্যা করে যে এটি কী হতে পারে। আমরা কি এত গুরুত্বপূর্ণ কিছুতে কম্পিউটারের উপর অন্ধভাবে নির্ভর করতে চাই?


মনে রাখবেন এটি একটি ল্যাপারসনের ব্যাখ্যা। আমি বেশ কয়েকটি সম্ভাব্য বিতর্কিত সমস্যা এখানে ছাড়িয়েছি। উদাহরণস্বরূপ, আমি বলতে চাইনি যে স্বল্প আয়ের জনসংখ্যার সাথে স্কুল জেলাগুলি আরও দরিদ্র পরিবেশিত হবে বলে আশা করা হচ্ছে, কারণ এটি কোনও ল্যাপারসনের পক্ষে ভাল লাগবে না।

এছাড়াও, আমি ধরে নিয়েছি যে লক্ষ্যটি আসলে মডেলের একটি যুক্তিসঙ্গতভাবে সুষ্ঠু বিবরণ দেওয়া। তবে আমি নিশ্চিত যে এখানে এনওয়াইটির লক্ষ্য ছিল না। সুতরাং তাদের ব্যাখ্যাটি দুর্বল হওয়ার কারণগুলির অন্তত অংশটি আমার মতে ইচ্ছাকৃত FUD is


আমি সম্ভবত শেষ অনুচ্ছেদের দ্বিতীয় বাক্যটি পরিবর্তন করে বলব, "যদিও তার students 66 জন শিক্ষার্থীর মধ্যে 65৫ জন রাষ্ট্রীয় পরীক্ষায় 'দক্ষ' হয়েছে, তবুও তারা অদক্ষ শিক্ষক থাকলেও সম্ভবত তারা একই স্কোর করতে পারত।"
ওয়েইন

11

"আপনার শিক্ষার স্কোর নির্ভর করে যে ভিত্তিতে করা পূর্বাভাসের সাথে তুলনা করা আপনার শিক্ষার্থীরা কতটা ভাল করেছে on

  • তারা যা জানত আগে তা যেমন জানত

  • শিক্ষার্থীরা তাদের সম্পর্কে আমরা স্বতন্ত্রভাবে কী কী জানি তার ভিত্তিতে (তাদের "বৈশিষ্ট্যগুলি") কীভাবে শিখতে পারি তা আমরা মনে করি,

  • এবং আপনার জেলা, স্কুল এবং শ্রেণিকক্ষে শিক্ষার্থীরা গড়ে কত ভাল করে (যদি আপনার শ্রেণিকক্ষে অন্য শিক্ষক থাকে)।

"অন্য কথায়, আমরা আপনার শিক্ষার্থীদের প্রস্তুতি এবং বৈশিষ্ট্যগুলিতে ফ্যাক্টরিংয়ের পরে এবং আপনার কাছে যে সংস্থানগুলি উপলভ্য ছিল সেগুলি দিয়ে আপনার মতো সেটিংসে সমস্ত শিক্ষার্থীর সাধারণ পারফরম্যান্সের পরে কী পরিমাণ শেখা হয়েছিল তার ভিত্তিতে আমরা আপনাকে মূল্যায়ন করছি।

"এইভাবে আপনার স্কোরটি শিক্ষার্থীদের পারফরম্যান্সে আপনি কী অবদান রেখেছেন তা প্রতিফলিত করে , যেমন আমরা এটি নির্ধারণ করতে পারি। অবশ্যই আমরা সবকিছু জানতে পারি না: আমরা জানি যে আপনার অনন্য এবং বিশেষ শিক্ষার্থী ছিল এবং আপনি যে পরিস্থিতির মুখোমুখি হয়েছিলেন তা কখনই অনুলিপি করা যায় না। তাই আমরা এই স্কোরটি কেবলমাত্র এমন একটি অনুমান যা অপূর্ণতার সাথে আপনি কতটা ভালভাবে শিখিয়েছেন তা প্রতিফলিত করে তবে এটি কেবলমাত্র পরীক্ষার উপর নির্ভর করে বা আপনার শ্রেণীর দ্বারা তৈরি কাঁচা পরীক্ষার লাভের উপর ভিত্তি করে একের চেয়েও সুন্দর এবং নির্ভুল অনুমান। "


2
এনবি দয়া করে আমাকে এই চিন্তাভাবনাগুলি দায়ী করবেন না! অনুরোধ অনুসারে আমি কেবল বর্ণিত মডেলটির উচ্চারণ এবং প্রতিরক্ষা করার জন্য যথাসাধ্য চেষ্টা করছি। এই মডেলটি উপযুক্ত, প্রযোজ্য, ভাল-ফিট ইত্যাদি is পুরোপুরি একটি পৃথক সমস্যা।
whuber

(+1) শেষ অনুচ্ছেদটি খুব ভালভাবে দেওয়া আছে।
chl

2

এখানে বোঝার মতো কিছুই নেই।

ঠিক আছে, ঠিক আছে, এটি কেবল একটি আদর্শ লিনিয়ার রিগ্রেশন মডেল। এটি ধরে নিয়েছে যে কোনও শিক্ষার্থীর স্কোরকে স্কুল এবং শিক্ষকের দক্ষতা সহগ সহ বিভিন্ন কারণের লিনিয়ার ফাংশন হিসাবে বর্ণনা করা যেতে পারে - সুতরাং এটি লিনিয়ার মডেলগুলির সমস্ত স্ট্যান্ডার্ড সমস্যা ভাগ করে দেয়, মূলত সত্য যে এটি একটি ননলাইনারের একটি দুর্দান্ত আনুমানিকতা বিশ্বের এবং সেইসাথে কোনও পরিস্থিতির উপর নির্ভর করে এবং কেউ এর সাথে কীভাবে বহির্মুখের চেষ্টা করতে পারে তার উপর নির্ভর করে পুরোপুরি বা বিব্রতকরভাবে খারাপ কাজ করতে পারে। (তবে কারও কারও কাছে প্রত্যাশা করা উচিত প্রযুক্তি প্রতিনিধিটির লেখক এটি পরীক্ষা করেছেন এবং খুঁজে পেয়েছেন যে এটি ঠিক আছে ;-))।

তবে আসল সমস্যাটি হ'ল এটি একটি বিশ্লেষণাত্মক সরঞ্জাম এবং এগুলি লোকের অর্জনগুলি মূল্যায়নের জন্য ব্যবহার করা উচিত নয় - এইভাবে (চিহ্ন নির্বিশেষে নির্বিশেষে নির্বিশেষে) প্রতিটি আসল তার / তার চিহ্ন বোঝার চেষ্টা করছে (সম্ভবত আশায় এটি অপ্টিমাইজ করার) কেবলমাত্র হতাশ বিভ্রান্তি পূরণ করবে, যেমন এই ক্ষেত্রে case


3
"এখানে বোঝার মতো কিছুই নেই - এটি কেবল একটি প্রমিত লিনিয়ার রিগ্রেশন মডেল" - টিহিহি .... যেমন ম্যাথফোবিকদের জন্য এটি কোনও সান্ত্বনা। আমি এটি গ্রহণ করি যে আপনার কাছে পরিসংখ্যানগুলিতে স্নাতক কোর্স পড়ানোর আগ্রহ কখনই হয়নি, আসুন আমরা বলি, সমাজবিজ্ঞান বা, meশ্বর আমাকে সাহায্য করুন, যোগাযোগের বড় বড় প্রতিষ্ঠানগুলি।
ফ্যাবিয়ানরা

@ ফাবিয়ানরা এটিই কেবল আমার বক্তব্য প্রমাণ করেছেন - গণনার তুলনায় গণিতের সাথে জটিল লোকদের মুখোমুখি হওয়াই এই পদ্ধতির বৃহত্তম ত্রুটি]] তবে আমি এটিকে উচ্চারণ করার চেষ্টা করব।

এটি বৈধ সমালোচনা - বিশেষত রৈখিকতা অনুমান করার অংশ - তবে এটি সত্যিকার অর্থে মূল প্রশ্নের জবাব দেয় না (যদি না আপনার অভিমান অনুমান "সাধারণ মানুষকে আপত্তি না করে)"।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.