যদি শ্রোতার সত্যিই কোনও পরিসংখ্যানগত পটভূমি না থাকে তবে আমি মনে করি আমি ব্যাখ্যাটি আরও কিছুটা আরও সহজ করার চেষ্টা করব। প্রথমে, আমি বোর্ডের উপর একটি লাইন সহ একটি সমন্বিত বিমান আঁকবো, যেমন:
আপনার আলাপের প্রত্যেকেই একটি সাধারণ লাইনের সমীকরণের সাথে পরিচিত হবেন, y = m x + b , কারণ এটি এমন কিছু যা গ্রেড স্কুলে শিখেছে। সুতরাং আমি অঙ্কন পাশাপাশি প্রদর্শিত হবে। তবে আমি এটিকে পিছন দিকে লিখতে চাই: y=mx+b
mx+b=y
আমি বলব যে এই সমীকরণটি একটি সাধারণ রৈখিক প্রতিরোধের উদাহরণ। আমি তখন ব্যাখ্যা করব যে কীভাবে আপনি (বা কোনও কম্পিউটার) ডেটা পয়েন্টের একটি বিক্ষিপ্ত প্লটের সাথে এই সমীকরণটি ফিট করতে পারেন, যেমন এই চিত্রটিতে প্রদর্শিত মত:
আমি বলব যে এখানে, আমরা যে জীবের অধ্যয়ন করছি তার বয়সটি আমরা এটি কত বড় তা অনুমান করতে ব্যবহার করছি এবং ফলস্বরূপ লিনিয়ার রিগ্রেশন সমীকরণ যেটি আমরা পেয়েছি (চিত্রটিতে দেখানো হয়েছে) অনুমান করতে ব্যবহার করা যেতে পারে যে জীবটি কত বড় আমরা যদি তার বয়স জানি।
mx+b=y
তারপরে আমি আবার ব্যাখ্যা করব যে এটি একটি সাধারণ লিনিয়ার রিগ্রেশন সমীকরণের একটি উদাহরণ এবং এখানে আরও জটিল বিভিন্ন প্রকার রয়েছে। উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন নামে পরিচিত বিভিন্ন ক্ষেত্রে y এর কেবলমাত্র 1 বা 0 এর হতে পারে। আপনি যদি "হ্যাঁ" বা "না" উত্তরটি ভবিষ্যদ্বাণী করতে চেষ্টা করেন তবে কারওর কোনও রোগ আছে কিনা তা যেমন কেউ এই ধরণের মডেলটি ব্যবহার করতে চাইতে পারেন। আর একটি বিশেষ বৈচিত্র্য হ'ল পোইসন রিগ্রেশন নামে পরিচিত যা "গণনা" বা "ইভেন্ট" ডেটা বিশ্লেষণ করতে ব্যবহৃত হয় (সত্যই প্রয়োজন না হলে আমি এর মধ্যে আরও কিছু জানাতে চাই না)।
আমি তখন ব্যাখ্যা করব যে লিনিয়ার রিগ্রেশন, লজিস্টিক রিগ্রেশন এবং পইসন রিগ্রেশন আসলেই আরও সাধারণ পদ্ধতির সমস্ত বিশেষ উদাহরণ, এটি একটি "জেনারালাইজড লিনিয়ার মডেল" নামে পরিচিত। "জেনারালাইজড লিনিয়ার মডেলগুলি" সম্পর্কে দুর্দান্ত জিনিসটি হ'ল তারা আমাদের "প্রতিক্রিয়া" ডেটা ব্যবহার করার অনুমতি দেয় যা কোনও মূল্য নিতে পারে (যেমন কোনও জীব রৈখিক প্রতিরোধে কত বড়) যেমন নিতে পারে, কেবল 1 এর বা 0 এর (যেমন কারও কাছে আছে বা নেই) লজিস্টিক রিগ্রেশন রোগ), বা পৃথক গণনা গ্রহণ (পয়সন রিগ্রেশন ইভেন্ট সংখ্যা হিসাবে)।
আমি তখন বলব যে এই ধরণের সমীকরণগুলিতে x এর (ভবিষ্যদ্বাণীকারী) y এর (প্রতিক্রিয়াগুলি) সাথে এমন কিছু সংযুক্ত থাকে যা পরিসংখ্যানবিদরা "লিঙ্ক ফাংশন" বলে। আমরা এই "লিঙ্ক ফাংশনগুলি" ব্যবহার করি সেই ক্ষেত্রে উদাহরণস্বরূপ যেগুলি x এর লিনিয়ার পদ্ধতিতে y এর সাথে সম্পর্কিত নয়।
যাইহোক, এই বিষয়গুলিতে আমার দুটি সেন্ট! হতে পারে আমার প্রস্তাবিত ব্যাখ্যাটি কিছুটা হোকি এবং বোবা লাগছে, তবে এই অনুশীলনের উদ্দেশ্য যদি কেবল শ্রোতাদের কাছে "সংক্ষেপ" পাওয়া যায় তবে সম্ভবত এর মতো ব্যাখ্যা খুব খারাপ নয়। আমি মনে করি যে ধারণাটি একটি স্বজ্ঞাত উপায়ে ব্যাখ্যা করা উচিত এবং আপনি "এলোমেলো উপাদান", "পদ্ধতিগত উপাদান", "লিংক ফাংশন", "নির্ধারক", "লজিট ফাংশন" ইত্যাদি শব্দগুলির চারপাশে ছড়িয়ে দেওয়া এড়ানো উচিত avoid সাধারণ মানুষের জীববিজ্ঞানী বা চিকিত্সকের মতো সত্যিকারের কোনও পরিসংখ্যানগত পটভূমি নেই এমন লোকদের সাথে কথা বলছি, এই শব্দগুলি শুনে তাদের চোখগুলি কেবল জ্বলজ্বল করে চলেছে। সম্ভাব্যতা বিতরণ কী তা তারা জানে না, তারা কখনও কোনও লিঙ্ক ফাংশন শুনেনি, এবং তারা জানে না যে "লজিট" কী
কোনও অ-পরিসংখ্যান দর্শকের কাছে আপনার ব্যাখ্যায় আমি কখন বিভিন্ন ধরণের মডেল ব্যবহার করব সেদিকেও মনোনিবেশ করব। সমীকরণের বাম দিকে আপনাকে কতগুলি ভবিষ্যদ্বাণীকারী অন্তর্ভুক্ত করার অনুমতি দেওয়া হয়েছে সে সম্পর্কে আমি কথা বলতে পারি (আমি দশটি দ্বারা ভাগ করে আপনার নমুনার আকারের চেয়ে বেশি থাম্বের নিয়ম শুনেছি)। ডেটা সহ একটি উদাহরণ স্প্রেড শিট অন্তর্ভুক্ত করা এবং শ্রোতাদের একটি মডেল উত্পন্ন করার জন্য কীভাবে একটি পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার প্যাকেজ ব্যবহার করতে হয় তা দর্শকদের বোঝাতেও ভাল লাগবে। আমি তখন ধাপে ধাপে model মডেলটির আউটপুটটি নিয়ে যাব এবং সমস্ত বর্ণ এবং সংখ্যাগুলির অর্থ কী তা বোঝানোর চেষ্টা করব। জীববিজ্ঞানীরা এই জিনিস সম্পর্কে অজ্ঞাতসারে এবং এসপিএসএসের জিইউআইয়ের পিছনে গণিতের উপলব্ধি করার পরিবর্তে কী পরীক্ষাটি ব্যবহার করতে হবে তা জানতে আগ্রহী!
আমি আমার প্রস্তাবিত ব্যাখ্যা সম্পর্কিত কোনও মন্তব্য বা পরামর্শের প্রশংসা করব, বিশেষত যদি কেউ ত্রুটিগুলি নোট করে বা ব্যাখ্যা করার জন্য আরও ভাল উপায়ের কথা চিন্তা করে!