বায়োমেডিকাল গবেষণায় সাধারণত আমরা একটি প্রশিক্ষণ সেট ব্যবহার করি না --- আমরা কেবলমাত্র ফলাফলের দিকে তাকিয়ে রয়েছি ফলাফলগুলি কী কী ঝুঁকিপূর্ণ কারণগুলি তা দেখার জন্য সম্পূর্ণ ডেটাসেটে লজিস্টিক রিগ্রেশন প্রয়োগ করি; বা ফলাফলের উপর সম্ভাব্য অন্যান্য ভবিষ্যদ্বাণীকারীদের প্রভাবের জন্য নিয়ন্ত্রণ করার সময় আগ্রহের একজন ভবিষ্যদ্বাণীকের দিকে নজর দেওয়া।
প্রান্তিক মানগুলি দ্বারা আপনি কী বোঝাতে চাইছেন তা আমি নিশ্চিত নই, তবে বিভিন্ন পরামিতি রয়েছে যা যে কেউ অনুকূলিত করতে চাইতে পারে: এউসি, ধারাবাহিক প্রেডিকটার ভেরিয়েবল, ধনাত্মক এবং নেতিবাচক ভবিষ্যদ্বাণীমূলক মান, আত্মবিশ্বাসের ব্যবধান এবং পি-মানগুলি, মিথ্যা ধনাত্মক এবং মিথ্যা নেতিবাচক হার। লজিস্টিক রিগ্রেশন বিষয়গুলির একটি জনসংখ্যার দিকে নজর দেয় এবং সেই জনসংখ্যার আগ্রহের ফলাফলকে অবদান রাখার ঝুঁকির কারণগুলির কার্যকারিতা এবং কার্যকারিতা পরিচালনা করে। "বিপরীতে এটি চালানো" এটিও সম্ভব, যাতে কথা বলা এবং পৃথক ব্যক্তির যে ঝুঁকির কারণ রয়েছে তার কারণে ব্যক্তির ফলাফলের ঝুঁকি নির্ধারণ করা যায়। লজিস্টিক রিগ্রেশন প্রতিটি স্বতন্ত্র ঝুঁকির উপর ভিত্তি করে ফলাফলের ঝুঁকি নিযুক্ত করে এবং ডিফল্টরূপে এটি 0.5 হয়। যদি একটি বিষয় ' ফলাফল হওয়ার সম্ভাবনা (আপনার মডেলের সমস্ত ডেটা এবং বিষয়গুলির উপর ভিত্তি করে) 0.5 বা তার বেশি, এটি ভবিষ্যদ্বাণী করে যে তার ফলাফল হবে; যদি 0.5 এর নিচে থাকে তবে ভবিষ্যদ্বাণী করে যে সে করবে না। তবে আপনি এই কাটঅফ স্তরটি সামঞ্জস্য করতে পারেন, উদাহরণস্বরূপ আরও বেশি ব্যক্তির পতাকা তুলতে যারা পরিণতি হওয়ার ঝুঁকি নিয়ে থাকতে পারে, তবুও মডেলটির দ্বারা আরও মিথ্যা ইতিবাচক হওয়ার পূর্বে এমনটি বলা যেতে পারে। কোন ব্যক্তিকে আরও মেডিকেল ফলোআপ গ্রহণের পরামর্শ দেওয়া হবে উদাহরণস্বরূপ, ভবিষ্যদ্বাণী করতে স্ক্রিনিংয়ের সিদ্ধান্তগুলি অনুকূল করতে আপনি এই কাট অফ স্তরটি সামঞ্জস্য করতে পারেন; এবং লজিস্টিক রিগ্রেশন মডেলের উপর ভিত্তি করে আপনার ইতিবাচক ভবিষ্যদ্বাণীমূলক মান, negativeণাত্মক ভবিষ্যদ্বাণীমূলক মান এবং মিথ্যা নেতিবাচক এবং মিথ্যা ধনাত্মক হারগুলি তৈরি করতে। আপনি আপনার অর্ধেক ডেটাসেটে মডেলটি বিকাশ করতে পারেন এবং অন্য অর্ধে এটি পরীক্ষা করতে পারেন, তবে আপনি ' আসলেই তা করতে হবে (এবং এটি করার ফলে আপনার 'প্রশিক্ষণ' তথ্য অর্ধেক কেটে যাবে এবং এভাবে মডেলটিতে উল্লেখযোগ্য ভবিষ্যদ্বাণীকারীদের সন্ধান করার ক্ষমতা হ্রাস পাবে)। সুতরাং হ্যাঁ, আপনি 'শেষ পর্যন্ত পুরো বিষয়টিকে প্রশিক্ষণ দিতে পারেন'। অবশ্যই, বায়োমেডিকাল গবেষণায়, আপনি এটিকে অন্য জনসংখ্যার ভিত্তিতে বৈধ করতে চান, আপনার ফলাফলকে আরও ব্যাপক জনসংখ্যায় সাধারণীকরণ করা যেতে পারে বলে আগে সেট করা অন্য একটি ডেটা। আরেকটি পদ্ধতি হ'ল বুটস্ট্র্যাপিং-টাইপ পদ্ধতির ব্যবহার যেখানে আপনি আপনার অধ্যয়নের জনসংখ্যার একটি নমুনায় আপনার মডেল চালান, তারপরে সেই বিষয়গুলিকে পুনরায় পুলের মধ্যে প্রতিস্থাপন করুন এবং আরও একটি নমুনা দিয়ে পুনরাবৃত্তি করুন, বহুবার (সাধারণত 1000 বার)। যদি আপনি উল্লেখযোগ্য ফলাফলগুলি সময় নির্ধারিত সিংহভাগ (যেমন 95% সময়) পান তবে আপনার মডেলটি বৈধ হিসাবে বিবেচিত হতে পারে --- কমপক্ষে আপনার নিজের ডেটাতে। তবে আবার, আপনি যে মডেলটি চালাবেন তার অল্প অধ্যয়ন জনসংখ্যা, কম সম্ভাবনা হ'ল কিছু ভবিষ্যদ্বাণীকারী ফলাফলের জন্য পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ঝুঁকির কারণ হয়ে উঠবেন। সীমিত সংখ্যক অংশগ্রহণকারীদের সাথে বায়োমেডিকাল অধ্যয়নের জন্য এটি বিশেষত সত্য।
আপনার মডেলের অর্ধেকটি আপনার মডেলকে 'প্রশিক্ষণ' দিতে এবং তারপরে অন্য অর্ধে এটি 'বৈধকরণ' করা একটি অপ্রয়োজনীয় বোঝা। আপনি টি-টেস্ট বা লিনিয়ার রিগ্রেশনের জন্য এটি করেন না, তবে কেন এটি লজিস্টিক রিগ্রেশন হয়? সর্বাধিক এটি করবে আপনাকে বলতে হবে 'হ্যাঁ এটি কাজ করে' তবে আপনি যদি আপনার সম্পূর্ণ ডেটাसेट ব্যবহার করেন তবে আপনি যেভাবেই নির্ধারণ করুন। আপনার ডেটাটি ছোট ডেটাশে বিভক্ত করা অধ্যয়ন জনসংখ্যার (বা বৈধকরণের জনসংখ্যা) উল্লেখযোগ্য ঝুঁকির কারণগুলি সনাক্ত না করার ঝুঁকিকে চালিত করে যখন তারা বাস্তবে উপস্থিত থাকে, ছোট নমুনার আকারের কারণে, আপনার অধ্যয়নের আকারের জন্য অনেক বেশি ভবিষ্যদ্বাণীকারী এবং সম্ভাবনা আপনার 'বৈধতা নমুনা' সুযোগ থেকে কোনও সমিতি দেখায় না। 'ট্রেন তারপরে বৈধতা দিন' পদ্ধতির পিছনে যুক্তি মনে হয় যে আপনি যে ঝুঁকির কারণগুলি উল্লেখযোগ্য হিসাবে চিহ্নিত করেছেন তা যদি যথেষ্ট শক্ত না হয়, তখন এগুলি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ হবে না যখন আপনার কিছু এলোমেলোভাবে নির্বাচিত অর্ধেকের মডেল করা হয়। তবে এলোমেলোভাবে নির্বাচিত নমুনাটি কেবলমাত্র সুযোগ অনুসারে কোনও সংযোগ না দেখানোর কারণ হতে পারে, বা ঝুঁকি ফ্যাক্টরের পক্ষে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া খুব সামান্য। তবে এটি ঝুঁকি বিষয়ক (গুলি) এর পরিধি এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং এজন্য আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে। আপনার কিছু এলোমেলোভাবে নির্বাচিত অর্ধেকের মডেলিং করার সময় পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হবেন না। তবে এলোমেলোভাবে নির্বাচিত নমুনাটি কেবলমাত্র সুযোগ অনুসারে কোনও সংযোগ না দেখানোর কারণ হতে পারে, বা ঝুঁকি ফ্যাক্টরের পক্ষে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া খুব সামান্য। তবে এটি ঝুঁকি বিষয়ক (গুলি) এর পরিধি এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং এজন্য আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে। আপনার কিছু এলোমেলোভাবে নির্বাচিত অর্ধেকের মডেলিং করার সময় পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হবেন না। তবে এলোমেলোভাবে নির্বাচিত নমুনাটি কেবলমাত্র সুযোগ অনুসারে কোনও সংযোগ না দেখানোর কারণ হতে পারে, বা ঝুঁকি ফ্যাক্টরের পক্ষে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া খুব সামান্য। তবে এটি ঝুঁকি বিষয়ক (গুলি) এর পরিধি এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং এজন্য আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে। তবে এলোমেলোভাবে নির্বাচিত নমুনাটি কেবলমাত্র সুযোগ অনুসারে কোনও সংযোগ না দেখানোর কারণ হতে পারে, বা ঝুঁকি ফ্যাক্টরের পক্ষে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া খুব সামান্য। তবে এটি ঝুঁকি বিষয়ক (গুলি) এর পরিধি এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং এজন্য আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে। তবে এলোমেলোভাবে নির্বাচিত নমুনাটি কেবলমাত্র সুযোগ অনুসারে কোনও সংযোগ না দেখানোর কারণ হতে পারে, বা ঝুঁকি ফ্যাক্টরের পক্ষে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া খুব সামান্য। তবে এটি ঝুঁকি বিষয়ক (গুলি) এর পরিধি এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং এজন্য আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে। ঝুঁকি ফ্যাক্টরের (ও) এর তাত্পর্য এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং সেই কারণে আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে। ঝুঁকি ফ্যাক্টরের (ও) এর তাত্পর্য এবং তাদের পরিসংখ্যানগত তাত্পর্য যা তাদের গুরুত্ব নির্ধারণ করে এবং সেই কারণে আপনার মডেলটি তৈরি করতে আপনার সম্পূর্ণ ডেটাসেট ব্যবহার করা ভাল। পরিসংখ্যানগত তাত্পর্য ছোট নমুনা মাপের সাথে কম তাৎপর্যপূর্ণ হয়ে উঠবে, কারণ এটি বেশিরভাগ পরিসংখ্যানগত পরীক্ষার সাথে হয়। লজিস্টিক রিগ্রেশন করা কোনও পরিসংখ্যান বিজ্ঞানের মতোই একটি শিল্প। আপনার অধ্যয়নের নকশার উপর নির্ভর করে অনুকূলকরণের জন্য বিভিন্ন পদ্ধতি এবং বিভিন্ন প্যারামিটার রয়েছে।