পরিসংখ্যানগত পরীক্ষা ডেটা থেকে অনুমান করার জন্য, এটি আপনাকে কীভাবে সম্পর্কিত তা বলে tells ফলাফলটি এমন একটি যা বাস্তব-বিশ্বের অর্থ আছে has যেমন ধূমপান কীভাবে ফুসফুসের ক্যান্সারের সাথে সম্পর্কিত, দিক এবং প্রস্থ উভয় ক্ষেত্রেই। এটি এখনও কেন আপনাকে ঘটে তা বলে না। কেন ঘটনাটি ঘটেছে তার উত্তর দেওয়ার জন্য, আমাদের অন্যান্য ভেরিয়েবলগুলির সাথে আন্তঃসম্পর্কতাও বিবেচনা করতে হবে এবং যথাযথ সামঞ্জস্য করা উচিত (পার্ল, জে। (2003) কার্যকারিতা: মডেলস, কারণ, এবং তথ্য)।
তত্ত্বাবধানে পড়াশোনা ভবিষ্যদ্বাণী করার জন্য, এটি আপনাকে কী ঘটবে তা বলে। উদাহরণস্বরূপ একজন ব্যক্তির ধূমপানের স্থিতি দেওয়া, আমরা অনুমান করতে পারি যে তার ফুসফুসের ক্যান্সার হবে কিনা। সাধারণ ক্ষেত্রে এটি এখনও আপনাকে "কীভাবে" বলে, উদাহরণস্বরূপ অ্যালগরিদম দ্বারা চিহ্নিত ধূমপানের স্থিতির কাট অফ দেখে। তবে আরও জটিল মডেলগুলি ব্যাখ্যা করা কঠিন বা অসম্ভব (অনেকগুলি বৈশিষ্ট্য সহ গভীর শিক্ষণ / উত্সাহ দেওয়া)।
উপরোক্ত দু'জনের সুবিধার্থে প্রায়শই নিরীক্ষণযোগ্য শিক্ষণ ব্যবহৃত হয়।
- পরিসংখ্যানগত পরীক্ষার জন্য, ডেটা (ক্লাস্টারিং) এর কিছু অজানা অন্তর্নিহিত সাবগ্রুপগুলি আবিষ্কার করে আমরা ভেরিয়েবলের মধ্যে সংঘবদ্ধতাগুলিতে ভিন্নতা নির্ধারণ করতে পারি। উদাহরণস্বরূপ ধূমপান এ সাবগ্রুপ এ এর জন্য নয় তবে ফুসফুসের ক্যান্সারের অসুবিধা বাড়িয়ে তোলে কিন্তু বি সাবগ্রুপ বি not
- তত্ত্বাবধানে শেখার জন্য, আমরা পূর্বাভাসের সঠিকতা এবং দৃust়তা উন্নত করতে নতুন বৈশিষ্ট্য তৈরি করতে পারি। যেমন উপগোষ্ঠীগুলি (ক্লাস্টারিং) বা বৈশিষ্ট্যগুলির সংমিশ্রণগুলি (মাত্রা হ্রাস) যা ফুসফুসের ক্যান্সারের সমস্যাগুলির সাথে সম্পর্কিত by
বৈশিষ্ট্য / ভেরিয়েবলের সংখ্যা যখন বড় হয়, তখন পরিসংখ্যান পরীক্ষার এবং তত্ত্বাবধানে শিক্ষার মধ্যে পার্থক্য আরও সুস্পষ্ট হয়ে যায়। পরিসংখ্যানগত পরীক্ষা অগত্যা এ থেকে উপকৃত হতে পারে না, এটি উদাহরণস্বরূপ নির্ভর করে যে আপনি অন্য কারণগুলির জন্য নিয়ন্ত্রণ করে বা উপরে বর্ণিত সংঘগুলিতে ভিন্নধর্ম চিহ্নিতকরণের মাধ্যমে কার্যকারণকে বিবেচনা করতে চান কিনা তা নির্ভর করে। বৈশিষ্ট্যগুলি প্রাসঙ্গিক হলে তত্ত্বাবধানে পড়াশুনা আরও ভাল সম্পাদন করবে এবং এটি আরও একটি ব্ল্যাকবক্সের মতো হয়ে যাবে।
যখন নমুনার সংখ্যাটি বড় হয়, আমরা পরিসংখ্যান পরীক্ষার জন্য আরও সুনির্দিষ্ট ফলাফল, তদারকি শিক্ষার জন্য আরও সঠিক ফলাফল এবং আনসারভিজড শিক্ষার জন্য আরও দৃ rob় ফলাফল পেতে পারি। তবে এটি ডেটার মানের উপর নির্ভর করে। খারাপ মানের ডেটা ফলাফলের প্রতি পক্ষপাত বা শব্দ প্রবর্তন করতে পারে।
কখনও কখনও আমরা জানতে চাই যে "কীভাবে" এবং "কেন" হস্তক্ষেপমূলক ক্রিয়াকলাপগুলি অবহিত করতে, যেমন ধূমপানের ফলে ফুসফুস ক্যান্সারের কারণ হয় তা চিহ্নিত করে নীতিমালা তৈরি করা যেতে পারে। কখনও কখনও আমরা সিদ্ধান্ত গ্রহণে অবহিত করতে "কী" জানতে চাই, উদাহরণস্বরূপ কার ফুসফুসের ক্যান্সার হওয়ার সম্ভাবনা রয়েছে তা খুঁজে বের করে তাদের প্রাথমিক চিকিত্সা দেওয়ার জন্য। ভবিষ্যদ্বাণী এবং এর সীমাবদ্ধতা সম্পর্কে বিজ্ঞানের উপর একটি বিশেষ সমস্যা প্রকাশিত হয়েছে ( http://s विज्ञान.sciencemag.org/content/355/6324/468)। "সাফল্য সবচেয়ে ধারাবাহিকভাবে অর্জিত হয়েছে বলে মনে হয় যখন প্রশ্নগুলি বহুবিজ্ঞানমূলক প্রচেষ্টাতে মোকাবেলা করা হয় যা ডেটা টেরাবাইট হ্যান্ডেল করার জন্য অ্যালগোরিদমিক ক্ষমতার সাথে প্রসঙ্গের মানবিক বোধের সাথে যোগ দেয়।" আমার মতে, উদাহরণস্বরূপ, হাইপোথিসিস পরীক্ষার সাহায্যে আবিষ্কার করা জ্ঞান আমাদের অবহিত করে তদারকি শেখায় সহায়তা করতে পারে আমাদের প্রথমে কোন ডেটা / বৈশিষ্ট্যগুলি সংগ্রহ করা উচিত। অন্যদিকে তত্ত্বাবধানে থাকা শিক্ষাগুলি কোন চলকগুলি অবহিত করে হাইপোথেসিগুলি তৈরি করতে সহায়তা করতে পারে