আইএমএইচও-তে কোনও আনুষ্ঠানিক পার্থক্য নেই যা মেশিন লার্নিং এবং ডেটাতে ফিটিং মডেলের মৌলিক স্তরে পরিসংখ্যানকে পৃথক করে। মডেলগুলির পছন্দের ক্ষেত্রে সাংস্কৃতিক পার্থক্য থাকতে পারে, উপাত্তে ফিটিং মডেলগুলির উদ্দেশ্য এবং কারও কাছে ব্যাখ্যার প্রসার থাকতে পারে।
সাধারণ উদাহরণগুলিতে আমি আমাদের সবসময় থাকতে পারি তা ভাবতে পারি
- কিছু সূচী সেট জন্য জন্য মডেলগুলির সংকলন ,Mii∈II
- এবং প্রতিটি জন্য একটি অজানা উপাদান মডেল (পরামিতি, অসীম মাত্রিক হতে পারে) ।iθiMi
জুতসই ডেটাতে প্রায় সবসময় একটি গাণিতিক অপ্টিমাইজেশান অজানা উপাদানের অনুকূল পছন্দ খোঁজার গঠিত সমস্যা করতে কিছু প্রিয় ফাংশন দ্বারা মাপা তথ্য মাপসই করা হবে।MiθiMi
মডেলগুলির মধ্যে নির্বাচন কম মানসম্পন্ন, এবং বিভিন্ন কৌশল উপলব্ধ। যদি মডেল ফিটিংয়ের উদ্দেশ্যটি বিশুদ্ধভাবে ভবিষ্যদ্বাণীপূর্ণ হয়, তবে মডেল নির্বাচনটি ভাল ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্স পাওয়ার প্রয়াসের সাথে সম্পন্ন করা হয়, যদিও প্রাথমিক উদ্দেশ্যটি যদি ফলাফলগুলির মডেলগুলির ব্যাখ্যার উদ্দেশ্যে হয়, তবে আরও সহজে ব্যাখ্যাযোগ্য মডেলগুলি অন্য মডেলের তুলনায় নির্বাচন করা যেতে পারে যদিও তাদের ভবিষ্যদ্বাণীমূলক শক্তি খারাপ হতে পারে বলে আশা করা হচ্ছে।Mi
পুরানো স্কুল পরিসংখ্যানগত মডেল নির্বাচন বলা যেতে পারে যা পরিসংখ্যান পরীক্ষার উপর ভিত্তি করে সম্ভবত ধাপ অনুসারে নির্বাচন কৌশলগুলির সাথে মিলিত হয়, অন্যদিকে মেশিন লার্নিং মডেল নির্বাচন সাধারণত প্রত্যাশিত সাধারণীকরণ ত্রুটির দিকে মনোনিবেশ করে, যা প্রায়শই ক্রস-বৈধতা ব্যবহার করে অনুমান করা হয়। মডেল নির্বাচনের বর্তমান বিকাশ এবং বোঝাপড়াগুলি অবশ্য আরও সাধারণ জমিনের দিকে রূপান্তরিত বলে মনে হচ্ছে উদাহরণস্বরূপ, মডেল নির্বাচন এবং মডেল গড় ।
মডেল থেকে কার্যকারিতা ferringোকানো
বিষয়টির মূর্খতা কীভাবে আমরা একটি মডেলকে ব্যাখ্যা করতে পারি? যদি প্রাপ্ত ডেটাগুলি সাবধানতার সাথে ডিজাইন করা পরীক্ষার থেকে থাকে এবং মডেলটি পর্যাপ্ত হয় তবে এটি প্রশংসনীয় যে আমরা মডেলটিতে একটি পরিবর্তনশীল পরিবর্তনের প্রভাবকে কার্যকারণ হিসাবে ব্যাখ্যা করতে পারি, এবং যদি আমরা পরীক্ষার পুনরাবৃত্তি করি এবং এই নির্দিষ্ট পরিবর্তনশীলটিতে হস্তক্ষেপ করি আমরা আনুমানিক প্রভাব পর্যবেক্ষণ আশা করতে পারি। যদি যাইহোক, ডেটা পর্যবেক্ষণমূলক হয় তবে আমরা আশা করতে পারি না যে মডেলটিতে আনুমানিক প্রভাবগুলি পর্যবেক্ষণযোগ্য হস্তক্ষেপের প্রভাবের সাথে মিলিত হয়। এটির জন্য মডেলটি "মেশিন লার্নিং মডেল" বা "শাস্ত্রীয় পরিসংখ্যানের মডেল" নির্বিশেষে অতিরিক্ত অনুমানের প্রয়োজন হবে।
এটি হতে পারে যে লোকেদের অবিচ্ছিন্ন প্যারামিটার অনুমান এবং প্রভাবের আকারের ব্যাখ্যাগুলিকে কেন্দ্র করে ক্লাসিক্যাল স্ট্যাটিস্টিকাল মডেলগুলি ব্যবহার করার প্রশিক্ষণ দেওয়া লোকেরা এই ধারণাটি বোধ করেন যে কোনও মেশিন লার্নিং ফ্রেমওয়ার্কের চেয়ে কার্যকারণীয় ব্যাখ্যাটি এই কাঠামোটিতে আরও বৈধ। আমি বলব এটা হয় না।
পরিসংখ্যানগুলিতে কার্যকারণ নির্ধারণের ক্ষেত্রটি সমস্যাটি সত্যিই সরিয়ে দেয় না, তবে এটি অনুমানগুলি তৈরি করে যে কার্যকারণ উপসংহারগুলি সুস্পষ্টভাবে বিশ্রামে। এগুলি অকেটেবল অনুমান হিসাবে চিহ্নিত করা হয় । পরিসংখ্যানগুলিতে কাগজটি কার্যকারণের অনুক্রম: জুডিয়া পার্লের একটি সংক্ষিপ্ত বিবরণ পড়ার জন্য একটি ভাল কাগজ। কার্যকারণ অনুমানের একটি প্রধান অবদান হ'ল অনুমানের অধীনে কার্যকারণ প্রভাবের অনুমানের জন্য পদ্ধতিগুলি সংগ্রহ যেখানে প্রকৃতপক্ষে অরক্ষিত কনফন্ডার রয়েছে, যা অন্যথায় একটি বড় উদ্বেগ। উপরের পার্ল পেপারে বিভাগ 3.3 দেখুন See মার্ডিনাল স্ট্রাকচারাল মডেলস এবং এপিডেমিওলজিতে কার্যকারণ সূচী পত্রিকায় আরও উন্নত উদাহরণ পাওয়া যাবে ।
অচিরাচরিত অনুমানগুলি ধরে রাখে কি না এটি একটি বিষয় বিষয়। এগুলি স্পষ্টতই অকেটযোগ্য কারণ আমরা তাদের ডেটা ব্যবহার করে পরীক্ষা করতে পারি না। অনুমানকে ন্যায়সঙ্গত করার জন্য অন্যান্য যুক্তি প্রয়োজন।
যেখানে মেশিন লার্নিং এবং কার্যকারণ সূচনাটি মিলিত হয় তার উদাহরণ হিসাবে, মার্ক ভ্যান ডার লান এবং ড্যানিয়েল রুবিন দ্বারা লক্ষ্যযুক্ত সর্বাধিক সম্ভাবনা শিক্ষার উপস্থাপিত লক্ষ্যযুক্ত সর্বাধিক সম্ভাবনার অনুমানের ধারণাগুলি সাধারণত "টার্গেটিংয়ের পরে নন-প্যারামেট্রিক অনুমানের জন্য মেশিন লার্নিং কৌশলগুলি কাজে লাগায়" "আগ্রহের প্যারামিটারের দিকে। পরেরটি কার্যকারণীয় ব্যাখ্যার সাথে খুব ভাল পরামিতি হতে পারে। সুপার লার্নারে ধারণাআগ্রহের পরামিতিগুলির অনুমানের জন্য মেশিন লার্নিং কৌশলগুলিতে প্রচুর নির্ভর করতে হয়। এটি মার্ক ভ্যান ডার লানের (ব্যক্তিগত যোগাযোগ) একটি গুরুত্বপূর্ণ বিষয় যে শাস্ত্রীয়, সাধারণ এবং "ব্যাখ্যাযোগ্য" পরিসংখ্যানের মডেলগুলি প্রায়শই ভুল হয়, যা পক্ষপাতদুষ্ট অনুমানকারী এবং অনুমানের অনিশ্চয়তার খুব আশাবাদী মূল্যায়নের দিকে পরিচালিত করে।