কার্যকারিতা বোঝার জন্য মেশিন লার্নিং কি কম কার্যকর, এইভাবে সামাজিক বিজ্ঞানের পক্ষে কম আকর্ষণীয়?


42

মেশিন লার্নিং / অন্যান্য পরিসংখ্যানমূলক ভবিষ্যদ্বাণীমূলক কৌশলগুলির মধ্যে আমার পার্থক্য সম্পর্কে বনাম। সামাজিক বিজ্ঞানীরা (উদাহরণস্বরূপ, অর্থনীতিবিদ) যে ধরণের পরিসংখ্যান ব্যবহার করেন তা হ'ল অর্থনীতিবিদরা একক বা একাধিক ভেরিয়েবলের প্রভাব বোঝার জন্য খুব আগ্রহী বলে মনে করেন - উভয় ক্ষেত্রেই পরিধি এবং সম্পর্ক কার্যকরী কিনা তা সনাক্ত করা। এর জন্য, আপনি নিজের সম্পর্কে পরীক্ষামূলক এবং অর্ধ-পরীক্ষামূলক পদ্ধতি ইত্যাদি দিয়ে শেষ করেন

মেশিন লার্নিং বা স্ট্যাটিস্টিকাল মডেলিং যা ভবিষ্যদ্বাণীমূলক হয় প্রায়শই পুরোপুরি এই দিকটিকে অবহেলা করে এবং অনেক ক্ষেত্রে আপনাকে একটি নির্দিষ্ট ডিগ্রি দেয় না যা একটি ভেরিয়েবল ফলাফলকে প্রভাবিত করে (লগজিট এবং প্রবিট উভয়ই করে না)।

একটি সম্পর্কিত প্রশ্ন হ'ল নতুন ডোমেনগুলির পূর্বাভাস দেওয়ার সময় তাত্ত্বিকভাবে অনুপ্রাণিত অর্থনৈতিক বা আচরণগত মডেলগুলির কতটুকু নাস্তিক্য মডেলগুলির চেয়ে সুবিধা রয়েছে? কোনও মেশিন লার্নিং বা ভবিষ্যদ্বাণী-ভিত্তিক পরিসংখ্যানবিদ এই সমালোচনাকে কী বলবেন যে কোনও অর্থনৈতিক মডেল ব্যতীত আপনি কোয়ারিয়েটগুলি খুব আলাদা ছিল এমন নতুন নমুনাগুলির সঠিকভাবে পূর্বাভাস দিতে সক্ষম হবেন না।

আমি সমস্ত দৃষ্টিকোণ থেকে মানুষ এটি গ্রহণ শুনে সত্যিই খুশি হব।


প্রশ্ন। আপনি কি 'নাস্তিকের মডেলগুলি' লিখতে চেয়েছিলেন, এবং যদি তাই হয় তবে এর অর্থ কী? অথবা আপনি কেবল 'তাত্ত্বিক' বোঝাতে চেয়েছিলেন?
ফাহিম মিঠা

2
আপনি সম্ভবত জেনেরেটভ বনাম বৈষম্যমূলক মডেলগুলির দিকে তাকিয়ে আছেন? মেশিন লার্নিং বৈষম্যমূলক মডেল এবং কৌশলগুলির দিকে ঝুঁকছে।
ওয়েইন

@ ফাহিমমিথা: 'অ্যাথোরেটিক্যাল': তত্ত্ব ছাড়াই।
naught101

উত্তর:


32

আইএমএইচও-তে কোনও আনুষ্ঠানিক পার্থক্য নেই যা মেশিন লার্নিং এবং ডেটাতে ফিটিং মডেলের মৌলিক স্তরে পরিসংখ্যানকে পৃথক করে। মডেলগুলির পছন্দের ক্ষেত্রে সাংস্কৃতিক পার্থক্য থাকতে পারে, উপাত্তে ফিটিং মডেলগুলির উদ্দেশ্য এবং কারও কাছে ব্যাখ্যার প্রসার থাকতে পারে।

সাধারণ উদাহরণগুলিতে আমি আমাদের সবসময় থাকতে পারি তা ভাবতে পারি

  • কিছু সূচী সেট জন্য জন্য মডেলগুলির সংকলন ,MiiII
  • এবং প্রতিটি জন্য একটি অজানা উপাদান মডেল (পরামিতি, অসীম মাত্রিক হতে পারে) ।iθiMi

জুতসই ডেটাতে প্রায় সবসময় একটি গাণিতিক অপ্টিমাইজেশান অজানা উপাদানের অনুকূল পছন্দ খোঁজার গঠিত সমস্যা করতে কিছু প্রিয় ফাংশন দ্বারা মাপা তথ্য মাপসই করা হবে।MiθiMi

মডেলগুলির মধ্যে নির্বাচন কম মানসম্পন্ন, এবং বিভিন্ন কৌশল উপলব্ধ। যদি মডেল ফিটিংয়ের উদ্দেশ্যটি বিশুদ্ধভাবে ভবিষ্যদ্বাণীপূর্ণ হয়, তবে মডেল নির্বাচনটি ভাল ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্স পাওয়ার প্রয়াসের সাথে সম্পন্ন করা হয়, যদিও প্রাথমিক উদ্দেশ্যটি যদি ফলাফলগুলির মডেলগুলির ব্যাখ্যার উদ্দেশ্যে হয়, তবে আরও সহজে ব্যাখ্যাযোগ্য মডেলগুলি অন্য মডেলের তুলনায় নির্বাচন করা যেতে পারে যদিও তাদের ভবিষ্যদ্বাণীমূলক শক্তি খারাপ হতে পারে বলে আশা করা হচ্ছে।Mi

পুরানো স্কুল পরিসংখ্যানগত মডেল নির্বাচন বলা যেতে পারে যা পরিসংখ্যান পরীক্ষার উপর ভিত্তি করে সম্ভবত ধাপ অনুসারে নির্বাচন কৌশলগুলির সাথে মিলিত হয়, অন্যদিকে মেশিন লার্নিং মডেল নির্বাচন সাধারণত প্রত্যাশিত সাধারণীকরণ ত্রুটির দিকে মনোনিবেশ করে, যা প্রায়শই ক্রস-বৈধতা ব্যবহার করে অনুমান করা হয়। মডেল নির্বাচনের বর্তমান বিকাশ এবং বোঝাপড়াগুলি অবশ্য আরও সাধারণ জমিনের দিকে রূপান্তরিত বলে মনে হচ্ছে উদাহরণস্বরূপ, মডেল নির্বাচন এবং মডেল গড়

মডেল থেকে কার্যকারিতা ferringোকানো

বিষয়টির মূর্খতা কীভাবে আমরা একটি মডেলকে ব্যাখ্যা করতে পারি? যদি প্রাপ্ত ডেটাগুলি সাবধানতার সাথে ডিজাইন করা পরীক্ষার থেকে থাকে এবং মডেলটি পর্যাপ্ত হয় তবে এটি প্রশংসনীয় যে আমরা মডেলটিতে একটি পরিবর্তনশীল পরিবর্তনের প্রভাবকে কার্যকারণ হিসাবে ব্যাখ্যা করতে পারি, এবং যদি আমরা পরীক্ষার পুনরাবৃত্তি করি এবং এই নির্দিষ্ট পরিবর্তনশীলটিতে হস্তক্ষেপ করি আমরা আনুমানিক প্রভাব পর্যবেক্ষণ আশা করতে পারি। যদি যাইহোক, ডেটা পর্যবেক্ষণমূলক হয় তবে আমরা আশা করতে পারি না যে মডেলটিতে আনুমানিক প্রভাবগুলি পর্যবেক্ষণযোগ্য হস্তক্ষেপের প্রভাবের সাথে মিলিত হয়। এটির জন্য মডেলটি "মেশিন লার্নিং মডেল" বা "শাস্ত্রীয় পরিসংখ্যানের মডেল" নির্বিশেষে অতিরিক্ত অনুমানের প্রয়োজন হবে।

এটি হতে পারে যে লোকেদের অবিচ্ছিন্ন প্যারামিটার অনুমান এবং প্রভাবের আকারের ব্যাখ্যাগুলিকে কেন্দ্র করে ক্লাসিক্যাল স্ট্যাটিস্টিকাল মডেলগুলি ব্যবহার করার প্রশিক্ষণ দেওয়া লোকেরা এই ধারণাটি বোধ করেন যে কোনও মেশিন লার্নিং ফ্রেমওয়ার্কের চেয়ে কার্যকারণীয় ব্যাখ্যাটি এই কাঠামোটিতে আরও বৈধ। আমি বলব এটা হয় না।

পরিসংখ্যানগুলিতে কার্যকারণ নির্ধারণের ক্ষেত্রটি সমস্যাটি সত্যিই সরিয়ে দেয় না, তবে এটি অনুমানগুলি তৈরি করে যে কার্যকারণ উপসংহারগুলি সুস্পষ্টভাবে বিশ্রামে। এগুলি অকেটেবল অনুমান হিসাবে চিহ্নিত করা হয় । পরিসংখ্যানগুলিতে কাগজটি কার্যকারণের অনুক্রম: জুডিয়া পার্লের একটি সংক্ষিপ্ত বিবরণ পড়ার জন্য একটি ভাল কাগজ। কার্যকারণ অনুমানের একটি প্রধান অবদান হ'ল অনুমানের অধীনে কার্যকারণ প্রভাবের অনুমানের জন্য পদ্ধতিগুলি সংগ্রহ যেখানে প্রকৃতপক্ষে অরক্ষিত কনফন্ডার রয়েছে, যা অন্যথায় একটি বড় উদ্বেগ। উপরের পার্ল পেপারে বিভাগ 3.3 দেখুন See মার্ডিনাল স্ট্রাকচারাল মডেলস এবং এপিডেমিওলজিতে কার্যকারণ সূচী পত্রিকায় আরও উন্নত উদাহরণ পাওয়া যাবে ।

অচিরাচরিত অনুমানগুলি ধরে রাখে কি না এটি একটি বিষয় বিষয়। এগুলি স্পষ্টতই অকেটযোগ্য কারণ আমরা তাদের ডেটা ব্যবহার করে পরীক্ষা করতে পারি না। অনুমানকে ন্যায়সঙ্গত করার জন্য অন্যান্য যুক্তি প্রয়োজন।

যেখানে মেশিন লার্নিং এবং কার্যকারণ সূচনাটি মিলিত হয় তার উদাহরণ হিসাবে, মার্ক ভ্যান ডার লান এবং ড্যানিয়েল রুবিন দ্বারা লক্ষ্যযুক্ত সর্বাধিক সম্ভাবনা শিক্ষার উপস্থাপিত লক্ষ্যযুক্ত সর্বাধিক সম্ভাবনার অনুমানের ধারণাগুলি সাধারণত "টার্গেটিংয়ের পরে নন-প্যারামেট্রিক অনুমানের জন্য মেশিন লার্নিং কৌশলগুলি কাজে লাগায়" "আগ্রহের প্যারামিটারের দিকে। পরেরটি কার্যকারণীয় ব্যাখ্যার সাথে খুব ভাল পরামিতি হতে পারে। সুপার লার্নারে ধারণাআগ্রহের পরামিতিগুলির অনুমানের জন্য মেশিন লার্নিং কৌশলগুলিতে প্রচুর নির্ভর করতে হয়। এটি মার্ক ভ্যান ডার লানের (ব্যক্তিগত যোগাযোগ) একটি গুরুত্বপূর্ণ বিষয় যে শাস্ত্রীয়, সাধারণ এবং "ব্যাখ্যাযোগ্য" পরিসংখ্যানের মডেলগুলি প্রায়শই ভুল হয়, যা পক্ষপাতদুষ্ট অনুমানকারী এবং অনুমানের অনিশ্চয়তার খুব আশাবাদী মূল্যায়নের দিকে পরিচালিত করে।


এই অবিশ্বাস্য উত্তরের জন্য ধন্যবাদ ... আমি আপনাকে সরবরাহিত সমস্ত লিঙ্ক অনুসরণ করার প্রত্যাশায় রয়েছি আমার কাছে একটি দীর্ঘতম প্রশ্ন কৌশল সম্পর্কিত। পর্যবেক্ষণের তথ্যের জন্য যন্ত্রের মতো ভেরিয়েবলগুলির মতো কোনও কিছুর মেশিন লার্নিং অ্যানালগ রয়েছে? এছাড়াও - ভেরিয়েবলের এলোমেলোকরণের ক্ষেত্রে, মেশিন লার্নিং বিকল্পটি চিকিত্সা জুড়ে পার্থক্যের একটি সহজ টি-টেস্টের সাথে তুলনামূলক কী হতে পারে? কোনও মেশিন লার্নিংয়ের উত্তর কৌশলটি কী দরকার, এতে কী সুবিধা হবে?
d_a_c321

@ চ্যানড্লার, ইন্সট্রুমেন্টাল ভেরিয়েবলগুলির সাথে আমার অভিজ্ঞতা খুব সীমাবদ্ধ তবে আবার আমি মডেল ফিটিংয়ের জন্য মেশিন লার্নিং এবং পরিসংখ্যান পদ্ধতির মধ্যে পার্থক্য করার কোনও আনুষ্ঠানিক কারণ দেখতে পাচ্ছি না , সুতরাং যদি এটি কোনও উদ্দেশ্য করে তবে আপনি খুব ভাল উপকরণের ভেরিয়েবলগুলি অন্তর্ভুক্ত করতে পারেন। আমি দেখতে পেলাম যে কার্যকারিতা সম্পর্কিত সবচেয়ে আকর্ষণীয় বিষয়টি হস্তক্ষেপের প্রভাব। এটি মূলত ভবিষ্যদ্বাণীগুলির একটি প্রশ্ন তবে পর্যবেক্ষণের তথ্য বিতরণের অধীনে নয়।
এনআরএইচ

@ ডিচেন্ডলার, দ্বিতীয় প্রশ্নের জন্য, আমি এটি মেশিন লার্নিংয়ের পদ্ধতিগুলির একটি এবং একের সাথে সম্পর্কের প্রশ্ন হিসাবে এবং পরিসংখ্যানের পদ্ধতিগুলির মতো করে রাখব না। একটি -test প্রশ্নের উত্তর দিতে নির্ণয় করা হয়: ডেটা সেখানে প্রমাণ নাল হাইপোথিসিস মানে সমান প্রত্যাখ্যান করার আছে কি? আমরা সম্পর্কে কিনা এই মজার দীর্ঘ আলোচনার থাকতে পারে, এবং এমনকি কিনা -test এবং সংশ্লিষ্ট -value একটি ভাল উত্তর প্রদান কিন্তু আমি মনে করি না যদি একটি মেশিন লার্নিং বিকল্প নেই জিজ্ঞাসা মধ্যে যে কোনো স্থানে আছে না। ttp
এনআরএইচ

যদিও হস্তক্ষেপ করার পরে, মেশিন লার্নিং কোন ধরণের পরিসংখ্যান নিয়োগ করবে? পরীক্ষামূলক ডিজাইনের প্রাথমিক পরিসংখ্যানগুলি সাধারণত মস্তিষ্ক-মৃত সহজ (একটি টি-টেস্টের মাধ্যমে তুলনা করার উপায়)। ইকোনোমেট্রিক্সে, আরও অনুমানের সাথে আপনি বিভিন্ন কোয়ান্টাইলগুলি পুনরুদ্ধার করতে বা চিকিত্সার প্রভাবগুলির বিতরণের চেষ্টা করতে পারেন। একটি মেশিন লার্নিং বিশ্লেষণের তুলনা করার অর্থ ছাড়িয়ে কী করবে?
d_a_c321

মস্তিষ্ক-মৃত যা সহজ তা হল কোনও কিছুর গণনা করা, যা এতটা সহজ নয় তা হ'ল প্রয়োজনীয় অনুমানকে ন্যায়সঙ্গত করা। মার্কের টিএমএল পদ্ধতিটি প্রভাবের আকারগুলির (সাধারণভাবে আগ্রহের পরামিতি, সম্ভবত হস্তক্ষেপের প্রভাব, সম্ভবত পর্যবেক্ষণমূলক প্রভাব) অনুমানের উপর নির্ভর করে এবং কম সীমাবদ্ধ মডেল অনুমানের সাথে সৎ আত্মবিশ্বাসের অন্তরগুলি সরবরাহ করে। ক্রস-বৈধতার উপর ভিত্তি করে মডেল নির্বাচনের সাথে নমনীয় মডেল ফিটিং একটি সীমাবদ্ধ এবং ভুল, প্যারামেট্রিক মডেল এড়ানোর জন্য ব্যবহৃত হয়।
এনআরএইচ

10

তথাকথিত "কার্যকারণ অনুমান" এর জন্য পরিসংখ্যান সরঞ্জামগুলির একটি (যথেষ্ট সীমাবদ্ধ) সেট রয়েছে। এগুলি কার্যকরী সম্পর্কের মূল্যায়নের জন্য ডিজাইন করা হয়েছে এবং এটি সঠিকভাবে প্রমাণিত। দুর্দান্ত, তবে হৃদয়ের নম্র (বা মস্তিষ্কের জন্য নয়)

তা ছাড়াও অনেক ক্ষেত্রে কার্যকারিতা বোঝার ক্ষমতা হ'ল কৌশলগুলির তুলনায় আপনার নকশার ফলাফল হিসাবে অনেক বেশি: আপনি যদি নিজের পরীক্ষায় 'সমস্ত' ভেরিয়েবলের উপর নিয়ন্ত্রণ রাখেন এবং আপনি প্রতিবার কিছু ঘটতে দেখেন ( কেবলমাত্র একটি পরিবর্তনশীল পরিবর্তন করুন, আপনি যে জিনিসটি বদলেছেন তার 'পরিণতি' হওয়া জিনিসটিকে যুক্তিযুক্ত বলা যুক্তিযুক্ত (দুর্ভাগ্যক্রমে, সত্যিকার গবেষণায়, এই চরম ঘটনাগুলি খুব কমই প্রকৃতপক্ষে ঘটে থাকে)। আর একটি স্বজ্ঞাত কিন্তু শব্দ যুক্তি সময় ভিত্তিক: যদি আপনি এলোমেলোভাবে (তবে একটি নিয়ন্ত্রিত পদ্ধতিতে) কোনও পরিবর্তনশীল পরিবর্তন করেন এবং পরের দিন অন্য পরিবর্তন করেন, কার্যকারিতাটিও কোণার চারপাশে।

আমার সমস্ত দ্বিতীয় অনুচ্ছেদটি মূলত কোন পদ্ধতিতে কোন ভেরিয়েবলগুলি পরিবর্তিত হয়েছে তা নির্ধারণের জন্য কোন পদ্ধতি ব্যবহার করে তা বিবেচনা করেই কাজ করে, সুতরাং তত্ত্বের কোনও কারণ নেই যে মেশিন লার্নিং (এমএল) পরিসংখ্যান ভিত্তিক পদ্ধতিগুলির চেয়ে খারাপ হতে পারে।

দাবি অস্বীকার: উচ্চতর সাবজেক্টিভ অনুচ্ছেদে অনুসরণ করা

তবে, আমার অভিজ্ঞতা হিসাবে, প্রায়শই এমএল কৌশলগুলি ডেটা কোথা থেকে আসে বা এটি কীভাবে সংগ্রহ করা হয় (যেমন নকশাকে উপেক্ষা করে) তা বিবেচনা না করে কেবল একটি অঙ্কের বিকাশের উপর ছেড়ে দেওয়া হয়। এই ক্ষেত্রে, প্রায়শই প্রায়শই একটি ফলাফল বব হয়, তবে কার্যকারিতা সম্পর্কে দরকারী কিছু বলা খুব কঠিন হবে। এই হবেযখন একই পরিসংখ্যানের ভিত্তিতে কিছু একই পদ্ধতি একই ডেটাতে চালিত হয় তখন ঠিক একই রকম হন। তবে, শক্তিশালী পরিসংখ্যানের পটভূমি রয়েছে এমন ব্যক্তিরা এই বিষয়গুলির প্রতি সমালোচনামূলক হতে প্রশিক্ষিত হয় এবং যদি সবকিছু ঠিকঠাক হয় তবে এই ক্ষতিগুলি এড়াতে পারবেন। সম্ভবত এটি কেবলমাত্র এমএল কৌশলগুলি গ্রহণকারীদের প্রাথমিক (তবে আস্তে আস্তে) গ্রহণকারীদের (সাধারণত নতুন কৌশলগুলির বিকাশকারী নয় তবে তাদের আগ্রহের ক্ষেত্রে তাদের সাথে কিছু ফলাফল 'প্রমাণ' করতে আগ্রহী) এটিই এমএলকে তার খারাপ খ্যাতি দিয়েছে the অ্যাকাউন্ট। (মনে রাখবেন যে আমি বলছি না যে পরিসংখ্যানগুলি এমএল এর চেয়ে ভাল, বা এমএল করছেন এমন সমস্ত লোক নিখরচায় এবং স্ট্যাটাসগুলি করছেন না তারা)


উত্তরের জন্য অনেক ধন্যবাদ। কৌশলগুলির তুলনায় কার্যকারিতা কীভাবে ডিজাইনের পরিণতি হয় সে সম্পর্কে আপনার ব্যাখ্যাটি আমি সত্যিই পছন্দ করি। কৌশল সম্পর্কে আমার একটি প্রশ্ন যদিও মেশিন লার্নিংয়ের জন্য উপকরণ ভেরিয়েবলগুলির মতো কিছু আছে কিনা। এছাড়াও - ভেরিয়েবলের এলোমেলোকরণের ক্ষেত্রে, মেশিন লার্নিং বিকল্পটি চিকিত্সা জুড়ে পার্থক্যের একটি সহজ টি-টেস্টের সাথে তুলনামূলক কী হতে পারে?
d_a_c321

9

আমার দৃষ্টিভঙ্গি হ'ল অর্থনীতিতে এবং অন্যান্য সামাজিক বিজ্ঞানে ব্যবহৃত মডেলগুলি কেবল প্রকৃত বিশ্বে ভবিষ্যদ্বাণীমূলক শক্তি হওয়ায় কেবল ইনফার কার্যকর - এমন একটি মডেল যা বাস্তব জগতকে ভবিষ্যদ্বাণী করে না এটি হ'ল কিছু চতুর গণিত। আমার সহকর্মীদের কাছে একটি প্রিয় বক্তব্য হ'ল "ডেটা কিং"।

আমার কাছে মনে হয় আপনার প্রশ্নটি ভবিষ্যদ্বাণীমূলক পদ্ধতির দুটি সমালোচনা উত্থাপন করে। প্রথমত, আপনি উল্লেখ করেছেন যে মেশিন লার্নিং কৌশলগুলি দ্বারা উত্পাদিত মডেলগুলি ব্যাখ্যাযোগ্য হতে পারে না । দ্বিতীয়ত, আপনি পরামর্শ দেন যে সামাজিক বিজ্ঞানগুলির দ্বারা ব্যবহৃত পদ্ধতিগুলি মেশিন লার্নিংয়ের চেয়ে কার্যকারণ সম্পর্ক উন্মুক্ত করার জন্য আরও কার্যকর useful

প্রথম পয়েন্টটি সম্বোধন করার জন্য, আমি নিম্নলিখিত পাল্টা যুক্তি উপস্থাপন করব। মেশিন লার্নিংয়ে উপস্থিত ফ্যাড এমন পদ্ধতিগুলির পক্ষে (যেমন এসভিএম এবং এনএন) সমর্থন করে যা কোনও ল্যাপারসন বোঝার পক্ষে মোটেই সহজ নয়। এর অর্থ এই নয় যে সমস্ত মেশিন শেখার কৌশলগুলির এই সম্পত্তি রয়েছে। উদাহরণস্বরূপ, সম্মানজনক C4.5 সিদ্ধান্ত গাছ তার বিকাশের চূড়ান্ত পর্যায়ে পৌঁছানোর 20 বছর পরেও ব্যাপকভাবে ব্যবহৃত হয় এবং আউটপুট হিসাবে প্রচুর শ্রেণিবিন্যাসের বিধি তৈরি করে। আমি যুক্তি দিয়ে বলব যে এই জাতীয় নিয়মগুলি লগ প্রতিক্রিয়া অনুপাতের মতো ধারণাগুলির চেয়ে ব্যাখ্যায় নিজেকে আরও ভাল ধার দেয় তবে এটি একটি বিষয়গত দাবি। যে কোন ক্ষেত্রে, এই ধরনের মডেল হয় interpretable।

দ্বিতীয় পয়েন্টটি সম্বোধন করার সময়, আমি স্বীকার করব যে আপনি যদি একটি পরিবেশে একটি মেশিন লার্নিং মডেলকে প্রশিক্ষণ দেন এবং অন্য একটিতে এটি পরীক্ষা করেন তবে এটি ব্যর্থ হবে, তবে, কোনও প্রাইরিটি ধরে নেওয়ার কারণ নেই যে এটি কোনও ক্ষেত্রেও সত্য নয় আরও প্রচলিত মডেল: আপনি যদি অনুমানের একটি সেটের অধীনে আপনার মডেলটি তৈরি করেন এবং তারপরে অন্যটির অধীনে এটি মূল্যায়ন করেন তবে আপনি খারাপ ফলাফল পাবেন। কম্পিউটার প্রোগ্রামিংয়ের একটি বাক্যাংশ সহ-অপ্ট করতে: "ময়লা আবর্জনা, আবর্জনা আউট" মেশিন লার্নিং এবং ডিজাইন করা মডেল উভয়ের ক্ষেত্রে সমানভাবে কার্যকর হয়।


9

নং কজাল অনুমান, মেশিন লার্নিং গবেষণার একটি সক্রিয় এলাকা উদাহরণস্বরূপ কার্যক্রমে দেখতে জন্য এই ওয়ার্কসপ ও এই এক । তবে আমি উল্লেখ করতে চাই যে কার্যকারিতা অনুমান বা মডেল ব্যাখ্যা আপনার প্রাথমিক আগ্রহের পরেও সমান্তরালভাবে একটি অস্বচ্ছ খাঁটি ভবিষ্যদ্বাণীপূর্ণ পদ্ধতির চেষ্টা করা এখনও ভাল ধারণা, যাতে জোর দেওয়ার সাথে জড়িত থাকার ক্ষেত্রে উল্লেখযোগ্য পারফরম্যান্স জরিমানা জড়িত কিনা তা আপনি জানতে পারবেন একটি ব্যাখ্যাযোগ্য মডেল।


1
interopretable? সম্ভবত আপনি ব্যাখ্যাযোগ্য বলতে চান?
ফাহিম মিঠা

4

আমি অন্যান্য উত্তরে ইতিমধ্যে তৈরি খুব ভাল পয়েন্ট পুনরায় পুনরুক্তি করব না, তবে কিছুটা ভিন্ন দৃষ্টিভঙ্গি যুক্ত করতে চাই। আমি এখানে যা বলছি তা কিছুটা দার্শনিক, পেশাদার অভিজ্ঞতা থেকে প্রয়োজনীয়ভাবে আঁকা নয়, তবে শারীরিক বিজ্ঞান, জটিল সিস্টেম তত্ত্ব এবং মেশিন লার্নিংয়ের মিশ্র পটভূমি থেকে (এবং, আমাকে স্বীকার করতে হবে, মূলত স্নাতক পরিসংখ্যান)।

মেশিন লার্নিং এবং শাস্ত্রীয় পরিসংখ্যানগত পদ্ধতির মধ্যে একটি উল্লেখযোগ্য পার্থক্য (যা সম্পর্কে আমি অবগত রয়েছি) অনুমানের সেটে রয়েছে। শাস্ত্রীয় পরিসংখ্যানগুলিতে, অন্তর্নিহিত প্রক্রিয়া এবং বিতরণ সম্পর্কে অনেক অনুমানগুলি স্থির হয় এবং তা মঞ্জুর করা হয়। মেশিন লার্নিংয়ের ক্ষেত্রে, এই অনুমানগুলি স্পষ্টভাবে প্রতিটি মডেলের জন্য বেছে নেওয়া হয়েছে, ফলস্বরূপ সম্ভাবনার একটি আরও বিস্তৃত সেট এবং অনুমানগুলি সম্পর্কে সম্ভবত আরও বৃহত্তর সচেতনতা তৈরি করা হবে।

আমরা আরও বেশি করে দেখছি যে আমাদের চারপাশের বিশ্বের সিস্টেমগুলি জটিল, অ-রৈখিক উপায়ে আচরণ করে এবং অনেকগুলি প্রক্রিয়া সাধারণত ধ্রুপদী পরিসংখ্যানগুলিতে উপস্থিত স্বাভাবিকতার অনুমানগুলি মানায় না। আমি যুক্তি দিয়ে বলব যে নমনীয়তা এবং বিভিন্ন ধরণের মডেল অনুমানের কারণে, মেশিন লার্নিং পদ্ধতির ক্ষেত্রে প্রায়শই এইরকম ক্ষেত্রে আরও দৃ rob় মডেল হতে পারে।

"প্রভাবের পরিমাণ", "কার্যকারিতা", এবং "এমন একটি ডিগ্রি যা একটি পরিবর্তনশীল ফলাফলকে প্রভাবিত করে" এর মত বাক্যাংশগুলিতে শক্তিশালী মডেল অনুমান রয়েছে। একটি জটিল সিস্টেমে (যেমন একটি অর্থনীতি), এই অনুমানগুলি কেবল সম্ভাব্য সিস্টেমের রাজ্যের একটি নির্দিষ্ট উইন্ডোর মধ্যে বৈধ হবে। কিছু পর্যবেক্ষণযোগ্য এবং প্রক্রিয়াগুলির সাথে, এই উইন্ডোটি বড় হতে পারে, তুলনামূলকভাবে শক্তিশালী মডেলগুলির দিকে পরিচালিত করে। অন্যের সাথে এটি ছোট বা খালিও হতে পারে। সম্ভবত সবচেয়ে বড় বিপদটি হ'ল মাঝের স্থল: কোনও মডেল কাজ করতে পারে বলে মনে হতে পারে, তবে যখন সিস্টেমটি স্থানান্তরিত হয়, হঠাৎ এবং আশ্চর্যজনক উপায়ে ব্যর্থ হন।

মেশিন লার্নিংয়ের কোনও নিরাময়ের উপায় নেই। পরিবর্তে, আমি এটিকে আমাদের পর্যবেক্ষণগুলি থেকে অর্থ জাগানোর নতুন উপায়গুলির অনুসন্ধান হিসাবে দেখতে পেয়েছি, আমাদের চারপাশের বিশ্বে যে জটিলতাটি আমরা বুঝতে শুরু করেছি তার সাথে কার্যকরভাবে মোকাবেলা করতে হলে প্রয়োজনীয় এমন নতুন দৃষ্টান্তগুলি অনুসন্ধান করা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.