সাধারণভাবে, অনুমান করা কি ভবিষ্যদ্বাণী করার চেয়ে আরও বেশি কঠিন?


13

আমার প্রশ্ন নিম্নলিখিত সত্য থেকে আসে। আমি পোস্ট, ব্লগ, বক্তৃতা পাশাপাশি মেশিন লার্নিংয়ের বই পড়ছি। আমার ধারণাটি হ'ল মেশিন লার্নিং অনুশীলনকারীরা পরিসংখ্যানবিদ / একনোমেট্রিক্স যে বিষয়গুলি যত্নবান হন সে সম্পর্কে অনেক কিছুই উদাসীন বলে মনে হয়। বিশেষত, মেশিন লার্নিং অনুশীলনকারীরা অনুমানের চেয়ে পূর্বাভাসের নির্ভুলতার উপর জোর দেয়।

এরকমই একটি উদাহরণ ঘটেছিল যখন আমি অ্যান্ড্রু এনগের মেশিন লার্নিংটি কর্সেরায় নিয়ে যাচ্ছিলাম। তিনি যখন সরল লিনিয়ার মডেলটি নিয়ে আলোচনা করেন, তখন তিনি অনুমানকারীদের BLUE সম্পত্তি সম্পর্কে বা হিটারোস্কেস্টাস্টিটি আত্মবিশ্বাসের ব্যবধানকে কীভাবে "অকার্যকর" করবেন সে সম্পর্কে কিছুই উল্লেখ করেননি। পরিবর্তে, তিনি গ্রেডিয়েন্ট বংশোদ্ভূত বাস্তবায়ন এবং ক্রস বৈধকরণ / আরওসি বক্ররেখার উপর দৃষ্টি নিবদ্ধ করেন। এই বিষয়গুলি আমার অর্থনীতি / পরিসংখ্যান শ্রেণিতে অন্তর্ভুক্ত ছিল না।

আমি যখন কাগল প্রতিযোগিতায় অংশ নিয়েছিলাম তখন আর একটি উদাহরণ ঘটল। আমি অন্য লোকের কোড এবং চিন্তাভাবনা পড়ছিলাম। অংশগ্রহণকারীদের একটি বড় অংশ কেবল সমস্ত কিছু এসভিএম / এলোমেলো বন / এক্সজিবিস্টে ফেলে দেয়।

তবুও অন্য একটি উদাহরণ পদক্ষেপের মডেল নির্বাচন সম্পর্কে। এই কৌশলটি কমপক্ষে অনলাইন এবং কাগল-তে ব্যাপকভাবে ব্যবহৃত হয়। অনেক ক্লাসিকাল মেশিন লার্নিং পাঠ্যপুস্তকগুলি এগুলিও আবরণ করে যেমন স্ট্যাটিস্টিকাল লার্নিংয়ের ভূমিকা। তবে, এই উত্তর অনুসারে (যা যথেষ্ট দৃinc়প্রত্যয়ী), ধাপে ধাপে মডেল নির্বাচন বিশেষত যখন "সত্যের মডেলটি আবিষ্কার করার" ক্ষেত্রে নেমে আসে তখন প্রচুর সমস্যার মুখোমুখি হয়। এটি দেখে মনে হয় যে কেবল দুটি সম্ভাবনা রয়েছে: মেশিন লার্নিং অনুশীলনকারীরা পদক্ষেপের সাথে সমস্যাটি জানেন না, বা তারা করেন তবে তাদের যত্ন নেই।

সুতরাং এখানে আমার প্রশ্নগুলি:

  1. এটা কি সত্য যে (সাধারণভাবে) মেশিন লার্নিং প্র্যাকটিশনাররা ভবিষ্যদ্বাণীতে মনোনিবেশ করে এবং এইভাবে পরিসংখ্যানবিদ / অর্থনীতিবিদদের যে বিষয়গুলির যত্ন নেয় সেগুলি অনেক কিছু সম্পর্কে চিন্তা করে না?
  2. যদি এটি সত্য হয়, তবে এর পিছনে কারণ কী? অনুমিতি কিছু অর্থে আরও কঠিন কারণ এটি?
  3. অনলাইনে মেশিন লার্নিংয়ে (বা পূর্বাভাস) প্রচুর পরিমাণে উপকরণ রয়েছে। আমি যদি অনুমান করা সম্পর্কে শিখতে আগ্রহী, তবে, অনলাইনে এমন কিছু সংস্থান কী কী যা আমি পরামর্শ করতে পারি?

আপডেট : আমি কেবল বুঝতে পেরেছি যে "ইনফারেন্স" শব্দটি সম্ভবত প্রচুর পরিমাণে জিনিস বোঝাতে পারে। "অনুমান" বলতে আমি কী বোঝাতে চাইছি এমন প্রশ্নগুলিকে বোঝায়

  1. কি কারণ বা সৃষ্ট ? বা আরও সাধারণভাবে, এর মধ্যে কার্যকারক সম্পর্ক কী?ওয়াই ওয়াই এক্স এক্স 1 , এক্স 2 , , এক্স এনXYYXX1,X2,,Xn

  2. যেহেতু "সমস্ত মডেল ভুল", সত্য মডেল থেকে আমাদের মডেলটি কী "ভুল"?

  3. একটি নমুনার তথ্য দেওয়া, জনসংখ্যা সম্পর্কে আমরা কী বলতে পারি এবং আমরা এটি কতটা আত্মবিশ্বাসী বলতে পারি?

আমার খুব সীমিত পরিসংখ্যান জ্ঞানের কারণে, আমি নিশ্চিত নই যে এই প্রশ্নগুলি পরিসংখ্যানের ক্ষেত্রের মধ্যে পড়ে কিনা। তবে এগুলি হ'ল ধরণের প্রশ্নগুলি যা মেশিন লার্নিং অনুশীলনকারীদের মনে হয় না। সম্ভবত পরিসংখ্যানবিদদেরও কি পরোয়া নেই? আমি জানি না।


2
ব্রায়ান ডি রিপলির ব্যবহারের উপর উদ্ধৃত! 2004 "উস্কানিমূলকভাবে প্যারাফ্রেজ করার জন্য, মেশিন লার্নিং হ'ল পরিসংখ্যানকে মডেল এবং অনুমানগুলির যে কোনও পরীক্ষার বিয়োগ হয়" " বাক্যাংশটি fortunesCRAN এ প্যাকেজের অংশ হয়ে গেছে । কেবল এটুকু বলার জন্য, আপনি ইমপ্রেশন নিয়ে একা নন, মেশিন লার্নিংয়ে গাণিতিক অনড়তা সবসময়ই প্রধান উদ্বেগ নয়।
বার্নহার্ড

লিও ব্রেইমান তার 2001 সালের গবেষণাপত্র "স্ট্যাটিস্টিকাল মডেলিং: দ্য কালচারস" -তে ঠিক এই প্রশ্নটির সমাধান করেছেন , যা দুর্দান্ত পঠনযোগ্য।
Skd

উত্তর:


6

প্রথমত, আমার কাছে মেশিন লার্নিংয়ের জন্য আলাদা দৃষ্টিভঙ্গি থাকবে। আপনি যা উল্লেখ করেছেন, অ্যান্ড্রু এনগের কর্সেরার বক্তৃতা এবং কাগল প্রতিযোগিতাটি মেশিন লার্নিংয়ের 100% নয় তবে কিছু শাখা যা ব্যবহারিক প্রয়োগগুলিকে লক্ষ্য করে। আসল মেশিন লার্নিং রিসার্চটি এমন কাজ হওয়া উচিত যা এলোমেলো বন / এসভিএম / গ্রেডিয়েন্ট বুস্টিং মডেল আবিষ্কার করে, যা পরিসংখ্যান / গণিতের কাছাকাছি।

আমি সম্মতি জানাব মেশিন লার্নিং অনুশীলনকারীগণ পরিসংখ্যানবিদ / অর্থনীতিবিদদের তুলনায় নির্ভুলতার দিকে বেশি মনোনিবেশ করেন। "সত্য বন্টন সম্পর্কে অনুমান" না দিয়ে লোকেরা আরও ভাল নির্ভুলতা অর্জনে আগ্রহী এমন কারণ রয়েছে। এর প্রধান কারণ হ'ল আমরা যেভাবে ডেটা সংগ্রহ করি এবং ডেটা ব্যবহার করি তা গত দশকগুলিতে পরিবর্তিত হয়েছে।

পরিসংখ্যান শত বছর ধরে প্রতিষ্ঠিত হয়েছিল, তবে অতীতে, কেউই আপনার সম্পর্কে প্রশিক্ষণের জন্য কয়েক বিলিয়ন ডেটা এবং পরীক্ষার জন্য অন্যান্য বিলিয়ন বিলিয়ন ডেটা রয়েছে তা ভাবেনা। (উদাহরণস্বরূপ, ইন্টারনেটে চিত্রের সংখ্যা)। সুতরাং, অপেক্ষাকৃত কম পরিমাণে ডেটা সহ, কাজটি করার জন্য ডোমেন জ্ঞান থেকে অনুমানগুলি প্রয়োজন। অথবা আপনি মডেলটিকে "নিয়মিত" করার বিষয়ে ভাবতে পারেন। একবার অনুমানগুলি করা হয়ে গেলে, তারপরে "সত্য" বিতরণ সম্পর্কে সমস্যাগুলি রয়েছে।

তবে, আমরা যদি যত্ন সহকারে এটি সম্পর্কে চিন্তা করি, আমরা কি এই অনুমানগুলি সত্য এবং নিশ্চিতকরণগুলি বৈধ কিনা তা নিশ্চিত করতে পারি? আমি জর্জ বক্স উদ্ধৃত করতে চাই:

সমস্ত মডেল ভুল তবে কিছু দরকারী

এখন, অনুমান / অনুমানের চেয়ে যথার্থতার উপর আরও বেশি জোর দেওয়ার জন্য ব্যবহারিক পদ্ধতির কথা ভাবা যাক। যখন আমাদের বিপুল পরিমাণে ডেটা থাকে তখন এটি একটি ভাল পদ্ধতির।

মনে করুন আমরা সমস্ত চিত্রের জন্য একটি মডেল তৈরি করছি যাতে পিক্সেল স্তরের মানুষের মুখ থাকে। প্রথমত, বিলিয়ন চিত্রের জন্য পিক্সেল স্তরে অনুমানগুলি প্রস্তাব করা খুব কঠিন: কারও কাছে সেই ডোমেন জ্ঞান নেই। দ্বিতীয়ত, আমরা ডেটা ফিট করার সম্ভাব্য সমস্ত উপায় সম্পর্কে চিন্তা করতে পারি এবং ডেটা বিশাল হওয়ার কারণে আমাদের কাছে থাকা সমস্ত মডেলগুলি পর্যাপ্ত পরিমাণে নাও থাকতে পারে (প্রায় ফিট হওয়া প্রায় অসম্ভব)।

এ কারণেই, "ডিপ লার্নিং / নিউরাল নেটওয়ার্ক" আবার জনপ্রিয় হয়েছিল। বড় ডেটার শর্তে আমরা এমন একটি মডেল বেছে নিতে পারি যা সত্যই জটিল, এবং এটি আমাদের যথাসম্ভব যথাসম্ভব ফিট করে তুলতে পারি এবং আমরা এখনও ঠিক করতে পারি, কারণ আমাদের গণনার সংস্থানগুলি সীমিত, শব্দের সমস্ত বাস্তব ডেটার সাথে তুলনা করে।

অবশেষে, আমরা যে মডেলটি তৈরি করেছি সেগুলি যদি বিশাল পরীক্ষার ডেটা সেটে ভাল হয় তবে সেগুলি ভাল এবং মূল্যবান, যদিও আমরা আন্ডারলাইন অনুমান বা সত্য বিতরণ জানি না।


আমি বলতে চাই যে "সম্প্রদায়" শব্দের বিভিন্ন সম্প্রদায়ের বিভিন্ন অর্থ রয়েছে।

  • পরিসংখ্যান সম্প্রদায়ে এটির অর্থ সাধারণত প্যারামিমেট্রিক বা নন-প্যারামেট্রিক পদ্ধতিতে সত্য বিতরণের তথ্য পাওয়া getting
  • মেশিন লার্নিং সম্প্রদায়ের মধ্যে এটির অর্থ সাধারণত প্রদত্ত বিতরণ থেকে কিছু সম্ভাব্যতা গণনা করা। উদাহরণগুলির জন্য মারফি গ্রাফিকাল মডেলগুলির টিউটোরিয়াল দেখুন ।
  • মেশিন লার্নিংয়ে, "সত্য বিতরণের প্যারামিটারগুলি পাওয়া" প্রতিনিধিত্ব করতে লোকেরা "শিক্ষণ" শব্দটি ব্যবহার করে, যা পরিসংখ্যান সম্প্রদায়ের "অনুমান" এর অনুরূপ।

সুতরাং, আপনি দেখতে পারেন, মূলত, মেশিন লার্নিংয়ের অনেক লোক "অনুমান "ও করছেন।

এছাড়াও, আপনি একাডেমিয়ায় থাকা লোকদের সম্পর্কেও "তাদের কাজটি পুনরায় ব্র্যান্ড করতে এবং পুনরায় বিক্রয়" করতে পছন্দ করতে পারেন: নতুন শর্তাবলী নিয়ে আসা গবেষণার অভিনবত্ব দেখাতে সহায়ক হতে পারে। আসলে, কৃত্রিম বুদ্ধিমত্তা, ডেটা মাইনিং এবং মেশিন লার্নিংয়ের মধ্যে অনেকগুলি ওভারল্যাপ রয়েছে। এবং তারা পরিসংখ্যান এবং অ্যালগরিদম ডিজাইনের সাথে নিবিড়ভাবে সম্পর্কিত। আবার "অনুমান" করার জন্য কোনও স্পষ্ট সীমানা নেই।


3
আমি দেখতে পাচ্ছি আপনি কোথা থেকে এসেছেন। একটি বিকল্প গ্রহণ হতে পারে: পূর্বাভাস = পর্যবেক্ষিত ভেরিয়েবলগুলিতে ফোকাস, অনুমান = লুকানো ভেরিয়েবলগুলিতে ফোকাস। সুতরাং এক অর্থে অনুমিতি নতুন ধরণের পরিমাপ উত্পাদন করার চেষ্টা করছে , যখন নীতিগতভাবে পরিমাপ করা যেতে পারে এমন পরিমাপের নতুন উপলব্ধির বিষয়ে পূর্বাভাস আরও বেশি ? (এটি অবশ্যই আপনার উত্তরের সাথে সামঞ্জস্যপূর্ণ)
জিওম্যাটট 22
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.