আমার প্রশ্ন নিম্নলিখিত সত্য থেকে আসে। আমি পোস্ট, ব্লগ, বক্তৃতা পাশাপাশি মেশিন লার্নিংয়ের বই পড়ছি। আমার ধারণাটি হ'ল মেশিন লার্নিং অনুশীলনকারীরা পরিসংখ্যানবিদ / একনোমেট্রিক্স যে বিষয়গুলি যত্নবান হন সে সম্পর্কে অনেক কিছুই উদাসীন বলে মনে হয়। বিশেষত, মেশিন লার্নিং অনুশীলনকারীরা অনুমানের চেয়ে পূর্বাভাসের নির্ভুলতার উপর জোর দেয়।
এরকমই একটি উদাহরণ ঘটেছিল যখন আমি অ্যান্ড্রু এনগের মেশিন লার্নিংটি কর্সেরায় নিয়ে যাচ্ছিলাম। তিনি যখন সরল লিনিয়ার মডেলটি নিয়ে আলোচনা করেন, তখন তিনি অনুমানকারীদের BLUE সম্পত্তি সম্পর্কে বা হিটারোস্কেস্টাস্টিটি আত্মবিশ্বাসের ব্যবধানকে কীভাবে "অকার্যকর" করবেন সে সম্পর্কে কিছুই উল্লেখ করেননি। পরিবর্তে, তিনি গ্রেডিয়েন্ট বংশোদ্ভূত বাস্তবায়ন এবং ক্রস বৈধকরণ / আরওসি বক্ররেখার উপর দৃষ্টি নিবদ্ধ করেন। এই বিষয়গুলি আমার অর্থনীতি / পরিসংখ্যান শ্রেণিতে অন্তর্ভুক্ত ছিল না।
আমি যখন কাগল প্রতিযোগিতায় অংশ নিয়েছিলাম তখন আর একটি উদাহরণ ঘটল। আমি অন্য লোকের কোড এবং চিন্তাভাবনা পড়ছিলাম। অংশগ্রহণকারীদের একটি বড় অংশ কেবল সমস্ত কিছু এসভিএম / এলোমেলো বন / এক্সজিবিস্টে ফেলে দেয়।
তবুও অন্য একটি উদাহরণ পদক্ষেপের মডেল নির্বাচন সম্পর্কে। এই কৌশলটি কমপক্ষে অনলাইন এবং কাগল-তে ব্যাপকভাবে ব্যবহৃত হয়। অনেক ক্লাসিকাল মেশিন লার্নিং পাঠ্যপুস্তকগুলি এগুলিও আবরণ করে যেমন স্ট্যাটিস্টিকাল লার্নিংয়ের ভূমিকা। তবে, এই উত্তর অনুসারে (যা যথেষ্ট দৃinc়প্রত্যয়ী), ধাপে ধাপে মডেল নির্বাচন বিশেষত যখন "সত্যের মডেলটি আবিষ্কার করার" ক্ষেত্রে নেমে আসে তখন প্রচুর সমস্যার মুখোমুখি হয়। এটি দেখে মনে হয় যে কেবল দুটি সম্ভাবনা রয়েছে: মেশিন লার্নিং অনুশীলনকারীরা পদক্ষেপের সাথে সমস্যাটি জানেন না, বা তারা করেন তবে তাদের যত্ন নেই।
সুতরাং এখানে আমার প্রশ্নগুলি:
- এটা কি সত্য যে (সাধারণভাবে) মেশিন লার্নিং প্র্যাকটিশনাররা ভবিষ্যদ্বাণীতে মনোনিবেশ করে এবং এইভাবে পরিসংখ্যানবিদ / অর্থনীতিবিদদের যে বিষয়গুলির যত্ন নেয় সেগুলি অনেক কিছু সম্পর্কে চিন্তা করে না?
- যদি এটি সত্য হয়, তবে এর পিছনে কারণ কী? অনুমিতি কিছু অর্থে আরও কঠিন কারণ এটি?
- অনলাইনে মেশিন লার্নিংয়ে (বা পূর্বাভাস) প্রচুর পরিমাণে উপকরণ রয়েছে। আমি যদি অনুমান করা সম্পর্কে শিখতে আগ্রহী, তবে, অনলাইনে এমন কিছু সংস্থান কী কী যা আমি পরামর্শ করতে পারি?
আপডেট : আমি কেবল বুঝতে পেরেছি যে "ইনফারেন্স" শব্দটি সম্ভবত প্রচুর পরিমাণে জিনিস বোঝাতে পারে। "অনুমান" বলতে আমি কী বোঝাতে চাইছি এমন প্রশ্নগুলিকে বোঝায়
কি কারণ বা সৃষ্ট ? বা আরও সাধারণভাবে, এর মধ্যে কার্যকারক সম্পর্ক কী?ওয়াই ওয়াই এক্স এক্স 1 , এক্স 2 , ⋯ , এক্স এন
যেহেতু "সমস্ত মডেল ভুল", সত্য মডেল থেকে আমাদের মডেলটি কী "ভুল"?
একটি নমুনার তথ্য দেওয়া, জনসংখ্যা সম্পর্কে আমরা কী বলতে পারি এবং আমরা এটি কতটা আত্মবিশ্বাসী বলতে পারি?
আমার খুব সীমিত পরিসংখ্যান জ্ঞানের কারণে, আমি নিশ্চিত নই যে এই প্রশ্নগুলি পরিসংখ্যানের ক্ষেত্রের মধ্যে পড়ে কিনা। তবে এগুলি হ'ল ধরণের প্রশ্নগুলি যা মেশিন লার্নিং অনুশীলনকারীদের মনে হয় না। সম্ভবত পরিসংখ্যানবিদদেরও কি পরোয়া নেই? আমি জানি না।
fortunes
CRAN এ প্যাকেজের অংশ হয়ে গেছে । কেবল এটুকু বলার জন্য, আপনি ইমপ্রেশন নিয়ে একা নন, মেশিন লার্নিংয়ে গাণিতিক অনড়তা সবসময়ই প্রধান উদ্বেগ নয়।