ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্স পদ্ধতির চেয়ে ডেটা অ্যানালিস্টের দক্ষতার উপর বেশি নির্ভর করে?


14

আমি একটি গুজব জুড়ে এসেছি যে কিছু গবেষণায় দেখা গেছে যে ভবিষ্যদ্বাণীপূর্ণ মডেলগুলির কার্য সম্পাদন পদ্ধতিটির পছন্দের চেয়ে বাছাই করা পদ্ধতিটির সাথে ডেটা বিশ্লেষকের দক্ষতার উপর বেশি নির্ভর করে।
অন্য কথায়, দাবিটি হ'ল আরও তাত্ত্বিক দিক থেকে সমস্যাটির জন্য কীভাবে "উপযুক্ত" পদ্ধতিটি মনে হবে তার চেয়ে বেশি গুরুত্বপূর্ণ যে ডেটা বিশ্লেষক নির্বাচিত পদ্ধতির সাথে পরিচিত।

এটি কেমোমেট্রিক্সের প্রসঙ্গে উল্লেখ করা হয়েছিল, যার মধ্যে সাধারণত বিভিন্ন ধরণের সমস্যা রয়েছে (100s - ওাল্ড), একাধিক কোলাইনারিটি এবং অবশ্যই খুব কম নমুনা রয়েছে। ভবিষ্যদ্বাণীটি শ্রেণিবিন্যাস বা রিগ্রেশন হতে পারে।

আমার ব্যক্তিগত অভিজ্ঞতা থেকে বোঝা যায় যে এটি প্রশংসনীয় , তবে একটি সমীক্ষা উল্লেখ করা হয়েছিল (আমি দ্রুত, তবে ব্যর্থ অনুসন্ধানের পরে ইমেলের মাধ্যমে যে ব্যক্তির উল্লেখ করেছেন তাকে জিজ্ঞাসা করেছি, তবে কখনও কোনও উত্তর পাইনি)। তবে আরও বিস্তৃত অনুসন্ধানের পরেও আমি কোনও কাগজপত্র সন্ধান করতে সক্ষম হইনি।

কেউ কি এই ধরনের আবিষ্কার সম্পর্কে সচেতন? যদি তা না হয় তবে এখানে বিগ গাইসের ব্যক্তিগত অভিজ্ঞতা কী বলে?


1
আমি প্রায় কাছাকাছি ছোট্ট ছেলে, তবে নিউরাল নেটওয়ার্কগুলিতে যা দেখেছি তা এই অনুমানকে সমর্থন করে: "যন্ত্রের বাইরে" সরঞ্জাম হওয়া থেকে "মেশিন কিছু শিখতে পারে", সফল শ্রেণিবদ্ধকরণ বা ভবিষ্যদ্বাণী একটি নির্ভর করে বলে মনে হয় ব্যক্তি কতটা স্মার্ট তার উপর অনেক কিছু যে নেটওয়ার্ক থেকে তথ্য থেকে কীভাবে শিখতে হয় তা জানায় - সবচেয়ে গুরুত্বপূর্ণভাবে ডেটা
প্রিপ্রোসেসিংয়ের

1
আমি মনে করি যে স্ট্যাটিস্টিকাল লার্নিংয়ের এলিমেন্টসের ২.৪ চিত্রটি যেখানে তারা নিকটবর্তী প্রতিবেশীদের তুলনামূলকভাবে পুনরায়ত-প্রকারের পদ্ধতিগুলির সাথে তুলনা করে (এবং অবশ্যই তারা পুরো বই জুড়ে একাধিক তুলনা পয়েন্ট সরবরাহ করে)।
StasK

@ স্ট্যাস্ক: অনুস্মারকটির জন্য ধন্যবাদ (মনে না থাকার জন্য আমার লজ্জা হয়েছে)। তারা আরও জানায় যে অনুশীলনে পিসিআর, পিএলএস এবং রিজ রিগ্রেশন খুব মিল, এবং এলডিএ এবং লজিস্টিক রিগ্রেশনও রয়েছে। তবে, পরবর্তী পদ্ধতিগুলিও তাত্ত্বিক দৃষ্টিকোণ থেকে খুব অনুরূপ।
সিবিলেটগুলি মনিকা

উত্তর:


1

প্রকৃতপক্ষে, আমি একটি গুজব শুনেছি যে বিশেষজ্ঞদের চেয়ে ভাল শিক্ষণ মেশিনগুলি সাধারণত ভাল, কারণ মানুষের প্রবণতা পক্ষপাতের (ব্যয়ভারটি) ব্যয়ে কমিয়ে আনতে হয়, যার ফলে নতুন ডেটাসেটে ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্স হয় না। মেশিনটি এমএসই হ্রাস করতে ক্যালিব্রেট করা হয় এবং এভাবে নতুন ডেটাসেটে ভবিষ্যদ্বাণী করার ক্ষেত্রে আরও ভাল করার ঝোঁক ।


1
আমার অভিজ্ঞতায় এটি অবশ্যই সত্য যে মানুষের মধ্যে ঝোঁক বেশি। যাইহোক, আমার অভিজ্ঞতায় আপনার একটি শালীন বিশেষজ্ঞেরও দরকার আছে যিনি না-ওভারফিটিং শেখার মেশিনটি চয়ন করেন। অন্যথায় কেউ কেবল এমন একটি লার্নিং মেশিন বেছে নেয় যা অত্যধিক মাপসই করে।
সিবিলেটগুলি

1
আপনি যদি মডেলটিকে খুব বেশি সীমাবদ্ধ না করেন তবে সাধারণভাবে এমএসই ওভারফিটিং থেকে রক্ষা করে না - এবং সেখানে বিশেষজ্ঞ আবার আসেন। তবুও লোকেরা উদাহরণস্বরূপ মডেল হাইপারপ্যারামিটারগুলি অনুকূল করতে চেষ্টা করে। বিশেষত পুনরাবৃত্তিমূলক অপ্টিমাইজেশান কৌশলগুলি (এমএসই বা না) অপ্রয়োজনীয়, যদি না আপনি প্রতিটি পুনরাবৃত্তির জন্য সম্পূর্ণ নতুন ডেটা স্বাধীন পরীক্ষার ডেটা সেট করতে পারেন। হয়তো আমার বলা উচিত যে আমি এমন একটি ক্ষেত্র থেকে এসেছি যেখানে পরীক্ষার কেসগুলি খুব বিরল। এবং, যে কোনও ক্ষেত্রে আপনি তর্ক করতে পারেন যে এটি একটি শালীন শেখার মেশিন নয়।
সিবেলাইটস মনিকাকে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.