কোনটি প্রথম: অ্যালগরিদম বেঞ্চমার্কিং, বৈশিষ্ট্য নির্বাচন, পরামিতি টিউনিং?


11

উদাহরণস্বরূপ একটি শ্রেণিবদ্ধকরণ করার চেষ্টা করার সময়, বর্তমানে আমার পদ্ধতির দিকে যেতে হবে

  1. প্রথমে বিভিন্ন অ্যালগরিদম চেষ্টা করে দেখুন এবং সেগুলি বেনমার্ক করুন
  2. উপরের ১ থেকে সেরা অ্যালগরিদমে বৈশিষ্ট্য নির্বাচন সম্পাদন করুন
  3. নির্বাচিত বৈশিষ্ট্য এবং অ্যালগরিদম ব্যবহার করে পরামিতিগুলি টিউন করুন

যাইহোক, আমি প্রায়শই নিজেকে বোঝাতে পারি না যে আরও ভাল অ্যালগরিদম থাকতে পারে তবে নির্বাচিতটি যদি অন্য অ্যালগরিদমগুলি সর্বোত্তম পরামিতি / সর্বাধিক উপযুক্ত বৈশিষ্ট্যগুলির সাথে অনুকূল হয়ে থাকে। একই সাথে, সমস্ত অ্যালগরিদম * প্যারামিটার * বৈশিষ্ট্যগুলি অনুসন্ধান করা খুব বেশি সময়সাপেক্ষ।

সঠিক পন্থা / ক্রম সম্পর্কে কোন পরামর্শ?

উত্তর:


8

আমি ধরে নিয়েছি আপনি ফিচার ইঞ্জিনিয়ারিং হিসাবে বৈশিষ্ট্য নির্বাচন বলতে চাইছেন । আমি সাধারণত যে প্রক্রিয়াটি অনুসরণ করি এবং আমি কিছু লোক দেখি তা হ'ল

  1. বৈশিষ্ট্য প্রকৌশল
  2. কয়েকটি রেকর্ডফোরস্ট, গ্রেডিয়েন্ট বুস্টেড ট্রিস, নিউট্রাল নেটওয়ার্কস বা এসভিএম এর মতো বৈশিষ্ট্যগুলি হিসাবে খুব বেশি পারফরম্যান্ট হিসাবে কয়েকটি অ্যালগরিদম ব্যবহার করে দেখুন।

    ২.১ সাধারণ পরামিতি টিউনিং যেমন প্যারামিটারের একটি ছোট পরিসরে গ্রিড অনুসন্ধান করুন

যদি পদক্ষেপ 2 এর ফলাফল সন্তোষজনক না হয় তবে আরও বৈশিষ্ট্য তৈরি করতে বা পদক্ষেপের বৈশিষ্ট্যগুলি সরিয়ে ফেলুন এবং সেরাগুলি রাখুন, লোকেরা সাধারণত এই বৈশিষ্ট্য নির্বাচনকে কল করে । নতুন বৈশিষ্ট্যগুলির জন্য ধারণার বাইরে চলে গেলে, আরও অ্যালগরিদম ব্যবহার করে দেখুন।

যদি ফলাফলটি ঠিক থাকে বা আপনি যা চান তার কাছাকাছি হয়, তবে পদক্ষেপ 3 এ যান move

  1. বিস্তৃত প্যারামিটার টিউনিং

এটি করার কারণ হ'ল শ্রেণিবিন্যাস হ'ল বৈশিষ্ট্য ইঞ্জিনিয়ারিং সম্পর্কে , এবং যদি না আপনি কিছু অবিশ্বাস্য শক্তিশালী শ্রেণিবদ্ধকে যেমন কম্পিউটার ভিশনের মতো কোনও নির্দিষ্ট সমস্যার জন্য গভীর শেখার মতো কাস্টমাইজড জানেন না। ভাল বৈশিষ্ট্য তৈরি করা মূল বিষয়। শ্রেণিবদ্ধ নির্বাচন করা গুরুত্বপূর্ণ তবে গুরুত্বপূর্ণ নয়। উপরোক্ত উল্লিখিত সমস্ত শ্রেণিবদ্ধগুলি পারফরম্যান্সের দিক থেকে তুলনীয় এবং বেশিরভাগ সময়, সেরা শ্রেণিবদ্ধকারীগুলির মধ্যে একটি হতে দেখা যায়।

প্যারামিটার টিউনিং কিছু ক্ষেত্রে, কার্যকারিতা বাড়িয়ে তুলতে পারে। তবে ভাল বৈশিষ্ট্যগুলি ছাড়া সুর করা খুব বেশি সহায়ক হয় না। মনে রাখবেন, প্যারামিটার টিউন করার জন্য আপনার কাছে সর্বদা সময় থাকে। এছাড়াও, প্যারামিটারটি ব্যাপকভাবে সুর করার কোনও মানে নেই তারপরে আপনি একটি নতুন বৈশিষ্ট্য আবিষ্কার করেন এবং পুরো জিনিসটি আবার করেন।


2

আরে আমি আপনার প্রশ্নটি দেখেছি। প্রথমে বৈশিষ্ট্য নির্বাচন করা এবং তারপরে ক্রস-বৈধতা ব্যবহার করে মডেলটি টিউন করা সম্পূর্ণরূপে ভুল। পরিসংখ্যানগত শিক্ষার উপাদানগুলিতে এবং এই ব্লগ পোস্টে স্পষ্টভাবে উল্লেখ করা হয়েছে যে: আপনার সমস্ত মডেল বিল্ডিং সিভি লুপের ভিতরে করা হলে সিভি পদ্ধতিটি পক্ষপাতহীন। প্যারামিটার টিউনিংয়ের জন্য সিভি লুপের ভিতরে বৈশিষ্ট্য নির্বাচন করুন। এটি আর এর এমএলআর প্যাকেজে ফিল্টার র‌্যাপার ব্যবহার করে সহজেই করা যায়।


1

আমি ইতিমধ্যে এখানে অনুরূপ প্রশ্নের উত্তর দিয়েছি । প্রক্রিয়াটি হবে:

  • রূপান্তর এবং হ্রাস: রূপান্তরকরণ, গড় এবং মিডিয়ান স্কেলিং ইত্যাদির মতো প্রক্রিয়াগুলিকে অন্তর্ভুক্ত করে
  • বৈশিষ্ট্য নির্বাচন: এটি থ্রেশহোল্ড নির্বাচন, উপসেট নির্বাচন ইত্যাদি অনেক উপায়ে করা যেতে পারে can
  • ভবিষ্যদ্বাণীপূর্ণ মডেল ডিজাইনিং: আপনার হাতে থাকা বৈশিষ্ট্যগুলির উপর নির্ভর করে প্রশিক্ষণ ডেটাতে ভবিষ্যদ্বাণীপূর্ণ মডেলটি ডিজাইন করুন।
  • ক্রস বৈধকরণ এবং প্যারামিটার টিউনিং:
  • চূড়ান্ত ভবিষ্যদ্বাণী, বৈধতা

মডেল নির্বাচনের আগে বৈশিষ্ট্য ইঞ্জিনিয়ারিং সর্বদা চেষ্টা করুন এবং করুন। তারপরে, সেরা বৈশিষ্ট্যগুলি অনুযায়ী মডেলটি নির্বাচন করুন (বা এমন বৈশিষ্ট্য যা সমস্যা / নির্ভরশীল পরিবর্তনশীলকে আরও ভালভাবে প্রভাবিত করে))


0

আপনি যদি কোনও নতুন সরঞ্জাম কীভাবে কাজ করে তা শিখতে যদি সময় ব্যয় করতে প্রস্তুত হন তবে আপনি অটোস্ক্লারন চেষ্টা করতে পারেন। এটি আপনার জন্য একটি এমএল পাইপলাইন তৈরি করার জন্য যা যা প্রয়োজন তা করে। বৈশিষ্ট্য প্রিপ্রোসেসিং, নির্বাচন, মডেল জড়ো করা বিল্ডিং এবং ক্রস বৈধকরণের মাধ্যমে টিউন করা। আপনার কাছে থাকা পরিমাণের উপর নির্ভর করে এটি একটি ভাল পূর্বাভাসের দ্রুত উপায় হতে পারে বা নাও হতে পারে। তবে এটি অবশ্যই একটি প্রতিশ্রুতিবদ্ধ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.