র‌্যাঙ্কিংয়ের জন্য মেশিন লার্নিং অ্যালগরিদম


10

আমি উপাদানগুলির একটি সেট পেয়েছি যা আমি বৈশিষ্ট্য অনুসারে বর্ণনা করতে পারি । এভাবে:Xn

xi:{ci1,ci2,,cin}xiX

যেখানে উপাদানের জন্য (সংখ্যাসূচক) মূল্যায়ন হয় বৈশিষ্ট্য অনুযায়ী । সুতরাং আমার উপাদানগুলি একটি মাত্রা স্পেসে পয়েন্ট হিসাবে দেখা যেতে পারে ।cijijn

আমার পঠন অনুসারে, "বেইস ক্লাসিফায়ার" এর মতো অ্যালগরিদম রয়েছে যা আমার সেটের কোনও উপাদানগুলিতে আমাকে "হ্যাঁ" বা "না" ধরণের উত্তর সরবরাহ করতে পারে, তবে আমি সরবরাহ করি যে আমি কিছু "প্রশিক্ষণ সেট" ব্যবহার করি আমার সেট এর উপাদানগুলি এবং অ্যালগরিদমের প্রত্যাশিত ফলাফল। সেই তথ্যের ভিত্তিতে, অ্যালগরিদমটি প্রশিক্ষণের সেটটির অংশ না হয়ে অন্য কোনও উপাদান গ্রহণ করতে সক্ষম হতে হবে এবং প্রশিক্ষণ সংস্থার জন্য যা শিখেছে তার উপর ভিত্তি করে "হ্যাঁ" বা "না" উত্তর সরবরাহ করবে। আপনার প্রত্যাশা (প্রশিক্ষণের সেট) কী হবে সে সম্পর্কে আপনার যদি এক ধরণের ধারণা থাকে তবে আপনি যে নির্দিষ্ট নিয়মে ফলাফলটি পেয়েছেন সে সম্পর্কে আপনি অনিশ্চিত থাকলে এটি দুর্দান্ত।

আমি আমার ডেটা দিয়ে যা করতে চাই তা "হ্যাঁ" বা "না" ধরণের উত্তর পাবে না, তবে আমি উপাদানগুলির মধ্যে একটি র‌্যাঙ্কিং প্রবর্তন করতে চাই। তাদের মধ্যে কিছু অন্যের চেয়ে "ভাল"। বেয়েস ফিল্টারটির মতো, আমি কী আশা করি তার একটি সাধারণ ধারণা পেয়েছি। আমি এইভাবে আমার উপাদানগুলির উপসেট থেকে নেওয়া একটি "প্রশিক্ষণ র‌্যাঙ্কিং" তৈরি করতে পারি, যা আমি বিধায়ককে খাওয়াত। প্রশিক্ষণের উপর ভিত্তি করে এটি আমার পুরো সেটকে স্থান দিতে সক্ষম হবে।

এটি করার জন্য আমি দুটি উপায় দেখতে পাচ্ছি:

  1. প্রতিটি উপাদানকে বিধায়ক দ্বারা একটি স্কোর দেওয়া হবে, তারপরে স্কোর অনুসারে উপাদানগুলিকে র‌্যাঙ্ক করুন।
  2. বিধায়ক এবং দুটি উপাদান নিতে এবং কোনটি আরও ভাল তা নির্ধারণ করতে সক্ষম হবেন (যুগলের সাথে তুলনা)। তুলনা অপারেশনটি ব্যবহার করে কুইকোর্টটি ব্যবহার করুন।xixj

দ্রষ্টব্য: স্কোরের ভিত্তিতে পেয়ারওয়াই ফাংশন বাস্তবায়নের জন্য তুচ্ছ এবং জোড়ায় ফাংশনের উপর ভিত্তি করে স্কোর উত্পন্ন করা তুচ্ছ, সুতরাং একই ফলাফলগুলি অর্জনের জন্য এগুলি মাত্র দুটি গ্রহণযোগ্য।

বিধায়কের এমন কোনও উদাহরণ রয়েছে যা স্কোরিং ফাংশন প্রদান করতে পারে, বা জোড়াবিধ তুলনা ফাংশন দিতে পারে?

সম্পাদনা করুন: আরো কনটেক্সট যোগ করার জন্য: বর্তমানে আমার আইটেম একটি আলগোরিদিম উত্পন্ন যে একটি স্কোর (প্রকৃত সংখ্যা) উপর গণনার উপার্জন দ্বারা প্রতিটি আইটেম Te অনুযায়ী তম স্থান হয় । উত্পন্ন র‌্যাঙ্কিং বেশ সঠিক হলেও, আমি প্রায়শই এটি কোনও উপায়ে টুইট করতে অ্যালগরিদমটি সংশোধন করতে হয় কারণ আমি স্পষ্টভাবে কিছু আইটেম দেখতে পাচ্ছি যা আমি প্রত্যাশা করতাম তা অনুসারে স্থিত হয় না arecij

সুতরাং বর্তমানে আমার নকশা প্রক্রিয়াটি হ'ল:

  1. নিখুঁত র‌্যাঙ্কিং কী হবে তার একটি ধারণা পান
  2. (ম্যানুয়ালি) একটি অ্যালগরিদম আহরণের চেষ্টা করুন যা আইটেমের মতো করে rank
  3. ফলাফলগুলি পর্যবেক্ষণ করুন
  4. অ্যালগরিদম মানিয়ে নিন

সুতরাং আমি বিধায়কদের সম্পর্কে ভেবেছিলাম যেহেতু আমার প্রক্রিয়াটির প্রারম্ভিক বিন্দুটি প্রশিক্ষণের ডেটা হিসাবে ব্যবহার করা যেতে পারে। আমি সম্ভবত বর্তমান র‌্যাঙ্ক গ্রহণ করে আমার প্রয়োজনীয়তা অনুসারে আইটেমগুলি স্যুপ করে শুরু করব that

উত্তর:


3

অনেক শ্রেণিবিন্যাস অ্যালগরিদম ইতিমধ্যে আপনি যা যা সন্ধান করছেন ঠিক তাই করে তবে প্রায়শই বাইনারি (বা এন-ওয়ে) রায় হিসাবে ব্যবহারকারীদের কাছে তাদের উত্তর উপস্থাপন করেন। উদাহরণস্বরূপ, এসভিএমএলাইট সমর্থন ভেক্টর মেশিন শ্রেণিবদ্ধকরণ অ্যালগরিদমের একটি বাস্তবায়ন; লোকেরা সাধারণত কিছু ডেটা সেটে বাইনারি রায় দেওয়ার জন্য এটি ব্যবহার করে। হুডের অধীনে যা ঘটে তা হ'ল আলগোরিদিম হ'ল ডেটাতে স্বাক্ষরযুক্ত আত্মবিশ্বাসের রায় প্রদান করে। এগুলি -1.0 এবং 1.0 এর মধ্যে আবদ্ধ এবং আপনার ডেটা র‌্যাঙ্কিংয়ের জন্য আপনার কী ব্যবহার করা উচিত!


2

দেখে মনে হচ্ছে আপনি রিগ্রেশন বিশ্লেষণ ব্যবহার করতে পারেন । এছাড়াও, সম্ভবত আপনার প্রশিক্ষণ সেটের উপাদানগুলিতে স্কোর (প্রকৃত সংখ্যা) নির্ধারণ করতে হবে, যদি আপনার তা না থাকে। যদিও আপনি কেবলমাত্র লক্ষ্যমাত্রার মান হিসাবে র‌্যাঙ্কটি ব্যবহার করতে পারেন, আপনার যদি প্রশিক্ষণের নমুনা মাত্র একটি ছোট সেট থাকে তবে এটি আপনাকে একটি দুর্বল মডেল পেতে সক্ষম করবে।


0

আমি মনে করি আপনি মেশিন লার্নিং অ্যালগরিদম থেকে খুব বেশি আশা করছেন। আইটেম 1 তার নিজের আইটেম 2 এর চেয়ে ভাল কিনা তা কোনও কম্পিউটার সিদ্ধান্ত নিতে পারে না। একটি মেশিন লার্নিং অ্যালগরিদম কী করতে পারে তা হ'ল যদি আপনি কয়েকটি উদাহরণ দেন যেখানে আপনি কিছু আইটেম 1 কে আইটেম 2 এর চেয়ে ভাল বলে চিহ্নিত করেছেন, তবে এটি আইটেমগুলি র‌্যাঙ্ক করতে শিখতে পারে [1]। তবে আপনার এখনও একটি প্রশিক্ষণ ডেটা দরকার যেখানে আপনি আইটেমের উদাহরণ সরবরাহ করেন এবং প্রশিক্ষণের ডেটাতে সমস্ত আইটেমের জন্য আইটেম 1 আইটেম 2 এর চেয়ে বড় কিনা তা সম্পর্কিত তথ্য রয়েছে।

[1] http://www.cs.cornell.edu/people/tj/svm_light/svm_rank.html


লিঙ্ক জন্য আপনাকে অনেক ধন্যবাদ। এবং আমি সম্পূর্ণরূপে বুঝতে পারি যে আমাকে অ্যালগরিদমের জন্য একটি প্রশিক্ষণ সেট সরবরাহ করতে হবে যাতে এটি পরবর্তী আইটেমগুলিতে র‌্যাঙ্ক করতে সক্ষম হবে।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.