মাল্টিভাইয়ারেট মেশিন লার্নিং কীভাবে করবেন? (একাধিক নির্ভরশীল ভেরিয়েবলের পূর্বাভাস)


9

আমি এমন কিছু আইটেমের গোষ্ঠীগুলির পূর্বাভাস দিতে যাচ্ছি যেগুলি কেউ কিনে নিবে ... অর্থাত্ আমার একাধিক, কলিনিয়ার নির্ভরশীল ভেরিয়েবল রয়েছে।

7 টি আইটেমের প্রতিটি কেনার সম্ভাবনা পূর্বাভাস দেওয়ার জন্য so বা ততোধিক স্বতন্ত্র মডেলগুলি তৈরির পরিবর্তে এবং ফলাফলগুলি সংমিশ্রণের পরিবর্তে, কোন পদ্ধতিতে related সম্পর্কিত, নির্ভরশীল ভেরিয়েবলের মধ্যে সম্পর্কের জন্য অ্যাকাউন্ট রয়েছে এমন একটি মডেল রাখার জন্য আমাকে কী পদ্ধতিগুলি দেখতে হবে? জিনিস তারা কিনতে পারে)।

আমি আরআরকে একটি প্রোগ্রামিং ভাষা হিসাবে ব্যবহার করছি, সুতরাং যে কোনও আর নির্দিষ্ট পরামর্শকে প্রশংসা করা হবে।

উত্তর:


7

আপনার বর্ণনার উপর ভিত্তি করে, এটি প্রদর্শিত হচ্ছে একটি বহু-জাতীয় লজিস্টিক রিগ্রেশন উপযুক্ত। আপনার ফলাফলটি 7 স্তরের (7 ক্রয়ের বিকল্পগুলির মধ্যে একটি) একটি ফ্যাক্টর হিসাবে ধরে নেওয়া উচিত, তাহলে আপনি বহুবারিক লজিস্টিক রিগ্রেশন মডেল ( আর ?multinomএর nnetপ্যাকেজে দেখুন ) ব্যবহার করে দ্রুত সদস্যতার পূর্বাভাস দিতে পারেন । যদি আপনার ফলাফলটি 7 টি স্তরের সাথে কোনও ফ্যাক্টরের সাথে একত্রিত করা যায় না, তবে বহুজাতিক তাত্পর্যপূর্ণ রিগ্রেশন ফিটিংয়ের আগে আইটেমগুলিকে একসাথে গ্রুপ করার জন্য একটি ক্লাস্টার বিশ্লেষণের প্রয়োজন হবে।


এটি বহুজাতিক রিগ্রেশন নয়। আমার কাছে 7 টি আলাদা পণ্য রয়েছে, প্রতিটি পণ্যটিতে 4 টির বেশি কারণ রয়েছে .... সেখানে স্ট্রবেরি এবং স্ট্রবেরি রয়েছে এবং তারপরে দুধ এবং বিভিন্ন ধরণের দুধ এবং আপেল এবং বিভিন্ন ধরণের আপেল রয়েছে এবং আমার সঠিক ভবিষ্যদ্বাণী করা দরকার শপিং কার্ট ...
খামার

1
আমি আপনার সমাধান আছে! আমি বহুগুণে সুপ্ত শ্রেণীর বিশ্লেষণের পরামর্শ দেব, যার ফলস্বরূপ এক বা একাধিক প্রচ্ছন্ন শ্রেণিতে গ্রুপ হিসাবে গণ্য করা এমন কারণগুলির একটি সেট। এই ক্লাসগুলিতে সদস্যপদ একটি বহু-জাতীয় লজিস্টিক রিগ্রেশন ভিত্তিক ভবিষ্যদ্বাণী করা হয়। ?poLCAএই মডেলটি ফিট করার জন্য আরও তথ্যের জন্য আর এ দেখুন ।
statsRus

আমি এর মাধ্যমে পড়ছি - ধন্যবাদ স্ট্যাটাস রুস। যদিও অন্যান্য উপায় থাকতে হবে।
ব্লাস্ট 100

বিশেষত, মেশিন শেখার পদ্ধতিগুলি যেহেতু আমার একটি সম্ভাব্যতা বন্টনের ফিট করার প্রয়োজন নেই / একটি কালো বাক্স মডেলের সাথে ঠিক আছে
ব্লাস্ট 100

মনে রাখবেন প্রচুর পরিসংখ্যানের মডেলগুলি বাস্তবে নিরীক্ষণযোগ্য মেশিন লার্নিং মডেলগুলি - তবে আপনি ঠিক বলেছেন আমরা সাধারণত এই মডেলগুলির ইনপুটগুলি যত্ন করি। অনেক ইনপুট এবং ফলাফল (এবং একটি কালো বাক্সের গুণমান) সহ তদারকি করা মেশিন লার্নিংয়ের জন্য, আমি নিউরাল নেটওয়ার্কগুলি প্রস্তাব করব (আরে ?nnet)।
statsRus

5

আপনি একটি এলোমেলো বন তৈরি করতে পারেন যেখানে আপনার প্রতিটি ক্লাস আইটেমের একটি গ্রুপ (যেমন "2% দুধযুক্ত ফার্মড স্ট্রবেরি সহ সবুজ আপেল")। তারপরে, শপারের বৈশিষ্ট্যগুলির উপর ভিত্তি করে বা আপনার ভবিষ্যদ্বাণীকারী যাই হোন না কেন, আপনি প্রতিটি গ্রুপ আইটেমের জন্য ক্রয়ের সম্ভাব্য সম্ভাবনা সরবরাহ করতে পারেন। আমি এটি করতে আর এর র্যান্ডমফোরস্ট প্যাকেজটি ব্যবহার করব ( https://cran.r-project.org/web/packages/randomForest/index.html ) এটি করতে।


3

একটি বিকল্প হ'ল পণ্য ক্রয়ের সমস্ত সংমিশ্রণের ফ্রিকোয়েন্সি অর্জন করা; কয়েকটি খুব সাধারণ সমন্বয় নির্বাচন করুন; তারপরে প্রতিটি ব্যক্তির পছন্দসই সমন্বয়টি পূর্বাভাস দেওয়ার জন্য একটি রিগ্রেশন মডেল তৈরি করুন। উদাহরণস্বরূপ, বাইনারি লজিস্টিক রিগ্রেশন সহ আপনি ক) কল্পিতভাবে হোয়াইট ওয়াইন, ব্রি, স্ট্রবেরি এবং আঙ্গুর বনাম খ) রেড ওয়াইন, চেডার এবং গৌদা ক্রয়ের পূর্বাভাস দিতে পারেন। এই জাতীয় 2 টিরও বেশি সংমিশ্রণের সাথে বা আপনি যদি "উপরের কোনওটির" শ্রেণিটি অন্তর্ভুক্ত করতে চান তবে মাল্টিনোমিয়াল লজিস্টিক রিগ্রেশন সম্ভবত পছন্দ করার পদ্ধতি হবে।

নোট করুন যে কেবল সাধারণ কম্বো অন্তর্ভুক্ত করার অর্থাত আপনার প্রত্যেকের আরও বেশি কার্যক্ষম নম্বর থাকবে তবে আপনি অন্যটিকে বাদ দিবেন, অন্তত এই পদ্ধতি থেকে। আমি কল্পনা করতে পারি 7 টি আইটেম কমপক্ষে কয়েক জন দ্বারা নির্বাচিত প্রতিটি ডজন ডজন কম্বো তৈরি করে। এটি আপনার নমুনা আকারের জন্য সম্ভবত অনেকগুলি বিভাগ। তদুপরি, যদি কম্বো মাত্র কয়েকজন লোক চয়ন করে থাকেন তবে আপনার মডেলটিতে কাজ করার জন্য খুব কম তথ্য থাকবে।

আরেকটি বিকল্প হ'ল একসাথে কেনার ঝোঁক রয়েছে এমন কয়েকটি সেট আইটেমের কাছে উপস্থিত হতে ক্লাস্টার বিশ্লেষণ ব্যবহার করা। 7 টি আইটেম সহ, আপনি সম্ভবত 4 টিরও কম ক্লাস্টার দিয়ে শেষ করবেন যা আপনার কাজটি আরও সহজ করে তুলবে। যদি আপনি ক্লাস্টার বিশ্লেষণ চেষ্টা করেন এবং ফলাফলগুলি অকার্যকর বলে মনে করেন তবে আপনাকে সেগুলি ব্যবহার করার কোনও কারণ নেই: কেবল উপরে বর্ণিত ফ্রিকোয়েন্সি ভিত্তিক পদ্ধতির দিকে ফিরে যান। এই ক্ষেত্রে, যদি আমি আপনাকে সঠিকভাবে পড়ে থাকি তবে আপনি সর্বাধিক বর্ণনামূলক এবং আকর্ষণীয় বিভাগগুলির সন্ধান করছেন এবং এটি প্রতিষ্ঠার জন্য আপনাকে স্বাধীনতার ডিগ্রি বা একাধিক তুলনা বা প্রযোজ্য এমন কোনও উদ্বেগ সম্পর্কে চিন্তা করার দরকার নেই আপনি যদি কিছু অনুমানমূলক পরীক্ষা করার জন্য একাধিক পদ্ধতি ব্যবহার করে যাচ্ছিলেন।


এই পরামর্শের জন্য ধন্যবাদ। যদিও মাল্টিভারিয়েট মেশিন শেখার পদ্ধতি থাকতে হবে। "সহজ" রিগ্রেশন মডেলটিতে আপনার কীভাবে 2 নির্ভরশীল ভেরিয়েবল থাকতে পারে তার সিমলিয়ার .. এবং আপনি কেবল lm (y + z ~ ...) করেন .. আমার মনে হয় ..
বিস্ফোরণ 200

0

আমি ধরে নিচ্ছি যে আপনি নীচের মতো পরিস্থিতি বিশ্লেষণ করতে চান;

ইআই = চ (এক্স), যেখানে চ () একটি অ-রৈখিক লিঙ্ক এবং এক্স হল কোভেরিয়েরের একটি ভেক্টর এবং ই হ'ল আই-তম নির্ভরশীল পরিবর্তনশীল, যা প্রকৃতির অর্ডিনাল (যদি এটি শ্রেণিবদ্ধ হয় তবে ইয়ে ক্যান্থ দুটির বেশি থাকে) বিভাগগুলি) এবং আপনার মডেলটি i = 1, 2, ... 5 এ বলুন এবং Yi এর প্রত্যেকটির সাথে সম্পর্কযুক্ত ... যদি তা হয় তবে আপনি অবশ্যই মাল্টিভায়েট প্রবিট নিয়োগ করতে পারেন। আর, এমপ্লাস এবং এসএএস এমভিপি অনুমান করতে পারে

বিপরীতে, আপনার কাছে Y = f (এক্স) রয়েছে, এবং ওয়াই (কেবলমাত্র এক জে আছে লক্ষ্য করুন) শ্রেণিবদ্ধ এবং উদাহরণস্বরূপ, এন বিভাগ রয়েছে যাতে এন বিভাগগুলির মাধ্যমে করা পছন্দগুলি একচেটিয়া এবং বিস্তৃত হয়; আপনি বহুজাতিক লজিট মডেল ফিট করতে হবে। মাল্টিনোমিয়াল প্রবিট নামেও কিছু আছে, বহুজাতিক নথিতে সিমিয়ালার।

আশাকরি এটা সাহায্য করবে. ধন্যবাদ সানজয়

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.