ইভেন্টগুলির মধ্যে পারস্পরিক সম্পর্ক খুঁজে পেতে আমি কোন অ্যালগরিদম ব্যবহার করতে পারি?


12

আমি মেশিন লার্নিংয়ে নতুন তাই আমি কিছু সাহিত্যের সন্ধান করার চেষ্টা করছি তবে গুগলের কী কী তা আমি নিশ্চিত নই। আমার তথ্য নিম্নলিখিত ফর্মের:

User A performs Action P
User B performs Action Q
User C performs Action R
...
User C performs Action X
User A performs Action Y
User B performs Action Z
...

যেখানে প্রতিটি ক্রমের নির্দিষ্ট বৈশিষ্ট্য রয়েছে (তারিখ, সময়, ক্লায়েন্ট, ইত্যাদি)। প্রায় 300 জন ব্যবহারকারী এবং আমাদের প্রায় 20,000 ক্রিয়া রয়েছে।

প্রশ্ন :

আমি ব্যবহারকারীর ক্রিয়াগুলির মধ্যে কোনও কার্যকারিতা / পারস্পরিক সম্পর্ক আছে কিনা তা জানতে চাই। উদাহরণস্বরূপ, "প্রতিবার ব্যবহারকারী E ক্রিয়া টি সঞ্চালন করে, 2 দিন পরে ব্যবহারকারী জি অ্যাকশন ভি করে"। তবে এর মধ্যে, অন্যান্য অনেকগুলি ক্রিয়াকলাপ সম্পাদনকারী আরও অনেক ব্যবহারকারী থাকতে পারে এবং এটির কোনও মিল খুঁজে পাওয়া যায় না। এটিও সম্ভব যে কিছু ব্যবহারকারী পারস্পরিক সম্পর্কযুক্ত তবে অন্যরা সম্পূর্ণ স্বতন্ত্র। এটি কি এমন কিছু যা মেশিন লার্নিং আমার জন্য সন্ধান করতে সক্ষম হবে? একটি নির্দিষ্ট অ্যালগরিদম বা অ্যালগরিদমের সেট আছে যা আমাকে সাহায্য করতে পারে?

আমি অ্যাসোসিয়েশন অ্যানালাইসিস এবং এপ্রোরি অ্যালগরিদম সম্পর্কে পড়ছি তবে আমি মনে করি না যে এটি আমার যা প্রয়োজন তা তা আমাকে দেবে, কারণ মনে হয় এটি ইনপুট হিসাবে সুপরিচিত, ডিলিমিটেড ডেটাসেটের প্রয়োজন আছে, যেখানে আমার কাছে আপাতদৃষ্টিতে এলোমেলো ব্যবহারকারীর দীর্ঘ প্রবাহ রয়েছে have কর্ম। কী দেখতে হবে সে সম্পর্কে কোনও পরামর্শই সবচেয়ে প্রশংসিত হবে!


1
আপনি কী ইভেন্টটিকে কোনও নির্দেশিত গ্রাফ , একটি শিরোনাম একটি ক্রিয়াকলাপের প্রতিনিধিত্ব করে যেমন । একটি প্রান্ত রয়েছে যদি কোনও ব্যবহারকারীর আগে অ্যাকশন । এ জাতীয় ক্রমটি ব্যবহারকারীর সংখ্যা দিয়ে এটি সহজেই ওজন করা যায়। আপনি প্রতি ব্যবহারকারী গ্রাফ করতে পারেন। ( আই , জে ) আমি জেজি=(ভী,)P(আমি,)আমি
0x90

উত্তর:


1

আমি মনে করি ঘন ঘন আইটেম সেট এবং সমিতির নিয়মগুলি খুঁজে পেতে কোনও অ্যালগরিদম ব্যবহার করার আগে আপনাকে কিছু তথ্য প্রস্তুত করতে হবে do

এই নিবন্ধে লেনদেনের সারণিটি দেখুন: বাজারের ঝুড়ি অ্যানালিসিস

আপনার ক্ষেত্রে আপনাকে আন্তঃসংযোগ স্থাপনের প্রত্যাশিত আন্তঃসংযোগের মধ্যে সর্বাধিক সময় নির্ধারণ করতে হবে (এবং সূক্ষ্ম সুর), তবে আপনি ঘন ঘন ব্যবহারকারী চয়ন করতে পারেন এবং তিনি যে প্রতিটি লেনদেন করেছেন (বা একটি নমুনা), আপনি একটি সংযুক্ত করুন একক রেকর্ড 2 দিন অন্যান্য ব্যবহারকারীর লেনদেন। বৈশিষ্ট্যগুলি যেমন বুলিয়ান হওয়া উচিত

UserA,transactionP |UserB,transaction Z| UserB, transaction F | [...]

এটা সত্যিই সহায়ক, ধন্যবাদ! সুতরাং আমি কি প্রতিটি ব্যবহারকারীর জন্য একবার অ্যালগরিদম চালাবো, যদি অন্য কোন ব্যবহারকারী সেই ব্যবহারকারীর সাথে সম্পর্কযুক্ত কিনা তা জিজ্ঞাসা করব, বা কেবল এটি একবার চালানো সম্ভব, এবং "আমাকে ব্যবহারকারীদের সেটগুলি দেখায় যা" সম্পর্কযুক্ত?
ম্যাট

আমার পদ্ধতির অনুসরণ করে আপনি কেবল কয়েকজন ব্যবহারকারী + ট্র সেশন দ্বারা শুরু করা "প্যাটার্ন" পরীক্ষা করতে পারেন। কোন ব্যবহারকারী এবং ক্রিয়াগুলি চয়ন করা উচিত এটি আপনার সম্ভাব্য পারস্পরিক সম্পর্কের জ্ঞানের উপর নির্ভর করে।
cesko80

তিনটি পরামর্শ। 1. আপনার তদন্তটি সঙ্কুচিত করুন। অসম্মানজনক হওয়ার কথা নয়, তবে এমন কোনও একক, আশ্চর্যরূপে বিস্তৃত পরিসংখ্যান পদ্ধতি নেই যা আপনাকে আপনার ডেটা সহ অন্তর্নিহিত অনেকগুলি, অনেকগুলি সম্ভাব্য বিষয়গুলির মধ্যে অর্থবোধক সংস্থাগুলির সমস্ত বলতে পারে। 2. সময় সিরিজ বিশ্লেষণ পড়ুন। ৩. কেবলমাত্র পারস্পরিক সম্পর্ক থেকে কার্যকারণকে আলাদা করার পদ্ধতিগুলি পড়ুন। দুর্ভাগ্যক্রমে, আমার কাছে কোনও দ্রুত সরবরাহ করার দরকার নেই!
Rolando2

1

আপনার ডেটা অন্বেষণ করার একটি উপায় হ'ল পূর্ববর্তী ক্রিয়া এক্স এর পরবর্তী ক্রিয়াটির একটি টেবিল তৈরি করা। সুতরাং প্রতিটি ইভেন্টের জন্য, একই ব্যবহারকারীর পরবর্তী ক্রিয়াটি সন্ধান করুন। আপনি পরবর্তী ক্রিয়া পর্যন্ত একইভাবে পূর্ববর্তী ক্রিয়া এক্স বিলম্বকে ট্যাবলেট করতে পারেন।

এরপরে আপনি পূর্ববর্তী ক্রিয়াটি পরেরটিটিকে প্রভাবিত করে কিনা তা অন্বেষণ করতে পারেন। যদি তা না হয় তবে আপনার ব্যবহারকারীরা "স্টেটলেস"।

আরেকটি সম্ভাব্য সরলীকরণ হ'ল ব্যবহারকারীদের উপেক্ষা করে এবং জিজ্ঞাসা করুন প্রতিটি ক্রিয়াকলাপ সময়ের সাথে একই হয় বা ভিন্ন হয়; এবং যদি এটি চক্রীয় হয় বা কোনও প্রবণতা দেখায় তা পরিবর্তিত হয়।

এই প্রশ্নের উত্তরগুলি দেখায় যে আপনার ডেটার খুব কম কাঠামো আছে। বিকল্পভাবে, তারা পরীক্ষার জন্য কিছু নতুন অনুমান বাড়াতে পারে।


1

এটা একটি মজার প্রশ্ন। সর্বোত্তম পদ্ধতির মধ্যে সম্পূর্ণ ডেটাসেটটি সন্ধান করা এবং একটি ফ্রিকোয়েন্সি টেবিল তৈরি করা হয়। উদাহরণস্বরূপ: ব্যবহারকারী এ একশন পি করছে এবং ওয়াই ব্যবহারকারী বি অ্যাকশন কিউ এবং জেড করছে, ব্যবহারকারী সি এক্সন আর এবং এক্স করছে একইভাবে, আরও ব্যবহারকারী আরও ক্রিয়া করছে। সুতরাং, এই ডেটাসেটের সাথে ডিল করার জন্য বিভিন্ন পন্থা রয়েছে 1) বিভিন্ন বালতিতে অনুরূপ আইটেমগুলি গোষ্ঠীর ক্লাস্টার অ্যালগরিদম 2) ক্রিয়াকলাপের ম্যাপিং এবং ফ্রিকোয়েন্সি বনাম ব্যবহারকারীদের সনাক্তকরণের জন্য বাজারের ঝুড়ি বিশ্লেষণ

পুরো ডেটা সেটটি অতিক্রম না করে এই ধরণের প্রশ্নের জন্য কোনও নির্দিষ্ট অ্যালগরিদম নির্ধারণ করার পরামর্শ দেওয়া হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.