শ্রেণিবদ্ধ ভেরিয়েবলগুলির জনপ্রিয় বা সাধারণ সংমিশ্রণগুলি খুঁজতে আমি কীভাবে পরিসংখ্যানগুলি ব্যবহার করতে পারি?


10

আমি পলিড্রু ব্যবহার সম্পর্কে একটি গবেষণা করছি। আমার কাছে 400 মাদকসেবীদের একটি ডেটা সেট রয়েছে, যারা প্রত্যেকে তাদের অপব্যবহারের ওষুধ বলেছিল। এখানে 10 টিরও বেশি ওষুধ রয়েছে এবং তাই এখানে সম্ভাব্য সংমিশ্রণ রয়েছে। তারা বাইনারি ভেরিয়েবলগুলিতে যে পরিমাণ ওষুধ খায় সেগুলির বেশিরভাগটি আমি পুনঃনির্মাণ করেছি (কোনও মাদকাসক্ত হেরোইন অন্য 0 টিকে গালি দিলে হেরোইন 1 হয়)। আমি 2 বা 3 ওষুধের জনপ্রিয় বা সাধারণ সংমিশ্রণগুলি খুঁজতে চাই। আমি ব্যবহার করতে পারি এমন কোন পরিসংখ্যান পদ্ধতি আছে?

উত্তর:


6

একত্রে ব্যবহারের জন্য ওষুধের কেবলমাত্র 1024 টি সম্ভাব্য সংমিশ্রণ রয়েছে (যদি সেখানে কেবলমাত্র 10 টি ওষুধ থাকে) প্রতিটি ব্যবহারকারী কমপক্ষে 1 টি ওষুধ ব্যবহার করেছেন বলে ধরে নেওয়া যায়। আপনি কেবল আপনার 0/1 ভেরিয়েবলগুলিকে স্ট্রিংয়ে রূপান্তর করতে এবং সেগুলিকে সংযুক্ত করতে এবং কোন সংমিশ্রণগুলি ঘন ঘন ঘন ঘন ঘন ঘন ঘটে তা দেখতে স্ট্রিংয়ের উপর ফ্রিকোয়েন্সি বিশ্লেষণ চালাতে পারেন। খেলনার উদাহরণ গ্রহণ করে, কেবলমাত্র 3, ড্রাগ, এ, বি এবং সি বলে আপনার গবেষণায় ছিল। যদি কোনও অংশগ্রহণকারী ড্রাগ ও ও সি ড্রাগ ব্যবহার করে, তবে চলকটি alldrugs101 কোডিং করা যায় A একটি অংশগ্রহনকারী যারা কেবলমাত্র ড্রাগ বি ব্যবহার করেন তাদের 010 কোড করা হবে most বেশিরভাগ ক্ষেত্রে নির্বাচিত কোনওটিকে সন্ধান করার জন্য এগুলিতে ফ্রিকোয়েন্সি চালান। বেশিরভাগ সফ্টওয়্যার সেকেন্ডের মধ্যে এটি প্রক্রিয়া করতে সক্ষম হওয়া উচিত।


1
একমত। কেবলমাত্র 400 আসক্তি রয়েছে তাই 1024 সমস্ত ঘটতে পারে না।
নিক কক্স

হাঁ। এটি কেকের টুকরো হওয়া উচিত।
স্ট্যাটস স্টুডেন্ট

5

প্রচ্ছন্ন শ্রেণীর মডেলিং এক হবে, অন্তর্নিহিত, "লুকানো" পার্টিশন বা ওষুধ ও মাদক ব্যবহারকারীদের গ্রুপিং সন্ধানের জন্য তদারকি শেখার পদ্ধতি approach এলসি দুটি বিস্তৃত পদ্ধতির একটি অত্যন্ত নমনীয় পদ্ধতি: একক বিষয় বনাম পুনঃনির্ধারণের জন্য শ্রেণিবদ্ধ ভেরিয়েবলগুলির একটি সেটকে ক্রস-শ্রেণিবদ্ধকরণের ভিত্তিতে প্রতিলিপিগুলির ভিত্তিতে পুনরাবৃত্তিগুলি। আপনার ডেটা দ্বিতীয় ধরণের ফিট করে।

এলসিএস নমনীয়তা তারতম্যের "মিশ্রণগুলি" পৃথক পৃথক স্কেলিংগুলির সাথে শোষিত করার ক্ষমতার একটি কার্য (যেমন, শ্রেণীবদ্ধ বা ধারাবাহিক)। যেহেতু পদ্ধতির ডেটাগুলিতে লুকানো পার্টিশন, বিভাগ বা ক্লাস্টারগুলি পাওয়া যায়, তাই এটি একটি মাত্রা হ্রাস কৌশল হিসাবেও বিবেচনা করা যেতে পারে।

সমস্ত এলসি মডেলের 2 টি পর্যায় রয়েছে: 1 ম পর্যায়ে, একটি নির্ভরশীল বা টার্গেট ভেরিয়েবল সনাক্ত করা যায় এবং একটি রিগ্রেশন মডেল নির্মিত হয়। দ্বিতীয় ধাপে, মঞ্চ 1 মডেলটির অবশিষ্ট (একক "সুপ্ত" ভেক্টর) বিশ্লেষণ করা হয় এবং পার্টিশনগুলি তৈরি করা হয় ভেরিয়েবল (বা বিজাতীয়তা) - "সুপ্ত শ্রেণি" - এই ভেক্টরটিতে।

ফ্রিওয়্যার ডাউনলোড করার জন্য রয়েছে যা সম্ভবত আপনার পক্ষে বেশ ভাল কাজ করবে। এর মধ্যে একটি হ'ল এখানে পলসিএ নামক একটি আরডি মডিউল পাওয়া যায়:

http://www.jstatsoft.org/article/view/v042i10

আপনার যদি বাণিজ্যিক পণ্যটিতে ব্যয় করতে প্রায় 1,000 ডলার থাকে তবে ল্যাটেন্ট গোল্ডটি www.statisticalinnovations.com থেকে পাওয়া যায় বছরের পর বছর ধরে লেটেন্ট সোনায় ব্যবহার করার পরে , আমি বিশ্লেষণ শক্তি এবং সমাধানের পরিসীমা জন্য এই পণ্যটির একটি বড় অনুরাগী। উদাহরণস্বরূপ, পলসিএ কেবলমাত্র এলসি মডেলগুলির জন্য শ্রেণিবদ্ধ তথ্য সহ কার্যকর যেখানে এলজি বোর্ড জুড়ে কাজ করে ... প্লাস, তাদের বিকাশকারীরা সর্বদা নতুন মডিউল যুক্ত করে চলেছে। অতি সাম্প্রতিক সংযোজন লুকানো মার্কভ চেইন ব্যবহার করে এলসি মডেল তৈরি করে। তবে মনে রাখবেন যে এলজি কোনও "শেষ থেকে শেষ" ডেটা প্ল্যাটফর্ম নয়, যেমন ভারী ডেটা হেরফের বা উত্তোলনের পক্ষে এটি ভাল নয়।

অন্যথায়, শ্রেণিবদ্ধ তথ্য বিশ্লেষণের জন্য আরও অনেকগুলি পদ্ধতির রয়েছে যা পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার যেমন আর, এসপিএসএস, এসএএস, পাইথন ইত্যাদি দ্বারা ব্যাপকভাবে সমর্থিত রয়েছে এর মধ্যে কন্টিজেন্সি টেবিল বিশ্লেষণ, লগ-লিনিয়ার মডেলস, সসীম মিশ্রণ মডেল, বায়েসিয়ান টেনসর রিগ্রেশন, ইত্যাদি। এই অঞ্চলের সাহিত্যটি বিস্তৃত এবং ১৯ish৫ সালে বিশপ, এট।, ডিস্রিপ্ট মাল্টিভারিয়েট অ্যানালাইসিস দিয়ে শুরু হয়েছিল, লেও গুডম্যানের আরসি মডেলগুলি 80 এর দশক থেকে করা তাঁর কাজের ভিত্তিতে প্রসারিত, অ্যাগ্র্রেস্টির শ্রেণিবদ্ধ ডেটা বিশ্লেষণ , স্টিফেন ফিনবার্গের বই এবং থমাস উইকেনস অন্তর্ভুক্ত 1989 সালে প্রকাশিত সামাজিক বিজ্ঞানের জন্য ' মাল্টিওয়ে কন্টিনজেন্সি টেবিল অ্যানালিসিস ' বইটি দুর্দান্ত। বইয়েশিয়ান টেনসর রিগ্রেশন ডিউকের ডেভিড ডানসনের একটি গবেষণাপত্রের শিরোনাম এবং এটি বহুলভাবে মাল্টিওয়ে কন্টিনজেন্সি টেবিলগুলির মডেলিংয়ের জন্য অতি সাম্প্রতিক পদ্ধতি হিসাবে একধরণের "স্টেট অফ দ্য আর্ট"।


রেফারেন্সের তালিকা পছন্দ!
ক্রিস

3

স্বজ্ঞাত আপনার মনে কী আসে? আপনি সংমিশ্রণগুলি গণনা করতে চান, কেন কেবল সমস্ত সম্ভাব্য সংমিশ্রণগুলি সন্ধান করুন এবং কেবল গণনা করবেন না? আমি আপনাকে বারবার আইটেম সেট খনির সন্ধান করার পরামর্শ দিই।

উইকিপিডিয়া - এপ্রিওরি

এখানে এর কয়েকটি বাস্তবায়ন দেওয়া হল:

ফ্রিকোয়েন্সি প্যাটার্ন খনি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.