সুপ্ত বৈশিষ্ট্যগুলির অর্থ?


24

আমি সুপারিশকারী সিস্টেমগুলির জন্য ম্যাট্রিক্স ফ্যাক্টেরাইজেশন সম্পর্কে শিখছি এবং আমি শব্দটি latent featuresখুব ঘন ঘন ঘটতে দেখছি তবে আমি এর অর্থ কী তা বুঝতে অক্ষম। বৈশিষ্ট্যটি কী তা আমি জানি তবে সুপ্ত বৈশিষ্ট্যগুলির ধারণাটি আমি বুঝতে পারি না। দয়া করে এটি ব্যাখ্যা করতে পারেন? বা কমপক্ষে আমাকে কোনও কাগজ / জায়গার দিকে নির্দেশ করুন যেখানে আমি এটি পড়তে পারি?


প্রচ্ছন্ন ভেরিয়েবল মডেলগুলি কী মডেল করা যায় তার পরিপ্রেক্ষিতে মডেলগুলিকে আরও শক্তিশালী করে তুলতে দেয়। এটি তাদের মান সংজ্ঞায়িত করতে ডেটা এবং অ্যালগরিদম পর্যন্ত। অন্য কথায়, সুপ্ত পরিবর্তনশীলগুলি "পদক্ষেপ" এর মতো যা আপনার পর্যবেক্ষিত ভেরিয়েবল এবং পছন্দসই পূর্বাভাসের মধ্যে ব্যবধানকে সরিয়ে দেয়। এই "ফাঁক" আরও বিস্তৃত, প্রচ্ছন্ন ভেরিয়েবলগুলি আরও কার্যকর useful
ভ্লাদিস্লাভস ডোভগ্লেকস

উত্তর:


25

অতিরিক্ত সরলকরণের ব্যয়ে সুপ্ত বৈশিষ্ট্যগুলি পর্যবেক্ষণ করা বৈশিষ্ট্যগুলি থেকে আলাদা করার জন্য 'লুকানো' বৈশিষ্ট্যগুলি। ম্যাট্রিক্স ফ্যাক্টরাইজেশন ব্যবহার করে পর্যবেক্ষণ করা বৈশিষ্ট্যগুলি থেকে প্রচ্ছন্ন বৈশিষ্ট্যগুলি গণনা করা হয়। উদাহরণ হ'ল পাঠ্য নথি বিশ্লেষণ। ডকুমেন্টগুলি থেকে নেওয়া শব্দ 'বৈশিষ্ট্যগুলি। যদি আপনি শব্দের ডেটা ফ্যাক্টরিজ করেন তবে আপনি 'বিষয়গুলি' সন্ধান করতে পারেন, যেখানে 'বিষয়' শব্দার্থগত প্রাসঙ্গিকতার সাথে শব্দের একটি গ্রুপ। নিম্ন-র‌্যাঙ্কের ম্যাট্রিক্স ফ্যাক্টেরাইজেশন সারিগুলির একটি ছোট সেট (সুপ্ত বৈশিষ্ট্য )গুলিতে কয়েকটি সারি (পর্যবেক্ষণ করা বৈশিষ্ট্য) মানচিত্র করে। বিস্তারিত বলার জন্য, নথিতে [সেল-বোট, স্কুনার, ইয়াচ, স্টিমার, ক্রুজার) মতো বৈশিষ্ট্য (শব্দ) পর্যবেক্ষণ করা যেতে পারে যা 'জাহাজ' এবং 'নৌকো'র মতো সুপ্ত বৈশিষ্ট্য (বিষয়) হিসাবে' ফ্যাক্টরাইজ 'করবে।

[পাল নৌকা, স্কুনার, ইয়াচ, স্টিমার, ক্রুজার, ...] -> [জাহাজ, নৌকা]

অন্তর্নিহিত ধারণা হ'ল সুপ্ত বৈশিষ্ট্যগুলি পর্যবেক্ষণ করা বৈশিষ্ট্যগুলির শব্দার্থগতভাবে প্রাসঙ্গিক 'সমষ্টি' are আপনার যখন বৃহত-স্কেল, উচ্চ-মাত্রিক এবং কোলাহলযুক্ত পর্যবেক্ষণ বৈশিষ্ট্যগুলি রয়েছে, তখন সুপ্ত বৈশিষ্ট্যগুলিতে আপনার শ্রেণিবদ্ধকে গড়ে তোলা অর্থবোধ করে।

ধারণাটি বোঝানোর জন্য এটি অবশ্যই একটি সরল বিবরণ। সঠিক বিবরণের জন্য আপনি লেটেন্ট ডিরিচলেট অ্যালোকেশন (এলডিএ) বা সম্ভাব্য ল্যাটেন্ট সিমেন্টিক অ্যানালাইসিস (পিএলএসএ) মডেলগুলির বিবরণ পড়তে পারেন।


"ম্যাট্রিক্স ফ্যাক্টরাইজেশন ব্যবহার করে পর্যবেক্ষণ করা বৈশিষ্ট্যগুলি থেকে প্রচ্ছন্ন বৈশিষ্ট্যগুলি গণনা করা হয়।" ম্যাট্রিক্স ফ্যাক্টেরাইজেশন ব্যবহার করে গণনা কি কোনও পরিমাণকে সুপ্ত বলে মনে করার জন্য প্রয়োজনীয় শর্ত?
ফ্লো

5

ধরুন আপনার কাছে (MxN)স্পর্স ম্যাট্রিক্স রয়েছে, যেখানে M- ব্যবহারকারীদের সংখ্যা যারা সুপারিশ করেছে এবং Nএটি প্রস্তাবিত আইটেমের সংখ্যা। ম্যাট্রিক্স উপাদান সুপারিশ কিছু উপাদান অনুপস্থিত সঙ্গে, দেওয়া হয় অর্থাত পূর্বাভাস করা হবে।xij

তারপরে আপনার ম্যাট্রিক্সকে K"সুপ্ত কারণগুলি" প্রবর্তনের মাধ্যমে "ফ্যাক্টরাইজড" করা যায়, যাতে একটি ম্যাট্রিক্সের পরিবর্তে আপনার দুটি থাকে: - (MxK)ব্যবহারকারীদের (KxN)জন্য এবং - আইটেমগুলির জন্য, ম্যাট্রিক্সের গুণটি যার মূল ম্যাট্রিক্স উত্পাদন করে।

অবশেষে আপনার প্রশ্নের কাছে: ম্যাট্রিক্স ফ্যাক্টেরাইজেশনে সুপ্ত বৈশিষ্ট্যগুলি কী কী? তারা Kব্যবহারকারীর স্বাদ এবং প্রস্তাবিত আইটেমগুলিতে অজানা বৈশিষ্ট্য ( ), যাতে এই দুটি ম্যাট্রিক যখন বহুগুণ হয়, তারা জ্ঞাত সুপারিশগুলির ম্যাট্রিক্স উত্পাদন করে। বিশেষ ওজন (নির্দিষ্ট বৈশিষ্ট্যের দিকে ব্যবহারকারী বৈশিষ্ট্য এবং নির্দিষ্ট আইটেমের বৈশিষ্ট্যের পরিমাণ) সংজ্ঞায়িত হয় অল্টারনেটিং লেস্ট স্কোয়ার্স অ্যালগো যার মাধ্যমে আপনি এখানে পড়তে পারেন আরও


3

এটা আমার মনে হচ্ছে যে সুপ্ত বৈশিষ্ট্য একটি শব্দ মানদণ্ড বর্ণনা করতে ব্যবহার করা হয় সত্ত্বা classifying তাদের গঠন দ্বারা, অন্য কথায়, দ্বারা বৈশিষ্ট্য (বৈশিষ্ট্যগুলো) তারা থাকে, পরিবর্তে শ্রেণীর তারা অন্তর্গত। এখানে "সুপ্ত" শব্দের অর্থ সম্ভবত সামাজিক বিজ্ঞানের সাথে এর অর্থের সমান, যেখানে খুব জনপ্রিয় শব্দটি সুপ্ত পরিবর্তনশীল ( http://en.wikedia.org/wiki/Latent_variable ) এর অর্থ অরক্ষণযোগ্য পরিবর্তনশীল (ধারণা)।

অনুচ্ছেদ নিম্নলিখিত কাগজে "ভূমিকা" সুপ্ত বৈশিষ্ট্য 'এর একটি ভাল ব্যাখ্যা প্রদান করে অর্থ এবং ব্যবহার মডেলিং সামাজিক বিজ্ঞান ঘটনা: http://papers.nips.cc/paper/3846-nonparametric-latent-feature-models-for- লিঙ্ক-ভবিষ্যদ্বাণী.পিডিএফ


আপনি যে কাগজে উল্লেখ করেছেন সে প্রবন্ধটি আমি পড়েছি কিন্তু সুপ্ত বৈশিষ্ট্যগুলির ধারণাটি বোঝার জন্য এটি খুব দরকারী বলে খুঁজে পাইনি।
উইল

@ আরও ভাল ব্যাখ্যা সহ উত্স (গুলি) নির্দ্বিধায় জানবেন।
আলেকসান্দ্র ব্লেক

1
আমি বেশ এই এক মত: tcts.fpms.ac.be/asr/project/sprach/report97/node162.html
উইল

@ উইল আপনাকে ধন্যবাদ আমি সম্মতি জানাই - এটি বেশ ভাল ভূমিকা / ব্যাখ্যা (যদিও আমি নিশ্চিত যে সেখানে আরও অনেক ভাল ছড়িয়ে ছিটিয়ে আছে)।
আলেকসান্দ্র ব্লেক

1

আর একটি উদাহরণ, নেটফ্লিক্স সেটআপের মতো চলচ্চিত্রের রেটিং ম্যাট্রিক্সের ক্ষেত্রে ব্যবহারকারীদের ক্ষেত্রে বিবেচনা করুন। এটি একটি বিশাল স্পার্স ম্যাট্রিক্স হবে যা প্রক্রিয়া করা কঠিন।

লক্ষ্য করুন প্রত্যেক ব্যবহারকারীর কল্পবিজ্ঞান সিনেমা বা রমন্যাস সিনেমা ইত্যাদি সুতরাং মত একটি নির্দিষ্ট পক্ষপাত থাকবে, পরিবর্তে সমস্ত সিনেমা রেটিং জমা করার আমরা সিনেমা বিভাগ যা বিভিন্ন জন্যে মত একটি একক সুপ্ত বৈশিষ্ট্যটি পারে জেনার এর কল্পবিজ্ঞান: যেমন বা রোম্যান্স, যে কোনও বিভাগের জন্য তার স্বাদ পরিমাণে। এগুলিকে প্রচ্ছন্ন বৈশিষ্ট্য বলা হয় , যা পুরো চলচ্চিত্রের তালিকা সঞ্চয় করার পরিবর্তে তার স্বাদের সারাংশ ধারণ করে।

অবশ্যই এটি একটি আনুমানিক হবে, তবে ফ্লিপ-সাইডে আপনার কাছে সঞ্চয় করার খুব কম পরিমাণ রয়েছে।

এটি সাধারণত ম্যাট্রিক্স পচানোর কৌশলগুলি ব্যবহার করে করা হয় যেমন এসভিডি যা কোনও ব্যবহারকারীকে আইটেমের মেট্রিক্স থেকে ব্যবহারকারীর পছন্দসই ম্যাট্রিক্স এবং আইটেমের পছন্দ ম্যাট্রিক্সের জন্য আইটেমকে অগ্রাধিকার দেয়, অ্যাডভান্সটেজ হ'ল আমরা কার্যকরভাবে নম্বর সংরক্ষণ করার পরিবর্তে সংরক্ষণ ।এন 1 1 এন এন 2 2 এনNNN11NN22N

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.