আমি বলব যে ওয়ার্ড 2 ওয়েভ অ্যালগোরিদম উভয়ের উপর ভিত্তি করে।
লোকেরা যখন বলে distributional representation
, তারা সাধারণত ভাষাগত দিকটিকে বোঝায়: অর্থ প্রসঙ্গ, শব্দটি এর সংস্থার এবং অন্যান্য বিখ্যাত উক্তিগুলি দ্বারা জানুন।
কিন্তু লোকেরা যখন বলে distributed representation
, এটির বেশিরভাগ ভাষাতত্ত্বের সাথে কোনও সম্পর্ক নেই। এটি কম্পিউটার বিজ্ঞানের দিক সম্পর্কে আরও বেশি। যদি আমি মিকোলভ এবং অন্যান্যগুলি সঠিকভাবে বুঝতে পারি তবে distributed
তাদের কাগজপত্রের শব্দের
অর্থ ভেক্টর উপস্থাপনের প্রতিটি একক উপাদানটির নিজস্ব অর্থ নেই। ব্যাখ্যামূলক বৈশিষ্ট্য (উদাহরণস্বরূপ, ওয়ার্ড 2vec এর ক্ষেত্রে শব্দের প্রসঙ্গগুলি) লুকানো রয়েছে এবং distributed
ব্যাখ্যামূলক ভেক্টর উপাদানগুলির মধ্যে রয়েছে: প্রতিটি উপাদান বিভিন্ন ব্যাখ্যাযোগ্য বৈশিষ্ট্যের জন্য দায়ী এবং প্রতিটি ব্যাখ্যাযোগ্য বৈশিষ্ট্য বেশ কয়েকটি উপাদানকে আবদ্ধ করে।
সুতরাং, word2vec (এবং doc2vec) প্রযুক্তিগতভাবে বিতরণ উপস্থাপনাগুলি ব্যবহার করে, লাক্ষিক শব্দার্থকে উপস্থাপনের উপায় হিসাবে। এবং একই সাথে এটি ধারণাগতভাবে বিতরণের অনুমানের উপর ভিত্তি করে: এটি কেবলমাত্র বিতরণ অনুমানটি সত্য বলেই কাজ করে (শব্দের অর্থগুলি তাদের সাধারণ প্রসঙ্গের সাথে সম্পর্কিত)।
তবে অবশ্যই প্রায়শই শর্তাদি distributed
এবং distributional
আন্তঃবিস্মরণীয়ভাবে ব্যবহৃত হয়, ভুল বোঝাবুঝি বাড়িয়ে তোলে :)