আমি বিভিন্ন উত্সে উল্লিখিত একই শব্দের মধ্যে পার্থক্যটি তুলনা করতে চাই। এটি হ'ল লেখকরা কীভাবে তাদের "গণতন্ত্র" এর মতো সংজ্ঞায়িত শব্দের ব্যবহারের ক্ষেত্রে পৃথক হন fer
একটি সংক্ষিপ্ত পরিকল্পনা ছিল
- "গণতন্ত্র" শব্দের উল্লেখ করা বইগুলি সরল পাঠ হিসাবে বিবেচনা করুন
- প্রতিটি বইয়ের
democracyসাথে প্রতিস্থাপন করুনdemocracy_%AuthorName% word2vecএই বইগুলিতে একটি মডেল প্রশিক্ষণ দিন- মধ্যে দূরত্ব গণনা
democracy_AuthorA,democracy_AuthorBএবং অন্যান্য relabeled "গণতন্ত্রের" উল্লেখ
সুতরাং প্রতিটি লেখকের "গণতন্ত্র" তার নিজস্ব ভেক্টর পায় যা তুলনার জন্য ব্যবহৃত হয়।
তবে এটি মনে word2vecহয় নির্ভরযোগ্য ভেক্টরদের প্রশিক্ষণের জন্য একাধিক বইয়ের (প্রতিটি সম্পর্কিত শব্দ কেবল বইয়ের একটি উপসেটে ঘটে) in সরকারী পৃষ্ঠা শব্দের বিলিয়ান সহ ডেটাসেট পরামর্শ দেওয়া হচ্ছে।
আমি কেবল জিজ্ঞাসা করতে চেয়েছিলাম যে কোনও লেখকের বইয়ের উপসেটটি word2vecযদি পাওয়া যায় তবে বিকল্প সরঞ্জামগুলির সাথে এই জাতীয় অনুভূতি তৈরি করার জন্য কত বড় হওয়া উচিত ?
windowপ্যারামিটার সেট কিভাবে প্রেক্ষাপটে অনেক শব্দ আপনার শব্দ জন্য মডেল প্রশিক্ষণের ব্যবহার করা হয় W