আমি বিভিন্ন উত্সে উল্লিখিত একই শব্দের মধ্যে পার্থক্যটি তুলনা করতে চাই। এটি হ'ল লেখকরা কীভাবে তাদের "গণতন্ত্র" এর মতো সংজ্ঞায়িত শব্দের ব্যবহারের ক্ষেত্রে পৃথক হন fer
একটি সংক্ষিপ্ত পরিকল্পনা ছিল
- "গণতন্ত্র" শব্দের উল্লেখ করা বইগুলি সরল পাঠ হিসাবে বিবেচনা করুন
- প্রতিটি বইয়ের
democracy
সাথে প্রতিস্থাপন করুনdemocracy_%AuthorName%
word2vec
এই বইগুলিতে একটি মডেল প্রশিক্ষণ দিন- মধ্যে দূরত্ব গণনা
democracy_AuthorA
,democracy_AuthorB
এবং অন্যান্য relabeled "গণতন্ত্রের" উল্লেখ
সুতরাং প্রতিটি লেখকের "গণতন্ত্র" তার নিজস্ব ভেক্টর পায় যা তুলনার জন্য ব্যবহৃত হয়।
তবে এটি মনে word2vec
হয় নির্ভরযোগ্য ভেক্টরদের প্রশিক্ষণের জন্য একাধিক বইয়ের (প্রতিটি সম্পর্কিত শব্দ কেবল বইয়ের একটি উপসেটে ঘটে) in সরকারী পৃষ্ঠা শব্দের বিলিয়ান সহ ডেটাসেট পরামর্শ দেওয়া হচ্ছে।
আমি কেবল জিজ্ঞাসা করতে চেয়েছিলাম যে কোনও লেখকের বইয়ের উপসেটটি word2vec
যদি পাওয়া যায় তবে বিকল্প সরঞ্জামগুলির সাথে এই জাতীয় অনুভূতি তৈরি করার জন্য কত বড় হওয়া উচিত ?
window
প্যারামিটার সেট কিভাবে প্রেক্ষাপটে অনেক শব্দ আপনার শব্দ জন্য মডেল প্রশিক্ষণের ব্যবহার করা হয় W