দ্রষ্টব্য যে আমি আর-তে সবকিছু করছি
সমস্যা অনুসরণ হিসাবে:
মূলত, আমার কাছে পুনঃসূচনাগুলির একটি তালিকা রয়েছে (সিভি)। কিছু প্রার্থীর আগে কাজের অভিজ্ঞতা থাকবে এবং কিছু না থাকুক। এখানে লক্ষ্যটি হ'ল: তাদের সিভিগুলির পাঠ্যের উপর ভিত্তি করে, আমি তাদের বিভিন্ন কাজের ক্ষেত্রে শ্রেণিবদ্ধ করতে চাই। আমি সেই ক্ষেত্রে বিশেষভাবে রয়েছি, যেখানে প্রার্থীদের কোনও অভিজ্ঞতা নেই / একজন শিক্ষার্থী এবং আমি প্রার্থী কোন চাকরি সেক্টর স্নাতক হওয়ার পরে সম্ভবত শ্রেণিবদ্ধ করার জন্য একটি ভবিষ্যদ্বাণী করতে চাই।
প্রশ্ন 1: আমি মেশিন লার্নিং অ্যালগরিদম জানি। তবে এর আগে আমি কখনও এনএলপি করিনি। আমি ইন্টারনেটে লেটেন্ট ডিরিচলেট বরাদ্দ পেয়েছি। তবে, আমি নিশ্চিত নই যে আমার সমস্যা সমাধানের জন্য এটিই সেরা পন্থা।
আমার আসল ধারণা: এটিকে তদারকি শিক্ষার সমস্যা করুন । ধরুন আমাদের কাছে ইতিমধ্যে প্রচুর পরিমাণে লেবেলযুক্ত ডেটা রয়েছে যার অর্থ আমরা প্রার্থীদের তালিকার জন্য কাজের ক্ষেত্রগুলি সঠিকভাবে লেবেল করেছি। আমরা এমএল অ্যালগরিদম (অর্থাৎ নিকটতম প্রতিবেশী ...) ব্যবহার করে মডেলটিকে প্রশিক্ষণ দিই এবং সেই অবিহিত ডেটাগুলিতে ফিড করি, যাঁরা কোনও কাজের অভিজ্ঞতা / প্রার্থী না এমন প্রার্থী, এবং তারা কোন চাকরি সেক্টরের অন্তর্ভুক্ত হবে তা ভবিষ্যদ্বাণী করার চেষ্টা করি।
আপডেট প্রশ্ন 2: আপনি কি পুনরায় শুরুতে সমস্ত কিছু বের করে একটি টেক্সট ফাইল তৈরি করে পাঠ্য ফাইলে এই তথ্যগুলি মুদ্রণ করা ভাল, যাতে প্রতিটি জীবনবৃত্তান্ত একটি পাঠ্য ফাইলের সাথে যুক্ত থাকে, যাতে কাঠামোগত স্ট্রিং থাকে এবং তারপরে আমরা পাঠ্য ফাইলগুলিতে পাঠ্য খননের কৌশল প্রয়োগ করে এবং ডেটাটি কাঠামোগত হয়ে যায় বা এমনকি পাঠ্য ফাইলগুলির বাইরে ব্যবহৃত পদগুলির একটি ফ্রিকোয়েন্সি ম্যাট্রিক্স তৈরি করতে পারে? উদাহরণস্বরূপ, পাঠ্য ফাইলটি এর মতো দেখতে পারে:
I deployed ML algorithm in this project and... Skills: Java, Python, c++ ...
এটিই আমি 'আনস্ট্রাকচার্ড' দ্বারা বোঝাতে চেয়েছিলাম, অর্থাত একক লাইনের স্ট্রিংয়ে সবকিছুকে সংকুচিত করে।
এই পদ্ধতির ভুল? আপনি যদি আমার ধারণা ভুল বলে মনে করেন তবে আমাকে সংশোধন করুন।
প্রশ্ন 3: কৌতুকপূর্ণ অংশটি: কীওয়ার্ডগুলি সনাক্ত এবং নিষ্ক্রিয় করবেন ? tm
আর-তে প্যাকেজটি ব্যবহার করছেন ? tm
প্যাকেজ ভিত্তিক কি অ্যালগরিদম হয় ? আমার কি এনএলপি অ্যালগরিদম ব্যবহার করা উচিত? যদি হ্যাঁ, তবে আমার কী অ্যালগরিদমগুলি উচিত? পাশাপাশি দেখার জন্য দয়া করে আমাকে কয়েকটি ভাল সংস্থার দিকে নির্দেশ করুন।
যেকোনো পরামর্শই বেশ কাজে দেবে.