আমি নিশ্চিত না যে এই প্রশ্নটি এখানে পুরোপুরি উপযুক্ত কিনা, যদি না হয় তবে দয়া করে মুছুন।
আমি অর্থনীতিতে গ্রেডের ছাত্র। এমন একটি প্রকল্পের জন্য যা সামাজিক বীমাগুলির ক্ষেত্রে সমস্যাগুলি অনুসন্ধান করে, আমার কাছে যথেষ্ট পরিমাণে প্রশাসনিক কেস রিপোর্টে (> 200 কে) অ্যাক্সেস রয়েছে যা যোগ্যতার মূল্যায়নের সাথে ডিল করে। এই প্রতিবেদনগুলি পৃথক প্রশাসনিক তথ্যের সাথে যুক্ত হতে পারে। আমি এই প্রতিবেদনগুলি থেকে পরিমাণগত বিশ্লেষণে ব্যবহার করা যেতে পারে এবং আদর্শ কী-ওয়ার্ড / রেজেক্স অনুসন্ধানগুলি grep
/ awk
ইত্যাদি ব্যবহার করে আদর্শর চেয়ে বেশি ব্যবহার করতে পারি সেগুলি থেকে তথ্য বের করতে চাই I
প্রাকৃতিক ভাষা প্রসেসিং এর জন্য কতটা কার্যকর? অন্যান্য দরকারী পাঠ্য-খননের পদ্ধতিগুলি কী কী? আমি যা বুঝতে পেরেছি এটি থেকে এটি একটি বৃহত ক্ষেত্র, এবং সম্ভবত কয়েকটি প্রতিবেদনের একটি কর্পাস হিসাবে ব্যবহারের জন্য রূপান্তর করতে হবে। সাহিত্য এবং পদ্ধতিগুলির সাথে পরিচিত হতে কি কিছুটা সময় ব্যয় করা উচিত? এটি কি সহায়ক হতে পারে এবং এর আগেও এরকম কিছু হয়েছিল? পুরষ্কারের ক্ষেত্রে এটি কি মূল্যবান, অর্থাত্ অর্থনীতিতে একটি অভিজ্ঞতামূলক গবেষণার জন্য এনএলপি ব্যবহার করে আমি কীভাবে সম্ভাব্য দরকারী তথ্য বের করতে পারি?
কিছু প্রতিবেদন পড়তে ও প্রস্তুত করার জন্য কাউকে ভাড়া দেওয়ার জন্য সম্ভবত তহবিল রয়েছে। এটি একটি বৃহত প্রকল্প এবং আরও তহবিলের জন্য আবেদন করার সম্ভাবনা রয়েছে। কঠোরভাবে প্রয়োজন হলে আমি বিষয়টি সম্পর্কে আরও বিশদ সরবরাহ করতে পারি। একটি সম্ভাব্য জটিলতা হ'ল ভাষাটি ইংরেজি, জার্মান নয়।
যোগ্যতার বিষয়ে, আমি বেশিরভাগ একনোমেট্রিক্সে প্রশিক্ষিত, এবং হাস্টি এট আল স্তরের গণনা সংক্রান্ত পরিসংখ্যান সম্পর্কে আমার কিছু জ্ঞান আছে । বই। আমি পাইথন, আর, স্টাটা জানি এবং সম্ভবত মতলবের সাথে দ্রুত পরিচিত হতে পারি। গ্রন্থাগারগুলি দেওয়া, আমি ধরে নিই পাইথন এটির জন্য পছন্দসই সরঞ্জাম। এটি প্রাসঙ্গিক হলে গুণগত পদ্ধতিতে কোনও প্রশিক্ষণ নেই, তবে আমি জানি এমন কিছু লোকের সাথে আমি যোগাযোগ করতে পারি।
আমি এটির যে কোনও ইনপুটটির জন্য খুশি, অর্থাৎ এটি যদি সম্ভাব্যভাবে কার্যকর হয়, যদি তাই হয় তবে কোথায় পড়া শুরু করতে হবে এবং বিশেষত কোন সরঞ্জামগুলিতে ফোকাস করতে হবে।