ভবিষ্যদ্বাণীটির বৈশিষ্ট্য হিসাবে আমি অ-পারমাণবিক ডেটা ব্যবহার করতে চাই। মনে করুন এই বৈশিষ্ট্যগুলির সাথে আমার একটি ছক রয়েছে:
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
আমি উদাহরণস্বরূপ, কলাম 2 পূর্বাভাস / শ্রেণিবদ্ধ করতে চাই।
আমি "ফু কোথায় জন্মগ্রহণ করেছি?" এর মতো কোনও ধরণের প্রশ্ন, স্বয়ংক্রিয়ভাবে প্রশ্নের জবাব দেওয়ার জন্য কিছু তৈরি করছি? ...
আমি প্রথমে একটি অনুসন্ধান ইঞ্জিনে একটি ক্যোরি করি, তারপরে আমি কিছু পাঠ্য ডেটা পেয়েছি, তারপরে আমি সমস্ত পার্সিং স্টাফ করি (ট্যাগিং, স্টেমিং, পার্সিং, বিভাজন ...)
"প্রথম শব্দ", "প্রথম শব্দের ট্যাগ", "খণ্ডগুলি", ইত্যাদির মতো প্রতিটি সারণীতে পাঠ্যটির একটি লাইন এবং অনেকগুলি বৈশিষ্ট্য সহ একটি সারণী তৈরি করা আমার প্রথম পদ্ধতির ছিল ...
তবে এই পদ্ধতির সাথে আমি বাক্যগুলির মধ্যে সম্পর্কগুলি মিস করছি।
আমি জানতে চাই যে কোনও অ্যালগরিদম আছে যা গাছের কাঠামোর (বা ভেক্টরগুলি) অভ্যন্তরে দেখায় এবং সম্পর্ক তৈরি করে এবং পূর্বাভাস / শ্রেণিবদ্ধকরণের জন্য যা প্রাসঙ্গিক তা নিষ্কাশন করে। আমি এমন একটি লাইব্রেরি সম্পর্কে জানতে পছন্দ করব যা এটি প্রয়োগ করতে হবে এমন একটি অ্যালগরিদমের চেয়ে বেশি করে।