অনুদায়ী তথ্য জন্য মেশিন শেখার কৌশল


11

আমি ভাবছিলাম যে দ্রাঘিমাংশের ডেটা মডেলিংয়ের জন্য কোনও মেশিন লার্নিং কৌশল (নিরীক্ষণ) আছে কিনা? আমি সবসময় মিশ্র প্রভাবগুলির মডেলগুলি ব্যবহার করেছি (বেশিরভাগ অ-লিনিয়ার) তবে আমি ভাবছিলাম যে এটি করার কোনও অন্য উপায় আছে (মেশিন লার্নিং ব্যবহার করে)।

মেশিন লার্নিং দ্বারা, আমার অর্থ এলোমেলো বন, শ্রেণিবদ্ধকরণ / গুচ্ছ, সিদ্ধান্ত গাছ এবং এমনকি গভীর শিক্ষণ ইত্যাদি


আপনি কি "মেশিন লার্নিং" বলতে চাইছেন তা বোঝাতে পারেন? উপযুক্ত স্তরবিন্যাসের পরে আপনি একটি এলএমই উত্সাহ দিতে পারেন। আসলে এটি বেশ উপন্যাস হবে!
usεr11852

@ usεr11852, আমি প্রশ্নের আরও কিছুটা ব্যাখ্যা যুক্ত করেছি-আশা করি এটি আরও কিছুটা স্পষ্ট করে।
জন_ডিডএক্স

আহ ... সুতরাং আপনার সংজ্ঞা অনুযায়ী এমএসএল বাড়ানো নয়। দুর্দান্ত স্পষ্টতার জন্য ধন্যবাদ আশা করি শিগগিরই এটি কিছুটা দৃষ্টি আকর্ষণ করবে।
usεr11852

... এবং খুব উত্সাহ।
জন_ডিডএক্স

3
এই প্রশ্নটি বেশ অস্পষ্ট বলে মনে হচ্ছে। "মেশিন লার্নিং" একটি বিস্তৃত শব্দ এবং এমনকি "এলোমেলো বন, শ্রেণিবদ্ধকরণ / গুচ্ছবদ্ধতা, সিদ্ধান্তের গাছ এবং এমনকি গভীর শিক্ষণ ইত্যাদির বিভাগ" " মোটামুটি বিস্তৃত। আপনি কি আগ্রহী একটি স্পষ্ট আবেদন আছে? উদাহরণস্বরূপ, যদি আপনাকে দ্বৈতশাসিত আউটপুট শ্রেণিবদ্ধ করা প্রয়োজন, আপনি লজিস্টিক মিশ্র প্রভাবগুলির মডেল বা লজিস্টিক জিইই ব্যবহার করতে পারেন। মেশিন লার্নিং এবং স্ট্যাটিস্টিকাল মডেলগুলি অগত্যা বিভিন্ন জিনিস নয়।
জন

উত্তর:


7

এক্ষেত্রে যেখানে এক বিষয় থেকে একাধিক পর্যবেক্ষণ রয়েছে (যেমন, একই রোগীর একাধিক দর্শন), তারপরে 'রোগী আইডি' একটি 'গ্রুপিং' পরিবর্তনশীল। মডেল মূল্যায়নের সময় অবশ্যই যত্ন নেওয়া উচিত যাতে প্রশিক্ষণ এবং পরীক্ষার উভয় ডেটাতে একই রোগীর ভিজিট উপস্থিত না হয়, কারণ এগুলি পারস্পরিক সম্পর্কযুক্ত এবং শ্রেণিবদ্ধের নির্ভুলতার মূল্যবৃদ্ধির দিকে পরিচালিত করে

ক্রস বৈধতা sklearn ডকুমেন্টেশন দলবদ্ধ ডেটার জন্য ক্রস-বৈধতা iterators হয়েছে। গ্রুপ কেফোল্ড , লেভোঅনগ্রুপআউট এবং লিপপগ্রুপস আউট দেখুন

আরও ভাল, পুনরুক্ত নিউরাল নেটওয়ার্ক বা লুকানো মার্কভ মডেলগুলি চেষ্টা করে দেখুন


4

আপনি কেবলমাত্র বৈশিষ্ট্য যোগ করে স্ট্যান্ডার্ড মেশিন লার্নিং পদ্ধতির সাথে আপনার অনুদৈর্ঘ্যের মডেল করতে পারেন, যা অনুদৈর্ঘ্যের প্রতিনিধিত্ব করে, যেমন সময়কে উপস্থাপন করে এমন একটি বৈশিষ্ট্য যুক্ত করে। বা এমন একটি বৈশিষ্ট্য যা কোনও গোষ্ঠী, ব্যক্তি ইত্যাদি (প্যানেল ডেটা ক্ষেত্রে) এর সদস্যপদ নির্দেশ করে।

আপনি যদি বৈশিষ্ট্য তৈরি / নিষ্কাশন নিয়ে সৃজনশীল হন তবে আপনি এমএল-অ্যালগরিদমগুলির সাথে যে কোনও কিছু মডেল করতে পারেন।


1
@ ফিলিপপ্রো, আমি এই উত্তর সম্পর্কে কিছুটা বিভ্রান্ত। (1) আপনি যদি কোনও প্রশিক্ষণের সেটে না থাকা ব্যক্তির জন্য ভবিষ্যদ্বাণী করতে চান তবে কী হবে? আপনার প্রশিক্ষণ সংস্থায় কেবলমাত্র তাদের জন্য সহগ আছে, তাই না? (২) ব্যক্তির সাথে সম্পর্কিত এমন একটি বৈশিষ্ট্য যুক্ত করার ফলে আপনার ডেটাসেটে আপনার ১০,০০,০০০ লোক রয়েছে বলে ধরে নিয়ে 100,000 টি পর্যন্ত নতুন ডামি ভেরিয়েবল যুক্ত হতে পারে। এই নতুন বৈশিষ্ট্যগুলি মূলগুলির পাশাপাশি ঠিক ফিট হতে পারে?
ব্যবহারকারী 0

(1) আপনার প্রশিক্ষণ ডেটাসেটে আপনি যে ব্যক্তিদের পূর্বাভাস দিতে চান তা যদি আপনার না থাকে তবে আপনি "ব্যক্তি বৈশিষ্ট্য" ব্যবহার করতে পারবেন না, এটি সঠিক। (২) ডামি বৈশিষ্ট্য তৈরির পরিবর্তে আপনি একটি "শ্রেণিবদ্ধ" বৈশিষ্ট্য তৈরি করতে পারেন (যেমন আপনি এগুলিকে আর এর মধ্যে ফ্যাক্টর সহ শ্রেণীবদ্ধ হিসাবে নির্দিষ্ট করেছেন)। কিছু অ্যালগরিদম এতগুলি বিভাগ পরিচালনা করতে পারে না (যেমন র্যান্ডমফোরস্ট কেবল প্রায় 50 টি পরিচালনা করতে পারে), তবে আপনাকে সত্যিকার অর্থে তাদের ডামি ভেরিয়েবল হিসাবে নির্দিষ্ট করতে হবে এবং আপনি যেমন উল্লেখ করেছেন তেমন অনেকগুলি বৈশিষ্ট্য (খুব) পেতে পারেন।
ফিলিপপ্রো

এমএল এত সহজে দ্রাঘিমাংশের ডেটাতে অনুবাদ করে না
আকাকাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.