কখন কী ব্যবহার করবেন - মেশিন লার্নিং [বন্ধ]


39

সম্প্রতি ইউপিসি / বার্সেলোনার প্রফেসর ওরিওল পুজলের কাছ থেকে একটি মেশিন লার্নিং ক্লাসে তিনি মেশিন লার্নিং সম্পর্কিত বিভিন্ন বিস্তৃত কাজের জন্য সবচেয়ে সাধারণ অ্যালগরিদম, নীতি এবং ধারণাটি বর্ণনা করেছেন। এখানে আমি এগুলি আপনার সাথে ভাগ করে নিচ্ছি এবং আপনাকে জিজ্ঞাসা করছি:

  • বিভিন্ন ধরণের মেশিন লার্নিং সম্পর্কিত সমস্যার সাথে সম্পর্কিত পদ্ধতিগুলির সাথে কি কোনও বিস্তৃত কাঠামো মিলছে?

আমি কীভাবে একটি সহজ গাউসিয়ান শিখতে পারি? সম্ভাবনা, এলোমেলো ভেরিয়েবল, বিতরণ; অনুমান, রূপান্তর এবং অ্যাসিপটিক্স, আত্মবিশ্বাসের ব্যবধান।

আমি গাউসিয়ানদের (এমওজি) মিশ্রণটি কীভাবে শিখব? সম্ভাবনা, প্রত্যাশা-ম্যাক্সিমাইজেশন (ইএম); সাধারণীকরণ, মডেল নির্বাচন, ক্রস-বৈধকরণ; কে-মানে, লুকানো মার্কভ মডেল (এইচএমএম)

আমি কীভাবে কোনও ঘনত্ব শিখব? প্যারামেট্রিক বনাম-অ-প্যারাম্যাট্রিক অনুমান, সোব্লেভ এবং অন্যান্য কার্যকরী স্পেস; l ́ 2 ত্রুটি; কার্নেলের ঘনত্বের অনুমান (কেডিএ), অনুকূল কার্নেল, কেডি থিওরি

আমি কীভাবে একটি ধারাবাহিক পরিবর্তনশীল (রিগ্রেশন) পূর্বাভাস করব? লিনিয়ার রিগ্রেশন, রেগুলেশন, রিজ রিগ্রেশন এবং ল্যাসো; স্থানীয় লিনিয়ার রিগ্রেশন; শর্তসাপেক্ষ ঘনত্বের অনুমান।

আমি কীভাবে একটি পৃথক পরিবর্তনশীল (শ্রেণিবিন্যাস) পূর্বাভাস করব? বেয়েস শ্রেণিবদ্ধ, নিষ্পাপ বেইস, জেনারেটর বনাম বৈষম্যমূলক; পারসেপট্রন, ওজন ক্ষয়, লিনিয়ার সমর্থন ভেক্টর মেশিন; নিকটতম প্রতিবেশী শ্রেণিবদ্ধ এবং তত্ত্ব

আমার কোন ক্ষতির ফাংশন ব্যবহার করা উচিত? সর্বাধিক সম্ভাবনা অনুমানের তত্ত্ব; l -2 অনুমান; বায়েসিয়ান অনুমান; মিনিম্যাক্স এবং সিদ্ধান্ত তত্ত্ব, বায়েশিয়ানিজম বনাম ঘনত্ব

আমার কোন মডেলটি ব্যবহার করা উচিত? এআইসি এবং বিআইসি; ভ্যাপনিক-চেরভোনেনস্কিস তত্ত্ব; ক্রস-বৈধতা তত্ত্ব; বুটস্ট্র্যাপিং; সম্ভবত প্রায় সঠিক (পিএসি) তত্ত্ব; মুরগি-উত্পন্ন সীমা

আমি কীভাবে ফ্যানসিয়ার (সম্মিলিত) মডেলগুলি শিখতে পারি? জড়ো শেখার তত্ত্ব; boosting; ব্যাগিং; স্ট্যাক

আমি কীভাবে ফ্যানসিয়ার (ননলাইনার) মডেলগুলি শিখতে পারি? সাধারণ রৈখিক মডেল, লজিস্টিক রিগ্রেশন; কলমোগোরভ উপপাদ্য, সাধারণকরণযোগ্য মডেল; কার্নেলাইজেশন, কার্নেল হিলবার্ট স্পেসস, নন-লিনিয়ার এসভিএম, গাউসিয়ান প্রক্রিয়া রিগ্রেশন পুনরুত্পাদন

আমি কীভাবে ফ্যানসিয়ার (কম্পোজিশনাল) মডেলগুলি শিখতে পারি? পুনরাবৃত্ত মডেল, সিদ্ধান্ত গাছ, শ্রেণিবদ্ধ ক্লাস্টারিং; নিউরাল নেটওয়ার্ক, পিছনে প্রচার, গভীর বিশ্বাস নেটওয়ার্ক; গ্রাফিক্যাল মডেল, এইচএমএমগুলির মিশ্রণ, শর্তাধীন র্যান্ডম ক্ষেত্র, সর্বাধিক-মার্জিন মার্কভ নেটওয়ার্ক; লগ-লিনিয়ার মডেল; ব্যাকরণ

আমি কীভাবে বৈশিষ্ট্যগুলি হ্রাস বা সম্পর্কিত করব? বৈশিষ্ট্য নির্বাচন বনাম মাত্রা হ্রাস, বৈশিষ্ট্য নির্বাচনের জন্য মোড়ক পদ্ধতি; কার্যকারিতা বনাম পারস্পরিক সম্পর্ক, আংশিক সম্পর্ক, বেয়েস নেট কাঠামো শেখা

আমি কীভাবে নতুন বৈশিষ্ট্য তৈরি করব? প্রধান উপাদান বিশ্লেষণ (পিসিএ), স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ), বহুমাত্রিক স্কেলিং, বহুবিধ শিখন, তত্ত্বাবধানের মাত্রিকতা হ্রাস, মেট্রিক শেখা

আমি কীভাবে ডেটা হ্রাস বা সম্পর্কিত করব? ক্লাস্টারিং, দ্বি-ক্লাস্টারিং, সীমাবদ্ধ ক্লাস্টারিং; সমিতি নিয়ম এবং বাজারের ঝুড়ি বিশ্লেষণ; র‌্যাঙ্কিং / অর্ডিনাল রিগ্রেশন; লিঙ্ক বিশ্লেষণ; সম্পর্কিত তথ্য

সময় সিরিজের সাথে আমি কীভাবে আচরণ করব? Arma; কলম্যান ফিল্টার এবং স্ট্যাট-স্পেস মডেল, কণা ফিল্টার; ক্রিয়ামূলক তথ্য বিশ্লেষণ; পরিবর্তন-পয়েন্ট সনাক্তকরণ; সময় সিরিজের জন্য ক্রস-বৈধকরণ

আমি কীভাবে অ-আদর্শ ডেটা ব্যবহার করব? covariate শিফট; বর্গ ভারসাম্যহীনতা; অনুপস্থিত ডেটা, অনিয়মিতভাবে নমুনাযুক্ত ডেটা, পরিমাপের ত্রুটি; অসঙ্গতি সনাক্তকরণ, দৃust়তা

আমি কীভাবে পরামিতিগুলি অনুকূল করব? নিয়ন্ত্রণহীন বনাম সীমাবদ্ধ / উত্তল অপ্টিমাইজেশন, ডেরিভেটিভ-মুক্ত পদ্ধতি, প্রথম এবং দ্বিতীয়-ক্রম পদ্ধতি, ব্যাকফিট; প্রাকৃতিক গ্রেডিয়েন্ট; আবদ্ধ অপ্টিমাইজেশন এবং ইএম

আমি লিনিয়ার ফাংশনগুলি কীভাবে অনুকূল করব? গণনামূলক রৈখিক বীজগণিত, সংক্ষিপ্তকরণের জন্য ম্যাট্রিক্স বিপরীতকরণ, মাত্রিকতা হ্রাসের জন্য একক মান ভলন (এসভিডি)

আমি কীভাবে প্রতিবন্ধকতাগুলির সাথে অপ্টিমাইজ করব? উত্তেজকতা, ল্যাঞ্জরেঞ্জ মাল্টিপ্লায়ার্স, কারুশ-কুহান-টকার শর্তাদি, অভ্যন্তর বিন্দু পদ্ধতি, এসভিএমের জন্য এসএমও অ্যালগরিদম

আমি কীভাবে গভীরভাবে নেস্টেড পরিমাণগুলি মূল্যায়ন করব? সঠিক গ্রাফিকাল মডেল অনুমিতি, অঙ্কগুলিতে পরিবর্তনের সীমানা, আনুমানিক গ্রাফিক্যাল মডেল অনুমিতি, প্রত্যাশা প্রচার

আমি কীভাবে বড় অঙ্কগুলি এবং অনুসন্ধানগুলি মূল্যায়ন করব? জেনারালাইজড এন-বডি সমস্যা (জিএনপি), শ্রেণিবিন্যাস সম্পর্কিত তথ্য কাঠামো, নিকটতম প্রতিবেশী অনুসন্ধান, দ্রুত একাধিক পদ্ধতি; মন্টি কার্লো একীকরণ, মার্কভ চেইন মন্টি কার্লো, মন্টি কার্লো এসভিডি

আমি আরও বড় সমস্যাগুলি কীভাবে চিকিত্সা করব? সমান্তরাল / বিতরণ ইএম, সমান্তরাল / বিতরণ জিএনপি; স্টোকাস্টিক সাবগ্রেডিয়েন্ট পদ্ধতি, অনলাইন শেখা

বাস্তব বিশ্বে আমি কীভাবে এই সমস্ত প্রয়োগ করব? এমএল এর অংশগুলির সংক্ষিপ্তসার, প্রতিটি কাজের জন্য ব্যবহারের পদ্ধতিগুলির মধ্যে নির্বাচন, পূর্ববর্তী জ্ঞান এবং অনুমান; অনুসন্ধানের তথ্য বিশ্লেষণ এবং তথ্য দৃশ্যায়ন; মূল্যায়ন এবং ব্যাখ্যা, আত্মবিশ্বাস অন্তর এবং অনুমান পরীক্ষা, আরওসি বক্ররেখা ব্যবহার করে; যেখানে এমএলে গবেষণার সমস্যা রয়েছে


সত্যিই বিস্তৃত। আমি মনে করি অর্থপূর্ণ উত্তর পেতে প্রতিটি উপ-প্রশ্ন অবশ্যই পৃথক প্রশ্ন হওয়া উচিত।
আমির আলী আকবরী

2
আপনি কীভাবে এটি দেখেন তার উপর নির্ভর করে এই প্রশ্নটি খুব বিস্তৃত বা খুব বেশি বিস্তৃত হিসাবে যোগ্যতা অর্জন করতে পারে। যদি প্রশ্নটি কার্য এবং পদ্ধতিগুলির বিশদ বিবরণ বোঝায় তবে অবশ্যই এটি কেবল একটি প্রশ্নের জন্য নয়, এমনকি একটি বইয়ের জন্যও বিস্তৃত। যাইহোক, আমি মনে করি না যে এই প্রশ্নটি সেই ব্যাখ্যাটিকে বোঝায় । আমি বিশ্বাস করি যে এই প্রশ্নটি একটি কাঠামো বা একটি শ্রেণিবিন্যাসের সন্ধান করে , পদ্ধতির সাথে বা পদ্ধতির সাথে মিলের কাজগুলি ( অ্যালগোরিদম এবং ধারণাগুলিকে গ্র্যানুলারিটির সমস্যাগুলির কারণে উপেক্ষা করা উচিত)। সেই দৃষ্টিকোণ থেকে, এই উত্তরটি খুব বেশি বিস্তৃত নয় এবং এইভাবে, আইএমএইচও বৈধ।
আলেকসান্দ্র ব্লেক

@ আলেকসান্দ্রব্লেখ ঠিক যেমনটি আপনি উল্লেখ করেছেন তার কাঠামো হ'ল প্রশ্নের উদ্দেশ্য। আমি স্পষ্ট করার জন্য এটি সম্পাদনা করছি। আপনাকে ধন্যবাদ
জাভিয়েরফ্ডার

@ জাভিয়ারফডিআর: আপনাকে স্বাগতম।
আলেকসান্দ্র ব্লেক

@ সীনওউইন আমি মূল প্রশ্নটি সংশোধন করেছি। যদি এখনও বিস্তৃত হয় এবং আমাকে এটি আরও তীব্র করা প্রয়োজন দয়া করে আমাকে বলুন। ধন্যবাদ!
জাভিয়েরফডর

উত্তর:


6

আমি @ জোগাফার এর সাথে একমত এটি সত্যিই একটি খুব ভাল তালিকা। যাইহোক, বর্তমানে এই তালিকাটি তৈরি করার সাথে সাথে আমি কিছু সমস্যা দেখছি । উদাহরণস্বরূপ, একটি বিষয় যে প্রস্তাব সমাধান আলাদা হয় গ্র্যানুলারিটি মাত্রা - তাদের কিছু প্রতিনিধিত্ব পন্থা - কিছু পদ্ধতি , কিছু - আলগোরিদিম মাত্র - এবং কিছু অন্যান্য ধারণার (অন্য কথায়, পদ একটি বিষয় ডোমেন পরিভাষা মধ্যে)। এছাড়াও, - এবং আমি বিশ্বাস করি যে এটি উপরের তুলনায় অনেক বেশি গুরুত্বপূর্ণ - আমি মনে করি যে এটি অনেক মূল্যবান হবে, যদি তালিকার সমস্ত সমাধান একীভূত বিষয়গত পরিসংখ্যান কাঠামোর মধ্যে সজ্জিত করা হত। এই ধারণাটি লিসা হারলো "মাল্টিভারিয়েট চিন্তার সারমর্ম" র একটি দুর্দান্ত বই পড়ে অনুপ্রাণিত হয়েছিল। অতএব, সম্প্রতি আমি স্ট্যাক এক্সচেঞ্জের ক্রস যাচাইকৃত সাইটে আলোচনা সত্ত্বেও কিছুটা সীমাবদ্ধ থাকা সত্ত্বেও একটি অনুরূপ সূচনা করেছি । শিরোনাম আপনাকে বিভ্রান্ত করতে দেবেন না - উপরে বর্ণিত হিসাবে আমার নিহিত উদ্দেশ্য এবং আশা একটি ইউনিফাইড কাঠামো তৈরির জন্য for


আপনি যে কাঠামোটি উল্লেখ করেছেন সেটি হ'ল দুর্দান্ত জিনিস হবে! অনুরূপ কিছু লেখা হচ্ছে?
জাভিয়েফডর

@ জাভিয়ারফডিআর: এমন কিছুই যা আমি অবগত নই। যাইহোক, আমি তাকিয়ে রাখা।
আলেকসান্দ্র ব্লেক

@ আলেকসান্দ্রব্লেখ যত বেশি আমি এটি সম্পর্কে চিন্তা করি ততই আমার মনে হয় একটি পরিসংখ্যান কাঠামোর সন্ধানটি বিপথগামী। আপনার প্রশ্নের উপর ফ্র্যাঙ্ক হ্যারেলের উত্তর এবং এটির আমার উত্তর দেখুন। তবে হার্লোর বইটি সত্যিই আকর্ষণীয় বলে মনে হচ্ছে এবং আমি এই সপ্তাহে এটি লাইব্রেরি থেকে তুলে নেব।
ছায়ামত

1
@ এসএসডেকট্রোল: আমি শ্রদ্ধার সাথে একমত নই। এই ধরণের কাঠামোটির অস্তিত্ব নেই বলে ধরে নিই (এটি সম্ভবত বর্তমান সময়ে কেস) এবং এটি উপলব্ধি করা যে কোনও সহজ কাজ নয় তা বুঝতে পেরে আমি দৃ strongly়ভাবে বিশ্বাস করি যে তবুও এটি খুব সম্ভব possible আপনি যে উত্তরের উল্লেখ করেছেন সেগুলি সম্পর্কে (আমি সবসময় তাদের সবকটিই পড়ে থাকি), আমি উভয়ই পড়েছি তবে তারা প্রমাণ করে না যে এ জাতীয় কাঠামো তৈরি করা অসম্ভব - কেবল কঠিন, যেমনটি আমি উল্লেখ করেছি। এটি এমন কিছু নয় যা লোকেদের এটি সম্পর্কে চিন্তাভাবনা করা এবং এমনকি সেদিকেও কাজ করা থেকে বিরত রাখা উচিত। হার্লোর বইটি উপভোগ করুন।
আলেকসান্দ্র ব্লেক

3

এটি একটি ভাল তালিকা অনেকটি কভার করে। যেকোনো কিছুকে মেশিন লার্নিং বলা হওয়ার আগে থেকে আমি এই পদ্ধতিগুলির কয়েকটি ব্যবহার করেছি এবং আমার মনে হয় আপনি তালিকাভুক্ত কয়েকটি পদ্ধতি সময়ের সাথে সাথে ব্যবহার এবং আগমনকে দেখতে পাবেন। যদি কোনও পদ্ধতি খুব দীর্ঘ সময়ের পক্ষে না থেকে যায় তবে এটি পুনর্বিবেচনার সময় হতে পারে। কিছু পদ্ধতি অধ্যয়নের বিভিন্ন ক্ষেত্রের ফলে বিভিন্ন নামের পেছনে বিস্মৃত হতে পারে।

আমি এই পদ্ধতিগুলি ব্যবহার করেছি এমন প্রধান ক্ষেত্রগুলির মধ্যে একটি হ'ল খনিজ সম্ভাব্য মডেলিংয়ে, যা ভূ-স্থানিক এবং এটি সমর্থন করার জন্য যে আপনি স্থানিক এবং ওরিয়েন্টেড ডেটা পদ্ধতির সাথে সম্পর্কিত কিছু অতিরিক্ত বিভাগ যুক্ত করতে পারেন।

আপনার বিস্তৃত প্রশ্নটিকে নির্দিষ্ট ক্ষেত্রগুলিতে নিয়ে যাওয়া সম্ভবত এমন হবে যেখানে আপনি আপনার বিস্তৃত তালিকায় নয় এমন পদ্ধতির আরও উদাহরণ খুঁজে পাবেন। উদাহরণস্বরূপ, খনিজ সম্ভাবনাগুলিতে আমি যে দুটি পদ্ধতি দেখেছি তা হ'ল পিছনের ধাপের দিকের রিগ্রেশন এবং প্রমাণ মডেলিংয়ের ওজন। আমি কোনও পরিসংখ্যানবিদ নই; সম্ভবত এগুলি লিনিয়ার রিগ্রেশন এবং বায়েশিয়ান পদ্ধতির অধীনে তালিকার অন্তর্ভুক্ত হিসাবে বিবেচিত হবে।


1

আমি মনে করি আপনার পন্থাটি কিছুটা পিছনের দিকে।

"এই ডেটাতে লাগানো কোনও গাউসিয়ান বিতরণের অর্থ কী?" সমস্যাটির বিবৃতি কখনই হয় না, সুতরাং "আমি কীভাবে কোনও গাউসিয়ান ফিট করব?" আপনি আসলে যে সমস্যাটি সমাধান করতে চান তা কখনই নয়।

পার্থক্যটি সিনমেটিকের চেয়ে বেশি। "আমি কীভাবে নতুন বৈশিষ্ট্যগুলি তৈরি করব?" প্রশ্নটি বিবেচনা করুন? আপনার লক্ষ্য যদি কোনও সূচক বিকাশ করা হয় তবে আপনি কিছু ধরণের ফ্যাক্টর বিশ্লেষণ ব্যবহার করতে পারেন। যদি আপনার লক্ষ্যটি কোনও রৈখিক মডেল ফিট করার আগে বৈশিষ্ট্যের স্থানটি হ্রাস করা হয় তবে আপনি এই পদক্ষেপটি পুরোপুরি এড়িয়ে যেতে পারেন এবং পরিবর্তে ইলাস্টিক নেট রিগ্রেশন ব্যবহার করতে পারেন।

আপনি মোকাবেলা করতে সক্ষম হতে চান এমন প্রকৃত ডেটা বিশ্লেষণ কার্যগুলির একটি তালিকা সংকলন করার জন্য একটি আরও ভাল উপায় হবে । প্রশ্নগুলি যেমন:

গ্রাহকরা আমার শপিং ওয়েবসাইটে ফিরে আসবেন কিনা তা আমি কীভাবে ভবিষ্যদ্বাণী করব?

কয়টি "প্রধান" গ্রাহক শপিংয়ের ধরণ রয়েছে তা আমি কীভাবে শিখব এবং সেগুলি কী?

আমি কীভাবে আমার অনলাইন স্টোরের বিভিন্ন আইটেমের জন্য "অস্থিরতা" এর একটি সূচক তৈরি করব?

এছাড়াও আপনার তালিকায় এখনই প্রচুর পরিমাণে উপাদান রয়েছে; "পর্যালোচনা" করার জন্য এবং পৃষ্ঠ-স্তরীয় বোঝার চেয়ে আরও বেশি লাভ করার পক্ষে অনেক বেশি। একটি আসল উদ্দেশ্য মাথায় রেখে আপনি আপনার অগ্রাধিকার বাছাই করতে সাহায্য করতে পারে।


আপনি যা বলছেন তা আমি বুঝতে পেরেছি এসএসডেকট্রোল, আপনার উল্লিখিত সমস্যা হিসাবে সাধারণত সমস্যার সমাধানের একটি বিস্তৃত তালিকা থাকাও খুব কার্যকর হতে পারে। এখন, দুটি পদ্ধতির মধ্যে মূল পার্থক্যটি হ'ল আমি প্রস্তাব করছি এমন প্রযুক্তিগত প্রশ্নগুলির সাথে সরাসরি যুক্ত যা আপনি ইতিমধ্যে বিকল্পগুলি ব্যবহার করার সময় নিজেকে জিজ্ঞাসা করতে পারেন এবং সেই সময়ে আপনি ইতিমধ্যে কিছু অনুমান করেছিলেন o সুতরাং, আপনি যদি ধরে নিয়ে থাকেন তবে আপনার বৈশিষ্ট্যগুলি গাউসিয়ান নয়, আমি কি মাত্রা হ্রাসের জন্য পিসিএ ব্যবহার করব? না। আপনার পদ্ধতির দিকটি আরও বিস্তৃত: ম্লান হয়ে কী ব্যবহার করবেন। হ্রাস -> পিসিএ, তবে গাউসীয় বৈশিষ্ট্যগুলি ধরে রাখুন। ধন্যবা
Javierfdr

@ জাভিয়ারফডিআর আমার বক্তব্যটি আপনার মনে যদি কোনও মুলতুবি প্রশ্ন না থাকে তবে প্রযুক্তিগত প্রশ্নগুলি একটি ব্যাঘাত।
ছায়াছবির
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.