মেশিন লার্নিংয়ের জন্য "হট অ্যালগরিদম" কী কী?


14

মেশিন লার্নিং শিখতে শুরু করা কারও কাছ থেকে এটি একটি নির্লজ্জ প্রশ্ন। আমি আজকাল মার্সল্যান্ডের "মেশিন লার্নিং: একটি অ্যালগোরিদমিক দৃষ্টিভঙ্গি" বইটি পড়ছি। আমি এটি একটি প্রবর্তনাকারী বই হিসাবে দরকারী মনে করি তবে এখন আমি উন্নত অ্যালগরিদমে যেতে চাই, যেগুলি বর্তমানে সেরা ফলাফল দিচ্ছে। আমি বেশিরভাগ বায়োইনফরম্যাটিক্সে আগ্রহী: জৈবিক নেটওয়ার্কগুলির গুচ্ছবৃত্তি এবং জৈবিক ক্রমগুলির নিদর্শনগুলি সন্ধান করি, বিশেষত একক নিউক্লিওটাইড পলিমারফিজম (এসএনপি) বিশ্লেষণে প্রয়োগ করা হয়। আপনি আমাকে কিছু রিভিউ বা বই পড়ার জন্য সুপারিশ করতে পারেন?

উত্তর:


15

ডিপ লার্নিং 2006 এর পর থেকে প্রচুর ফোকাস পেয়েছে It's এটি মূলত গভীর স্নায়বিক নেটওয়ার্কগুলি প্রশিক্ষণের জন্য একটি পদ্ধতির এবং খুব শক্ত ডেটাসেটগুলিতে (যেমন ডকুমেন্ট ক্লাস্টারিং বা অবজেক্টের স্বীকৃতি হিসাবে) সত্যই চিত্তাকর্ষক ফলাফলের দিকে নিয়ে যাচ্ছে। কিছু লোক দ্বিতীয় নিউরাল নেটওয়ার্ক রেনেসাঁ সম্পর্কে কথা বলছেন (যেমন এই গুগল টকটিতে শ্মিধুবারের টকটিতে)।

আপনি যদি মুগ্ধ হতে চান তবে আপনার এই সায়েন্স পেপারটি স্নায়বিক নেটওয়ার্কগুলির সাথে ডেটার মাত্রিকতা হ্রাস করা উচিত , হিন্টন এবং সালখুদ্দিনভের ।

(এই অঞ্চলে এখনই অনেক কাজ চলছে, আমি জানি যে মাত্র দুটি আগত বইই এটিকে চিকিত্সা করবে: লার্জ স্কেল মেশিন লার্নিং , ল্যাংফোর্ড এট এবং মেশিন লার্নিং: একটি সম্ভাব্য দৃষ্টিভঙ্গি কেভিন মরফির ।)

আপনি যদি আরও জানতে চান তবে প্রধান গভীর শিক্ষার দলগুলি কী করছে তা পরীক্ষা করে দেখুন: স্ট্যানফোর্ড , মন্ট্রিল এবং সর্বাধিক গুরুত্বপূর্ণ টরন্টো # 1 এবং টরন্টো # 2


8

এখনও অবধি দেওয়া বেশিরভাগ উত্তর "তদারকি করা শিক্ষণ" (অর্থাত্ আপনার যেখানে আপনার ডেটাসেটের কোনও অংশের জন্য লেবেল রয়েছে, যা আপনি অ্যালগোরিদমকে প্রশিক্ষণের জন্য ব্যবহার করতে পারেন) বোঝায়। প্রশ্নটিতে বিশেষত ক্লাস্টারিংয়ের কথা বলা হয়েছে, যা একটি "নিরীক্ষণ" পদ্ধতি (যেমন কোনও লেবেল আগে জানা যায়নি)। এই পরিস্থিতিতে আমি এটি দেখার পরামর্শ দিই:

  • k-মানে এবং কার্নেল কে-মানে
  • Agglomerative ক্লাস্টারিং
  • অ-নেতিবাচক ম্যাট্রিক্স কারখানা
  • লেটেন্ট ডিরিচলেট বরাদ্দ
  • ডিরিচলেট প্রসেস এবং হায়ারারিকিকাল ডিরিচলেট প্রক্রিয়াগুলি

তবে প্রকৃতপক্ষে আপনি সম্ভবত দেখতে পাবেন যে আপনার সাদৃশ্য / দূরত্বের পরিমাপ আপনি যে নির্দিষ্ট অ্যালগরিদম ব্যবহার করছেন তার চেয়ে বেশি গুরুত্বপূর্ণ।

আপনার যদি কিছু লেবেলযুক্ত ডেটা থাকে, তবে "আধা-তত্ত্বাবধান লার্নিং" পদ্ধতিগুলি জনপ্রিয়তা অর্জন করছে এবং এটি খুব শক্তিশালী হতে পারে। এসএসএলের জন্য একটি ভাল প্রারম্ভিক বিন্দু হ'ল ল্যাপএসভিএম (ল্যাপ্লাসিয়ান সাপোর্ট ভেক্টর মেশিন)।


7

এগুলি এমন বই যা সহায়ক হতে পারে:

  • ডেটা মাইনিংয়ের পরিচিতিপাং-নিং টান, মাইকেল স্টেইনবাচ, বিপিন কুমার দ্বারা মাইনিংয়ের । এটি বিশ্ববিদ্যালয়ে আমার ডেটা মাইনিং ক্লাস চলাকালীন প্রস্তাবিত বই ছিল। আমি এর বিন্যাস এবং তাত্ত্বিক পদ্ধতির পছন্দ করি;
  • ডেটা মাইনিং: প্র্যাকটিকাল মেশিন লার্নিং সরঞ্জাম এবং কৌশলগুলি আয়ান এইচ। উইটেন, আইবে ফ্র্যাঙ্ক, মার্ক এ। একটি খুব আকর্ষণীয় বই। এই বইটি ডেটা মাইনিং ফ্রেমওয়ার্ক WEKA এর সাথে অনেকগুলি প্রয়োগকৃত কৌশলও কভার করে ;
  • টমাস মিচেল মেশিন লার্নিং । এটি কিছুটা পুরাতন বই তবে এটি কার্যকর হতে পারে।

তারপরে মনে রাখবেন যে আপনি স্ট্যানফোর্ডে মেশিন লার্নিংয়ের ফ্রি ক্লাসগুলিতে সবে শুরু করেছেন: www.ML-class.com

এবং আপনার বিশেষ সমস্যার জন্য, এটি এসএনপি বিশ্লেষণ, আমি পাডোভা বিশ্ববিদ্যালয়ের ডি ক্যামিলোর গ্রুপটি দেখার পরামর্শ দেব ।


5

এখানে একটি দুর্দান্ত নিবন্ধ এবং বই রয়েছে যা বেশিরভাগ জনপ্রিয় পদ্ধতির যুক্তি, তত্ত্ব এবং প্রয়োগের ব্যাখ্যা দেয়:

ডেটা মাইনিংয়ের শীর্ষ 10 অ্যালগরিদম

এটি বিশেষভাবে ঝরঝরে কারণ এটি ক্ষেত্রের পোলিং বিশেষজ্ঞদের দ্বারা নির্বাচিত একটি "শীর্ষ 10"।

এছাড়াও, সাধারণভাবে জিনের ডেটাগুলির জন্য, বৈশিষ্ট্য নির্বাচন অনেকগুলি বৈশিষ্ট্যের কারণে অত্যন্ত গুরুত্বপূর্ণ। উদাহরণস্বরূপ, এসভিএম রিকার্সিভ বৈশিষ্ট্য নির্মূলকরণ (এসভিএম-আরএফই) এবং সম্পর্কিত পদ্ধতিগুলি খুব জনপ্রিয় এবং জিনের ডেটা প্রসঙ্গে সক্রিয়ভাবে বিকাশিত এবং প্রয়োগ করা হচ্ছে।


4

বুস্টেড ট্রি এবং কিছু ফর্ম এসভিএম প্রচুর প্রতিযোগিতা জিততে পারে তবে এটি সর্বদা প্রসঙ্গে চলে আসে। ম্যানিফোल्ड নিয়মিতকরণও এখন কাটিয়া প্রান্তে।


4

আমি হস্টি, তিবশিরানী এবং ফ্রেডম্যানের দ্বারা "স্ট্যাটাসটিকাল লার্নিংয়ের উপাদানগুলি" প্রস্তাব দিই। কেবল এটি পড়বেন না, তাদের দ্বারা বর্ণিত কিছু অ্যালগরিদম নিয়ে খেলুন (তাদের বেশিরভাগ আর এ প্রয়োগ করা হয়েছে, অথবা আপনি নিজে কিছু প্রয়োগ করতে পারেন), এবং তাদের দুর্বল এবং দৃ strong় বিষয়গুলি শিখুন।



3

রাসমুসেন এবং উইলিয়ামস (এমআইটি প্রেস) দ্বারা মেশিন লার্নিংয়ের জন্য গাউসীয় প্রক্রিয়াগুলি অবশ্যই আবশ্যক। গাউসীয় প্রক্রিয়া এখন মেশিন লার্নিংয়ের অন্যতম উত্তপ্ত অ্যালগরিদম যা প্রত্যাশা প্রচার এবং বৈকল্পিক ইনফারেন্স অ্যালগরিদম উপলব্ধ। বইটি খুব ভাল লেখা হয়েছে, একটি ফ্রি ম্যাটল্যাব সরঞ্জামবাক্স রয়েছে (কিট বিটটি ভাল), এবং বইটি বিনামূল্যে ডাউনলোড করা যায়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.