মেশিন লার্নিং কুকবুক / রেফারেন্স কার্ড / চিটশিট?


57

আমি সম্ভাব্যতা এবং পরিসংখ্যান কুকবুক এবং ডেটা মাইনিংয়ের জন্য রেফারেন্স কার্ডের মতো সংস্থানগুলি অবিশ্বাস্যভাবে দরকারী বলে খুঁজে পাই । তারা স্পষ্টতই রেফারেন্স হিসাবে ভাল পরিবেশন করে তবে একটি বিষয়ে আমার চিন্তাভাবনাগুলি সংগঠিত করতে এবং জমির লেওটি পেতে আমাকে সহায়তা করে।

প্রশ্ন: মেশিন লার্নিং পদ্ধতির জন্য কি এই সংস্থানগুলির মতো কিছু বিদ্যমান?

আমি একটি রেফারেন্স কার্ডটি কল্পনা করছি যা প্রতিটি এমএল পদ্ধতিতে অন্তর্ভুক্ত থাকবে:

  • সাধারণ বৈশিষ্ট্য
  • যখন পদ্ধতিটি ভালভাবে কাজ করে
  • যখন পদ্ধতিটি খারাপ হয় না
  • যা থেকে বা কোন অন্যান্য পদ্ধতিতে পদ্ধতিটি সাধারণীকরণ করে। এটি কি বেশিরভাগই ছাড় দেওয়া হয়েছে?
  • পদ্ধতিতে আঞ্চলিক কাগজপত্র
  • পদ্ধতির সাথে যুক্ত ওপেন সমস্যাগুলি
  • গণনার তীব্রতা

আমি নিশ্চিত যে পাঠ্যপুস্তকের মাধ্যমে কিছু ন্যূনতম খনন করে এই সমস্ত জিনিস পাওয়া যাবে। এগুলিকে কয়েকটি পৃষ্ঠায় রাখা খুব সুবিধাজনক হবে।


5
একটি দুর্দান্ত লক্ষ্য, তবে "কিছু পাঠ্যপুস্তকের মাধ্যমে ন্যূনতম খনন"? পরিসংখ্যানগত পড়াশুনা এবং ডেটা মাইনিং + mloss.org/software/rating এর জন্য এই 20 টি বই কীভাবে কেউ সঙ্কলন করতে শুরু করতে পারে ?
ডেনিস


2
(+1) চুজ্জার জন্য, যদি এইরকম ওভারভিউ উপস্থিত থাকে তবে আমি এর জন্য অর্থ প্রদান করব। মূল সমস্যাটি হ'ল কিছু বৈশিষ্ট্য যা নিজে নিজেই অ্যালগরিদম থেকে উদ্ভূত হতে পারে, এর মতো বেশিরভাগ বৈশিষ্ট্য বা আঙ্গুলের নিয়মগুলি অভিজ্ঞতা, অর্থাত্ অ্যাপ্লিকেশন দ্বারা অর্জিত হয়। আমি নিশ্চিত যে যুদ্ধ-কড়া প্রয়োগিত গবেষক বা এমএল-ফ্রেমওয়ার্ক-প্রোগ্রামার / পরামর্শদাতা এরকম কিছু লিখতে পারেন ... তবে এখানে এবং এখন?
স্টিফেন

@ ডেনিস: "20 বই .." লিঙ্কটি কাজ করে না, আপনি কি এটি পরীক্ষা করতে পারেন?
lmsasu

6
আমি কোনও মেশিন লার্নিং বিশেষজ্ঞ নই তাই আমি উত্তর পোস্ট করার জন্য অন্যের কাছে পিছিয়ে দেব তবে আমি মনে করি যে পরিসংখ্যান শিক্ষার উপাদানগুলি বিষয়টির একটি ভাল পাঠ হিসাবে বিবেচিত এবং ক্ষেত্রের বৃহত্তম কিছু নাম দ্বারা এটি রচিত। আমার যুক্ত করা উচিত যে এই বইটি একটি উচ্চ স্তরে লেখা হয়েছে এবং যাঁরা শুনেছি তাদের কাছে এটি পরিসংখ্যানে পিএইচডি আছে।
ম্যাক্রো

উত্তর:


25

কয়েকটি সেরা এবং অবাধে উপলভ্য সংস্থানগুলি হ'ল :

লেখকের প্রশ্নের হিসাবে আমি "সমস্তই এক পৃষ্ঠায়" সমাধানটি পাই নি


সের্গেই, নাপিতের বইটি কি মাতলাবের সাথে বাঁধা?
ডেনিস

2
হ্যাঁ, কেবলমাত্র বইটির লিঙ্কটি একবার দেখুন: বিআরএমএল টোল বক্সটি পাঠকদের যাতে গণিতের মডেলগুলি প্রকৃত এমএটি-ল্যাব কোডগুলিতে অনুবাদ করে তা দেখতে সহায়তা করে।
সের্গে

31

আপনি যদি মেশিন লার্নিং শিখতে চান তবে আমি আপনাকে প্রফেসর অ্যান্ড্রু এনজি দ্বারা শেখানো শীতে বিনামূল্যে অনলাইন এমএল কোর্সে ভর্তির জন্য দৃ strongly় পরামর্শ দিচ্ছি ।

আমি শরত্কালে পূর্বেরটি করেছি এবং সমস্ত শিক্ষার উপাদান ব্যতিক্রমী মানের এবং ব্যবহারিক প্রয়োগগুলির দিকে লক্ষ্য রাখে, এবং বইয়ের সাথে একা লড়াই করে যাওয়াই অনেক সহজ।

এটি ভাল স্বজ্ঞাত ব্যাখ্যা এবং গণিতের সর্বনিম্ন পরিমাণ সহ একটি সুন্দর কম ঝুলন্ত ফলও তৈরি করেছে।


আমি সবেমাত্র এই কোর্সটি শেষ করেছি এবং এটি দুর্দান্ত! এছাড়াও, এটি আমাকে মেশিন লার্নিংয়ের বইগুলি বোঝার জন্য একটি দুর্দান্ত সূচনা দিয়েছে।
বি সেভেন

1
আমি মনে করি এই লিঙ্কে এখন coursera.org/course/ml
n611x007

14

হ্যাঁ, আপনি ভাল আছেন; ক্রিস্টোফার বিশপের "প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিং" সাধারণ রেফারেন্সের জন্য একটি দুর্দান্ত বই, আপনি এটির সাথে সত্যই ভুল হতে পারবেন না।

মোটামুটি সাম্প্রতিক একটি বই কিন্তু খুব ভাল লেখা এবং সমানভাবে বিস্তৃত ডেভিড বারবারের " বায়সিয়ান রিজনিং এবং মেশিন লার্নিং "; আমার মনে হবে এমন একটি বই ক্ষেত্রের নতুন আগতদের জন্য কিছুটা উপযুক্ত।

আমি হাসতি এট আল এর "পরিসংখ্যানগত শিক্ষার উপাদানগুলি" ব্যবহার করেছি। (ম্যাক্রো দ্বারা উল্লিখিত) এবং খুব শক্তিশালী বইয়ের সময় আমি এটিকে প্রথম রেফারেন্স হিসাবে সুপারিশ করব না; সম্ভবত এটি আরও বিশেষীকৃত বিষয়ের জন্য দ্বিতীয় রেফারেন্স হিসাবে আপনাকে আরও ভালভাবে পরিবেশন করতে পারে। সেই দিক থেকে, ডেভিড ম্যাকের বই ইনফরমেশন থিওরি, ইনফারেন্স এবং লার্নিং অ্যালগরিদমও একটি দুর্দান্ত কাজ করতে পারে।


2
বিশপের পক্ষে +1। এমনকি সমান স্তরের বিশদ সহ বিকাশ পরিষ্কার করুন। এখনও ভাল থাকাকালীন আমি সবসময় হাসতি এবং অন্যকে খুঁজে পাই। একটু চপ্পি
কনজুগেটপায়ার

1
+1 - হস্টি, তিবশিরানী এবং ফ্রেডম্যান আমার ব্যক্তিগত প্রিয়।
স্টাসকে

1
আমার ব্যক্তিগত প্রিয়, হস্টি, তিবশিরানী এবং ফ্রেডম্যানের প্রস্তাব দেওয়ার জন্যও +1 করুন। এবং অন্যান্য সুপারিশের জন্য ধন্যবাদ; আমি তাদের একটি পঠন দেব কারণ আমার অ-পরিসংখ্যানবিদদের (বা কেবলমাত্র ক্ষেত্রের মধ্যে প্রবেশ করা ব্যক্তিদের) সুপারিশ করার জন্য সত্যই একটি ভাল বই দরকার।
নস্টর

1
বিশপের পক্ষে +1। এটি আসলে শাস্ত্রীয় পরিসংখ্যানের জন্যও দুর্দান্ত উত্স, তবে আপডেট এবং ছদ্মবেশে।
অনুমানগুলি

10

যেহেতু conক্যমত্য বলে মনে হচ্ছে যে এই প্রশ্নটি কোনও সদৃশ নয়, তাই আমি মেশিন শিখতে শুরুর জন্য আমার পছন্দটি ভাগ করতে চাই:

আমি প্রোগ্রামিং কালেক্টিভ ইন্টেলিজেন্স নবীনদের জন্য সবচেয়ে সহজ বইটি পেয়েছি , যেহেতু লেখক টবি সেগারান মিডিয়ান সফটওয়্যার বিকাশকারীকে যত দ্রুত সম্ভব ডেটা হ্যাকিংয়ের সাথে তার হাত নোংরা করার সুযোগ দেওয়ার দিকে মনোনিবেশ করছেন।

সাধারণ অধ্যায়: ডেটা সমস্যাটি স্পষ্টভাবে বর্ণিত হয়েছে, তারপরে একটি অ্যালগরিদম কীভাবে কাজ করে তার একটি মোটামুটি ব্যাখ্যা দিয়ে এবং শেষ পর্যন্ত দেখায় কীভাবে কোডের কয়েকটি লাইন দিয়ে কিছু অন্তর্দৃষ্টি তৈরি করা যায়।

পাইথনের ব্যবহার একজনকে বরং দ্রুত সমস্ত কিছু বোঝার অনুমতি দেয় (আপনাকে অজগরটি গুরুত্বের সাথে জানার দরকার নেই, আমি এটি আগেও জানতাম না)। মনে করবেন না যে এই বইটি কেবলমাত্র সুপারিশকারী সিস্টেম তৈরির দিকেই নিবদ্ধ। এটি টেক্সট মাইনিং / স্প্যাম ফিল্টারিং / অপ্টিমাইজেশন / ক্লাস্টারিং / বৈধকরণ ইত্যাদির সাথেও কাজ করে এবং তাই আপনাকে প্রতিটি ডেটা মাইনারের প্রাথমিক সরঞ্জামগুলির উপর একটি ঝরঝরে ওভারভিউ দেয়।


6

উইটেন এবং ফ্র্যাঙ্ক, "ডেটা মাইনিং", এলসেভিয়ার 2005 স্ব-শিক্ষার জন্য একটি ভাল বই কারণ বইটির সাথে জাভা পাঠাগারটি রয়েছে (ওয়েকা) বইটি যাবার জন্য এবং খুব ব্যবহারিকভাবেই ওরিয়েন্টেড। আমার সন্দেহ হয় আমার যে সংস্করণটি রয়েছে তার চেয়ে আরও সাম্প্রতিক সংস্করণ রয়েছে।


1
হ্যাঁ, এই বইটিকে "মেশিন লার্নিং" বলা হত তবে প্রকাশকরা সেই সময় ডেটা মাইনিং হাইপকে চালানোর জন্য এই নামটি "ডেটা মাইনিং" হিসাবে পরিবর্তন করেছিলেন, তবুও বইটি এমএল নয়, ডিএম সম্পর্কিত (দুটি খালি মিল, তবে বিভিন্ন ক্ষেত্র!)।
clyfe

1
টম মিচেলের "মেশিন লার্নিং" বইটিও খুব ভাল; শৈলীটি কিছুটা পুরানো-ব্যর্থ, তবে সামগ্রীটি দুর্দান্ত।
ডিকরান মার্শুপিয়াল

হ্যাঁ, টম মিশেলের এমএল এমএল বাইবেলের মতো, মাঠে সত্যই বিস্তৃত!
clyfe

5

আমার কাছে মেশিন লার্নিং রয়েছে: স্টিফেন মার্সল্যান্ডের একটি অ্যালগরিদমিক দৃষ্টিভঙ্গি এবং এটি স্ব-শিক্ষার জন্য খুব দরকারী find পাইথন কোডটি পুরো বই জুড়ে দেওয়া হয়েছে।

আমি এই অনুকূল পর্যালোচনায় যা বলেছি তার সাথে আমি একমত:

http://blog.rtwilson.com/review-machine-learning-an-algorithmic-perspective-by-stephen-marsland/


5

"স্ট্যাটিস্টিকাল লার্নিং এর উপাদানগুলি" আপনার উদ্দেশ্যগুলির জন্য একটি দুর্দান্ত বই হবে। ২০১১ সালের গোড়ার দিকে প্রকাশিত বইয়ের 5 তম সংস্করণটি http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf এ অবাধে উপলব্ধ


2
এটি গণিতের ভারী বই তাই স্ব-শিক্ষার পক্ষে এটি অনুসরণ করা কঠিন।
আতিলা ওজগুর

আপনি কী জানেন যে স্প্রিঞ্জার যখন এটির জন্য 70 charges চার্জ করে তখন ট্র্যাভর হাস্টির ব্যক্তিগত পৃষ্ঠায় কীভাবে অবাধে ডাউনলোডযোগ্য হয়?
আলফ্রেড এম

আমি নিশ্চিতভাবে জানি না, তবে আমি কল্পনা করব যে স্প্রিংগার অর্থ চায় এবং লেখকরা মূলত তাদের বইটি ব্যাপকভাবে প্রচার করতে চান। এটি স্প্রিঞ্জার আপনাকে প্রকাশিত নিবন্ধগুলি কীভাবে বিক্রি করবে তার অনেক মিল বলে মনে হচ্ছে যখন অনেকগুলি "ওয়ার্কিং পেপার সংস্করণ" লেখকের ওয়েবসাইটে নিখরচায় পাওয়া যায়।
ড্যানবি

এফওয়াইআই, ডাউনলোডটি দ্বিতীয় সংস্করণের 5 ম মুদ্রণের জন্য। ডেমিংকে দায়ী করা হয়েছে "Godশ্বরের উপরে আমরা বিশ্বাস করি, অন্যরা ডেটা নিয়ে আসে" theপৃষ্ঠের পাদটীকাটি আমি পছন্দ করি। পাদটীকাটি বিদ্রূপের দিকে ইঙ্গিত করে যে ডেমিং আসলে এটি বলছে এমন কোনও তথ্য "ডেটা" পাওয়া যায় না।
হিফফান জন

আপনি উল্লেখ করা উচিত আর সঙ্গে পরিসংখ্যানগত শিক্ষণ পরিচিতি --it এর সাজানোর তাদের মত ইএসএল -lite (যদি গণিত ইএসএল খুব daunting হয়)।
স্টিভ এস

5

এখানে চিত্র বর্ণনা লিখুন

প্রায়শই একটি মেশিন লার্নিংয়ের সমস্যা সমাধানের সবচেয়ে শক্ত অংশটি কাজের জন্য সঠিক অনুমানকারীকে সন্ধান করতে পারে। বিভিন্ন ধরণের ডেটা এবং বিভিন্ন সমস্যার জন্য বিভিন্ন অনুমানকারী আরও ভাল। নীচের ফ্লোচার্টটি ব্যবহারকারীদের আপনার ডেটা নিয়ে কোন অনুমানকারী চেষ্টা করতে হবে সে সম্পর্কে সমস্যাগুলির কাছে কীভাবে যেতে হবে সে সম্পর্কে একটি মোটামুটি গাইড দেওয়ার জন্য ডিজাইন করা হয়েছে। এটি ডকুমেন্টেশন দেখতে নীচের চার্টে কোনও অনুমানকারীকে ক্লিক করুন।



3

অন্যান্য উত্তরে উল্লিখিত বেশিরভাগ বইগুলি খুব ভাল এবং আপনি সেগুলির কোনওটির সাথেই সত্যিই ভুল হতে পারবেন না। অতিরিক্তভাবে, পাইথনের বেশ দরকারী জন্য আমি নীচের চিট শীটটি পেয়েছি scikit-learn


2

আমি দুদা, হার্ট এবং স্টর্ক "প্যাটার্ন শ্রেণিবিন্যাস" পছন্দ করি। এটি একটি ক্লাসিক পাঠ্যের সাম্প্রতিক সংস্করণ যা সমস্ত কিছু খুব ভালভাবে ব্যাখ্যা করে। নিউরাল নেটওয়ার্ক এবং এসভিএমগুলির অনেক বেশি কভারেজ থাকতে আপডেট হয়েছে তা নিশ্চিত নন Not হাসেটি, তিবশিরানী এবং ফ্রেডম্যানের বইটি সেখানে সবচেয়ে সেরা সম্পর্কে রয়েছে তবে আপনি যা খুঁজছেন তার চেয়ে খানিকটা প্রযুক্তিগত হতে পারে এবং বিষয়টির ওভারভিউয়ের চেয়ে বিশদ বিবরণ রয়েছে।


2

মাইক্রোসফ্ট অ্যাজুরে আন্তোন তারাসেনকো পোস্ট করা বিজ্ঞান-শিখার জন্য একই ধরণের চিট শীট সরবরাহ করে।

মাইক্রোসফ্ট অ্যাজুরি মেশিন লার্নিং অ্যালগরিদম চিট শিট

(উত্স: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

তারা একটি বিজ্ঞপ্তি সহ এটি সহ:

এই অ্যালগরিদম চিট শীটে প্রদত্ত প্রস্তাবনাগুলি আনুমানিক নিয়মের-থাম্ব। কিছু বক্র করা যেতে পারে, এবং কিছু প্রতারণামূলকভাবে লঙ্ঘন করা যেতে পারে। এটি একটি সূচনা পয়েন্ট পরামর্শ দেওয়ার উদ্দেশ্যে করা হয়। (...)

মাইক্রোসফ্ট অতিরিক্ত বিবরণ সরবরাহ করে এমন একটি প্রারম্ভিক নিবন্ধ সরবরাহ করে।

দয়া করে লক্ষ্য করুন যে those উপকরণগুলি মাইক্রোসফ্ট অ্যাজুরেতে প্রয়োগকৃত পদ্ধতির উপর দৃষ্টি নিবদ্ধ করে।


1

পরিসংখ্যান শিক্ষার উপাদানগুলির সাথে শুরু করবেন না। এটি দুর্দান্ত, তবে এটি একটি রেফারেন্স বই, যা আপনি যা খুঁজছেন তা শোনাচ্ছে না। আমি প্রোগ্রামিং কালেক্টিভ ইন্টেলিজেন্স দিয়ে শুরু করব কারণ এটি একটি সহজ পঠন।


আমি নিশ্চিত নই যে আমি ইএসএলকে একটি রেফারেন্স পাঠ্য হিসাবে চিহ্নিত করব। এটি আমার কাছে একটি ওভারভিউর আরও বেশি মনে হয়, যেমন আপনি কোনও কিছুরই কৌতুকপূর্ণ কৌটা বিবরণ শিখছেন না। আপনি বিস্তৃত কৌশল এবং অত্যধিক থিমগুলি দেখতে পাবেন।
কার্ডিনাল

1

মেশিন লার্নিং সম্পর্কিত একটি প্রথম বইয়ের জন্য, যা নীতিগুলি ব্যাখ্যা করার জন্য ভাল কাজ করে, আমি দৃ strongly়ভাবে সুপারিশ করব

রজার্স এবং গিরোলামি, মেশিন লার্নিংয়ের প্রথম কোর্স , (চ্যাপম্যান এবং হল / সিআরসি মেশিন লার্নিং এবং প্যাটার্ন রিকগনিশন), ২০১১।

ক্রিস বিশপের বই বা ডেভিড বারবারের দু'টিই নীতিগুলি সম্পর্কে ভালভাবে উপলব্ধি করার পরে, বৃহত্তর প্রস্থ সহ একটি বইয়ের জন্য ভাল পছন্দ করে।


0

আমি এর মতো একটি সংক্ষিপ্তসার লিখেছি, তবে কেবল একটি মেশিন লার্নিং টাস্কে (নেটফ্লিক্স প্রাইজ), এবং এটিতে ১৯৫ টি পৃষ্ঠা রয়েছে: http://arek-paterek.com/book



0

ম্যাক্স কুহান বই ফলিত ভবিষ্যদ্বাণীমূলক মডেলিংয়ের মধ্যে একটি ভাল চিটশিট । বইটিতে বেশ কয়েকটি এমএল লার্নিং মডেলের একটি ভাল সারসংক্ষেপ টেবিল রয়েছে। টেবিল পরিশিষ্ট এ পৃষ্ঠা 549 এ রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.