অধ্যয়নকারী মেশিন লার্নিং অ্যালগরিদম: অ্যালগরিদমের সংখ্যা বনাম বোঝার গভীরতা


13

সম্প্রতি আমি ডেটা সায়েন্সের ক্ষেত্রে পরিচয় করিয়েছি (এটি প্রায় months মাস প্রায় হয়েছে), এবং আইআইএইচইউ দ্বারা ডেটা সায়েন্স স্পেশালাইজেশনে কাজ করা পোস্টটি অ্যান্ড্রু এনজি দ্বারা মেশিন লার্নিং কোর্সের মাধ্যমে যাত্রা শুরু করেছিল।

ব্যবহারিক প্রয়োগের সম্মুখভাগে, আমি একটি ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরির জন্য কাজ করছি যা আত্মত্যাগের পূর্বাভাস দেয়। এখনও অবধি আমি এই পদ্ধতিগুলি শেখার এবং প্রয়োগ করার চেষ্টায় গ্ল্যাম, বায়সগ্ল্যাম, আরএফ ব্যবহার করেছি তবে এই অ্যালগরিদমগুলি সম্পর্কে আমার বোঝার মধ্যে আমি অনেক ফাঁক পেয়েছি।

আমার প্রাথমিক দ্বিধা হ'ল:

কয়েকটি অ্যালগরিদমের জটিলতা শিখতে আমার আরও ফোকাস করা উচিত বা আমি তাদের যখন এবং কখন এবং প্রয়োজনীয় হিসাবে অনেক কিছু জানার পদ্ধতিকে ব্যবহার করব?

দয়া করে আমাকে সঠিক দিকনির্দেশনা দিন, সম্ভবত বই বা নিবন্ধ বা আপনার যে কোনও উপকারে সহায়তা করবে বলে পরামর্শ দিয়ে।

আপনি যদি ডেটা সায়েন্সের ক্ষেত্রে সবেমাত্র তার ক্যারিয়ার শুরু করেছেন এমন কাউকে গাইড করার ব্যবসায়ের ধারণার সাথে উত্তর দেন এবং ব্যবসায় জগতের জন্য বাস্তব সমস্যাগুলি সমাধান করেন এমন একজন ব্যক্তি হতে চান তবে আমি কৃতজ্ঞ হব would

আমি এই পোস্টে প্রস্তাবিত সংস্থান (যত বেশি সম্ভব) সংস্থানগুলি (বই, নিবন্ধগুলি) পড়ব এবং একইরকম প্রশ্নগুলি জুড়ে আসা লোকদের জন্য এটি সহায়ক পোস্ট হিসাবে তৈরি করার জন্য একই রকমের উপকারিতা এবং তার পক্ষে একটি ব্যক্তিগত ফিড সরবরাহ করব as ভবিষ্যতে, এবং আমি মনে করি এই বইগুলির পরামর্শ দেওয়া লোকেরা যদি এটি করতে পারে তবে তা দুর্দান্ত হবে।

উত্তর:


9

আমি নিজেকে কয়েকটি চেষ্টা করা এবং বিশ্বাসযোগ্য অ্যালগরিদমে সীমাবদ্ধ করার সুপারিশ করব। আমি পরিসংখ্যানগত শিক্ষার উপাদানগুলির (প্রথম বই হিসাবে) সুপারিশ করব না। এটি খুব তাত্ত্বিক, স্নাতক শিক্ষার্থীদের লক্ষ্য, এক্স বা ওয়াই কীভাবে প্রমাণ করা যায় তা জিজ্ঞাসা করার অনুশীলন সহ ... আমি মনে করি আইএসএল আরও উপযুক্ত, আরও ব্যবহারিক পরামর্শ দিয়ে (কোনও ক্ষেত্রে উভয় বইই পিডিএফ ডাউনলোড হিসাবে বিনামূল্যে)।

পরিসংখ্যান ছাড়াও, আমি নিশ্চিত করবো যে আপনি পরীক্ষামূলক নকশা / এবি পরীক্ষায় এবং বিজনেস ইন্টেলিজেন্স / ভিজ্যুয়ালাইজেশন সহ স্বাচ্ছন্দ্য বোধ করছেন।


আপনি যদি এমন কিছু অ্যালগরিদমগুলির পরামর্শ দিতে পারেন যেগুলি মিস করা উচিত নয় বা ব্যবহারিক ব্যবসায়ের সমস্যাগুলি সমাধান করার জন্য সবচেয়ে বেশি কার্যকর বলা ভাল। সম্ভব হলে দয়া করে সেগুলি শিখার সর্বোত্তম উপায়গুলি উল্লেখ করুন (নির্দিষ্ট বই, স্বনির্ভর নিবন্ধ বা ট্রায়াল এবং ত্রুটি হতে পারে)

2
আমি আইএসএল-এর সমস্ত অ্যালগোসকে অনেক সুন্দরভাবে বলতে চাই: লিনিয়ার রিগ্রেশন, লজিস্টিক রিগ্রেশন, ট্রি ভিত্তিক পদ্ধতি, এসভিএম; ক্লাস্টারিং এবং মাত্রা হ্রাস যেমন পিসিএ। বইটি দেখুন এবং এটি সম্পর্কিত অনলাইন কোর্সটি দেখুন (অনলাইন. stanford.edu/course/statistical-learning-winter-2014 - সম্ভবত ইউটিউবে?)।
seanv507

গ্রেট রিসোর্স, লেখকরা নিজেরাই এটির জন্য একটি বই এবং ভিডিও থাকা ভাল link লিঙ্কটির জন্য অনেক ধন্যবাদ, এটি সম্পর্কে অবগত ছিল না।
বিনয় তিওয়ারি

আমি দুঃখিত, তবে এটি অত্যন্ত ভয়ঙ্কর পরামর্শ। একজন ডেটা বিজ্ঞানী কখনও কখনও কয়েকটি অ্যালগরিদমের উপর নির্ভর করবেন না। আপনাকে ডেটা এবং বিশ্লেষণের নিজস্ব দক্ষতার উপর নির্ভর করতে হবে এবং কোনও দুটি ডাটা সমস্যা এক রকম নয়। কিছু এক্স এর সাথে সমাধান করা হবে, অন্যটি ওয়াই দিয়ে সমাধান করা হবে the তথ্য মহাবিশ্বটি আপনার কয়েকটি অ্যালগরিদমের সাথে তুলনা করবে বলে আশা করা যুক্তিসঙ্গত নয়। কৌতূহলী হন, নমনীয় হন, জ্ঞানী হন এবং কাজের জন্য সঠিক সরঞ্জামটি ব্যবহার করুন, কেবল আপনার জানা বিষয়গুলি নয়।
আই_প্লে_উথ_ডাটা

5

সম্ভবত যে কেউ তাদেরকে ডেটা বিজ্ঞানী বলছেন তার যে অ্যালগরিদমগুলি তিনি ব্যবহার করছেন তার জটিলতা সম্পর্কে আরও জানতে হবে - যেমন জিএলএম-এ ফিশার স্কোরিং অ্যালগরিদমকে কী প্রভাবিত করে - একজন সাধারণ বা উদ্যানের পরিসংখ্যানবিদ - যিনি কেবল বিষয়বস্তু হতে পারেন তা জানতে সর্বাধিক সম্ভাবনার সমাধান পাওয়া যাবে (সম্ভবত তারা এক কাপ কফি তৈরির পরে)। যে কোনও ক্ষেত্রে পরিসংখ্যান এবং মেশিন লার্নিংয়ের সাধারণ ধারণাগুলি বোঝা গুরুত্বপূর্ণ you আপনি যে পদ্ধতিগুলি ব্যবহার করেন তার সাথে পরিচিত হওয়ার পাশাপাশি - তাদের পিছনে তত্ত্ব, তারা যে অনুমানগুলি করেন, আপনার কী ডায়াগনস্টিক চেক করা উচিত, ফলাফলগুলি কীভাবে ব্যাখ্যা করা যায়। এই বিদ্রূপ হওয়া এড়ান

আপনি সম্ভবত হাস্টি এট পড়তে পছন্দ করবেন (২০০৯), পরিসংখ্যান শিক্ষার উপাদানসমূহ


নিশ্চয়ই এটি পড়বে! সত্যিই শেষ লাইনটি পছন্দ হয়েছে ... আমি মনে করি তাড়াহুড়ো এবং কখনও কখনও ASAP ফলাফল পাওয়ার চাপ প্রায়ই এ জাতীয় প্যারোডিগুলিতে নিয়ে যায়। এবং এর বিপরীত এড়াতে এটি সমান গুরুত্বপূর্ণ যার মধ্যে কেউ এই শেখার এত গভীর হয়ে যায় যে এটি বাস্তব বিশ্বের সমস্যার জন্য অকেজো হয়ে যায়। বর্ধমান / শেখার সময় কখনও কখনও কী করা উচিত নয় তা জানা আরও গুরুত্বপূর্ণ, দিকনির্দেশনাটির জন্য অনেক ধন্যবাদ এই জাতীয় আরও অন্তর্দৃষ্টিগুলি দেখায় যা আমাকে এবং অন্যদের অনুরূপ যাত্রায় আলোকিত করে would

"জিএলএম-এ ফিশার স্কোরিং অ্যালগোরিদমের কনভার্জেন্স হারকে কী প্রভাবিত করে" - আমার ধারণা আপনি এখানে ডেটা সায়েন্টিস্টদের 99% হারিয়েছেন।

@ মোমো: ঠিক আছে, "ডেটা সায়েন্টিস্ট" হ'ল এইসব খারাপ-অভিনীত পদগুলির মধ্যে একটি যা অবমূল্যায়ন করা শুরু করার আগে সবেমাত্র মুদ্রা অর্জন করেছে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2

ঠিক আছে, আমি বলব 1 বা 2 অ্যালগরিদমগুলির বিশদভাবে জেনে রাখা (তাদের প্যারামিটারগুলির অভ্যন্তরীণ কাজগুলির মতো) এগুলির একটি গুচ্ছ কীভাবে চালানো যায় তা জানার চেয়ে অবশ্যই ভাল better

আমি অ্যানালিটিক্স অঞ্চলে প্রায় 11 বছর এবং ডেটা সায়েন্টিস্ট 2.5 বছর ধরে আছি এবং আমি অভিজ্ঞতা থেকে বলছি। অন্যদিকে, আপনার অবশ্যই অন্যান্য জিনিসগুলি সম্পর্কে অবশ্যই সচেতন হওয়া উচিত (আরও সাম্প্রতিক অ্যালগোরিদম যেমন গভীর শিক্ষার, এসভিএম, এক্সজিবিস্ট ইত্যাদি) যা আপনার সমস্যাটি হাতের কাছে প্রয়োগ করতে পারে।

আমি মনে করি ডঃ অ্যান্ড্রু এনজি এর কোর্স কিছু অ্যালগরিদমের বেশ কয়েকটি বিশদ নিয়ে গেছে এবং এটি একটি ভাল শুরু good অন্যরা যেমন উল্লেখ করেছে, http://statweb.stanford.edu/~tibs/ElemStatLearn/ একটি ভাল বই এবং এটিতে এটির ভিডিও রয়েছে।

এটি আমার ব্যক্তিগত মতামত, যে অ্যালগরিদমগুলি আপনি এড়ানো উচিত নয় সেগুলি হ'ল: (এগুলি বিস্তারিতভাবে জানুন):

1) একাধিক লিনিয়ার রিগ্রেশন 2) লজিস্টিক রিগ্রেশন 3) পিসিএর মতো মাত্রিকতা হ্রাসের সাধারণ কৌশল 4) কে-মানে ক্লাস্টারিং 5) নন-লিনিয়ার রিগ্রেশন 6) অপ্টিমাইজেশন পদ্ধতি: গ্রেডিয়েন্ট ভিত্তিক অনুসন্ধান পদ্ধতি, লিনিয়ার প্রোগ্রামিং এবং পৃথক অপ্টিমাইজেশন 7) ধারণা এবং অ্যালগরিদম বৈশিষ্ট্য ইঞ্জিনিয়ারিং 8) সাধারণ সময়-সিরিজের পূর্বাভাস পদ্ধতি

আরও এসোটেরিক অ্যালগোরিদম:

1) এলোমেলো বন 2) এসভিএম 3) গভীর শেখা 4) এলডিএর মতো মাত্রিকতা হ্রাসের অন্যান্য পদ্ধতি 5) অন্যান্য কার্নেল ভিত্তিক পদ্ধতি 6) জেনেটিক অ্যালগোরিদমস 7) এক্সজি বুস্ট 8) গতিশীল রিগ্রেশন 9) জিআরচ / এআরএইচ পদ্ধতি 10) স্ট্রাকচারাল সমীকরণ মডেলিং 11) সময়-সিরিজের পূর্বাভাসের বাক্সে জেনকিন্স পদ্ধতিগুলি 12) তথ্য তত্ত্ব: তথ্য লাভ, পারস্পরিক লাভ ইত্যাদি


0

আমারও একই অবস্থা ছিল। আমি এখানে এবং প্রতিটি অ্যালগরিদম দিয়ে শুরু করেছি (এবং দুর্দান্ত বিবরণে)।

এখানে চিত্র বর্ণনা লিখুন

যাইহোক, আমি শীঘ্রই জানতে পেরেছি যে মেশিন / গভীর শিক্ষার একাডেমীটি সত্যিকারের দ্রুতগতিতে চলেছে, এবং সর্বদা দ্রুত / অত্যাধুনিক আলগোরিদিমগুলি নিয়ে আসে যা অনেক বাস্তব-বাস্তব অ্যাপ্লিকেশনগুলিতে traditionalতিহ্যবাহী অ্যালগরিদমকে ছাড়িয়ে যাওয়ার দীর্ঘ পথ অবলম্বন করে । সুতরাং, সর্বদা সর্বশেষতম ট্রেন্ডগুলির সাথে আপডেট হওয়া ভাল। আমি প্রস্তাব দিচ্ছি (যেমন আমি সাধারণত নিজেরাই করি) ভাল নিউজফিডের (যেমন মিডিয়াম) একটি সাবস্ক্রিপশন বা একটি আশ্চর্যজনক, অত্যাধুনিক গবেষণা জার্নাল ধরে তা অনুসরণ করতে। অনেক সময় আশ্চর্যজনক অ্যালগরিদমগুলি গবেষণাপত্র থেকে আসে কোনও নির্দিষ্ট সমস্যা মোকাবেলা করে (সম্ভবত আপনার অনুরূপ)।

মুল বক্তব্যটি হ'ল একজন ভাল ডেটা-সায়েন্টিস্ট (বা এমএল ইঞ্জিনিয়ার) হওয়ার জন্য আপনার গভীরতা এবং প্রস্থ উভয়ের মিশ্রণ প্রয়োজন। আমি ব্যক্তিগতভাবে তাদের তলদেশে প্রচুর অ্যালগরিদমগুলি জানার জন্য দরকারী মনে করি (কেবল তারা কী করে, কখন তারা ব্যবহার হয়, উপকারিতা এবং কনস)। আমি তাদের কাছে ফিরে আসি যখন আমি অনুভব করি ( কেবল অনুভব করি ) তারা আমাকে কোনও বিশেষ সমস্যা সমাধানে সহায়তা করতে পারে। আমি সেগুলি বিশদে পড়ি এবং দেখি তারা ভাল ফিট কিনা। তারা হতে পারে, বা তারা নাও হতে পারে। তবে সেই পদ্ধতির অন্তর্দৃষ্টি না থাকার কারণে আপনি আপনার সমস্যার জন্য আশ্চর্যজনক পদ্ধতির হাতছাড়া না করে তা নিশ্চিত করার জন্য বিশদ সম্পর্কে চিন্তা করা অপরিহার্য। উদাহরণস্বরূপ, একবার আমি এমন কোনও বিষয়ে কাজ করছিলাম যার জন্য অবজেক্ট সনাক্তকরণ প্রয়োজন (যদিও খুব সহজ)। আমি আর-সিএনএন, ফাস্ট-সিএনএন, ইওলো সম্পর্কে কোথাও পড়েছি। তারা সঙ্গে সঙ্গে ফিট করে কিনা তা দেখতে আমি তত্ক্ষণাত তাদের দিকে ফিরে গেলাম। সেদিন আমি তাদের আরও বিস্তারিত জানতাম।

কয়েকটি অ্যালগরিদমের জটিলতা শিখতে আমার আরও ফোকাস করা উচিত বা আমি তাদের যখন এবং কখন এবং প্রয়োজনীয় হিসাবে অনেক কিছু জানার পদ্ধতিকে ব্যবহার করব?

জটিলতা শেখা আশ্চর্যজনক। যাইহোক, বিশ্ব একটি বাস্তব দ্রুত গতিতে চলে আসে। এমন একটি নতুন অ্যালগরিদম থাকতে পারে যা আপনি খুব বিস্তারিতভাবে শিখেছিলেন তাকে ছাড়িয়ে যায়। এখন সময় এসেছে, সেই ব্যবহারটি ফুটিয়ে তোলার এবং নতুনটি আপনাকে আরও ভাল করে কিনা তা দেখার জন্য।

যখন প্রয়োজন হয় জিনিস শিখুন। এবং যখন প্রয়োজন হয়, তাদের বিস্তারিত শিখুন। আপনার যদি মনে হয় যে তারা সম্ভবত কাজ করতে পারে তবে জিনিসগুলি প্রয়োগ করতে সক্ষম হবেন। এবং এই অন্তর্দৃষ্টি জ্ঞান থেকে আসে।

শুভকামনা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.