ডেটা মাইনিং এবং মেশিন লার্নিংয়ের জন্য আপনি কোন গণিতের বিষয়গুলি প্রস্তুত করার পরামর্শ দিবেন?


30

আমি ডেটা মাইনিং এবং মেশিন লার্নিং শেখার জন্য প্রস্তুত করার জন্য একটি স্ব-নির্দেশিত গণিত পাঠ্যক্রম একসাথে রাখার চেষ্টা করছি। এগুলি অ্যান্ড্রু এনগের মেশিন লার্নিং ক্লাসেরায় শুরু করে এবং অনুভূত হয় যে এগিয়ে যাওয়ার আগে আমার গণিত দক্ষতা উন্নত করা দরকার। আমি কলেজ থেকে কিছুক্ষণ আগে স্নাতক হয়েছি তাই আমার বীজগণিত এবং পরিসংখ্যান (বিশেষত রাষ্ট্রবিজ্ঞান / মনোবিজ্ঞান বিভাগ থেকে) মরিচা পড়েছে।

থ্রেডের উত্তরগুলি কি গণিতে শক্তিশালী পটভূমি এমএল-এর মোট প্রয়োজনীয়? কেবল মেশিন লার্নিংয়ের সাথে সম্পর্কিত বই বা ক্লাসের পরামর্শ দিন; আমি ইতিমধ্যে সেগুলি কয়েকটি ক্লাস এবং বইয়ের সন্ধান করেছি এবং জানি না কোন গণিতটি অধ্যয়ন করতে পারে তা উদাহরণস্বরূপ: উদাহরণস্বরূপ: "ব্যয়কে কমিয়ে আনতে" কোনও সমীকরণ প্রাপ্ত গণিতের ঠিকানার কোন ক্ষেত্র [গুলি]?)। অন্য থ্রেড প্রস্তাবিত ( দক্ষতা ও কোর্সওয়ার্ক ডেটা বিশ্লেষক হওয়া দরকার ) কেবলমাত্র তথ্য বিশ্লেষণের জন্য প্রয়োজনীয় দক্ষতার বিস্তৃত শ্রেণির উল্লেখ করেছে। থ্রেড ভূমিকা গণিতবিদ জন্য পরিসংখ্যান থেকে , কারণ আমি ইতিমধ্যে গণিত একটি ডিগ্রী আছে না প্রযোজ্য নয়; একটি অনুরূপ থ্রেড ম্যাথমেটিকিয়ান একটি মানের পরিসংখ্যান ডিগ্রির সমতুল্য জ্ঞান চান পরিসংখ্যানের বইগুলির একটি অবিশ্বাস্য তালিকা রয়েছে, তবে আবার, আমি বীজগণিতের এক জঞ্জাল স্মৃতি থেকে গণিত শুরু করার এবং সেখান থেকে উপরে উঠার দিকে তাকিয়ে আছি।

সুতরাং, যাঁরা মেশিন লার্নিং এবং ডেটা মাইনিংয়ে কাজ করেন তাদের পক্ষে গণিতের কোন ক্ষেত্রগুলি আপনার কাজটি করার জন্য প্রয়োজনীয় বলে মনে করেন? ডেটা মাইনিং এবং মেশিন লার্নিংয়ের জন্য আপনি কোন গণিতের বিষয়গুলি প্রস্তুত করার পরামর্শ দিবেন এবং কোন ক্রমে? আমার এখন পর্যন্ত তালিকা এবং আদেশটি এখানে:

  • বীজগণিত
  • প্রি-ক্যালকুলাস
  • পাথুরি
  • রৈখিক বীজগণিত
  • সম্ভাব্যতা
  • পরিসংখ্যান (এখানে অনেকগুলি পৃথক উপ-ক্ষেত্র, তবে কীভাবে সেগুলি ছিন্ন করবেন তা জানেন না)

ডেটা মাইনিং এবং মেশিন লার্নিংয়ের ক্ষেত্রে, আমার বর্তমান কাজের মাধ্যমে আমার কাছে ওয়েবসাইট / অ্যাপের ক্রিয়াকলাপ, গ্রাহক / সাবস্ক্রিপশন লেনদেন এবং রিয়েল এস্টেট ডেটা (উভয় স্থিতিশীল এবং সময়-সিরিজ) রেকর্ডের অ্যাক্সেস রয়েছে। আমি এই ডেটাসেটগুলিতে ডেটা মাইনিং এবং মেশিন লার্নিং প্রয়োগ করার আশা করছি।

ধন্যবাদ!

সম্পাদনা করুন:

উত্তরসূরীদের পক্ষে, আমি সিএমইউতে জেফ্রি গর্ডনের / অ্যালেক্স স্মোলার ইন্ট্রোতে মেশিন লার্নিং ক্লাসের জন্য একটি সহায়ক গণিতের স্ব-মূল্যায়ন ভাগ করে নিতে চেয়েছিলাম ।


3
কোর্সেরা ক্লাসগুলির পূর্বশর্তগুলির ক্ষেত্রে, সেই তথ্যটি তাদের উপকরণগুলির কোথাও পাওয়া উচিত। তাদের ক্লাসের বাইরে / আরও সাধারণভাবে, স্ট্যাট / এমএল / ডিএম এর জন্য আপনার কী গণিতের প্রয়োজন তা প্রশ্নটি আমাকে নকল হিসাবে আঘাত করে। সিভিতে এমন বেশ কয়েকটি থ্রেড রয়েছে যা এই উপাদানটি কভার করে, এর মধ্যে রয়েছে: হ'ল- একটি-শক্তিশালী-ব্যাকগ্রাউন্ড-ইন-গণিত-এ-প্রয়োজনীয়-এমএল , এবং দক্ষতা-কোর্স-ওয়ার্ক-টু-এ-ডেটা-বিশ্লেষক ( সম্ভবত অন্যদের মধ্যে)।
গুং - মনিকা পুনরায়

1
দয়া করে সেই থ্রেডগুলি পর্যালোচনা করুন, থ্রেডগুলি যেগুলি এখানে যুক্ত রয়েছে হিসাবে নিবিড়ভাবে সম্পর্কিত, এবং সম্ভবত সাইটটি অনুসন্ধান করুন। আপনার চারপাশে পড়ার পরেও যদি এখনও প্রশ্ন থাকে তবে এখানে ফিরে আসুন এবং এটিকে আরও স্বতন্ত্র করার জন্য এই প্রশ্নটি সম্পাদনা করুন / আরও সুনির্দিষ্টভাবে নির্দিষ্ট করুন যা আপনার এখনও অন্য কোথাও আচ্ছন্ন ছিল না তা জানতে হবে।
গুং - মনিকা পুনরায়

উত্তর:


15

@ গং যে পরামর্শগুলি দিয়েছে তা অবশ্যই অনুসরণ করার মতো। কোর্স কোর্স করে, আমি মনে করি আপনার তালিকাটি একটি ভাল শুরু good কিছু মন্তব্য:

  1. লিনিয়ার বীজগণিত এবং ম্যাট্রিক্স বীজগণিত একই জিনিস, সুতরাং পরবর্তীটি বাদ দিন।
  2. ক্যালকুলাসে আংশিক পার্থক্য অন্তর্ভুক্ত করতে ভুলবেন না। এই ক্যালকুলাস একাধিক পরিবর্তনশীল (কার্যাবলী প্রয়োগ প্রতীকী, যদি, বলে, হয় একটি ফাংশন এবং তারপর যদি আপনি চান বদলে )। ভাগ্যক্রমে এটি কঠিন নয়।z- রএক্সYz- রএক্সz- রএক্স
  3. ক্যালকুলাসে আপনার মৌলিক একীকরণের বাইরে কিছু প্রয়োজন নেই (এবং সম্ভবত এটিও নয়)। এটি ভাগ্যবান কারণ ইন্টিগ্রেশন শক্ত।
  4. বেসিক অপ্টিমাইজেশন যুক্ত করুন, অর্থাত কোনও ফাংশনের সর্বাধিক বা ন্যূনতম সন্ধান করা, সাধারণত একাধিক ভেরিয়েবলের ফাংশন। খুব কম সময়ে গ্রেডিয়েন্ট বংশোদ্ভূত হওয়ার একটি উপলব্ধি অপরিহার্য।
  5. অসুবিধার দিক থেকে আপনি সম্ভবত 1 ম বছরের স্নাতকের শেষ এবং শেষের মধ্যে কোথাও থাকতে চান।
  6. কিছু বেসিক সম্ভাব্যতা এবং পরিসংখ্যান পাঠগুলি অনলাইনে বা অন্যথায় পড়ার চেষ্টা করুন তবে খুব বেশি চিন্তা করবেন না (সম্ভাব্যতা এবং পরিসংখ্যান বোঝার জন্য বেসিক গণিতগুলি পূর্বশর্ত)। আপনি যদি এমন কিছু কোর্স করেন যা আপনি প্রস্তাব করেন তবে আপনি কী শিখতে হবে এবং আপনার আগ্রহ কোথায় রয়েছে তা নির্ধারণ করতে পারেন। কমপক্ষে প্রথমে আপনি যা করতে চান না তা হ'ল হাইপোথিসিস টেস্টিং সম্পর্কে শিখতে প্রচুর সময় ব্যয় করা। আপনি বরং বুনিয়াদি পরিসংখ্যান - র্যান্ডম ভেরিয়েবল, সম্ভাব্যতা বিতরণ (পিএফডি, সিডিএফ), বর্ণনামূলক পরিসংখ্যান - এবং তারপরে রিগ্রেশন বোঝার চেষ্টা করার দিকে লক্ষ্য রাখতে চান।

5

এই ফোরামে বেশ কয়েকটি দুর্দান্ত থ্রেড রয়েছে - এটি সহ একটি যা আমি আমার জন্য ডেটা বিজ্ঞানের কাজের জন্য গুরুত্বপূর্ণ দক্ষতার ধারণাগত রূপরেখা বিকাশের ক্ষেত্রে বিশেষভাবে সহায়ক বলে মনে করেছি।

উপরে উল্লিখিত হিসাবে, অনেকগুলি অনলাইন কোর্স উপলব্ধ। উদাহরণস্বরূপ, এখন কোর্সেরাতে একটি ডেটা সায়েন্স স্পেশালাইজেশন রয়েছে এমন কয়েকটি কোর্স রয়েছে যা সম্ভবত আপনার কাজের জন্য প্রয়োজনীয় কিছু সরঞ্জামকে আবরণ করবে।


3

আপনি যদি মেশিন লার্নিং / ডেটা মাইনিংয়ের বিষয়ে সন্ধান করেন তবে আমি অনুকূলিতকরণ / লিনিয়ার বীজগণিত / পরিসংখ্যান এবং সম্ভাব্যতার জন্য দৃability়তার সাথে অনুরোধ করব। সম্ভাবনার জন্য বইগুলির তালিকা এখানে । আশা করি এইটি কাজ করবে.


3

খুব প্রাথমিক গাণিতিক দক্ষতাগুলি ব্রাশ করার জন্য, আমি এই বইগুলি ব্যবহার করছি:

অর্থনীতি এবং অর্থের জন্য গণিতের উপাদানসমূহ। ম্যাভ্রন, ভ্যাসিলিস সি, ফিলিপস, টিমোথি এন এই বইগুলিতে আংশিক পার্থক্য, সংহতকরণ, ম্যাট্রিক্স এবং নির্ধারক এবং অপ্টিমাইজেশনের একটি ছোট অধ্যায় এবং ডিফারেনশিয়াল সমীকরণের জন্য প্রয়োজনীয় গণিত দক্ষতা (সংযোজন বিয়োগ) covers এটি অর্থনীতি এবং অর্থের জন্য লক্ষ্যযুক্ত, তবে এটি একটি ছোট বই, অধ্যায়গুলির ক্রমটি আমার প্রয়োজন অনুসারে এবং আমার পক্ষে সহজ পাঠযোগ্য read

পরিসংখ্যানগত বিশ্লেষণ: মাইক্রোসফ্ট এক্সেল 2010. কনরাড কার্লবার্গ একাধিক রিগ্রেশন এবং কোভেরিয়েন্সের বিশ্লেষণে বুনিয়াদি পরিসংখ্যান বিশ্লেষণকে কভার করে এবং এটি এক্সেল ব্যবহার করে।

আর। অ্যান্ডি ফিল্ড, জেরেমি মাইলস, জোয়ে ফিল্ড ব্যবহার করে পরিসংখ্যান আবিষ্কার করা। এখনও পড়েনি। এটি আর ব্যবহার করে।

প্রাথমিক লিনিয়ার বীজগণিত। রন লারসন, ডেভিড সি ফ্যালভো।

ম্যাট্রিক্স পদ্ধতি: প্রয়োগিত লিনিয়ার বীজগণিত রিচার্ড ব্রনসন, গ্যাব্রিয়েল বি কোস্টা দ্বারা। প্রাথমিক লিনিয়ার বীজগণিত এবং ম্যাট্রিক্স ক্যালকুলাস কভার করে

এগুলি হ'ল প্রাথমিক গণিতের বই যা আমি ডেটা মাইনিং / মেশিন লার্নিংয়ের সাথে সম্পর্কিত use

আশাকরি এটা সাহায্য করবে


3

তথাকথিত "ওপেন সোর্স ডেটা সায়েন্স মাস্টার্স" এ এখানে প্রচুর প্রাসঙ্গিক সংস্থান তালিকাভুক্ত (এবং শ্রেণিবদ্ধ) রয়েছে ।

বিশেষত গণিতের জন্য তারা তালিকাবদ্ধ করে:

  1. লিনিয়ার বীজগণিত ও প্রোগ্রামিং
  2. পরিসংখ্যান
  3. ডিফারেনশিয়াল সমীকরণ এবং ক্যালকুলাস

বেশ জেনেরিক প্রস্তাবনাগুলি, যদিও তারা কিছু পাঠ্যপুস্তকের তালিকা তৈরি করে যা আপনাকে দরকারী মনে হতে পারে।


2
  • সম্ভাবনা এবং পরিসংখ্যান অপরিহার্য। কিছু কীওয়ার্ড হ'ল হাইপোথিসিস টেস্ট, মাল্টিভারিয়েট নরমাল ডিস্ট্রিবিউশন, বেয়েসিয়ান ইনফারেন্স (যৌথ সম্ভাবনা, শর্তসাপেক্ষ সম্ভাবনা), গড়, বৈচিত্র, কোভেরিয়েন্স, কুলব্যাক-লেবেলার বিচ্যুতি, ...
  • মেশিন লার্নিংয়ের জন্য বেসিক লিনিয়ার বীজগণিত প্রয়োজনীয়। যে বিষয়গুলি আপনি শিখতে পারেন সেগুলি হ'ল ইগেন পচন এবং একক মান পচন। (অবশ্যই আপনার কীভাবে ম্যাট্রিক্স পণ্য গণনা করা উচিত তা জানা উচিত))
  • টুটোন যেমন ইতিমধ্যে উল্লেখ করেছে: অপ্টিমাইজেশন গুরুত্বপূর্ণ। গ্রেডিয়েন্ট বংশোদ্ভূত কী তা আপনার জানা উচিত এবং নিউটনের পদ্ধতি, লেভেনবার্গ-মার্কুয়ার্ড, ব্রয়ডেন-ফ্লেচার-গোল্ডফার্ব-শান্নোর দিকে নজর দেওয়া উচিত।
  • ক্যালকুলাস তাত্পর্যপূর্ণ নয় তবে কীভাবে ফাংশনগুলির আংশিক ডেরাইভেটিভস (জ্যাকোবি ম্যাট্রিক্স, হেসি ম্যাট্রিক্স, ...) গণনা করতে হবে তা জানার জন্য দরকারী এবং অবিচ্ছেদ্য কী তা আপনার জানা উচিত।

0

লিনিয়ার বীজগণিত, পরিসংখ্যান, ক্যালকুলাস। আমি মনে করি আপনি এগুলিকে ডাব্লু / এমএল - বা বেসিকের পরেও শিখতে পারবেন । স্টার্টার কোর্স / বইগুলি গণিতের প্রাইম অধ্যায়গুলির সাথে দুর্দান্ত কাজ করে এবং এমএল শিখার সময় আপনি গণিতের প্রয়োজনীয় বিষয়গুলি শিখেন। আপনার কাছে মেশিন লার্নিংয়ের প্রয়োজনীয় গণিত এবং সেগুলি শেখার জন্য যে সংস্থান রয়েছে সেগুলি সম্পর্কে আমি একটি পডকাস্ট পর্ব তৈরি করেছি: মেশিন লার্নিং গাইড # 8


0

যেকোন মেশিন লার্নিং কোর্স শুরুর আগে নিচের গণিতের কোর্সটি পড়ুন। এছাড়াও একক প্রচেষ্টা খনন চেষ্টা করবেন না। মৌলিক ধারণাগুলি শিখুন তারপরে আবার আপনার গণিতের দক্ষতাগুলি ব্রাশ আপ করুন এবং পুনরাবৃত্তি করুন: -

গণিতের বিষয়গুলি নিম্নরূপ: -

  • রৈখিক বীজগণিত
  • সম্ভাব্যতা
  • বেসিক ক্যালকুলাস
  • ম্যাক্সিমা এবং ফাংশনের মিনিমা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.