গণিতের একটি শক্তিশালী পটভূমি কি এমএল-এর মোট প্রয়োজনীয়?


37

আমি আমার নিজস্ব দক্ষতা এগিয়ে নিতে চাই শুরু করছি এবং আমি সবসময় মেশিন লার্নিং দ্বারা মুগ্ধ হয়েছি। যাইহোক, ছয় বছর আগে এটি অনুসরণ করার পরিবর্তে আমি কম্পিউটার বিজ্ঞানে একটি সম্পূর্ণ সম্পর্কযুক্ত ডিগ্রি নেওয়ার সিদ্ধান্ত নিয়েছিলাম।

আমি এখন প্রায় 8-10 বছর ধরে সফ্টওয়্যার এবং অ্যাপ্লিকেশনগুলি বিকাশ করছি, সুতরাং আমার একটি ভাল হ্যান্ডেল রয়েছে তবে আমি কেবল মেশিন লার্নিং / সম্ভাবনা / পরিসংখ্যানের গণিতের দিকটি অনুভব করতে পারি না।

আমি শিখনের উপাদানগুলি অনুসন্ধান করা শুরু করি এবং প্রথম পৃষ্ঠায় এতে এমন কিছু অন্তর্ভুক্ত থাকতে পারে যা আমাকে বিভ্রান্ত করে এবং তাত্ক্ষণিকভাবে আমার শিক্ষার ক্ষেত্রে একটি প্রতিবন্ধকতা স্থাপন করে।

  • গণিতের একটি শক্তিশালী পটভূমি কি এমএল-এর মোট প্রয়োজনীয়? এমএল চালিয়ে যাওয়ার আগে আমার চেষ্টা করা উচিত এবং আমার গণিতের ফাঁকা স্থান পূরণ করা উচিত? সেলফ লার্নিং কোনও হার্ড কম্পিউটার বিজ্ঞানের ব্যাকগ্রাউন্ড ছাড়াই কেবল কোনও বিকাশকারীর পক্ষে কাজ করতে পারে?

সম্পর্কিত প্রশ্ন:


4
আমি বলব যে আপনি বেইশিয়ান অ্যাপ্লিকেশনগুলির জন্য কমপক্ষে এবং সম্ভবত কিছুটা সম্ভাবনাও রৈখিক বীজগণিতকে খুব ভালভাবে বুঝতে হবে। আপনাকে গণিতে কোডে অনুবাদ করতেও স্বাচ্ছন্দ্য বোধ করতে হবে এবং স্বরলিপি কনভেনশন (যা মোটেই সামঞ্জস্য নয়) এর সাথে খাপ খাইয়ে নিতে হবে। বেশিরভাগ কম্পিউটার বিজ্ঞানীর পক্ষে এমএল সহজ নয়।
জন মোয়েলার

3
আমি বিশ্বাস করি না যে প্রশ্নগুলি একেবারেই সম্পর্কিত। এটি একটি খুব আমন্ত্রিত স্ট্যাকেক্সচেঞ্জ সাইট তৈরি এবং প্রশ্নটি বন্ধ করার জন্য আপনাকে ধন্যবাদ। এমনকি আমার কাছে কোনও বইয়ের সুপারিশ করার জন্য আমি কারও উল্লেখও করি নি। এটি "সম্ভাব্য সদৃশ" এর উপর ভিত্তি করে কোনও সদৃশ নয়
লাইট

2
আমি এটি আবার খুলতে বলার জন্য মেটাতে একটি থ্রেড তৈরি করেছি (8 ঘন্টা আগে)। meta.stats.stackexchange.com/questions/1442/…
ডগলাস

1
ধন্যবাদ. এটি এখনও "খুব সাবজেক্টিভ" বা "সত্যিকারের প্রশ্ন নয়" বলে বন্ধ করা যেতে পারে তবে এটি অবশ্যই সদৃশ নয়।

1
লেক, @ ডগলাস জ্যারে শুরু হওয়া মেটা থ্রেডে বর্ণিত হিসাবে, আমরা আশা করি আপনি এই প্রশ্নটি বন্ধ করা আপনার পক্ষে একটি সম্ভাব্য অনুগ্রহ বিবেচনা করবেন, কারণ এটি অবিলম্বে আপনাকে সম্পর্কিত থ্রেডগুলিতে অ্যাক্সেস দেয় যা সম্ভবত ইতিমধ্যে আপনার প্রশ্নের উত্তর দিয়েছে। তবে যেহেতু আপনি মন্তব্য করেছেন যে এটি সদৃশ হওয়ার উদ্দেশ্যে নয়, তাই আপনার সাইটটি কী অর্থে এই জাতীয় অনুরূপ প্রশ্নের সদৃশ হয় না তা বোঝাতে আপনার প্রশ্নটি সম্পাদনা করতে আপত্তি করবেন ? আমরা এটি আবার খুলতে পেরে খুশি হব।
whuber

উত্তর:


23

স্ট্যানফোর্ড (এনজি) এবং ক্যালটেক (আবু-মোস্তফা) ইউটিউবে মেশিন লার্নিং ক্লাস স্থাপন করেছে। আপনি অ্যাসাইনমেন্টগুলি দেখতে পাবেন না, তবে বক্তৃতাগুলি সেগুলির উপর নির্ভর করে না। আমি প্রথমে তাদের দেখার চেষ্টা করার পরামর্শ দিচ্ছি, কারণ এগুলি আপনাকে কী গণিত শিখতে হবে তা জানতে আপনাকে সহায়তা করবে। আমি বিশ্বাস করি অ্যাসাইনমেন্টের সাথে একটি খুব একই শ্রেণীর পাঠ্যসূচী অ্যান্ড্রু এনজি কর্সেরার উপর দিয়েছিলেন, যা এনজি তৈরি করতে সহায়তা করেছিল।

একটি ব্যতিক্রম: যদি আমি সঠিকভাবে স্মরণ করি, স্ট্যানফোর্ডের বক্তৃতার শুরুতে, এনজি ম্যাট্রিকের পণ্যগুলির ট্রেসগুলির ডেরিভেটিভগুলির সাথে জড়িত কিছু গণনা করে। এগুলি বরং বিচ্ছিন্ন, তাই আপনি যদি এই গণনাগুলি অনুসরণ না করেন তবে চিন্তা করবেন না। আমি জানি না কোন কোর্সটি তাদের কভার করবে।

আপনার সম্ভাবনা, লিনিয়ার বীজগণিত, লিনিয়ার প্রোগ্রামিং এবং মাল্টিভারিয়াল ক্যালকুলাসের সাথে কিছুটা পরিচিতি থাকতে চান। যাইহোক, এই বিষয়গুলিতে অনেকগুলি সম্পূর্ণ কলেজের ক্লাসে যা রয়েছে তার চেয়ে আপনার অনেক কম প্রয়োজন।


3
ক্যালটেক অ্যাসাইনমেন্টগুলি: work.caltech.edu/homeworks.html
ফ্রাঙ্ক ডারননকোর্ট

15

প্রয়োগের ধরণের উপর নির্ভর করে আপনার প্রয়োজনে এমএল প্র্যাকটিশনার হিসাবে প্রচুর গণিতের প্রয়োজন নেই।

স্ব-শিক্ষিত প্রোগ্রামার হিসাবে (~ 15 বছর) এবং গণিতে খুব বেশি ব্যাকগ্রাউন্ড ছাড়াই ঘন ঘন কলেজ ড্রপআউট (ক্যালকুলাস III) বা পরিসংখ্যান হিসাবে, আমি কয়েকটি সংস্থান দিয়ে মেশিন লার্নিং / ডেটা মাইনিং দিয়ে শুরু করেছি:

  • বেরি এবং লিনফের "মাস্টারিং ডেটা মাইনিং: গ্রাহক সম্পর্ক ব্যবস্থাপনার শিল্প ও বিজ্ঞান" বইটি

  • একই লেখকের "ডেটা মাইনিং টেকনিকস" বইটি

  • আর, বিশেষত এবং প্যাকেজ পার্টি এবং নেট

আমি একটি অলাভজনক সমর্থন বিপণন এবং ক্রিয়াকলাপে কাজ করি। বিশেষত শুরুতে, আমি সরাসরি মেল আপিলের জন্য ডেটা মাইনিং ব্যবহার করি।

পরে আমি লিনিয়ার বীজগণিত, অ্যান্ড্রু এনগের মেশিন লার্নিং, সিএসইউতে পরিসংখ্যান সংক্রান্ত পদ্ধতি (STAT 301) ইত্যাদি গ্রহণ করি etc.

আপনার জন্য আমি দুটি বই, অ্যান্ড্রু এনজির কোর্সটি শুরু করার এবং আপনার আবেদনের উপর নির্ভর করে সিদ্ধান্ত গাছ (আর-তে পার্টি প্যাকেজ) recommend


9

আমি মনে করি এটি আসলে একটি ভাল প্রশ্ন এবং অত্যন্ত বিষয়; আমি নিশ্চিত না তবে উত্তর আছে কিনা। একটি সাম্প্রতিক নিবন্ধটি বিতর্ককে মোকাবেলা করেছিল ( এখানে দেখুন ) পরামর্শ দিয়েছিলেন যে ডেটা বিজ্ঞানটি অনলাইনে শেখা সহজ ছিল। সেই নিবন্ধে উল্লিখিত বেশিরভাগ কেস স্টাডি সম্পর্কে একটি উল্লেখযোগ্য বিষয় হ'ল এগুলি বাস্তব বা গাণিতিক পটভূমি থেকে আসে।

এটি একটি আকর্ষণীয় বিষয়, কারণ এটি ইঙ্গিত দেয় যে কোর্সেরা, স্ট্যানফোর্ড এবং এডিএক্সের মতো অনলাইন কোর্সগুলি প্রয়োজনীয় নির্দিষ্ট কম্পিউটার বিজ্ঞানের দক্ষতা শেখাতে সহায়ক, সম্ভবত আপনি প্রয়োগ করছেন এমন মডেলগুলি কী করছে তা বোঝার জন্য কিছু গাণিতিক পটভূমি অপরিহার্য । অন্যদিকে, একটি সমান দৃ strong় যুক্তিও তৈরি করা যেতে পারে যে এই ছেলেরা সকলেই বিশ্লেষণাত্মকভাবেই শুরু করার মনস্থ হয়েছিল, এবং এটি উভয়ই কেন তারা পরিমাণগত শৃঙ্খলে কাজ করে সেইসাথে কেন তারা সহজেই মেশিন লার্নিং বেছে নিয়েছিল এবং প্রতিযোগিতা জিতেছে।

আমি মৌলিকভাবে মনে করি যে এখানে বিশ্লেষণের একটি স্তরের সমস্যা চলছে। যদিও গাণিতিক দক্ষতাগুলি আপনি প্রয়োগ করছেন সেই অ্যালগরিদমের সম্ভাব্য শিকড়গুলি বোঝার ক্ষেত্রে অনেক সময় সহায়ক, সেখানে একটি সমতুল্য যুক্তিও তৈরি করা যায় যে ভাল সফ্টওয়্যার ইঞ্জিনিয়ারিং দক্ষতা আপনাকে উচ্চ স্তরের বিশ্লেষণ করতে দেয় এবং অ্যালগোরিদমের অংশগুলি একসাথে রেখে আরও বেশি যুক্ত করতে পারে made তারা কেন এটি করছে তা আপনি পুরোপুরি বুঝতে না পারলেও আপনার লক্ষ্য অর্জন করতে । সাধারণত ডেটা সায়েন্স (এবং অ্যাসোসিয়েশন দ্বারা মেশিন লার্নিং) একটি উত্তেজনাপূর্ণ ক্ষেত্র হ'ল এই প্রশস্ততার কারণে - আপনি সমস্যা সমাধানের জন্য ডেটাবেস লোক হতে পারেন এবং বদ্ধ শক্তি ব্যবহার করতে পারেন, বা সিমুলেশন ব্যবহার করে এমন একজন গণিতবিদ, বা কম্পিউটার ইঞ্জিনিয়ার যিনি ভাল ইঞ্জিনিয়ারিং লাভ করেন verages একটি অনুকূল উপায়ে বিভিন্ন অ্যালগরিদম এবং পদ্ধতির একসাথে রাখার কোড।

ভবিষ্যদ্বাণীতে যুক্ত হওয়া সমস্ত পদ্ধতির পক্ষে ভাল, তাই আমি বলব যে কিছু গণিত শিখাই আপনার ক্ষেত্রে ক্ষেত্রে সাফল্যের সর্বোত্তম সুযোগ দেওয়ার পক্ষে একটি ভাল ধারণা হতে পারে। আপনি যদি কিছু ভাল শুরুর পয়েন্ট চান তবে এমআইটি-র একটি দুর্দান্ত রৈখিক বীজগণিত কোর্স রয়েছে , যার সাথে কয়েকটি চমৎকার কম্পিউটেশনাল অ্যাপ্লিকেশন রয়েছে, যা আমি বুঝতে সহজ পেয়েছি। তাদের স্টোকাস্টিক প্রসেস এবং মাল্টিভেয়ারেবল ক্যালকুলাস সম্পর্কিত অন্যান্য কোর্সও রয়েছে যা আপনার জ্ঞান বাড়ানোর ক্ষেত্রেও আগ্রহী হতে পারে।


অ-বিশ্লেষণাত্মক মনের লোকেরা (বা অ-নিখরচায় বিমূর্ত) সত্যই গণিতকে সরল করে আসলেই আমাকে সহায়তা করে না (সর্বদা +1) concerned স্ট্র্যাং লিনিয়ার বীজগণিত কোর্সটিও পছন্দ হয়েছে তবে লিনিয়ার বীজগণিতগুলি কি জোর বলের গণনা দ্বারা গ্রহন করা প্রথম গণিত নয়? তথ্য বিজ্ঞানের পক্ষে সহজ লিঙ্ক, সম্ভবত কেউ ইতিমধ্যে উত্থাপিত হয়েছে তবে ছদ্মবেশী শেয়ার বাজারের প্রতিযোগিতায় হাজারের মধ্যে 1 বা 2 এর চেয়ে বেশি পরিমাণে বিশেষজ্ঞরা পরাজিত করবে - যাতে যে কেউ রিক পিকিং স্টক পেতে পারে!
ফেনেরন

4

গণিতের একটি শক্তিশালী পটভূমি কি এমএল-এর মোট প্রয়োজনীয়? - এমএল এর জন্য একটি উত্তর এবং কিছু জল্পনা কল্পনা হিসাবে পরিসংখ্যান হিসাবে ;-)

1990 এর আশেপাশে আমার কাছে কম্পিউটার বীজগণিত সহায়তার আশা ছিল, আমি মনে করি এটি তবে এটি যথেষ্ট সীমাবদ্ধ। তবে এটি অবশ্যই গণিতের শিক্ষার গতি বাড়িয়ে তুলতে সহায়তা করে (অনুশীলনের মাধ্যমে ম্যানিপুলেটরি দক্ষতা বিকাশের প্রয়োজন হবে না বা সহজ ব্যায়াম করতে সক্ষম হবার চেষ্টা করুন)। আমি ম্যাথমেটিকার সাথে ফ্রেড জাজাবোর লিনিয়ার বীজগণিতকে এর একটি দুর্দান্ত উদাহরণ পেয়েছি (তবে আমি ইতিমধ্যে একটি উন্নত তত্ত্ব স্তর লিনিয়ার বীজগণিত কোর্স গ্রহণ করেছি।)

আমি 1988 সাল থেকে (পরিসংখ্যান থেকে "কনক্রিটাইজ" তত্ত্ব এবং নীতিগুলি - যথাযথভাবে) কম্পিউটারের নিবিড় পদ্ধতিগুলি ব্যবহার করে উত্তরটি ন্যূনতম বা কমপক্ষে প্রয়োজনীয় নয় (পরিসংখ্যানের জন্য) করার জন্য কাজ করছি। অতিরিক্ত গাণিতিক দক্ষতা এবং বোধগম্যতার সাথে একজন আরও দ্রুত এবং আরও সাধারণভাবে বুঝতে সক্ষম হবে । আমি মনে করি আমি কাছাকাছি আসতে শুরু করেছি তবে সম্ভাব্যতা তৈরির মডেলগুলির একটি ম্যানিপুলেট-সক্ষম প্রতিনিধিত্ব প্রয়োজন এবং অনুশীলন যা খেলনা সমস্যার চেয়ে বেশি বৈধ এবং কার্যকর ference

এমএল চালিয়ে যাওয়ার আগে আমার চেষ্টা করা উচিত এবং আমার গণিতের ফাঁকা স্থান পূরণ করা উচিত?

প্রায় সবাই কে MHO মধ্যে - ওটা একটি হার্ড প্রচেষ্টা এর বুঝতে পারে পরিসংখ্যান খুব আরামদায়ক হচ্ছে মান নিপূণভাবে ব্যবহার করে সেখানে পেয়েছিলাম এবং সম্ভাব্যতা উৎপাদিত মডেল এবং অনুমান গাণিতিক characterizations বিশেষ করে তাই মান না গাণিতিক উপস্থাপনা (শীর্ষ গাণিতিক পরিসংখ্যান পিএইচডি মধ্যে x%)। সুতরাং এটি কেবল বেসিকগুলিই পাচ্ছেন না তবে গণিতের সাথে আসল স্বাচ্ছন্দ্য বোধ করছেন। (একদিকে যেমন, আমার জন্য ফুরিয়ার থিওরি অপরিহার্য ছিল।)

কেন এই উপস্থাপনাগুলি কঠোর (এমনকি প্রচুর গণিত সহ)?

গার্ড জিগেরেনজার বেশ প্রতিষ্ঠিত করেছেন যে _ প্রাকৃতিক ফ্রিকোয়েন্সি ব্যবহার করে সাধারণ রোগের ইতিবাচক / নেতিবাচক প্রদত্ত পরীক্ষার ইতিবাচক / নেতিবাচক সমস্যা নিয়ে কোনও চ্যালেঞ্জ নেই ” লিঙ্কিত প্রশ্ন থেকে একটি রেফারেন্স মনে হয় যে এটি ব্যবহার করতে পারে http://www.autonlab.org/tutorials/prob18.pdf

কেন সাধারণ করা এই কঠিন?

কে পরীক্ষার জন্য (পুনরাবৃত্তি এবং বিভিন্ন) - 2 ^ কে

ভি মানগুলি গ্রহণ করে এমন পরীক্ষার জন্য - ভি ^ কে ^

সুতরাং বাইনারি অজানা - 2 * v ^ কে নমুনা পথের সম্ভাবনা

পি একাধিক বাইনারি অজানা জন্য 2 ^ পি * ভি ^ কে

পি একাধিক যুক্তিযুক্ত অজানা জন্য Q ^ p * v ^ k

এটিকে মোকাবেলায় কেউ দ্রুত গণনাযোগ্য এবং অগণিত অসম্পূর্ণতাগুলির সাথে গণিতে চলে আসে, যা গাণিতিক দক্ষতার সাথেও অনেক ভুল বোঝাবুঝি এবং আপাতদৃষ্টিতে বিপর্যয় সৃষ্টি করে (উদাঃ বোরেলের প্যারাডক্স?)

অতিরিক্তভাবে লিনিয়ার-অ-বিপজ্জনক বিপজ্জনক ভুল বোঝাবুঝি রয়েছে (যেমন পূর্ববর্তী বিতরণের কোনও তথ্য ছাড়াই নন-ফরমেশনাল প্রাইজার্স উইনবগস এবং অন্যান্য এমসিসিসি সম্পর্কিত গোপন বিপদ ) এবং মিথস্ক্রিয়া এবং এলোমেলো প্রভাব ইত্যাদি etc.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.