ভবিষ্যদ্বাণীপূর্ণ মডেলিংয়ের জন্য পরিবর্তনশীল নির্বাচন 2016 সালে সত্যই প্রয়োজন?


67

এই প্রশ্নটি কয়েক বছর আগে সিভিতে জিজ্ঞাসা করা হয়েছিল, এটি 1 এর আলোকে পুনরায় পোস্ট করা উচিত বলে মনে হয়) আরও ভাল কম্পিউটারিং প্রযুক্তি (যেমন সমান্তরাল কম্পিউটিং, এইচপিসি ইত্যাদি) এবং 2) আরও নতুন প্রযুক্তি, যেমন [3] order

প্রথম, কিছু প্রসঙ্গ। আসুন ধরে নেওয়া যাক লক্ষ্য অনুমানের পরীক্ষা নয়, প্রভাব অনুমান নয়, অ-দেখা টেস্ট সেট সম্পর্কে পূর্বাভাস। সুতরাং, কোন ওজন কোনও ব্যাখ্যাযোগ্য সুবিধা দেওয়া হয় না। দ্বিতীয়ত, ধরা যাক আপনি বিষয় বিবেচনার ক্ষেত্রে কোনও ভবিষ্যদ্বাণীকের প্রাসঙ্গিকতাটি অস্বীকার করতে পারবেন না। এগুলি সমস্ত পৃথকভাবে বা অন্যান্য ভবিষ্যদ্বাণীকের সাথে সম্মিলিত বলে মনে হয়। তৃতীয়ত, আপনি কয়েক মিলিয়ন ভবিষ্যদ্বাণীকের সাথে মুখোমুখি। চতুর্থত, ধরা যাক আপনার সীমাহীন বাজেটের সাথে AWS এ অ্যাক্সেস রয়েছে, সুতরাং কম্পিউটিং পাওয়ার কোনও সীমাবদ্ধতা নয়।

পরিবর্তনশীল নির্বাচনের জন্য সাধারণ রেওনগুলি 1) দক্ষতা; একটি ছোট মডেল ফিট করার জন্য দ্রুত এবং কম ভবিষ্যদ্বাণী সংগ্রহের জন্য সস্তা, 2) ব্যাখ্যা; "গুরুত্বপূর্ণ" ভেরিয়েবলগুলি জানার ফলে অন্তর্নিহিত প্রক্রিয়াটি অন্তর্দৃষ্টি দেয় [1]।

এটি এখন বহুল পরিচিত যে বহু পরিবর্তনশীল নির্বাচনের পদ্ধতিগুলি অকার্যকর এবং প্রায়শই একেবারে বিপজ্জনক (উদাহরণস্বরূপ ধাপে ধাপে ধাপে ধাপ) [2]।

দ্বিতীয়ত, নির্বাচিত মডেলটি যদি ভাল হয় তবে ভবিষ্যদ্বাণীকারীদের তালিকায় একেবারে কাটা উচিত নয়। মডেলটি আপনার জন্য এটি করা উচিত। একটি ভাল উদাহরণ লাসো, যা সমস্ত অপ্রাসঙ্গিক ভেরিয়েবলের জন্য একটি শূন্য সহগ নির্ধারণ করে।

আমি সচেতন যে কিছু লোক "হাতি" মডেল ব্যবহার করে, যেমন। প্রতিটি অনুমেয় ভবিষ্যদ্বাণীকে ফিটের মধ্যে টস করুন এবং এটির সাথে চালান [2]।

লক্ষ্যটি পূর্বাভাসের যথাযথতা হলে ভেরিয়েবল নির্বাচন করার কোনও মৌলিক কারণ আছে কি?

[1] রুনানেন, জে। (2003) পরিবর্তনশীল নির্বাচন পদ্ধতির মধ্যে তুলনা করার ক্ষেত্রে অত্যধিক মানানসই। জার্নাল অফ মেশিন লার্নিং রিসার্চ, 3, 1371-1382।

[2] হ্যারেল, এফ (2015)। রিগ্রেশন মডেলিং কৌশল: রৈখিক মডেলগুলির জন্য অ্যাপ্লিকেশন সহ, লজিস্টিক এবং অর্ডিনাল রিগ্রেশন এবং বেঁচে থাকার বিশ্লেষণ। স্প্রিঙ্গের।

[3] টেলর, জে।, এবং তিবশিরানী, আরজে (2015)। পরিসংখ্যানগত শিক্ষা এবং নির্বাচনী অনুমান in জাতীয় বিজ্ঞান একাডেমির কার্যক্রম, 112 (25), 7629-7634।

[4] ঝো, জে।, ফস্টার, ডি।, স্টাইন, আর।, এবং উঙ্গার, এল। (2005, আগস্ট)। আলফা-বিনিয়োগ ব্যবহার করে স্ট্রিমিং বৈশিষ্ট্য নির্বাচন। ডেটা মাইনিংয়ের জ্ঞান আবিষ্কার সম্পর্কিত একাদশ এসিএম সিগ্কিডিডি আন্তর্জাতিক সম্মেলনের কার্যক্রমে (পিপি। 384-393)। এসিএম।


6
প্রথম প্রথম প্রশ্ন - এটি সম্ভবত একটি সদৃশ হিসাবে বন্ধ করা যেতে পারে, তবে আমি প্রশংসা করি যে আপনি যা অনুভব করেছেন তা এটিকে আলাদা করে দেওয়ার জন্য আপনি ব্যয় করতে ব্যয় করেছেন। আমি শিরোনাম সম্পাদনা করার পরামর্শ দিচ্ছি, সুতরাং এটি পরিষ্কার যে আপনার ফোকাস কেবলমাত্র ভবিষ্যদ্বাণীতে on
সিলভারফিশ 20

5
যদি এই প্রশ্নটি ইতিমধ্যে জিজ্ঞাসা করা হয়েছিল তবে আপনি আগের প্রশ্নটির একটি লিঙ্ক সরবরাহ করতে পারে তার চেয়ে কিছু সময় পার হওয়ার পরে এটি পুনরায় পোস্ট করা গুরুত্বপূর্ণ মনে করেন? পূর্ববর্তী উত্তরগুলির তুলনা করতে সক্ষম হওয়া আকর্ষণীয় হতে পারে।
টিম

1
@ qbert65536 একটি দর্শন হ'ল আপনি না। বৈশিষ্ট্য নির্বাচন অন্তর্নিহিত অবিশ্বাস্য।
horaceT

8
পদ্ধতিগুলি যা স্বয়ংক্রিয়ভাবে বৈশিষ্ট্যগুলির একটি বিরল উপসেট নির্বাচন করে (উদাহরণস্বরূপ l1 জরিমানা মডেল) এছাড়াও বৈশিষ্ট্য নির্বাচন সম্পাদন করছে। সুতরাং সমালোচনামূলক প্রশ্নটি "বৈশিষ্ট্য নির্বাচন ভাল / খারাপ" নয়, তবে "বৈশিষ্ট্যগুলি খারাপগুলি থেকে ভাল বৈশিষ্ট্য নির্বাচনের পদ্ধতিগুলি কী আলাদা করে?" প্যারামিটার অনুমানের সাথে যৌথভাবে সঞ্চালিত হওয়া (লাসো হিসাবে) একটি সম্পত্তি এবং আমরা জিজ্ঞাসা করতে পারি যে বিষয়টি (অন্যান্য অনেক বৈশিষ্ট্য সহ) গুরুত্বপূর্ণ কিনা whether
ব্যবহারকারী20160

2
@ টসাইন্টলুভারচার যেহেতু আমি এক বছর আগে এই প্রশ্নটি পোস্ট করেছি তাই আমার দ্বিতীয় (এবং তৃতীয়) চিন্তাভাবনা আছে। পরীক্ষার সমস্ত বৈশিষ্ট্য থেকে সাধারণীকরণ করা আরও বেশি দক্ষ মডেল বাছাইয়ের পরিবর্তে নির্বাচনকে মডেল না করে পরিবর্তিত নির্বাচনের দিকে পরিচালিত প্রচেষ্টা করা কতটা গুরুত্বপূর্ণ তা এখন আমি বিশ্বাস করি যে উপযুক্ত প্রশ্নটি।
horaceT

উত্তর:


37

বহু বছর ধরে গুজব রয়েছে যে গুগল তার ভবিষ্যদ্বাণীপূর্ণ অ্যালগরিদম তৈরিতে সমস্ত উপলব্ধ বৈশিষ্ট্য ব্যবহার করে। এখনও অবধি, কোনও অস্বীকৃতি, ব্যাখ্যা বা শ্বেতপত্র নেই যে এই গুজবকে স্পষ্ট করে এবং / অথবা বিতর্ক করে। এমনকি তাদের প্রকাশিত পেটেন্টগুলি বুঝতে সহায়তা করে না। ফলস্বরূপ, গুগলের বহিরাগত কেউই জানেন না তারা কী করছে, আমার জ্ঞানের সেরা।

/ * ২০১২ সালের সেপ্টেম্বরে আপডেট হওয়া, গুগল টেনস্রোফ্লো প্রচারক একটি উপস্থাপনায় রেকর্ড করেছিলেন যে গুগল ইঞ্জিনিয়াররা পেজর্যাঙ্কের বর্তমান সংস্করণের জন্য নিয়মিতভাবে 5 বিলিয়ন প্যারামিটারের মূল্যায়ন করে । * /

ওপি নোট হিসাবে, ভবিষ্যদ্বাণীপূর্ণ মডেলিংয়ের বৃহত্তম সমস্যাগুলির মধ্যে একটি হ'ল ক্লাসিক হাইপোথিসিস টেস্টিং এবং খাঁটি ডেটা মাইনিং বনাম সাবধানে মডেল স্পেসিফিকেশন মধ্যে সংঘাত। ক্লাসিক্যালি প্রশিক্ষিত প্রশিক্ষিতরা মডেল ডিজাইন এবং বিকাশে "কঠোরতার" প্রয়োজন সম্পর্কে যথেষ্ট দ্বিধাদায়ক হতে পারেন। আসল বিষয়টি হ'ল যখন বিপুল সংখ্যক প্রার্থী ভবিষ্যদ্বাণী এবং একাধিক সম্ভাব্য লক্ষ্য বা নির্ভরশীল ভেরিয়েবলের মুখোমুখি হন, ক্লাসিক কাঠামোটি কার্যকর হয় না, রাখে না বা দরকারী দিকনির্দেশনা সরবরাহ করে না। চট্টোপাধ্যায় এবং লিপসনের উজ্জ্বল কাগজ ডেটা স্ম্যাশিংয়ের কাছ থেকে সাম্প্রতিক অসংখ্য কাগজপত্র এই দ্বিধা প্রকাশ করেছে : ডেটাতে উদ্ভাসিত লুকিং অর্ডার http://rsif.royalsocietypublishing.org/content/royinterface/11/101/20140826.full.pdf

মূল সমস্যাটি হ'ল বর্তমানে বেশিরভাগ ডেটা তুলনা অ্যালগরিদমগুলি কোনও মানব বিশেষজ্ঞের উপর নির্ভর করে ডেটাগুলির 'বৈশিষ্ট্যগুলি' তুলনার জন্য প্রাসঙ্গিক specify এখানে, আমরা ডোমেন জ্ঞান বা শেখার উভয়ই ব্যবহার না করে স্বেচ্ছাচারিত তথ্য স্ট্রিমের উত্সগুলির মধ্যে সাদৃশ্যটি অনুমান করার জন্য একটি নতুন নীতি প্রস্তাব করি।

ক্লিনবার্গ দ্বারা প্রেডিকশন পলিসি সমস্যাগুলির বিষয়ে গত বছরের এআইআর পেপারে , ইত্যাদি। https://www.aeaweb.org/articles?id=10.1257/aer.p20151023 যা ডেটা মাইনিং এবং ভবিষ্যদ্বাণীকে অর্থনৈতিক নীতি নির্ধারণে দরকারী সরঞ্জাম হিসাবে উল্লেখ করে, যেখানে "কার্যকারণ অনুমিতি কেন্দ্রীয় নয়, এমনকি প্রয়োজনীয়ও নয়" উদাহরণগুলি উল্লেখ করে। "

আসল বিষয়টি হ'ল বৃহত্তর, ,000৪,০০০ ডলারের প্রশ্নটি ক্লাসিক হাইপোথিসিস-টেস্টিং ফ্রেমওয়ার্কের অন্তর্নিহিত উদাহরণস্বরূপ চিন্তাভাবনা এবং চ্যালেঞ্জকে বিস্তৃত স্থানান্তর, উদাহরণস্বরূপ, "অপ্রচলিত" বৈজ্ঞানিক চিন্তাধারার এই এজ.আর.জি. সংলাপটি https://www.edge.org/ প্রতিক্রিয়া / কি-বৈজ্ঞানিক-ধারণা-অবসর গ্রহণের জন্য প্রস্তুত এবং পাশাপাশি "নতুন অর্থনীতি" সম্পর্কে এরিক বেনহোকারের এই সাম্প্রতিক নিবন্ধ যা আচরণগত অর্থনীতি, জটিলতা তত্ত্ব, ভবিষ্যদ্বাণীমূলক মডেল হিসাবে বিস্তৃতভাবে বিভিন্ন শাখাগুলির একীকরণের জন্য কিছু মৌলিক প্রস্তাব উপস্থাপন করে নীতি বাস্তবায়ন এবং গ্রহণের প্ল্যাটফর্ম হিসাবে বিকাশ, নেটওয়ার্ক এবং পোর্টফোলিও তত্ত্ব https://evonomics.com/the-DP-and-profound-changes-in-economics-thinking/বলা বাহুল্য, এই বিষয়গুলি নিছক অর্থনৈতিক উদ্বেগের চেয়ে অনেক বেশি এগিয়ে যায় এবং পরামর্শ দেয় যে আমরা বৈজ্ঞানিক দৃষ্টান্তের ক্ষেত্রে একটি মৌলিক স্থান পরিবর্তন করছি। স্থানান্তরিত দৃষ্টিভঙ্গি হ্রাসমানের মধ্যে পার্থক্যগুলির মতোই মৌলিক, ওপামের রেজারের মতো মডেল-বিল্ডিং বনাম এপিকুরাসের বিস্তৃত নীতি বা একাধিক ব্যাখ্যা যা মোটামুটিভাবে বলে যে বেশ কয়েকটি অনুসন্ধান যদি কিছু ব্যাখ্যা করে তবে সেগুলি সবই ধরে রাখুন ... https: // en। wikipedia.org/wiki/Principle_of_plenitude

অবশ্যই, বেনহোকারের মতো ছেলেরা এই বিকশিত দৃষ্টান্তটির প্রয়োগ, পরিসংখ্যানগত সমাধান সম্পর্কিত উদ্বেগের ক্ষেত্রে ব্যবহারিকভাবে সম্পূর্ণরূপে নিরঙ্কিত। অতি উচ্চ মাত্রিক পরিবর্তনশীল নির্বাচনের কট্টর প্রশ্নগুলি লিখুন, অপারেটিং মডেল বিল্ডিংয়ের সম্ভাব্য পদ্ধতির বিষয়ে অপেক্ষাকৃত অপ্রয়োজনীয়, যেমন লাসো, এলএআর, স্টেপওয়াইজ অ্যালগরিদম বা "হাতির মডেল" যা উপলব্ধ সমস্ত তথ্যই ব্যবহার করে। বাস্তবতাটি হ'ল, এডাব্লুএস বা একটি সুপার কম্পিউটারের সাহায্যেও আপনি সমস্ত উপলব্ধ তথ্য একই সাথে ব্যবহার করতে পারবেন না - এগুলি সমস্ত লোড করার পক্ষে যথেষ্ট পরিমাণে র্যাম নেই this এর অর্থ কী? ওয়ার্কআরউন্ডগুলি প্রস্তাব করা হয়েছে, উদাহরণস্বরূপ, কমপ্লেক্স বা ম্যাসিভ ডেটাসেটগুলিতে এনএসএফের আবিষ্কার: সাধারণ পরিসংখ্যানীয় থিমবিশাল ডেটা মাইনিংয়ের জন্য অ্যালগরিদমগুলিকে "বিভাজন এবং বিজয়" করতে, যেমন, ওয়াং, এট আল এর কাগজ, পরিসংখ্যান সংক্রান্ত একটি জরিপ এবং বিগ ডেটার জন্য কম্পিউটিং http://arxiv.org/pdf/1502.07989.pdf পাশাপাশি লেসকোভেক, ইত্যাদি বই বৃহদায়তন ডেটাসেটস অনুযায়ী খনির http://www.amazon.com/Mining-Massive-Datasets-Jure-Leskovec/dp/1107077230/ref=sr_1_1?ie=UTF8&qid=1464528800&sr=8-1&keywords=Mining+of+Massive+Datasets

আক্ষরিক অর্থে শত শত, যদি এই চ্যালেঞ্জগুলির বিভিন্ন দিক নিয়ে কাজ করে না এমন হাজার হাজার কাগজপত্র থাকে তবে সমস্ত বিশ্লেষণাত্মক ইঞ্জিনকে "বিভাজন এবং বিজয়" অ্যালগরিদম থেকে তাদের মূল হিসাবে প্রস্তাব করে; নিষ্ক্রিয়, "গভীর শেখার" মডেল; এলোমেলো ম্যাট্রিক্স তত্ত্বটি বিশাল কোভারিয়েন্স নির্মাণে প্রয়োগ হয়েছে; ক্লাসিক, তদারকি করা লজিস্টিক রিগ্রেশন এবং আরও অনেক কিছুতে বয়েশিয়ান টেনসর মডেল। পনেরো বছর বা তারও আগে, বিতর্কটি মূলত ক্রমবর্ধমান সসীম মিশ্রণের মডেল বনাম বংশগত বায়সিয়ান সমাধান সম্পর্কিত আপেক্ষিক গুণাবলী সম্পর্কিত প্রশ্নগুলিতে কেন্দ্র করে। এই বিষয়গুলিকে সম্বোধন করে একটি গবেষণাপত্রে, আইনজী, ইত্যাদি। http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.197.788&rep=rep1&type=pdfবাস্তবে পৃথক তাত্ত্বিক পদ্ধতির সিদ্ধান্তে এই সিদ্ধান্তে পৌঁছেছিল যে, এইচবি মডেলগুলির সুবিধা ছিল যেখানে স্পার্স এবং / বা উচ্চ মাত্রিক ডেটা জড়িত সমস্যাগুলি ব্যতীত ভিন্নতর তাত্ত্বিক পদ্ধতির ব্যপারে সমতুল্য ফলাফল তৈরি হয়েছিল। আজ ডি অ্যান্ড সি কর্মক্ষেত্রের আবির্ভাবের সাথে, এইচবি মডেলগুলির যে কোনও সালিশ historতিহাসিকভাবে উপভোগ করেছে তা নির্মূল করা হচ্ছে।

এই ডি অ্যান্ড সি কর্মক্ষেত্রগুলির মূল যুক্তিটি হ'ল এবং বড় আকারে ব্রেইমানের বিখ্যাত এলোমেলো বন প্রযুক্তির বর্ধন যা পর্যবেক্ষণ এবং বৈশিষ্ট্যগুলির বুটস্ট্র্যাপযুক্ত পুনরায় মডেলিংয়ের উপর নির্ভর করে। ব্রেইমান 90 এর দশকের শেষের দিকে একটি সিপিইউতে তাঁর কাজ করেছিলেন যখন বিশাল ডেটা কয়েক ডজন জিগ এবং কয়েক হাজার বৈশিষ্ট্য বোঝায়। আজকের বৃহত্তর সমান্তরাল, মাল্টি-কোর প্ল্যাটফর্মগুলিতে, কয়েক ঘন্টার মধ্যে লক্ষ লক্ষ "আরএফ" মিনি-মডেল তৈরির লক্ষ লক্ষ বৈশিষ্ট্যযুক্ত টেরাবাইট ডেটা বিশ্লেষণ করে অ্যালগরিদমগুলি চালানো সম্ভব।

এই সমস্ত থেকে যে কোন গুরুত্বপূর্ণ প্রশ্ন আসছে। এই কাজের ক্ষেত্রগুলির প্রাকৃতিক আকারের কারণে নির্ভুলতা হ্রাস পাওয়ার বিষয়ে উদ্বেগের সাথে একটি করতে হবে। এই সমস্যাটি চেন এবং জাই তাদের কাগজটিতে সম্বোধন করেছেন , বহির্মুখী বড় ডেটা বিশ্লেষণের জন্য একটি স্প্লিট-এন্ড-কোঙ্কার অ্যাপ্রোচ http://dimacs.rutgers.edu/ টেকনিক্যাল রিপোর্টগুলি / টেকারপোর্টস / ২০১২/২০১. pdf যেখানে তারা সিদ্ধান্তটি নিয়েছে অনুমানগুলি "সম্পূর্ণ তথ্য" মডেলগুলির থেকে পৃথক পৃথক।

দ্বিতীয় উদ্বেগ, যা আমার জ্ঞানের সর্বোপরি সাহিত্যের দ্বারা যথাযথভাবে সমাধান করা হয়নি, সম্ভাব্য কয়েক মিলিয়ন ভবিষ্যদ্বাণীমূলক মিনি-মডেলগুলির ফলাফলগুলি একবার থেকে ফলাফলের সাথে করা (যেমন, "পরামিতি") এর সাথে করতে হবে has গুটিয়ে রাখা হয়েছে এবং সংক্ষিপ্ত করা হয়েছে। অন্য কথায়, কীভাবে কেউ এই ফলাফলগুলির সাথে নতুন স্কোরকে "স্কোরিং" করার মতো সহজ কিছু কার্যকর করে? ক্ষুদ্র-মডেল সহগগুলি সংরক্ষণ এবং সংরক্ষণের জন্য রয়েছে বা নতুন ডেটাতে কি সহজেই ডি অ্যান্ড অ্যালগরিদম পুনরায় চালু করা যায়?

তাঁর বই, নাম্বার রুল ইওর ওয়ার্ল্ডে কাইজার ফাং তাদের প্রতিযোগিতার বিজয়ীদের হাতে তুলে দেওয়া মাত্র ১০৪ টি মডেলের একটি উপহার উপস্থাপন করার সময় মুখোমুখি দ্বিধা নেটফ্লিক্সের বর্ণনা দিয়েছেন। বিজয়ীরা প্রকৃতপক্ষে এমএসই বনাম অন্যান্য প্রতিযোগীদের হ্রাস পেয়েছিল তবে এটি তাদের মুভি সুপারিশকারী সিস্টেম দ্বারা ব্যবহৃত 5-পয়েন্ট, লিকার্ট-টাইপ রেটিং স্কেলের যথার্থতার ক্ষেত্রে এক দশমিক দশমিক এক দশমিক উন্নয়নে অনুবাদ করেছে। তদ্ব্যতীত, মডেলগুলির এই সংগ্রহের জন্য প্রয়োজনীয় আইটি রক্ষণাবেক্ষণের জন্য মডেল নির্ভুলতায় "উন্নতি" থেকে পাওয়া কোনও সঞ্চয় চেয়ে অনেক বেশি ব্যয় হয়।

তারপরে এই মাত্রার তথ্যের সাথে "অপ্টিমাইজেশন" এমনকি সম্ভব কিনা তা নিয়েও পুরো প্রশ্ন রয়েছে। উদাহরণস্বরূপ, পদার্থবিজ্ঞানী এবং আর্থিক প্রকৌশলী ইমানুয়েল ডার্মান তাঁর মাই লাইফ অ্যাজ কোয়ান্ট বইয়ে পরামর্শ দিয়েছেন যে অনুকূলিতকরণ একটি অন্তত আর্থিক ইঞ্জিনিয়ারিংয়ের ক্ষেত্রে একটি অনর্থক কল্পকাহিনী।

অবশেষে, প্রচুর সংখ্যক বৈশিষ্ট্যযুক্ত তুলনামূলক বৈশিষ্ট্যটির গুরুত্ব সম্পর্কিত গুরুত্বপূর্ণ প্রশ্নগুলির সমাধান করা এখনও হয়নি।

চলক নির্বাচনের প্রয়োজনীয়তা এবং বর্তমান দ্বারা নতুন নতুন চ্যালেঞ্জগুলি খোলার বিষয়ে কোনও সহজ উত্তর নেই answers মূল কথাটি হ'ল আমরা এখন সমস্ত তথ্য বিজ্ঞানী।

**** সম্পাদনা করুন *** তথ্যসূত্র

  1. চট্টোপাধ্যায় আই, লিপসন এইচ। 2014 ডেটা স্ম্যাশিং: ডেটাতে লুকোচুরি অর্ডার উন্মোচন। জেআর সোস। ইন্টারফেস 11: 20140826. http://dx.doi.org/10.1098/rsif.2014.0826

  2. ক্লেইনবার্গ, জোন, জেনস লুডভিগ, সেন্ডিল মুল্লাইনাথন এবং জিয়াড ওবারমায়ার। 2015. "ভবিষ্যদ্বাণী নীতি সমস্যা।" আমেরিকান অর্থনৈতিক পর্যালোচনা, 105 (5): 491-95। ডিওআই: 10.1257 / aer.p20151023

  3. এজ.আর.২০১৪, বার্ষিক প্রশ্ন: স্বীকৃতি পাওয়ার জন্য সায়েন্টিফিক আইডিয়া কী প্রস্তুত? https://www.edge.org/responses/what-scientific-idea-is-ready-for-retirement

  4. এরিক বেইনহকার, অর্থনীতিতে কীভাবে গভীর পরিবর্তনগুলি বামে বনাম ডান বিতর্ককে অপ্রাসঙ্গিক, 2016, এভনোমিক্স.অর্গ। https://evonomics.com/the-deep-and-profound-changes-in-economics-thinking/

  5. একাধিক ব্যাখ্যার এপিকিউরাস নীতি: সমস্ত মডেল রাখুন। উইকিপিডিয়া https: //www.c ورس hero.com/file/p6tt7ej/Epicurus- প্রিন্সিপাল- এর- বহুবিধ- এক্সপ্লোরেশন- কীপ- সমস্ত- Models- that- are- consistance/

  6. এনএসএফ, কমপ্লেক্স বা ম্যাসিভ ডেটাসেটস আবিষ্কার: সাধারণ পরিসংখ্যান থিমস, ন্যাশনাল সায়েন্স ফাউন্ডেশন দ্বারা অর্থায়িত একটি কর্মশালা, 16-17 অক্টোবর, 2007 https://www.nsf.gov/mps/dms/documents/DiscoveryInComplexOrMassiveDatasets.pdf

  7. চুন ওয়াং, মিং-হুই চেন, এলিজাবেথ শিফানো, জিং উ, এবং জুন ইয়ান, ওয়ার্কিং পেপার, বিগ ডেটার জন্য পরিসংখ্যানগত পদ্ধতি এবং কম্পিউটিং, অক্টোবর 29, 2015 http://arxiv.org/pdf/1502.07989.pdf

  8. জুরে লেসকোভেক, আনন্দ রাজারামন, জেফ্রি ডেভিড উলম্যান, ম্যাসিভ ডেটাসেটসের খনি, কেমব্রিজ ইউনিভার্সিটি প্রেস; 2 সংস্করণ (29 ডিসেম্বর, 2014) আইএসবিএন: 978-1107077232

  9. জিয়ানফেং ইয়াও, শুরং ঝেং, জিদং বাই, কেমব্রিজ ইউনিভার্সিটি প্রেসের বৃহত নমুনা কোভারিয়েন্স ম্যাট্রিক্স এবং উচ্চ-মাত্রিক ডেটা অ্যানালাইসিস (স্ট্যাটিস্টিকাল অ্যান্ড প্রোব্যাবিলিস্টিক গণিতে ক্যামব্রিজ সিরিজ); 1 সংস্করণ (30 মার্চ, 2015) আইএসবিএন: 978-1107065178

  10. রিক এল অ্যান্ড্রুস, অ্যান্ড্রেইউ আইনজীবি এবং ইমরান এস কুরিম, ভিন্ন ভিন্নতার ধারাবাহিক উপস্থাপনা, বিপণন গবেষণা জার্নাল, 479 খণ্ডের লগইট চয়েস মডেলের একটি অনুগত তুলনা। XXXIX (নভেম্বর 2002), 479–487 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.197.788&rep=rep1&type=pdf

  11. অসাধারণভাবে বড় ডেটা বিশ্লেষণের জন্য একটি স্প্লিট-এন্ড কোঙ্কার অ্যাপ্রোচ, জুইয়িং চেন এবং মিংজ জেই, ডিআইএমএসিএস প্রযুক্তিগত প্রতিবেদন ২০১২-০১, জানুয়ারী ২০১২ http://dimacs.rutgers.edu/TechnicalReports/TechReports/2012/2012-01.pdf

  12. কায়সার ফাং, নাম্বারগুলি আপনার বিশ্বকে নিয়ম করুন: আপনি যা কিছু করেন তার উপর সম্ভাবনা এবং পরিসংখ্যানের লুকানো প্রভাব, ম্যাকগ্রা-পার্বত্য শিক্ষা; 1 সংস্করণ (15 ফেব্রুয়ারী, 2010) আইএসবিএন: 978-0071626538

  13. এমমানুয়েল ডারমান, কোয়ান্ট হিসাবে আমার জীবন: পদার্থবিজ্ঞান এবং অর্থের প্রতিচ্ছবি, উইলি; 1 সংস্করণ (11 জানুয়ারী, 2016) আইএসবিএন: 978-0470192733

* নভেম্বর 2017 এ আপডেট করুন *

নাথন কুটজ ২০১৩ বই, ডেটা-ড্রাইভড মডেলিং এবং বৈজ্ঞানিক গণনা: জটিল সিস্টেমগুলির পদ্ধতি এবং বিগ ডেটা একটি গাণিতিক এবং পিডিই-কেন্দ্রিক ভ্রমণ যেমন পরিবর্তনশীল নির্বাচনের পাশাপাশি মাত্রা হ্রাস পদ্ধতি এবং সরঞ্জামগুলিতে is তার ভাবনার জন্য একটি দুর্দান্ত, 1 ঘন্টার পরিচিতি এই জুন 2017 সালে ইউটিউব ভিডিও ডায়নামিকাল সিস্টেমস এবং পিডিইগুলির ডেটা চালিত আবিষ্কারের মধ্যে পাওয়া যাবে । এতে তিনি এই ক্ষেত্রে সর্বশেষতম অগ্রগতির উল্লেখ করেছেন। https://www.youtube.com/watch?feature=youtu.be&v=Oifg9avnsH4&app=desktop


1
কয়েক বছর আগে মেশিন লার্নিং গ্রীষ্মকালীন বিদ্যালয়ে, গুগলের এক সহকর্মী একটি কথা বলেছেন (নাম ভুলে গেছেন)। তিনি উল্লেখ করেছিলেন যে উত্পাদনে বেশ কয়েকটি (বাইনারি শ্রেণিবদ্ধকরণ) মডেলগুলি million 30 টিবি ডেটাসেটের উপর ব্যাচ প্রশিক্ষিত ~ 200 মিলিয়ন বৈশিষ্ট্যগুলির মতো কিছু জড়িত; তাদের বেশিরভাগ সম্ভবত বাইনারি বৈশিষ্ট্য। আমার মনে নেই তিনি কখনও ভেরিয়েবল নির্বাচনের কথা উল্লেখ করেছিলেন।
horaceT

1
দুর্দান্ত মন্তব্য (যদিও এর একটি অংশটি স্পর্শকাতর হয়ে গেছে)। আমি বিশেষত সেই দৃষ্টিকোণটি পছন্দ করি যে বিগ ডেটার যুগে অনেক পুরানো ধরণের ধারণার পুনরায় পরীক্ষা করা দরকার need
horaceT

1
@ horaceT খুব আকর্ষণীয় অন্তত এটি গুজবকে নিশ্চিত করে। ধন্যবাদ। এটি কোন এমএল প্রোগ্রাম ছিল?
মাইক হান্টার

1
ইউসি সান্তা ক্রুজ এ এমএলএসএস 2012। স্পিকার ছিলেন তুষার চন্দ্র, এখানে স্লাইডগুলি, ব্যবহারকারীদের.সয়ে.সিএসসি.ইডু
এনিয়েজিয়াজং /

2
@ গ্লেন_বি মন্তব্যের জন্য ধন্যবাদ। আমি ভেবেছিলাম ভাঙা লিংক ইস্যুর কারণে আমি রেফারেন্সগুলির জন্য নাম এবং শিরোনামগুলি সরবরাহ করেছি। নির্বিশেষে, আমি শেষে একটি রেফারেন্স বিভাগ যুক্ত করব। যদি কিছু অনুপস্থিত থাকে তবে আমাকে জানান।
মাইক হান্টার

14

পূর্বাভাসের শর্তাবলী, আপনাকে সম্ভবত মডেলটি কীভাবে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি শিখবে তা নিয়ে ভাবতে হবে । এমনকি ওএলএস-এর কথা ভাবাও, এটি আপনাকে যথেষ্ট পরিমাণে ডেটা দেওয়া মডেল নির্বাচনের মতো কিছু দেবে। তবে আমরা জানি যে এটি দ্রুত এই সমাধানে রূপান্তরিত করে না - তাই আমরা আরও ভাল কিছু অনুসন্ধান করি।

বেশিরভাগ পদ্ধতি যে ধরণের বিটা / সহগের মুখোমুখি হতে চলেছে (বেইসিয়ান মডেলটিতে পূর্ব বিতরণ করার মতো) তা নিয়ে ধারণা তৈরি করছে। এই অনুমানগুলি ধরে রাখলে তারা সেরা কাজ করে। উদাহরণস্বরূপ, রিজ / লাসো রিগ্রেশন ধরে নেয় বেশিরভাগ বিটা প্রায় শূন্যের সাথে একই স্কেলে রয়েছে। তারা বেশিরভাগ বিটা শূন্য যেখানে "একটি খড়ের কাঁধের সূঁচ" রেজিস্ট্রেশনের পক্ষেও তেমন কাজ করবে না এবং কিছু বিটা খুব বড় (যেমন স্কেলগুলি খুব আলাদা) different বৈশিষ্ট্য নির্বাচন এখানে আরও ভাল কাজ করতে পারে - ল্যাসো সঙ্কুচিত শব্দ এবং সংকেতটি ছোঁয়া ছাড়ার মধ্যে আটকে যেতে পারে। বৈশিষ্ট্য নির্বাচন আরও চঞ্চল - একটি প্রভাব হয় "সংকেত" বা "শব্দ"।

সিদ্ধান্ত নেওয়ার ক্ষেত্রে - আপনার কী ধরণের প্রেডিক্টর ভেরিয়েবল রয়েছে সে সম্পর্কে আপনার কিছু ধারণা থাকতে হবে। আপনার কিছু সত্যই ভাল আছে? নাকি সব ভেরিয়েবল দুর্বল? এটি আপনার কাছে থাকা বিটাসের প্রোফাইলকে চালিত করবে। এবং আপনি কোন জরিমানা / নির্বাচনের পদ্ধতিগুলি ব্যবহার করেন (কোর্সের জন্য ঘোড়া) এবং এটি সমস্ত।

বৈশিষ্ট্য নির্বাচনটিও খারাপ নয় তবে গণনা সংক্রান্ত বিধিনিষেধের কারণে কিছু পুরানো অনুমানগুলি আর ভাল হয় না (ধাপে ধাপে, এগিয়ে)। বৈশিষ্ট্য নির্বাচন ব্যবহার করে মডেল গড় গড়ে তোলা হয় (সমস্ত 1 ভের মডেল, 2 ভের মডেল, ইত্যাদি) তাদের কর্মক্ষমতা দ্বারা ভারিত) ভবিষ্যদ্বাণীতে খুব ভাল কাজ করবে। তবে এগুলি মূলত বিযুক্তদের বাদ দেওয়া মডেলগুলিকে দেওয়া ওজনের মাধ্যমে বিটাগুলিকে মূলত দণ্ড দিচ্ছে - কেবল সরাসরি নয় - এবং উত্তল অপ্টিমাইজেশান সমস্যার ক্ষেত্রে নয়।


12

আমি আপনাকে শিল্পের দৃষ্টিভঙ্গি দিচ্ছি।

শিল্পগুলি সেন্সর এবং মনিটরিং সিস্টেমে অর্থ ব্যয় করতে পছন্দ করে না যা তারা জানে না যে তারা কতটা উপকৃত হবে।

উদাহরণস্বরূপ, আমি নাম বলতে চাই না, সুতরাং প্রতি মিনিটে 10 সেন্সর ডেটা সংগ্রহ করার একটি উপাদান কল্পনা করুন। সম্পত্তির মালিক আমার দিকে ফিরে যান এবং আমাকে জিজ্ঞাসা করেন যে আপনি 10 সেন্সর থেকে এই ডেটা দিয়ে আমার উপাদানগুলির আচরণের কতটা পূর্বাভাস দিতে পারেন? তারপরে তারা ব্যয়-বেনিফিট বিশ্লেষণ করে।

তারপরে, তাদের 20 টি সেন্সর সহ একই উপাদান রয়েছে, তারা আমাকে আবার জিজ্ঞাসা করেছেন, 20 সেন্সর থেকে এই ডেটা দিয়ে আপনি আমার উপাদানটির আচরণ সম্পর্কে কতটা অনুমান করতে পারেন? তারা আরেকটি ব্যয়-বেনিফিট বিশ্লেষণ করে।

এই প্রতিটি ক্ষেত্রে, তারা সেন্সরগুলির ইনস্টলেশনগুলির কারণে বিনিয়োগের ব্যয়ের সাথে সুবিধাটি তুলনা করে। (এটি কেবল কোনও উপাদানগুলিতে 10 ডলার সেন্সর যুক্ত করছে না A অনেক কারণের একটি ভূমিকা রয়েছে)। এখানে একটি পরিবর্তনশীল নির্বাচন বিশ্লেষণ দরকারী হতে পারে।


1
ভাল যুক্তি. তবে আপনি ২০ টি থেকে কিছু ডেটা না পাওয়া পর্যন্ত আপনি 10 সেন্সরকে যথেষ্ট ভাল জানেন না বা অন্য 10 টির দরকার নেই
horaceT

সত্য, এবং আপনি সর্বদা কিছু অধ্যয়নের ভিত্তিতে অনুমান করতে পারেন। ব্যর্থতা এড়াতে আপনি প্রতিটি সেন্সরকে লক্ষ্য সহ ইনস্টল করেন। যদি ব্যর্থতার হার কম হয় বা আপনি ইতিমধ্যে কোনও উপাদানটির উল্লেখযোগ্য অংশগুলি কভার করেছেন, আপনি জানেন যে 1 সেন্সর যুক্ত করা কোনও বড় রিটার্ন আনবে না। সুতরাং, সেই অতিরিক্ত সেন্সরগুলি আসলে পর্যাপ্ত পরিমাণে যথেষ্ট কিনা তা জানতে আপনার সেই সেন্সরগুলি ইনস্টল করার, ডেটা সংগ্রহ করার এবং একটি গবেষণা করার দরকার নেই।
PeyM87

'সেন্সর' বলতে সেন্সর বোঝাতে পারে না - আমার সংস্থায় আমরা আমাদের সমস্ত ডেটা সাবস্ক্রাইব করে থাকি, সুতরাং এমন বৈশিষ্ট্যগুলি আবিষ্কার করার সুযোগ রয়েছে যা কোনও কিছুতে অবদান রাখছে না, এবং সাবস্ক্রিপশন পরিষেবা থেকে এগুলি সরিয়ে ব্যয়গুলি হ্রাস করে (স্পষ্ট হতে পারে, সাবস্ক্রিপশন হারগুলি স্বতন্ত্র কলামগুলির চেয়ে উচ্চ স্তরে তৈরি করা হয়েছে তবে অবশ্যই চাঁদা গ্রহণের কোনও উপাদান একটি চূড়ান্ত মডেলটিতে একটি বৈশিষ্ট্য অবদান রাখে এবং এর কার্যকারিতা উন্নতি না করে যদি তা বন্ধ করতে সক্ষম হয় তবে তা কল্পনা করা
বাঞ্ছনীয়

9

খাঁটি ভবিষ্যদ্বাণীপূর্ণ মডেল শেখার জন্য অ্যালগরিদমের অংশ হিসাবে, পরিবর্তনশীল নির্বাচন একটি পারফরম্যান্স দৃষ্টিকোণ থেকে অগত্যা খারাপ নয় বা এটি স্বয়ংক্রিয়ভাবে বিপজ্জনকও নয়। তবে কিছু বিষয় রয়েছে যা সম্পর্কে আমাদের সচেতন হওয়া উচিত।

প্রশ্ন একটু বেশি কংক্রিট তৈরি করতে হলে, এর সঙ্গে রৈখিক রিগ্রেশনের সমস্যা বিবেচনা করা যাক জন্য , এবং এবং হচ্ছে -dimensional এর ভেক্টর যথাক্রমে ভেরিয়েবল এবং পরামিতি। উদ্দেশ্যটি হ'ল ফাংশনের একটি ভাল অনুমানের সন্ধান করা যা দেওয়া পূর্বাভাস । অনুমান করে এটি অর্জন করা যেতে পারেi = 1 , , N X i β p x E ( Y X = x ) = X T β , Y X = x β

E(YiXi)=XiTβ
i=1,,NXiβp
xE(YX=x)=XTβ,
YX=xβভেরিয়েবল নির্বাচন এবং ক্ষতির সাথে কোনও দণ্ড ছাড়াই বা সংশোধন করার সংমিশ্রণগুলি ব্যবহার করে। মডেল গড় বা বায়েশিয়ান পদ্ধতিগুলিও ব্যবহার করা যেতে পারে তবে আসুন একক মডেল পূর্বাভাসের দিকে মনোনিবেশ করুন।

ফরোয়ার্ড এবং পশ্চাৎ পরিবর্তনশীল নির্বাচনের মতো স্টেপওয়্যার সিলেকশন অ্যালগরিদমগুলিকে একটি সর্বোত্তম উপসেট নির্বাচন সমস্যা সমাধানের আনুমানিক প্রচেষ্টা হিসাবে দেখা যেতে পারে, যা গণনাগতভাবে শক্ত (গণনার শক্তির উন্নতি সামান্য গুরুত্বপূর্ণ)। আগ্রহ প্রতিটি ভেরিয়েবল সহ সেরা (বা কমপক্ষে একটি ভাল) মডেল সন্ধানে। এরপরে, আমরা ওভারটিমাইজ করতে পারি ।k=1,,min(N,p)kk

এ জাতীয় পরিবর্তনশীল নির্বাচনের পদ্ধতিটি হ'ল বিপদটি হ'ল প্রচলিত মান বিতরণের ফলাফল ভেরিয়েবল নির্বাচনের ক্ষেত্রে শর্তাধীন অবৈধ। এটি স্ট্যান্ডার্ড টেস্ট এবং আত্মবিশ্বাসের ব্যবধানগুলি ধারণ করে এবং হ্যারেল [২] যে সমস্যাগুলির বিষয়ে সতর্ক করছেন সেগুলির মধ্যে একটি। Breiman এছাড়াও মডেল নির্বাচন যেমন Mallows 'উপর ভিত্তি করে সম্পর্কে সতর্ক মধ্যে ... লিটল বুটস্ট্র্যাপ । ম্যাল্লোসের , বা এআইসি, সেই বিষয়ে মডেল নির্বাচনের জন্য নয় এবং তারা অত্যধিক আশাবাদী ভবিষ্যদ্বাণী ত্রুটি দেবে।CpCp

তবে, পূর্বাভাস ত্রুটি অনুমান করার জন্য এবং বাছাইয়ের জন্য ক্রস-বৈধকরণ ব্যবহার করা যেতে পারে এবং পরিবর্তনশীল নির্বাচন পক্ষপাত এবং বৈকল্পিকের মধ্যে একটি ভাল ভারসাম্য অর্জন করতে পারে। যদি এই প্রবণতা বিশেষ করে সত্য বাকি শূন্য পাসে সঙ্গে কিছু বড় স্থানাঙ্ক হয়েছে যেমন @probabilityislogic উল্লেখ করা হয়।kβ

সংকীর্ণ পদ্ধতি যেমন রিজ রিগ্রেশন এবং লাসো সুস্পষ্ট পরিবর্তনশীল নির্বাচন ছাড়াই পক্ষপাত এবং বৈকল্পিকের মধ্যে একটি ভাল ট্রেডঅফ অর্জন করতে পারে। যাইহোক, ওপি যেমন উল্লেখ করেছে, লাসো অন্তর্ভুক্ত পরিবর্তনশীল নির্বাচন করে does এটি প্রকৃতপক্ষে মডেল নয় বরং পরিবর্তনশীল নির্বাচন করে এমন মডেলটিকে ফিট করার জন্য পদ্ধতি । সেই দৃষ্টিকোণ থেকে, পরিবর্তনশীল নির্বাচন (অন্তর্ভুক্ত বা স্পষ্ট) মডেলটিকে ডেটাতে ফিটিং করার পদ্ধতির কেবল একটি অংশ এবং এটিকে হিসাবে বিবেচনা করা উচিত।

লাসো অনুমানের গণনার জন্য অ্যালগরিদমগুলি পরিবর্তনশীল নির্বাচন (বা স্ক্রিনিং) থেকে উপকৃত হতে পারে। ইন Sparsity সঙ্গে পরিসংখ্যানগত শিক্ষণ:, Lasso এবং সরলীকরণ , বিভাগ 5.10, এটা বর্ণনা কিভাবে স্ক্রীনিং, বাস্তবায়িত যেমন glmnet, দরকারী। এটি লাসো অনুমানকারকের যথেষ্ট গতিতে তুলতে পারে।

একটি ব্যক্তিগত অভিজ্ঞতা এমন একটি উদাহরণ থেকে যেখানে ভেরিয়েবল নির্বাচনটি নির্বাচিত ভেরিয়েবলগুলি ব্যবহার করে আরও জটিল মডেলের (একটি সাধারণীকরণযোগ্য মডেল) ফিট করা সম্ভব করে তোলে। ক্রস-বৈধকরণের ফলাফলগুলি ইঙ্গিত দেয় যে এই মডেলটি বেশ কয়েকটি বিকল্পের চেয়ে সেরা যদিও এলোমেলো বন নয়। গ্যামসেল যদি প্রায় থাকত যা ভেরিয়েবল নির্বাচনের সাথে জেনারেলাইজড অ্যাডিটিভ মডেলগুলিকে একীভূত করে আমি এটি চেষ্টা করে দেখতেও পারতাম- -

সম্পাদনা: যেহেতু আমি এই উত্তরটি লিখেছি সে সম্পর্কে আমার মনে থাকা বিশেষ প্রয়োগের একটি কাগজ রয়েছে । কাগজে ফলাফল পুনরায় উত্পাদনের জন্য আর-কোড উপলব্ধ is

সংক্ষিপ্তভাবে আমি বলব যে পরিবর্তনশীল নির্বাচন (এক রূপে বা অন্য রূপে) ব্যবহারযোগ্য থাকবে এবং থাকবে এমনকি খাঁটি ভবিষ্যদ্বাণীমূলক উদ্দেশ্যেও পক্ষপাতিত্ব-বৈকল্পিক ট্রেড অফকে নিয়ন্ত্রণ করার উপায় হিসাবে। যদি অন্য কারণে না হয় তবে কমপক্ষে কারণেই আরও জটিল মডেলগুলি খুব বেশি সংখ্যক ভেরিয়েবলের বাইরে থাকা বাক্সটিকে পরিচালনা করতে সক্ষম না হতে পারে। তবে সময়ের সাথে সাথে আমরা প্রাকৃতিকভাবে গ্যামেলের মতো বিকাশ দেখতে পাব যা ভেরিয়েবল নির্বাচনকে অনুমানের পদ্ধতিতে সংহত করে। -

এটি অবশ্যই সর্বদা অপরিহার্য যে আমরা ভেরিয়েবল নির্বাচনটিকে অনুমান পদ্ধতির অংশ হিসাবে বিবেচনা করি। বিপদটি বিশ্বাস করা যায় যে চলক নির্বাচনটি একটি ওরাকলের মতো সম্পাদন করে এবং ভেরিয়েবলগুলির সঠিক সেটটি চিহ্নিত করে। যদি আমরা তা বিশ্বাস করি এবং এমনভাবে এগিয়ে যাই যদি ডেটার উপর ভিত্তি করে ভেরিয়েবলগুলি নির্বাচিত না হয় তবে আমরা ত্রুটি করার ঝুঁকিতে আছি।


1
পরিবর্তনশীল নির্বাচনের ফলে কীভাবে আরও জটিল মডেলের ফিট করা সম্ভব হয়েছিল তা সম্পর্কে আমি পরিষ্কার নই। চলক নির্বাচনের সাহায্যে আপনি এখনও একই বৃহত সংখ্যক পরামিতি অনুমান করছেন; আপনি কেবল তাদের মধ্যে শূন্য হিসাবে অনুমান করছেন। পরিবর্তনশীল নির্বাচনের পরে শর্তযুক্ত মডেলটির স্থায়িত্ব একটি মরীচিকা হতে পারে।
ফ্রাঙ্ক হ্যারেল

1
@ হ্যারেল, বিশেষ উদাহরণে ভেরিয়েবল নির্বাচন লাসো ব্যবহার করে মডেলটির স্থায়িত্ব নির্বাচনের সাথে মিশ্রিত করা হয়েছিল যেখানে সমস্ত ভেরিয়েবল লাইনযুক্তভাবে প্রবেশ করেছিল। গ্যামটি নির্বাচিত ভেরিয়েবলগুলি ব্যবহার করে ফিট করা হয়েছিল। আমি সম্পূর্ণরূপে সম্মত হই যে পরিবর্তনশীল নির্বাচনটি কেবলমাত্র কিছু প্যারামিটার শূন্যের অনুমান করে এবং অ্যাপ্লিকেশনটি ঠিক দ্বি-পদক্ষেপের পদ্ধতিতে গ্যাম মডেলে এটি করেছিল। আমি নিশ্চিত যে গ্যামসেল আরও নিয়মতান্ত্রিক পদ্ধতির সরবরাহ করে। আমার বক্তব্যটি ছিল যে এই জাতীয় দৃষ্টিভঙ্গি ছাড়াই পরিবর্তনশীল নির্বাচন দরকারী শর্টকাট হতে পারে।
এনআরএইচ

1
পূর্বের শাস্তি পর্বে নির্বাচিত ভেরিয়েবলগুলি পুনরায় ফিট করার জন্য একটি আনপেনালাইজড পদ্ধতি ব্যবহার করা উপযুক্ত নয়। এটি যথেষ্ট পক্ষপাতদুষ্ট হবে। এবং আনপেনালাইজড ভেরিয়েবল নির্বাচন ভাল শর্টকাট নয়।
ফ্র্যাঙ্ক হ্যারেল

1
স্থিতিশীলতা নির্বাচন লাসো ব্যবহার করে ভেরিয়েবল নির্বাচন করা এবং দন্ড বিহীন পুনরায় ফিটিংয়ের চেয়ে বেশি রক্ষণশীল। পরবর্তীকরা, প্রত্যাশিতভাবে, ভবিষ্যদ্বাণীমূলক দৃষ্টিকোণ (ক্রস-বৈধকরণ দ্বারা পরিমাপ হিসাবে) থেকে খুব ভাল কাজ করে নি। যখন আমি কোনও কংক্রিটের ক্ষেত্রে ক্রস-বৈধকরণের মাধ্যমে দেখতে পাই যে পরিবর্তনশীল নির্বাচন + গেমটি রিজ বা লাসো অনুমানের চেয়ে ভাল ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্স দেয়, তবে প্রক্রিয়াটি ভাল কিনা তা আমার মাপকাঠি।
এনআরএইচ

1
'স্থায়িত্ব নির্বাচন' সংজ্ঞায়িত করুন। এবং দণ্ড ছাড়াই পুনরায় ফিট করা রক্ষণশীল বিরোধী।
ফ্র্যাঙ্ক হ্যারেল

4

আমাকে এই বক্তব্যটিতে মন্তব্য করতে দিন: "... কে প্যারামিটারগুলিকে এন <কে পর্যবেক্ষণে লাগানো ঠিক হচ্ছে না।"

In chemometrics we are often interested in predictive models, and the situation k >> n is frequently encountered (e.g. in spectroscopic data). This problem is typically solved simply by projecting the observations to a lower dimensional subspace a, where a < n, before the regression (e.g. Principal Component Regression). Using Partial Least Squares Regression the projection and regression are performed simultaneously favoring quality of prediction. The methods mentioned find optimal pseudo-inverses to a (singular) covariance or correlation matrix, e.g. by singular value decomposition.

অভিজ্ঞতা দেখায় যে শ্লোগানযুক্ত ভেরিয়েবলগুলি সরিয়ে ফেলা হলে মাল্টিভারিয়েট মডেলের ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্স বৃদ্ধি পায়। সুতরাং এমনকি যদি আমরা - অর্থবহ উপায়ে - কেবলমাত্র n সমীকরণ (এন <কে) থাকা কে প্যারামিটারগুলি অনুমান করতে সক্ষম হয়, আমরা পার্সোনমিয়াস মডেলগুলির জন্য প্রচেষ্টা করি। এই উদ্দেশ্যে, পরিবর্তনীয় নির্বাচন প্রাসঙ্গিক হয়ে ওঠে এবং অনেকগুলি কেমোমেট্রিক সাহিত্য এই বিষয়ে নিবেদিত হয়।

যদিও পূর্বাভাস একটি গুরুত্বপূর্ণ উদ্দেশ্য, একই সময়ে প্রক্ষেপণ পদ্ধতিগুলি যেমন ভেরিয়েবলগুলির প্রাসঙ্গিকতার সাথে সম্পর্কিত নিদর্শনগুলির জন্য মূল্যবান অন্তর্দৃষ্টি সরবরাহ করে। এটি মূলত বিবিধ মডেল-প্লট, যেমন স্কোর, লোডিং, অবশিষ্টাংশ ইত্যাদির দ্বারা সহজতর হয় ...

কেমোমেট্রিক প্রযুক্তি যেমন ব্যাপকভাবে ব্যবহৃত হয় যেমন শিল্পে যেখানে নির্ভরযোগ্য এবং নির্ভুল ভবিষ্যদ্বাণীগুলি সত্যই গণনা করা হয়।


3

বেশ কয়েকটি সুপরিচিত ক্ষেত্রে, হ্যাঁ, পরিবর্তনশীল নির্বাচন করার প্রয়োজন নেই। এই কারণেই গভীরভাবে পড়াশোনা কিছুটা চাপড়িত হয়ে উঠেছে।

উদাহরণস্বরূপ, যখন একটি সংশ্লেষিত নিউরাল নেটওয়ার্ক ( http://cs231n.github.io/convolutional-networks/ ) কোনও কেন্দ্রিক চিত্রটিতে একটি মানুষের মুখ থাকে তবে ভবিষ্যদ্বাণী করার চেষ্টা করলে চিত্রের কোণগুলিতে ন্যূনতম ভবিষ্যদ্বাণীপূর্ণ মান থাকে। Ditionতিহ্যবাহী মডেলিং এবং পরিবর্তনশীল নির্বাচনের মাধ্যমে মডেলার কর্নার পিক্সেলটিকে ভবিষ্যদ্বাণী হিসাবে সরান; যাইহোক, সংশ্লেষিত নিউরাল নেটওয়ার্কগুলি মূলত এই ভবিষ্যদ্বাণীকারীদের স্বয়ংক্রিয়ভাবে ফেলে দেওয়ার জন্য যথেষ্ট স্মার্ট। এটি বেশিরভাগ গভীর শেখার মডেলগুলির ক্ষেত্রে সত্য যা কোনও চিত্রের মধ্যে কোনও বস্তুর উপস্থিতির পূর্বাভাস দেওয়ার চেষ্টা করে (উদাহরণস্বরূপ, স্ব-ড্রাইভিং গাড়িগুলি "ভবিষ্যদ্বাণী করে" লেনের চিহ্নগুলি, বাধা বা অন্যান্য গাড়িতে চালিত ভিডিও স্ট্রিমের ফ্রেমে)।

ডিপ লার্নিং সম্ভবত প্রচুর traditionalতিহ্যবাহী সমস্যার জন্য অতিমাত্রায় দক্ষ যেমন যেমন ডেটাসেটগুলি ছোট বা যেখানে ডোমেন জ্ঞান প্রচুর পরিমাণে রয়েছে, তাই traditionalতিহ্যবাহী পরিবর্তনশীল নির্বাচন সম্ভবত দীর্ঘস্থায়ীভাবে কমপক্ষে কিছু ক্ষেত্রে প্রাসঙ্গিক থাকবে। যাইহোক, আপনি যখন ন্যূনতম মানুষের হস্তক্ষেপের সাথে একটি "বেশ ভাল" সমাধানটি একসাথে ফেলতে চান তখন গভীর শেখা দুর্দান্ত। চিত্রগুলিতে হস্তাক্ষর অঙ্কগুলি সনাক্ত করতে হ্যান্ডক্রাফ্ট করতে এবং ভবিষ্যদ্বাণীকারীদের নির্বাচন করতে আমার অনেক ঘন্টা সময় লেগে যেতে পারে তবে একটি সংশ্লেষিত নিউরাল নেটওয়ার্ক এবং শূন্য ভেরিয়েবল নির্বাচনের সাহায্যে গুগলের টেনসরফ্লো (মাত্র 20 মিনিটের মধ্যে আমি একটি অত্যাধুনিক মডেল পেতে পারি) https://www.tensorflow.org/versions/r0.8/tutorials/mnist/pros/index.html )।


3
আমি সত্যিই এই ডিএল দৃষ্টিকোণটি পছন্দ করি। কম্পিউটার ভিশনে, আপনার মুখোমুখি হওয়া ডেটা ম্যাট্রিকগুলি 2D চিত্র সমতল, যেখানে নির্দিষ্ট কলামটির অর্থ পর্যবেক্ষণের উপর নির্ভর করে। উদাহরণস্বরূপ, পিক্সেল 147 ইমেজ নং 27-এ একটি বিড়ালের মুখ হতে পারে, তবে এটি চিত্র নং 42-এ পটভূমির প্রাচীর So সুতরাং, বৈশিষ্ট্য নির্বাচন হিসাবে আমরা জানি এটি খারাপভাবে ব্যর্থ হবে। এজন্য কনভনেট এত শক্তিশালী কারণ এতে বিল্ড-ইন অনুবাদক / ঘূর্ণন আক্রমণ রয়েছে।
horaceT
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.