পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
পিসিএর লিনিয়ারিটি
পিসিএ একটি লিনিয়ার পদ্ধতি হিসাবে বিবেচিত হয়, তবে: পি সি এ (এক্স) ≠ পি সি এ ( এক্স)1) + পি সি এ ( এক্স)2) + + ... + + পি সি একটি ( এক্সএন) ,PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), যেখানে । এই বলতে চাই যে eigenvectors ডেটার উপর PCAs দ্বারা প্রাপ্ত ম্যাট্রিক্স হয় …
35 pca  linear 

5
বায়সিয়ানদের মতো ভাবুন, ঘন ঘন মতবাদীর মতো চেক করুন: এর অর্থ কী?
আমি একটি ডেটা সায়েন্স কোর্সে কিছু বক্তৃতা স্লাইডগুলি দেখছি যা এখানে পাওয়া যাবে: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf দুর্ভাগ্যক্রমে, আমি এই বক্তৃতার জন্য ভিডিওটি দেখতে পাচ্ছি না এবং স্লাইডের এক পর্যায়ে উপস্থাপকের কাছে নিম্নলিখিত পাঠ্য রয়েছে: কিছু মূল নীতি বায়েশিয়ানদের মতো চিন্তা করুন, ফ্রিকোয়েন্সিস্টের মতো চেক করুন (পুনর্মিলন) কেউ কি জানে আসলে এর অর্থ …

2
লিনিয়ার রিগ্রেশন-এর গ্রেডিয়েন্ট বুস্টিং - কেন এটি কাজ করে না?
গ্রেডিয়েন্ট বুস্টিং সম্পর্কে শিখার সময়, আমি কোনও "দুর্বল শ্রেণিবদ্ধ" এর বৈশিষ্ট্য সম্পর্কিত কোনও প্রতিবন্ধকতা সম্পর্কে শুনিনি যা পদ্ধতিটি মডেল তৈরি ও ensemble করতে ব্যবহার করে। যাইহোক, আমি এমন একটি জিবি অ্যাপ্লিকেশনটি কল্পনা করতে পারি না যা লিনিয়ার রিগ্রেশন ব্যবহার করে, এবং বাস্তবে যখন আমি কিছু পরীক্ষা করেছি - এটি কার্যকর …

3
একটি ক্লাস্টারিং পদ্ধতি কীভাবে নির্বাচন করবেন? একটি ক্লাস্টার সমাধানকে কীভাবে বৈধতা দেওয়া যায় (পদ্ধতির পছন্দটি ওয়ারেন্ট করার জন্য)?
ক্লাস্টার বিশ্লেষণের সবচেয়ে বড় সমস্যাটি হ'ল আমরা যখন বিভিন্ন ক্লাস্টারিং পদ্ধতির ভিত্তিতে (শ্রেণিবদ্ধ ক্লাস্টারিংয়ের বিভিন্ন লিঙ্কেজ পদ্ধতি সহ) ব্যবহার করি তখন বিভিন্ন উপসংহার পেতে পারি । আমি এ সম্পর্কে আপনার মতামত জানতে চাই - আপনি কোন পদ্ধতিটি নির্বাচন করবেন এবং কীভাবে। কেউ বলতে পারে "ক্লাস্টারিংয়ের সেরা পদ্ধতিটি যা আপনাকে সঠিক …

7
নাল অনুমান কেন প্রায়শই প্রত্যাখ্যান করার চেষ্টা করা হয়?
আমি আশা করি শিরোনামটি দিয়ে আমি অর্থবোধ করব। প্রায়শই নাল অনুমানটি এটিকে প্রত্যাখ্যান করার অভিপ্রায় নিয়ে গঠিত হয়। এর কোনও কারণ আছে, নাকি এটি কেবল একটি সম্মেলন?

4
কীভাবে এলএসটিএম বিলুপ্ত গ্রেডিয়েন্ট সমস্যা রোধ করে?
এলএসটিএম উদ্ভাবিত গ্রেডিয়েন্ট সমস্যা এড়াতে বিশেষত উদ্ভাবিত হয়েছিল। এটি কনস্ট্যান্ট ত্রুটি ক্যারোসেল (সিইসি) দিয়ে করার কথা রয়েছে, যা নীচের চিত্রটিতে ( গ্রিফ এট আল। থেকে ) ঘরের চারপাশের লুপের সাথে মিল রয়েছে । (সূত্র: ডিপলাইনিং ৪ জ.আর.আর ) এবং আমি বুঝতে পারি যে অংশটি একটি পরিচয় ফাংশনের ধরণের হিসাবে দেখা …

2
ইলাস্টিক নেট নিয়মিতকরণ কী কী এবং এটি কীভাবে রিজ (
ইলাস্টিক নেট নিয়মিতকরণ কি সবসময়ই লাসো এবং রিজকে প্রাধান্য দেয় যেহেতু এই পদ্ধতির ত্রুটিগুলি সমাধান করার জন্য মনে হয়? অন্তর্দৃষ্টি কী এবং ইলাস্টিক জালের পিছনে গণিতটি কী?

11
(0, 255) কেন 8 টি এলোমেলো বিট ইউনিফর্ম তৈরি হচ্ছে?
আমি 8 টি এলোমেলো বিট তৈরি করছি (হয় একটি 0 বা 1) অথবা এগুলি একসাথে 8-বিট সংখ্যা তৈরি করতে। একটি সাধারণ পাইথন সিমুলেশন পৃথক পৃথক বিতরণ দেয় [0, 255] yield এটি কেন আমার মাথায় বোধগম্য তা বিচার করার চেষ্টা করছি। যদি আমি এটি 8 টি কয়েনকে উল্টানোর সাথে তুলনা করি, …

6
সমস্ত সিমুলেশন পদ্ধতি কি মন্টি কার্লোর কিছু রূপ?
মন্টি কার্লো নয় এমন সিমুলেশন পদ্ধতি আছে কি? সমস্ত সিমুলেশন পদ্ধতি ফাংশনটির জন্য মূল্যগুলির একটি সীমার সন্ধান করতে ফাংশনে এলোমেলো সংখ্যার পরিবর্তনের সাথে জড়িত। সুতরাং মন্টি কার্লো পদ্ধতিতে কী সমস্ত সিমুলেশন পদ্ধতি রয়েছে?

6
স্বল্প সময়ের সিরিজের জন্য সেরা পদ্ধতি
শর্ট টাইম-সিরিজ মডেলিং সম্পর্কিত আমার একটি প্রশ্ন রয়েছে। এগুলি মডেল করবেন কিনা তা নয় , তবে কীভাবে। মডেলিংয়ের (খুব) স্বল্প সময়ের সিরিজ (দৈর্ঘ্য বলুন) জন্য আপনি কোন পদ্ধতির প্রস্তাব করবেন ? "সেরা" দ্বারা আমি এখানে সবচেয়ে শক্তিশালী বলতে চাইছি, এটি সীমিত সংখ্যক পর্যবেক্ষণের কারণে ত্রুটিগুলির মধ্যে সবচেয়ে কম প্রবণ। সংক্ষিপ্ত …

4
কীভাবে কোনও বিতরণের সীমাহীন গড় এবং বৈচিত্র থাকতে পারে?
নিম্নলিখিত উদাহরণগুলি দেওয়া যেতে পারলে এটি প্রশংসা হবে: অসীম গড় এবং অসীম বৈকল্পিক সহ একটি বিতরণ। অসীম গড় এবং সসীম বৈকল্পিক সহ একটি বিতরণ। সীমাবদ্ধ গড় এবং অসীম বৈকল্পিক সহ একটি বিতরণ। সীমাবদ্ধ গড় এবং সসীম বৈকল্পিক সহ একটি বিতরণ। উইলমট ফোরাম / ওয়েবসাইটে আমি যে নিবন্ধটি পড়ছি, গুগল করছি …

5
স্বতঃসংশ্লিষ্টতার জন্য পরীক্ষা: লুং-বক্স বনাম ব্রুশ-গডফ্রে
কাঁচা ডেটাতে বা মডেলের অবশিষ্টাংশগুলিতে স্বতঃসংশোধনের পরীক্ষার জন্য লজং-বক্স পরীক্ষাটি প্রায়শই ব্যবহার করা দেখতে আমার অভ্যস্ত। আমি প্রায় ভুলে গিয়েছিলাম যে অটোক্রেরিলেন্সের জন্য আরেকটি পরীক্ষা রয়েছে, যথা, ব্রুশ-গডফ্রে পরীক্ষা। প্রশ্ন: লাজং-বক্স এবং ব্রুশ-গডফ্রে পরীক্ষার মূল পার্থক্য এবং সাদৃশ্যগুলি কখন এবং অন্যটির তুলনায় কখন একটিকে পছন্দ করা উচিত? (তথ্যসূত্রগুলি স্বাগত। আমি …

3
পিসিএ এবং ট্রেন / পরীক্ষা বিভক্ত
আমার কাছে একটি ডেটাসেট রয়েছে যার জন্য আমার কাছে বাইনারি লেবেলের একাধিক সেট রয়েছে। প্রতিটি সেট লেবেলের জন্য, আমি একটি শ্রেণিবদ্ধ প্রশিক্ষণ দিচ্ছি, এটি ক্রস-বৈধকরণের মাধ্যমে মূল্যায়ন করে। আমি মূল উপাদান বিশ্লেষণ (পিসিএ) ব্যবহার করে মাত্রিকতা হ্রাস করতে চাই। আমার প্রশ্নটি হ'ল: পুরো ডেটাসেটের জন্য একবার পিসিএ করা এবং তারপরে …

2
একাধিক রিগ্রেশন বা আংশিক সম্পর্কের সহগ? এবং দুজনের মধ্যে সম্পর্ক
আমি জানি না এই প্রশ্নটি বোঝা যায় কিনা, তবে একাধিক রিগ্রেশন এবং আংশিক পারস্পরিক সম্পর্কের মধ্যে পার্থক্য কী (পারস্পরিক সম্পর্ক এবং প্রতিরোধের মধ্যে সুস্পষ্ট পার্থক্য বাদে, যা আমি লক্ষ্য করছি তা নয়)? আমি নিম্নলিখিতটি বের করতে চাই: আমার দুটি স্বতন্ত্র ভেরিয়েবল ( , ) এবং একটি নির্ভরশীল ভেরিয়েবল ( ) …

5
সিম্পসনের প্যারাডক্স কীভাবে সমাধান করবেন?
সিম্পসনের প্যারাডক্স বিশ্বব্যাপী প্রারম্ভিক পরিসংখ্যান কোর্সে আলোচিত একটি ক্লাসিক ধাঁধা। যাইহোক, আমার কোর্সটি ছিল যে কেবল কোনও সমস্যা বিদ্যমান ছিল এবং কোনও সমাধান দেয়নি তা লক্ষ করার জন্য বিষয়বস্তু ছিল। আমি কীভাবে প্যারাডক্সটি সমাধান করবেন তা জানতে চাই। এটি হ'ল, যখন সিম্পসনের প্যারাডক্সের সাথে মুখোমুখি হন, যেখানে ডেটা বিভক্ত হয় …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.