পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

1
এল 1 নিয়ন্ত্রণের সাথে রিগ্রেশন কি লাসোর মতো এবং এল 2 নিয়মিতকরণের সাথে রিজ রিগ্রেশন একই? এবং কিভাবে "লাসো" লিখবেন?
আমি একটি সফটওয়্যার ইঞ্জিনিয়ার লার্নিং মেশিন লার্নিং, বিশেষত অ্যান্ড্রু এনগের মেশিন লার্নিং কোর্সের মাধ্যমে । নিয়মিতকরণের সাথে লিনিয়ার রিগ্রেশন অধ্যয়ন করার সময় , আমি এমন পদ পেয়েছি যা বিভ্রান্তিকর: এল 1 নিয়মিতকরণ বা এল 2 নিয়ন্ত্রণের সাথে রিগ্রেশন ফাঁস-দড়ি রিজ রিগ্রেশন সুতরাং আমার প্রশ্নগুলি: এল 1 নিয়মিতকরণের সাথে রিগ্রেশন কি …

2
টিখোনভ নিয়মিতকরণ কি রিজ রিগ্রেশন-এর মতো?
টিখনোভ নিয়মিতকরণ এবং রিজ রিগ্রেশন এমন শব্দগুলি প্রায়শই ব্যবহৃত হয় যেমন তারা অভিন্ন। পার্থক্যটি কী তা নির্দিষ্ট করে বলা সম্ভব?

1
বুস্টিংয়ের জন্য আপেক্ষিক পরিবর্তনশীল গুরুত্ব
আমি গ্রেডিয়েন্ট বুস্টেড ট্রিগুলিতে তুলনামূলকভাবে পরিবর্তনশীল গুরুত্বকে কীভাবে গণনা করা হয় যা অতিরিক্ত সাধারণ / সরল নয় যেমন: প্রতিটি বিভাজনের ফলে মডেলটির বর্গক্ষেত্রের উন্নতি দ্বারা ওজন করা এবং সমস্ত গাছের গড় গড়ে এই ব্যবস্থাগুলি বিভাজনের জন্য কতবার পরিবর্তনশীল নির্বাচন করা হয় তার ভিত্তিতে করা হয় । [ এলিথ এট আল। …

3
র্যান্ডম বনগুলি কীভাবে বিদেশীদের কাছে সংবেদনশীল নয়?
আমি এই কয়েকটি সহ কয়েকটি উত্সে পড়েছি যে র্যান্ডম অরণ্যগুলি বিদেশিদের কাছে সংবেদনশীল নয় (যেমন লজিস্টিক রিগ্রেশন এবং অন্যান্য এমএল পদ্ধতিগুলি উদাহরণস্বরূপ)। যাইহোক, স্বজ্ঞাত দুটি টুকরা অন্যথায় আমাকে বলুন: যখনই কোনও সিদ্ধান্ত গাছ নির্মিত হয়, সমস্ত পয়েন্ট অবশ্যই শ্রেণিবদ্ধ করা উচিত। এর অর্থ হ'ল এমনকি বহিরাগতরাও শ্রেণিবদ্ধ হবে, এবং তাই …

4
রিজ, লাসো এবং ইলাস্টিক নেট
রিজ, লাসো এবং ইলাস্টিকনেট নিয়ন্ত্রণের পদ্ধতিগুলি কীভাবে তুলনা করতে পারে? তাদের সম্পর্কিত সুবিধা এবং অসুবিধাগুলি কী কী? যে কোনও ভাল প্রযুক্তিগত কাগজ, বা বক্তৃতা নোট পাশাপাশি প্রশংসা করা হবে।

2
লিনিয়ার রিগ্রেশন-এ আত্মবিশ্বাস ব্যান্ডগুলির আকার এবং গণনা বোঝা
আমি কোনও ওএলএস লিনিয়ার রিগ্রেশন সম্পর্কিত কার্ভড শেপযুক্ত কনফিডেন্স ব্যান্ডের উত্স এবং এটি কীভাবে রিগ্রেশন প্যারামিটারের (আচ্ছাদন এবং ইন্টারসেপ্ট) আত্মবিশ্বাসের অন্তরগুলির সাথে সম্পর্কিত তা বোঝার চেষ্টা করছি: উদাহরণস্বরূপ (আর ব্যবহার করে): require(visreg) fit <- lm(Ozone ~ Solar.R,data=airquality) visreg(fit) দেখা যাচ্ছে যে ব্যান্ডটি 2.5% ইন্টারসেপ্ট, এবং 97.5% opeালের পাশাপাশি 97.5% ইন্টারসেপ্ট …

3
লুকানো মার্কভ মডেল এবং শর্তসাপেক্ষ র্যান্ডম ক্ষেত্রগুলির মধ্যে স্বজ্ঞাত পার্থক্য
আমি বুঝতে পেরেছি যে এইচএমএস (লুকানো মার্কভ মডেল) জেনারেটরি মডেল এবং সিআরএফ বৈষম্যমূলক মডেল। আমি বুঝতে পারি কীভাবে সিআরএফ (শর্তসাপেক্ষ র্যান্ডম ক্ষেত্রগুলি) ডিজাইন এবং ব্যবহার করা হয়। যা আমি বুঝতে পারি না তারা কীভাবে এইচএমএম থেকে আলাদা? আমি পড়েছি যে এইচএমএম-এর ক্ষেত্রে আমরা কেবলমাত্র আমাদের পরবর্তী অবস্থাটি পূর্ববর্তী নোড, বর্তমান …

2
বুটস্ট্র্যাপ পদ্ধতি / প্রস্তাবিত পদ্ধতির জন্য প্রয়োজনীয় নমুনা আকার নির্ধারণ করা
আমি জানি এটি একটি বরং উত্তপ্ত বিষয় যেখানে সত্যিকার অর্থে কেউ সহজ উত্তর দিতে পারে না। তবুও আমি ভাবছি যে নিম্নলিখিত পদ্ধতিটি কার্যকর না হতে পারে। বুটস্ট্র্যাপ পদ্ধতি কেবল তখনই কার্যকর যখন আপনার নমুনা কম বেশি বা কম (সঠিকভাবে পড়ুন) মূল জনসংখ্যার মতো একই বন্টন অনুসরণ করে। নিশ্চিত হওয়ার জন্য …

5
উভয় পৃথক এবং অবিচ্ছিন্ন ভেরিয়েবল সহ একটি ডেটাসেট ক্লাস্টারিং
আমার একটি ডেটাসেট এক্স রয়েছে যার 10 টি মাত্রা রয়েছে যার মধ্যে 4 টি আলাদা মান। আসলে, এই 4 টি পৃথক ভেরিয়েবলগুলি অর্ডিনাল, অর্থাত্ একটি উচ্চতর মান উচ্চতর / আরও ভাল শব্দার্থ বোঝায়। এই পৃথক ভেরিয়েবলগুলির মধ্যে 2 এই অর্থে শ্রেণিবদ্ধ যে এই প্রতিটি পরিবর্তকের জন্য, 11 থেকে 12 পর্যন্ত …

5
তথ্য লাভ, পারস্পরিক তথ্য এবং সম্পর্কিত ব্যবস্থা
অ্যান্ড্রু মোর তথ্য প্রাপ্তির সংজ্ঞা দেয় : IG(Y|X)=H(Y)−H(Y|X)IG(Y|X)=H(Y)−H(Y|X)IG(Y|X) = H(Y) - H(Y|X) যেখানে H(Y|X)H(Y|X)H(Y|X) হচ্ছে শর্তসাপেক্ষ এনট্রপি । তবে উইকিপিডিয়া উপরের পরিমাণটিকে পারস্পরিক তথ্য বলে । অন্যদিকে উইকিপিডিয়া দুটি এলোমেলো ভেরিয়েবলের মধ্যে কুলব্যাক – লেবলার ডাইভারজেন্স (ওরফে ইনফরমেশন ডাইভারজেন বা আপেক্ষিক এনট্রপি) হিসাবে তথ্য প্রাপ্তির সংজ্ঞা দেয় : DKL(P||Q)=H(P,Q)−H(P)DKL(P||Q)=H(P,Q)−H(P)D_{KL}(P||Q) = …

7
আপনি কোনও অ-পরিসংখ্যানবিদকে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের সৌন্দর্যটি কীভাবে প্রকাশ করবেন?
আমার বাবা একজন গণিত উত্সাহী, তবে পরিসংখ্যান নিয়ে খুব একটা আগ্রহী না। পরিসংখ্যানের কিছু বিস্ময়কর বিট চিত্রিত করার চেষ্টা করা ঝরঝরে হবে এবং সিএলটি একজন প্রধান প্রার্থী। আপনি কীভাবে গাণিতিক সৌন্দর্য এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটির প্রভাব কোনও অ-পরিসংখ্যানবিদকে বোঝাতে চান?

7
বিমানে কোনও নমুনার মধ্যস্থতার জন্য কোনও গৃহীত সংজ্ঞা আছে, বা উচ্চতর অর্ডার করা স্পেস রয়েছে?
তা হলে কী? তা না হলে কেন? লাইনের একটি নমুনার জন্য, মিডিয়ান মোট নিখুঁত বিচ্যুতি হ্রাস করে। আর -2 ইত্যাদি সংজ্ঞাটি প্রসারিত করা স্বাভাবিক বলে মনে হবে তবে আমি এটি কখনও দেখিনি। তবে, আমি দীর্ঘদিন ধরে বাম মাঠে আছি out

2
শ্রেণিবদ্ধ ক্লাস্টারিংয়ের জন্য সঠিক লিঙ্কেজ পদ্ধতি নির্বাচন করা
আমি গুগল বিগকুয়েরিতে রেডডিট ডেটা ডাম্প থেকে সংগ্রহ করেছি এবং প্রক্রিয়া করেছি এমন ডেটাগুলিতে শ্রেণিবদ্ধ ক্লাস্টারিং করছি । আমার প্রক্রিয়াটি নিম্নলিখিত: / আর / রাজনীতিতে সর্বশেষ 1000 পদ পান সমস্ত মন্তব্য সংগ্রহ করুন ডেটা প্রক্রিয়া করুন এবং একটি n x mডেটা ম্যাট্রিক্স গণনা করুন (এন: ব্যবহারকারী / নমুনা, এম: পোস্ট …

2
আংশিক সর্বনিম্ন স্কোয়ার রিগ্রেশন পিছনে থিওরি
যে কেউ এসভিডি এবং পিসিএ বোঝে এমন ব্যক্তির জন্য আংশিক ন্যূনতম স্কোয়ার রিগ্রেশন (অনলাইনে উপলব্ধ) এর পিছনে তত্ত্বটির ভাল প্রদর্শনের প্রস্তাব দিতে পারে? আমি অনলাইনে অনেক উত্সের দিকে নজর রেখেছি এবং এমন কোনও কিছুই খুঁজে পাইনি যার মধ্যে কঠোরতা এবং অ্যাক্সেসযোগ্যতার সঠিক সংমিশ্রণ ছিল। আমি স্ট্যাটিস্টিকাল লার্নিংয়ের এলিমেন্টগুলিতে নজর রেখেছি …

4
তানহ কেন একটি অ্যাক্টিভেশন ফাংশন হিসাবে সিগময়েডের চেয়ে প্রায় সবসময়ই ভাল?
অ্যান্ড্রু এনগের নিউরাল নেটওয়ার্কস এবং কোর্সেরার ডিপ লার্নিং কোর্সে তিনি বলেছিলেন যে ব্যবহারের ক্ষেত্রে ব্যবহার প্রায় সবসময়ই পছন্দনীয় ।s i g m o i dtanhtanhtanhsigmoidsigmoidsigmoid তিনি যে কারণটি দিয়েছেন তা হ'ল ০.০ এর চেয়ে প্রায় 0 টি কেন্দ্র ব্যবহার করে আউটপুটগুলি এবং "পরবর্তী স্তরটির জন্য কিছুটা সহজ করে তোলে"।s i …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.