পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

1
রিগ্রেশন: পরিবর্তনশীল রূপান্তর
ভেরিয়েবলগুলি রূপান্তর করার সময়, আপনাকে কি একই রূপান্তরগুলির সবগুলি ব্যবহার করতে হবে? উদাহরণস্বরূপ, আমি কি আলাদা আলাদা রূপান্তরিত ভেরিয়েবলগুলি বাছাই বা বেছে নিতে পারি, যেমন: , বয়সের বয়স, কর্মসংস্থানের দৈর্ঘ্য, আবাসের দৈর্ঘ্য এবং আয় হতে দিন।x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) বা, আপনার অবশ্যই আপনার রূপান্তরগুলির সাথে সামঞ্জস্য …

4
একটি বৃহত যথেষ্ট নমুনা আকার হিসাবে 30 ব্যবহার করে সমর্থন করার জন্য কোন উল্লেখগুলি উদ্ধৃত করা উচিত?
আমি অনেকবার পড়ে / শুনেছি যে কমপক্ষে 30 ইউনিটের নমুনার আকারটিকে "বৃহত নমুনা" হিসাবে বিবেচনা করা হয় (সাধারণত স্বাভাবিকতার অনুমানগুলি সিএলটি-র কারণে সাধারণত প্রায় ধরে থাকে, ...)। সুতরাং, আমার পরীক্ষায় আমি সাধারণত 30 টি ইউনিটের নমুনা উত্পন্ন করি। আপনি কি দয়া করে আমাকে কিছু রেফারেন্স দিতে পারেন যা নমুনা আকার …

3
দুটি বিতরণযোগ্য এলোমেলো ভেরিয়েবলের মধ্যে ইউক্যালিডিয়ান দূরত্বের বিতরণ কী?
মনে করুন আপনি দুটি বস্তুর হয়েছে যার সঠিক অবস্থানে অজানা দেওয়া হয়, কিন্তু পরিচিত পরামিতি সঙ্গে স্বাভাবিক ডিস্ট্রিবিউশন (যেমন অনুযায়ী বিতরণ করা হয় a ∼ N( এম , এস )a∼N(m,s)a \sim N(m, s) এবং খ ∼ এন( ভি , টি ) )b∼N(v,t))b \sim N(v, t)) । আমরা অনুমান করতে পারেন …

8
যদি দেওয়া নমুনাগুলি কোনও পোইসন বিতরণ থেকে নেওয়া হয় তবে আমি কীভাবে পরীক্ষা করতে পারি?
আমি স্বাভাবিকতা পরীক্ষা জানি, কিন্তু আমি কীভাবে "পোয়েসন-নেস" পরীক্ষা করব? আমার কাছে ~ 1000 অ-নেতিবাচক পূর্ণসংখ্যার নমুনা রয়েছে, যা আমি সন্দেহ করি যে এটি পোইসন বিতরণ থেকে নেওয়া হয়েছে এবং আমি এটি পরীক্ষা করতে চাই।

13
মধ্যযুগ কেন গড় বয়সের চেয়ে ভাল পরিসংখ্যান?
ওল্ফ্রাম আলফার দিকে নজর দিলে অথবা এই উইকিপিডিয়া পৃষ্ঠাটি মধ্যযুগ অনুসারে দেশগুলির তালিকা স্পষ্টতই মধ্যযুগীয় বয়সগুলির ক্ষেত্রে এটি পছন্দের পরিসংখ্যান বলে মনে হয়। আমি গাণিতিক মানে কেন আরও খারাপ পরিসংখ্যান হবে তা আমি নিজেকে ব্যাখ্যা করতে পারছি না । এটা এমন কেন? মূলত এখানে পোস্ট করা হয়েছে কারণ আমি জানতাম …
41 mean  median 

4
শূন্য সম্পর্ক কীভাবে অগত্যা স্বাধীনতা বোঝায় না
দুটি ভেরিয়েবলের যদি 0 পারস্পরিক সম্পর্ক থাকে তবে তারা কেন অগত্যা স্বাধীন হয় না? শূন্যের সম্পর্কযুক্ত পরিবর্তনগুলি কি বিশেষ পরিস্থিতিতে স্বাধীন? যদি সম্ভব হয় তবে আমি একটি স্বজ্ঞাত বিবরণ খুঁজছি, একটি উচ্চ প্রযুক্তিগত নয়।

1
ত্রুটির ব্যবস্থা কীভাবে ব্যাখ্যা করবেন?
আমি একটি নির্দিষ্ট ডেটাসেটের জন্য ওয়েকার মধ্যে শ্রেণিবদ্ধ করছি I've তবে, এখন আমি এটি একটি সংখ্যাসূচক বৈশিষ্ট্যের জন্য চালাচ্ছি এবং আউটপুটটি হ'ল: Correlation coefficient 0.3305 Mean absolute error 11.6268 Root mean squared error 46.8547 Relative absolute error 89.2645 % Root relative squared error 94.3886 % Total Number of Instances 36441 …

5
ব্যবহারিক হাইপারপ্যারামিটার অপ্টিমাইজেশন: এলোমেলো বনাম গ্রিড অনুসন্ধান
আমি বর্তমানে হাইপার-প্যারামিটার অপ্টিমাইজেশনের জন্য বেনজিও এবং বার্গস্তার র্যান্ডম অনুসন্ধানের মধ্য দিয়ে যাচ্ছি [1] যেখানে লেখকরা দাবি করেন যে প্রায় সমান পারফরম্যান্স অর্জনে গ্রিড অনুসন্ধানের চেয়ে র্যান্ডম অনুসন্ধান আরও দক্ষ efficient আমার প্রশ্ন: এখানকার লোকেরা কি এই দাবির সাথে একমত? আমার কাজটিতে আমি গ্রিড অনুসন্ধানটি বেশিরভাগ ক্ষেত্রে সহজেই এলোমেলো অনুসন্ধান …

3
একটি সাধারণ এবং গাউসীয় বিতরণের মধ্যে পার্থক্য কী
কোনও নরমাল এবং গাউসীয় বিতরণের মধ্যে কি গভীর পার্থক্য রয়েছে, আমি অনেকগুলি কাগজপত্র এগুলিকে বিনা পার্থক্যে ব্যবহার করে দেখেছি এবং আমি সাধারণত তাদের একই জিনিস হিসাবে উল্লেখ করি। যাইহোক, আমার পিআই আমাকে সম্প্রতি বলেছিল যে একটি স্বাভাবিক মানে গড় = 0 এবং স্টাডি = 1 সহ গাউসের নির্দিষ্ট ক্ষেত্রে, যা …

3
কীভাবে আমি ক্যালকুলেট
ধরুন এবং স্ট্যান্ডার্ড সাধারণ বিতরণের ঘনত্ব ফাংশন এবং বিতরণ ফাংশন।ϕ(⋅)ϕ(⋅)\phi(\cdot)Φ(⋅)Φ(⋅)\Phi(\cdot) কীভাবে একজন অবিচ্ছেদ্য গণনা করতে পারে: ∫∞−∞Φ(w−ab)ϕ(w)dw∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

9
কীভাবে এফ-পরিমাপের মূল্যবোধ ব্যাখ্যা করবেন?
আমি জানতে চাই কীভাবে চ-পরিমাপের মানগুলির একটি পার্থক্য ব্যাখ্যা করতে হয়। আমি জানি যে চ-পরিমাপটি নির্ভুলতা এবং পুনর্বিবেচনার মধ্যে একটি ভারসাম্যপূর্ণ গড়, তবে আমি এফ-ব্যবস্থাগুলির পার্থক্যের ব্যবহারিক অর্থ সম্পর্কে জিজ্ঞাসা করছি। উদাহরণস্বরূপ, যদি শ্রেণিবদ্ধ সি 1 এর 0,4 এবং অন্য শ্রেণিবদ্ধ সি 2 এর যথার্থতা 0.8 থাকে তবে আমরা বলতে …

5
রিপ্রেশনে কোভারিয়েট যুক্ত করার চেয়ে প্রপেনসিটি স্কোর কীভাবে আলাদা এবং সেগুলি কখন পরবর্তীগুলির চেয়ে বেশি পছন্দ করা হয়?
আমি স্বীকার করি আমি প্রবণতা স্কোর এবং কার্য বিশ্লেষণে তুলনামূলকভাবে নতুন। একটি নতুন বিষয় যা আমার কাছে স্পষ্ট নয় তা হ'ল প্রপেনসিটি স্কোর ব্যবহার করে "ভারসাম্য" কীভাবে গাণিতিকভাবে আলাদা হয় যখন আমরা কোনও রিগ্রেশনে কোভেরিয়ট যুক্ত করি তখন কী ঘটে? অপারেশন সম্পর্কে আলাদা কী, এবং কেন এটি (বা এটি) কোনও …

1
সফটম্যাক্স_ক্রস_এন্ট্রপী_উইথ_লগিটগুলি সফটম্যাক্স_ক্রস_এন্ট্রপী_বিহীন_লগিট_ভি 2 থেকে কীভাবে আলাদা?
বিশেষত, আমি মনে করি আমি এই বিবৃতিটি সম্পর্কে অবাক হই: টেনসরফ্লো এর ভবিষ্যতের বড় সংস্করণগুলি ডিফল্টরূপে ব্যাকপ্রপতে লেবেলগুলির ইনপুটগুলিতে গ্রেডিয়েন্টগুলি প্রবাহিত করতে দেবে। আমি ব্যবহার করার সময় যা প্রদর্শিত হয় tf.nn.softmax_cross_entropy_with_logits। একই বার্তায় এটি আমাকে একবার দেখার জন্য অনুরোধ করে tf.nn.softmax_cross_entropy_with_logits_v2। আমি ডকুমেন্টেশনটি দেখেছি তবে এটি কেবলমাত্র এতে বলেছে tf.nn.softmax_cross_entropy_with_logits_v2: …

6
র্যান্ডম ফরেস্ট - কীভাবে ওভারফিটিং পরিচালনা করবেন
আমার একটি কম্পিউটার বিজ্ঞানের পটভূমি রয়েছে তবে ইন্টারনেটে সমস্যা সমাধানের মাধ্যমে নিজেকে ডেটা বিজ্ঞান শেখানোর চেষ্টা করছি। আমি গত কয়েক সপ্তাহ ধরে প্রায় এই সমস্যাটি নিয়ে কাজ করছি (প্রায় 900 টি সারি এবং 10 টি বৈশিষ্ট্য)। আমি প্রথমে লজিস্টিক রিগ্রেশন ব্যবহার করছিলাম তবে এখন আমি এলোমেলো বনগুলিতে স্যুইচ করেছি। আমি …

3
পরিসংখ্যানগত স্বাধীনতা মানে কি কার্যকারণের অভাব?
দুটি এলোমেলো ভেরিয়েবল এ এবং বি পরিসংখ্যানগতভাবে স্বতন্ত্র। এর অর্থ প্রক্রিয়াটির ডাগে : এবং অবশ্যই পি ( এ | বি ) = পি ( এ ) । তবে এর অর্থ কি এই যে বি বি থেকে শুরু করে সামনে কোনও দরজা নেই?( একটি ⊥⊥ খ)(A⊥⊥B)(A {\perp\!\!\!\perp} B)পি( এ | বি …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.