পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

5
এলডিএ বনাম word2vec
শব্দের মিলের জন্য গণ্য করার জন্য লেটেন্ট ডিরিচলেট বরাদ্দ এবং ওয়ার্ড 2vec এর মধ্যে মিল কী তা আমি বুঝতে চেষ্টা করছি । আমি যেমন বুঝতে পেরেছি, এলডিএ প্রচ্ছন্ন বিষয়গুলির সম্ভাবনার একটি ভেক্টরকে শব্দের মানচিত্র দেয়, যখন ওয়ার্ড 2vec এগুলি প্রকৃত সংখ্যার ভেক্টরের কাছে মানচিত্র করে (পয়েন্টওয়াইস পারস্পরিক তথ্যের একক মান …

4
আর-তে স্টাতার "মজবুত" বিকল্পটি প্রতিলিপি করা হচ্ছে
আমি robustআর-তে স্টাটা বিকল্পের ফলাফলগুলি প্রতিলিপি দেওয়ার চেষ্টা করছি I আমি rlmকমান্ডটি MASS প্যাকেজ গঠন করেছি এবং lmrobপ্যাকেজ "রোবস্টবেস" থেকে কমান্ডটি ব্যবহার করেছি। উভয় ক্ষেত্রেই ফলাফল স্টাতার "মজবুত" বিকল্পের থেকে একেবারেই আলাদা। এই প্রসঙ্গে কেউ দয়া করে কিছু প্রস্তাব দিতে পারেন? স্টাটাতে শক্তিশালী বিকল্পটি চালানোর সময় আমি প্রাপ্ত ফলাফলগুলি এখানে: …

3
ক্রস-বৈধতা ব্যবহার করার সময় এক মান ত্রুটির নিয়মের জন্য অভিজ্ঞতাগত ন্যায়সঙ্গততা
পার্সিমোনির পক্ষে একক স্ট্যান্ডার্ড ত্রুটি বিধি ব্যবহারকে ন্যায্যতা প্রমাণ করার জন্য কি কোন অভিজ্ঞতামূলক গবেষণা রয়েছে? স্পষ্টতই এটি ডেটা ডেটা-প্রজন্মের প্রক্রিয়ার উপর নির্ভর করে, তবে যে কোনও কিছু যা ডেটাসেটের একটি বৃহত কর্পাস বিশ্লেষণ করে তা খুব আকর্ষণীয় পঠনযোগ্য হবে। "এক স্ট্যান্ডার্ড ত্রুটি বিধি" প্রয়োগ করা হয় যখন ক্রস-বৈধকরণের মাধ্যমে …

3
লজিস্টিক রিগ্রেশন ফিটিং করার আগে মানিককরণ প্রয়োজন?
আমার প্রশ্ন হ'ল লজিস্টিক রিগ্রেশন ফিটিংয়ের আগে [0,1] এর মধ্যে সমস্ত ভেরিয়েবলের একই স্কেল রয়েছে কিনা তা নিশ্চিত করার জন্য আমাদের কী ডেটা সেট মানক করা দরকার? সূত্রটি হ'ল: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} আমার ডেটা সেটে 2 টি ভেরিয়েবল রয়েছে, তারা দুটি চ্যানেলের জন্য একই জিনিস বর্ণনা করে তবে ভলিউমটি আলাদা। বলুন এটি …

1
আর তে র‌্যাঙ্ক - অবতরণী ক্রম [বন্ধ]
আমি ডেটা র‍্যাঙ্ক করতে যাচ্ছি যে, কিছু ক্ষেত্রে, বৃহত্তর মানটি 1 র‌্যাঙ্ক ধারণ করে I আমি আর তুলনামূলকভাবে নতুন, তবে আমি কীভাবে র‌্যাঙ্ক ফাংশনে এই সেটিংটি সামঞ্জস্য করতে পারি তা দেখছি না। x <- c(23,45,12,67,34,89) rank(x) উত্পন্ন: [1] 2 4 1 5 3 6 যখন আমি এটি হতে চাই: [1] …
39 r 

5
এআইসিসির জন্য নেতিবাচক মান (সঠিক আকাইকে তথ্য মানদণ্ড)
আমি দুটি সাধারণ রৈখিক মিশ্র মডেলের তুলনা করতে এআইসি এবং এআইসিসি গণনা করেছি; মডেল 1 এর মডেল 1 এর তুলনায় এআইসিগুলি ইতিবাচক model নেতিবাচক AICc মানগুলি ব্যবহার এবং তুলনা করা কি বৈধ?

1
কীভাবে ডেটা কেন্দ্রীকরণ রিগ্রেশন এবং পিসিএর বিরতি থেকে মুক্তি পাবে?
ইন্টারসেপটি ( এই প্রশ্নে উল্লিখিত হিসাবে) মুছে ফেলার জন্য আমি উদাহরণগুলি যেখানে আমরা তথ্যকে কেন্দ্র করি (যেমন, নিয়মিতকরণ বা পিসিএ সহ) পাঠ করি । আমি জানি এটি সহজ, তবে স্বজ্ঞাতভাবে এটি বুঝতে আমার খুব কঠিন সময় কাটাচ্ছে। কেউ পড়তে পারলে অন্তর্দৃষ্টি বা রেফারেন্স সরবরাহ করতে পারে?

5
একটি জনসংখ্যা এবং একটি নমুনার মধ্যে পার্থক্য কী?
একটি জনসংখ্যা এবং একটি নমুনার মধ্যে পার্থক্য কী? প্রত্যেকের জন্য কি সাধারণ পরিবর্তনশীল এবং পরিসংখ্যান ব্যবহৃত হয় এবং সেগুলি কীভাবে একে অপরের সাথে সম্পর্কিত?

6
আমি কেন 100% নির্ভুলতার সিদ্ধান্ত গাছ পাব?
আমি আমার সিদ্ধান্ত গাছের জন্য 100% নির্ভুলতা পাচ্ছি। আমি কি ভুল করছি? এটি আমার কোড: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test = …

3
কেন সিদ্ধান্ত গাছ গণনা ব্যয়বহুল হয় না?
ইন আর মধ্যে অ্যাপ্লিকেশন সঙ্গে পরিসংখ্যানগত শেখার ভূমিকা , লেখক লিখুন ঝুলানো একটি সিদ্ধান্ত গাছ খুব দ্রুত, কিন্তু এই আমাকে অর্থে দেখা যায় না। অনুকূল বিভাজন সন্ধানের জন্য অ্যালগরিদমকে প্রতিটি বৈশিষ্ট্যের মধ্য দিয়ে যেতে এবং এটিকে যথাসম্ভব বিভাজন করতে হবে। পর্যবেক্ষণ সহ সংখ্যাযুক্ত বৈশিষ্ট্যগুলির জন্য, প্রতিটি বৈশিষ্ট্যের জন্য পার্টিশনগুলির ফলাফল …
38 cart 

2
পক্ষপাতদুষ্ট অনুমানকারী কখন নিরপেক্ষ ব্যক্তির চেয়ে পছন্দনীয়?
কেন এটি নিরপেক্ষ অনুমানকারীকে বেশি পছন্দ করা যায় তা বহুবার স্পষ্ট। তবে, এমন কোনও পরিস্থিতি রয়েছে যার অধীনে আমরা বাস্তবে কোনও পক্ষপাতহীন ব্যক্তির চেয়ে পক্ষপাতদুষ্ট অনুমানকারীকে পছন্দ করতে পারি?

4
আর এর সাথে চক্রান্ত করার জন্য, আমি কি জিজিপ্লট 2 বা জিজিভিস শিখতে পারি?
আর এর সাথে চক্রান্ত করার জন্য, আমি কি জিজিপ্লট 2 বা জিজিভিস শিখতে পারি? তাদের মধ্যে যে কোনও বিষয়ে উচ্চতর হলে আমি উভয়ই শিখতে চাই না। কেন সম্প্রদায় ওভারল্যাপিং কার্যকারিতা সহ নতুন প্যাকেজ তৈরি করে রাখে? ভূমিকা ব্লগ পোস্ট একটি শব্দ কেন ggvis দেওয়া তৈরি করা হয় যে একটি অত্যাধুনিক …

3
বহুতোষ রেগ্রেশনকে একাধিক লিনিয়ার রিগ্রেশনের একটি বিশেষ কেস হিসাবে বিবেচনা করা হয়?
যদি বহুবর্ষীয় রিগ্রেশন মডেলগুলি ননলাইনার সম্পর্কের মডেল করে, তবে কীভাবে এটি একাধিক লিনিয়ার রিগ্রেশনের একটি বিশেষ ক্ষেত্রে হিসাবে বিবেচনা করা যেতে পারে? উইকিপিডিয়ায় উল্লেখ করা হয়েছে যে "যদিও বহুবর্ষীয় রিগ্রেশন তথ্যের সাথে একটি অ-লাইন মডেল ফিট করে তবে একটি পরিসংখ্যানগত অনুমানের সমস্যা হিসাবে এটি লিনিয়ার, এই অর্থে যে রিগ্রেশন ফাংশন …

3
বুটস্ট্র্যাপযুক্ত রেসপন্স থেকে নেওয়া আত্মবিশ্বাস ব্যবধানের অর্থ কী?
আমি এই সাইটে বুটস্ট্র্যাপিং এবং আত্মবিশ্বাসের ব্যবধানগুলি সম্পর্কে অসংখ্য প্রশ্ন দেখছি, তবে আমি এখনও বিভ্রান্ত। আমার বিভ্রান্তির কারণ সম্ভবতঃ আমি আমার পরিসংখ্যান জ্ঞানে যথেষ্ট উত্তর বোধ করি না। আমি একটি পরিসংখ্যান সংক্রান্ত পরিসংখ্যান কোর্সের প্রায় অর্ধেক পথ এবং আমার গণিত স্তরটি কেবল দ্বিতীয় মধ্য-বীজগণিত সম্পর্কে, সুতরাং সেই স্তরের অতীতের যে …

2
শর্তসাপেক্ষ এবং শর্তহীন কোয়ান্টাইল রিগ্রেশন মধ্যে পার্থক্য কি?
কোয়ানকার এবং বাসেট (১৯ 197৮) দ্বারা শর্তসাপেক্ষ কোয়ান্টাইল রিগ্রেশন অনুমানকারীকে কোয়ান্টাইল হিসাবে হিসাবে সংজ্ঞায়িত করা হয়েছে যেখানে \ rho_ \ তাউ = ইউ_আই \ সিডট (\ তাউ - 1 (u_i <0)) একটি পুনরায় ওজন ফাংশন (যাকে "চেক" বলা হয় - ফাংশন) অবশিষ্টাংশের u_i ।τt hτth\tau^{th} ρτ=Uআমি⋅(τ-1(Uআমি<0))তোমার দর্শন লগ করাআমিβˆপ্রশ্ন আর= …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.