পরিসংখ্যান এবং বড় তথ্য

3

স্তরিত ক্রস-বৈধকরণ এবং ক্রস-বৈধকরণের মধ্যে পার্থক্য কী ? উইকিপিডিয়া বলেছেন: ইন স্তরীভূত K-ধা ক্রস বৈধতা , ভাঁজ নির্বাচন করা হয়, যাতে গড় প্রতিক্রিয়া মান সব ভাঁজ প্রায় সমান। দ্বিগুণ শ্রেণিবিন্যাসের ক্ষেত্রে, এর অর্থ হ'ল প্রতিটি ভাগে দুটি ধরণের শ্রেণির লেবেলের প্রায় একই অনুপাত থাকে। তবে আমি এখনও বিভ্রান্ত। mean response …

54 cross-validation stratification

3

বাক্স-কক্স স্বাধীন ভেরিয়েবলের রূপান্তরের মতো?

স্বাধীন ভেরিয়েবলগুলির জন্য রূপান্তর করার মতো কোনও বাক্স-কক্স রয়েছে? এটি, এমন একটি রূপান্তর যা পরিবর্তনশীলকে অনুকূল করে তোলে যাতে লিনিয়ার মডেলটির জন্য আরও যুক্তিসঙ্গত ফিট করতে পারে?xxxy~f(x) যদি তাই হয় তবে এটির সাথে কোন অনুষ্ঠান করার আছে R?

53 r regression data-transformation normality-assumption

3

আর এ প্যাকেজ হিসাবে ডেটা এপিআই / ফিডগুলি উপলব্ধ

সম্পাদনা: ওয়েব টেকনোলজিস এবং পরিষেবাদি ক্র্যান টাস্ক ভিউতে আর-এ উপলব্ধ ডেটা সোর্স এবং এপিআই-র অনেক বেশি বিস্তৃত তালিকা রয়েছে you আপনি যদি টাস্ক ভিউতে কোনও প্যাকেজ যুক্ত করতে চান তবে আপনি গিথুবে একটি পুল অনুরোধ জমা দিতে পারেন। আমি বিভিন্ন ডেটা ফিডের একটি তালিকা তৈরি করছি যা ইতিমধ্যে আর এর …

53 r references dataset

4

পারস্পরিক সম্পর্কযুক্ত এলোমেলো সংখ্যা (প্রদত্ত উপায়, রূপ এবং পারস্পরিক সম্পর্কের ডিগ্রি) কীভাবে উত্পন্ন করা যায়?

এটিকে যদি কিছুটা প্রাথমিক মনে হয় তবে আমি দুঃখিত, তবে আমি অনুমান করি যে আমি এখানে বোঝার বিষয়টি নিশ্চিত করতে চাই। আমি বুঝতে পারি যে আমাকে এই দুটি পদক্ষেপে করতে হবে এবং আমি পারস্পরিক সম্পর্কের ম্যাট্রিকগুলি ছড়িয়ে দেওয়ার চেষ্টা শুরু করেছি, তবে এটি কেবল জড়িত বলে মনে হচ্ছে। পারস্পরিক সম্পর্কযুক্ত …

53 probability correlation conditional-probability random-generation

10

পাইথন ব্যবহার করে মেশিন লার্নিং

আমি আমার মেশিন লার্নিং পরীক্ষাগুলি করার জন্য পাইথন গ্রন্থাগারগুলি ব্যবহার করার বিষয়ে বিবেচনা করছি। এখনও অবধি আমি WEKA এর উপর নির্ভর করছিলাম তবে পুরোপুরি বেশ অসন্তুষ্ট ছিলাম। এটি মূলত কারণ হ'ল আমি WEKA তেমন সমর্থিত নয় বলে প্রমাণ পেয়েছি (খুব কম উদাহরণ, ডকুমেন্টেশন অপ্রয়োজনীয় এবং সম্প্রদায়ের সমর্থন আমার অভিজ্ঞতায় কাঙ্ক্ষিতের …

53 machine-learning python

6

দক্ষ অনলাইন লিনিয়ার রিগ্রেশন

আমি এমন কিছু ডেটা বিশ্লেষণ করছি যেখানে আমি সাধারণ লিনিয়ার রিগ্রেশন করতে চাই, তবে এটি সম্ভব নয় কারণ আমি ইনপুট ডেটার ধারাবাহিক স্ট্রিমের সাথে অন-লাইন সেটিংয়ের সাথে কাজ করছি (যা দ্রুত স্মৃতিতে খুব বেশি বড় হবে) এবং প্রয়োজন যখন এটি গ্রাস করা হচ্ছে তখন প্যারামিটারের অনুমানগুলি আপডেট করতে। অর্থাৎ আমি …

53 time-series regression algorithms real-time

5

প্রাক-পোস্ট চিকিত্সা-নিয়ন্ত্রণ ডিজাইন বিশ্লেষণ করার সময় সেরা অনুশীলন

নিম্নলিখিত সাধারণ নকশা কল্পনা করুন: 100 জন অংশগ্রহণকারীকে এলোমেলোভাবে চিকিত্সা বা নিয়ন্ত্রণ গ্রুপের জন্য বরাদ্দ দেওয়া হয় নির্ভরশীল পরিবর্তনশীলটি সংখ্যাসূচক এবং পরিমাপকৃত প্রাক এবং চিকিত্সা পরে এই জাতীয় ডেটা বিশ্লেষণের জন্য তিনটি সুস্পষ্ট বিকল্প হ'ল: মিশ্র অ্যানোভাতে সময় পারস্পরিক মিথস্ক্রিয়া প্রভাব দ্বারা গোষ্ঠীটি পরীক্ষা করুন চতুর্থ হিসাবে শর্তযুক্ত এবং কোভেরিয়েট …

53 anova ancova clinical-trials change-scores

9

2 ডি বাইনারি ম্যাট্রিক্সের এনট্রপি / তথ্য / নিদর্শনগুলি পরিমাপ

আমি দ্বি-মাত্রিক বাইনারি ম্যাট্রিক্সের এনট্রপি / তথ্য ঘনত্ব / প্যাটার্ন-অনুরূপ পরিমাপ করতে চাই। স্পষ্টতার জন্য আমাকে কিছু ছবি দেখাতে দাও: এই প্রদর্শন একটি বরং উচ্চ এনট্রপি থাকতে হবে: ক) এর মাঝারি এনট্রপি থাকা উচিত: B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর) এই ছবিগুলি, শেষ অবধি, সকলের কাছে শূন্য-এনট্রপি থাকা উচিত: সি) ডি) …

53 algorithms binary-data entropy pattern-recognition information

30

সর্বাধিক বিখ্যাত পরিসংখ্যানবিদ

সর্বাধিক গুরুত্বপূর্ণ পরিসংখ্যানবিদরা কী এবং এটি কী তাদের বিখ্যাত করেছে? (অনুগ্রহ করে প্রতি উত্তরে মাত্র একজন বিজ্ঞানীকে উত্তর দিন।)

53 methodology history

5

সময়-সিরিজ মডেলিংয়ের জন্য রাজ্য-স্থানের মডেলগুলি এবং কালম্যান ফিল্টারগুলির অসুবিধাগুলি কী কী?

রাজ্য-স্থানের মডেল এবং কেএফ এর সমস্ত ভাল বৈশিষ্ট্য দেওয়া, আমি অবাক হই - রাষ্ট্রীয় স্থানের মডেলিং এবং কলম্যান ফিল্টার (বা EKF, UKF বা কণা ফিল্টার) অনুমানের জন্য কী কী অসুবিধাগুলি রয়েছে? আসুন প্রচলিত পদ্ধতি যেমন এরিমা, ভিএআর বা অ্যাড-হক / হিউরিস্টিক পদ্ধতিগুলি বলি methods তারা কি শক্তিশালী করা কঠিন? কোনও …

53 time-series arima kalman-filter var

7

জেনেরিক সময় সিরিজের পিরিয়ড সনাক্তকরণ

এই পোস্টটি টাইম সিরিজে আউটিলার সনাক্তকরণের জন্য জেনেরিক পদ্ধতি সম্পর্কিত আরও একটি পোস্টের ধারাবাহিকতা । মূলত, এই মুহুর্তে আমি প্রচুর আওয়াজ দ্বারা প্রভাবিত জেনেরিক সময় সিরিজের সাময়িকতা / alityতু আবিষ্কার করার শক্তিশালী উপায়ে আগ্রহী। বিকাশকারী দৃষ্টিকোণ থেকে, আমি একটি সাধারণ ইন্টারফেস চাই যেমন: unsigned int discover_period(vector<double> v); vনমুনাগুলি সমেত অ্যারে …

53 time-series algorithms frequency real-time

6

ক্ষতিকারক ক্ষয় সহ অ্যাডাম অপ্টিমাইজার

বেশিরভাগ টেনসরফ্লো কোডে আমি দেখেছি অ্যাডাম অপ্টিমাইজারটি ধ্রুবক শেখার হারের 1e-4(অর্থাৎ 0.0001) ব্যবহার করে। কোডটি সাধারণত নিম্নলিখিতটি দেখায়: ...build the model... # Add the optimizer train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # Add the ops to initialize variables. These will include # the optimizer slots added by AdamOptimizer(). init_op = tf.initialize_all_variables() # launch …

53 neural-networks deep-learning gradient-descent tensorflow adam

2

লিনিয়ার রিগ্রেশন মডেলটিতে "ধ্রুবক বৈচিত্র" থাকার অর্থ কী?

ত্রুটি শব্দটির মধ্যে "ধ্রুবক বৈকল্পিক" থাকার অর্থ কী? আমি এটি দেখতে পাচ্ছি, আমাদের একটি নির্ভরশীল ভেরিয়েবল এবং একটি স্বতন্ত্র ভেরিয়েবল সহ একটি ডেটা আছে। নিয়মিত বৈকল্পিকতা লিনিয়ার রিগ্রেশন-এর অন্যতম অনুমান। আমি ভাবছি যে সমকামিতা মানে কি। যেহেতু আমার কাছে 500 টি সারি রয়েছে, আমার একক বৈকল্পিক মান থাকবে যা স্পষ্টত …

53 regression heteroscedasticity

3

যখন আমাদের প্রয়োজন হয় না তখন কেন আমরা সাধারণত বিতরণ ত্রুটি শর্তাদি (এবং সমকামিতা) লিনিয়ার রিগ্রেশন সম্পর্কে এত যত্ন করি?

আমি মনে করি প্রতিবারই আমি যখন কেউ শুনি যে হতাশ হয়ে পড়ে থাকি যে অবশেষ এবং / অথবা বৈষম্যমূলক আচরণের অস্বাভাবিকতা ওএলএস অনুমানকে লঙ্ঘন করে। কোনও ওএলএস মডেলের প্যারামিটারগুলি অনুমান করার জন্য গাউস-মার্কভের উপপাদ্য দ্বারা এই অনুমানগুলির কোনওটিই প্রয়োজন। ওএলএস মডেলের হাইপোথিসিস পরীক্ষায় এটি কীভাবে গুরুত্বপূর্ণ তা আমি দেখতে পাচ্ছি …

52 regression assumptions normality-assumption robust teaching

3

মডেল বৈধকরণের আগে বা এর মধ্যে বৈশিষ্ট্যটির নরমালাইজেশন সম্পাদন করবেন?

মেশিন লার্নিংয়ে একটি সাধারণ ভাল অনুশীলন হ'ল ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির বৈশিষ্ট্য সাধারনকরণ বা ডেটা মানিককরণ করা, এটি হ'ল ডেটাটিকে কেন্দ্র করে এবং এটি বৈকল্পিক (বা মানক বিচ্যুতি দ্বারা) বিভাজনকে সাধারণ করে তোলে। স্ব সংযোজন এবং আমার বোঝার জন্য আমরা দুটি প্রধান জিনিস অর্জনের জন্য এটি করি: সংখ্যাগত স্থিতিশীলতার লক্ষ্যে অতিরিক্ত ছোট …

52 machine-learning normalization standardization multidimensional-scaling