পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
স্তরিত ক্রস-বৈধতা বোঝা
স্তরিত ক্রস-বৈধকরণ এবং ক্রস-বৈধকরণের মধ্যে পার্থক্য কী ? উইকিপিডিয়া বলেছেন: ইন স্তরীভূত K-ধা ক্রস বৈধতা , ভাঁজ নির্বাচন করা হয়, যাতে গড় প্রতিক্রিয়া মান সব ভাঁজ প্রায় সমান। দ্বিগুণ শ্রেণিবিন্যাসের ক্ষেত্রে, এর অর্থ হ'ল প্রতিটি ভাগে দুটি ধরণের শ্রেণির লেবেলের প্রায় একই অনুপাত থাকে। তবে আমি এখনও বিভ্রান্ত। mean response …

3
বাক্স-কক্স স্বাধীন ভেরিয়েবলের রূপান্তরের মতো?
স্বাধীন ভেরিয়েবলগুলির জন্য রূপান্তর করার মতো কোনও বাক্স-কক্স রয়েছে? এটি, এমন একটি রূপান্তর যা পরিবর্তনশীলকে অনুকূল করে তোলে যাতে লিনিয়ার মডেলটির জন্য আরও যুক্তিসঙ্গত ফিট করতে পারে?xxxy~f(x) যদি তাই হয় তবে এটির সাথে কোন অনুষ্ঠান করার আছে R?

3
আর এ প্যাকেজ হিসাবে ডেটা এপিআই / ফিডগুলি উপলব্ধ
সম্পাদনা: ওয়েব টেকনোলজিস এবং পরিষেবাদি ক্র্যান টাস্ক ভিউতে আর-এ উপলব্ধ ডেটা সোর্স এবং এপিআই-র অনেক বেশি বিস্তৃত তালিকা রয়েছে you আপনি যদি টাস্ক ভিউতে কোনও প্যাকেজ যুক্ত করতে চান তবে আপনি গিথুবে একটি পুল অনুরোধ জমা দিতে পারেন। আমি বিভিন্ন ডেটা ফিডের একটি তালিকা তৈরি করছি যা ইতিমধ্যে আর এর …
53 r  references  dataset 

4
পারস্পরিক সম্পর্কযুক্ত এলোমেলো সংখ্যা (প্রদত্ত উপায়, রূপ এবং পারস্পরিক সম্পর্কের ডিগ্রি) কীভাবে উত্পন্ন করা যায়?
এটিকে যদি কিছুটা প্রাথমিক মনে হয় তবে আমি দুঃখিত, তবে আমি অনুমান করি যে আমি এখানে বোঝার বিষয়টি নিশ্চিত করতে চাই। আমি বুঝতে পারি যে আমাকে এই দুটি পদক্ষেপে করতে হবে এবং আমি পারস্পরিক সম্পর্কের ম্যাট্রিকগুলি ছড়িয়ে দেওয়ার চেষ্টা শুরু করেছি, তবে এটি কেবল জড়িত বলে মনে হচ্ছে। পারস্পরিক সম্পর্কযুক্ত …

10
পাইথন ব্যবহার করে মেশিন লার্নিং
আমি আমার মেশিন লার্নিং পরীক্ষাগুলি করার জন্য পাইথন গ্রন্থাগারগুলি ব্যবহার করার বিষয়ে বিবেচনা করছি। এখনও অবধি আমি WEKA এর উপর নির্ভর করছিলাম তবে পুরোপুরি বেশ অসন্তুষ্ট ছিলাম। এটি মূলত কারণ হ'ল আমি WEKA তেমন সমর্থিত নয় বলে প্রমাণ পেয়েছি (খুব কম উদাহরণ, ডকুমেন্টেশন অপ্রয়োজনীয় এবং সম্প্রদায়ের সমর্থন আমার অভিজ্ঞতায় কাঙ্ক্ষিতের …

6
দক্ষ অনলাইন লিনিয়ার রিগ্রেশন
আমি এমন কিছু ডেটা বিশ্লেষণ করছি যেখানে আমি সাধারণ লিনিয়ার রিগ্রেশন করতে চাই, তবে এটি সম্ভব নয় কারণ আমি ইনপুট ডেটার ধারাবাহিক স্ট্রিমের সাথে অন-লাইন সেটিংয়ের সাথে কাজ করছি (যা দ্রুত স্মৃতিতে খুব বেশি বড় হবে) এবং প্রয়োজন যখন এটি গ্রাস করা হচ্ছে তখন প্যারামিটারের অনুমানগুলি আপডেট করতে। অর্থাৎ আমি …

5
প্রাক-পোস্ট চিকিত্সা-নিয়ন্ত্রণ ডিজাইন বিশ্লেষণ করার সময় সেরা অনুশীলন
নিম্নলিখিত সাধারণ নকশা কল্পনা করুন: 100 জন অংশগ্রহণকারীকে এলোমেলোভাবে চিকিত্সা বা নিয়ন্ত্রণ গ্রুপের জন্য বরাদ্দ দেওয়া হয় নির্ভরশীল পরিবর্তনশীলটি সংখ্যাসূচক এবং পরিমাপকৃত প্রাক এবং চিকিত্সা পরে এই জাতীয় ডেটা বিশ্লেষণের জন্য তিনটি সুস্পষ্ট বিকল্প হ'ল: মিশ্র অ্যানোভাতে সময় পারস্পরিক মিথস্ক্রিয়া প্রভাব দ্বারা গোষ্ঠীটি পরীক্ষা করুন চতুর্থ হিসাবে শর্তযুক্ত এবং কোভেরিয়েট …

9
2 ডি বাইনারি ম্যাট্রিক্সের এনট্রপি / তথ্য / নিদর্শনগুলি পরিমাপ
আমি দ্বি-মাত্রিক বাইনারি ম্যাট্রিক্সের এনট্রপি / তথ্য ঘনত্ব / প্যাটার্ন-অনুরূপ পরিমাপ করতে চাই। স্পষ্টতার জন্য আমাকে কিছু ছবি দেখাতে দাও: এই প্রদর্শন একটি বরং উচ্চ এনট্রপি থাকতে হবে: ক) এর মাঝারি এনট্রপি থাকা উচিত: B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর) এই ছবিগুলি, শেষ অবধি, সকলের কাছে শূন্য-এনট্রপি থাকা উচিত: সি) ডি) …


5
সময়-সিরিজ মডেলিংয়ের জন্য রাজ্য-স্থানের মডেলগুলি এবং কালম্যান ফিল্টারগুলির অসুবিধাগুলি কী কী?
রাজ্য-স্থানের মডেল এবং কেএফ এর সমস্ত ভাল বৈশিষ্ট্য দেওয়া, আমি অবাক হই - রাষ্ট্রীয় স্থানের মডেলিং এবং কলম্যান ফিল্টার (বা EKF, UKF বা কণা ফিল্টার) অনুমানের জন্য কী কী অসুবিধাগুলি রয়েছে? আসুন প্রচলিত পদ্ধতি যেমন এরিমা, ভিএআর বা অ্যাড-হক / হিউরিস্টিক পদ্ধতিগুলি বলি methods তারা কি শক্তিশালী করা কঠিন? কোনও …

7
জেনেরিক সময় সিরিজের পিরিয়ড সনাক্তকরণ
এই পোস্টটি টাইম সিরিজে আউটিলার সনাক্তকরণের জন্য জেনেরিক পদ্ধতি সম্পর্কিত আরও একটি পোস্টের ধারাবাহিকতা । মূলত, এই মুহুর্তে আমি প্রচুর আওয়াজ দ্বারা প্রভাবিত জেনেরিক সময় সিরিজের সাময়িকতা / alityতু আবিষ্কার করার শক্তিশালী উপায়ে আগ্রহী। বিকাশকারী দৃষ্টিকোণ থেকে, আমি একটি সাধারণ ইন্টারফেস চাই যেমন: unsigned int discover_period(vector<double> v); vনমুনাগুলি সমেত অ্যারে …

6
ক্ষতিকারক ক্ষয় সহ অ্যাডাম অপ্টিমাইজার
বেশিরভাগ টেনসরফ্লো কোডে আমি দেখেছি অ্যাডাম অপ্টিমাইজারটি ধ্রুবক শেখার হারের 1e-4(অর্থাৎ 0.0001) ব্যবহার করে। কোডটি সাধারণত নিম্নলিখিতটি দেখায়: ...build the model... # Add the optimizer train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # Add the ops to initialize variables. These will include # the optimizer slots added by AdamOptimizer(). init_op = tf.initialize_all_variables() # launch …

2
লিনিয়ার রিগ্রেশন মডেলটিতে "ধ্রুবক বৈচিত্র" থাকার অর্থ কী?
ত্রুটি শব্দটির মধ্যে "ধ্রুবক বৈকল্পিক" থাকার অর্থ কী? আমি এটি দেখতে পাচ্ছি, আমাদের একটি নির্ভরশীল ভেরিয়েবল এবং একটি স্বতন্ত্র ভেরিয়েবল সহ একটি ডেটা আছে। নিয়মিত বৈকল্পিকতা লিনিয়ার রিগ্রেশন-এর অন্যতম অনুমান। আমি ভাবছি যে সমকামিতা মানে কি। যেহেতু আমার কাছে 500 টি সারি রয়েছে, আমার একক বৈকল্পিক মান থাকবে যা স্পষ্টত …

3
যখন আমাদের প্রয়োজন হয় না তখন কেন আমরা সাধারণত বিতরণ ত্রুটি শর্তাদি (এবং সমকামিতা) লিনিয়ার রিগ্রেশন সম্পর্কে এত যত্ন করি?
আমি মনে করি প্রতিবারই আমি যখন কেউ শুনি যে হতাশ হয়ে পড়ে থাকি যে অবশেষ এবং / অথবা বৈষম্যমূলক আচরণের অস্বাভাবিকতা ওএলএস অনুমানকে লঙ্ঘন করে। কোনও ওএলএস মডেলের প্যারামিটারগুলি অনুমান করার জন্য গাউস-মার্কভের উপপাদ্য দ্বারা এই অনুমানগুলির কোনওটিই প্রয়োজন। ওএলএস মডেলের হাইপোথিসিস পরীক্ষায় এটি কীভাবে গুরুত্বপূর্ণ তা আমি দেখতে পাচ্ছি …

3
মডেল বৈধকরণের আগে বা এর মধ্যে বৈশিষ্ট্যটির নরমালাইজেশন সম্পাদন করবেন?
মেশিন লার্নিংয়ে একটি সাধারণ ভাল অনুশীলন হ'ল ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির বৈশিষ্ট্য সাধারনকরণ বা ডেটা মানিককরণ করা, এটি হ'ল ডেটাটিকে কেন্দ্র করে এবং এটি বৈকল্পিক (বা মানক বিচ্যুতি দ্বারা) বিভাজনকে সাধারণ করে তোলে। স্ব সংযোজন এবং আমার বোঝার জন্য আমরা দুটি প্রধান জিনিস অর্জনের জন্য এটি করি: সংখ্যাগত স্থিতিশীলতার লক্ষ্যে অতিরিক্ত ছোট …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.