প্রশ্ন ট্যাগ «large-data»

'বৃহত্তর ডেটা' এমন পরিস্থিতিতে বোঝায় যেখানে পর্যবেক্ষণের সংখ্যা (ডেটা পয়েন্ট) এত বেশি যে তথ্য বিশ্লেষক বিশ্লেষণ সম্পর্কে ভাবেন বা পরিচালনা করেন সেভাবে পরিবর্তনের প্রয়োজন হয়। ('উচ্চ মাত্রিকতা' নিয়ে বিভ্রান্ত হওয়ার দরকার নেই))

1
আরএমএসই এর উপর ভিত্তি করে নির্ভুলতার পরিমাপ কীভাবে গণনা করবেন? আমার বড় ডেটাসেটটি সাধারণত বিতরণ করা হয়?
কয়েক হাজার পয়েন্টের ক্রমে আমার বেশ কয়েকটি ডেটাসেট রয়েছে। প্রতিটি ডেটাসেটের মানগুলি হ'ল এক্স, ওয়াই, জেড স্থানের স্থানাঙ্কের উল্লেখ করে। জেড-মান স্থানাঙ্ক জোড়া (এক্স, ওয়াই) এর উচ্চতার পার্থক্যের প্রতিনিধিত্ব করে। সাধারণত আমার জিআইএসের ক্ষেত্রে, আরএমএসইতে উচ্চতা ত্রুটিটিকে একটি পরিমাপের পয়েন্টে (লিডার ডেটা পয়েন্ট) বিস্তৃত করে গ্রাউন্ড-ট্রুথ পয়েন্টটি বিয়োগ করে রেফারেন্স …

3
খুব বড় ডেটাসেট থেকে কীভাবে দ্রুত গুরুত্বপূর্ণ ভেরিয়েবলগুলি নির্বাচন করবেন?
আমার প্রায় 2000 বাইনারি ভেরিয়েবল / 200,000 সারি সহ একটি ডেটাসেট রয়েছে এবং আমি একক বাইনারি নির্ভরশীল ভেরিয়েবলের পূর্বাভাস দেওয়ার চেষ্টা করছি। আমার এই পর্যায়ে প্রধান লক্ষ্য পূর্বাভাসের সঠিকতা পাচ্ছে না, বরং এর মধ্যে কোনটি পরিবর্তনশীল গুরুত্বপূর্ণ ভবিষ্যদ্বাণীকারী তা সনাক্ত করার জন্য identify আমি আমার চূড়ান্ত মডেলটিতে ভেরিয়েবলের সংখ্যা প্রায় …

3
স্থান-দক্ষ ক্লাস্টারিং
বেশিরভাগ ক্লাস্টারিং অ্যালগরিদমগুলি আমি সমস্ত পয়েন্টের মধ্যে প্রতিটি থেকে প্রতিটি দূরত্ব তৈরি শুরু করে দেখেছি যা বড় ডেটাসেটগুলিতে সমস্যাযুক্ত হয়ে ওঠে। এমন কি আছে যে এটি করে না? বা এটি কোনও ধরণের আংশিক / আনুমানিক / স্তিমিত পদ্ধতির মধ্যে রয়েছে? কোন ক্লাস্টারিং অ্যালগরিদম / প্রয়োগটি O (n ^ 2) স্পেসের …

1
আমি কি প্রতিটি এমসিসিএম পুনরাবৃত্তিতে একটি বড় ডেটাসেট সাবমেল করতে পারি?
সমস্যা: আমি একটি বড় ডেটাসেটের চেয়ে কিছু উত্তরোত্তর অনুমান করতে একটি গিবস নমুনা করতে চাই। দুর্ভাগ্যক্রমে, আমার মডেল খুব সহজ নয় এবং এইভাবে নমুনাটি খুব ধীর। আমি পরিবর্তনশীল বা সমান্তরাল পদ্ধতির বিবেচনা করব, তবে এতদূর যাওয়ার আগে ... প্রশ্ন: আমি জানতে চাই যে আমি প্রতিটি গিবস পুনরাবৃত্তিতে আমার ডেটাসেট থেকে …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.