কুইকোর্টের বিশ্লেষণ করার সময় ডিসঅর্ডারের কী পরিমাপ করা উচিত


9

আমি বোঝার চেষ্টা করছি যে লোমুটো পার্টিশন এবং একটি নির্দিষ্ট পিভট ব্যবহার করে কুইকোর্টটি এলোমেলোভাবে, তবে সামগ্রিকভাবে খারাপভাবে, এলোমেলোভাবে উত্পন্ন ইনপুটগুলিতে কেন সঞ্চালন করছে। আমি ভাবছি যে ইনপুটগুলি এলোমেলোভাবে উত্পাদিত হলেও সিকোয়েন্সগুলিতে অনেকগুলি ক্রম থাকতে পারে তবে সিকোয়েন্সগুলিতে ডিসঅর্ডারের মাত্রা কীভাবে পরিমাপ করা যায় তা আমি নিশ্চিত নই। আমি বিপরীতে সংখ্যার ব্যবহার সম্পর্কে ভেবেছিলাম, তবে আমি এই অন্যান্য প্রশ্ন থেকে দেখেছি যে আমি এই ক্ষেত্রে এটি সত্যিই ভাল ব্যবস্থা নয় asked

আমার সন্দেহজনক কারণ যে আমার এলোমেলো ক্রমগুলি তাদের কাছে প্রচুর "অর্ডার" রয়েছে তা হ'ল পিভটটি এলোমেলো করে দেওয়া পারফরম্যান্স সমস্যার সমাধান করে। তবে তাত্ত্বিকভাবে এই অনুমিত "এলোমেলো" ইনপুট সিকোয়েন্সগুলিতে কোনও কার্য সম্পাদনের সমস্যা হওয়া উচিত নয়।


এই ধরণের জিনিসটির জন্য ব্যাধিগুলির একটি ভাল পরিমাপ হ'ল কলমোগোরভ জটিলতা। এটি মূলত বলে যে যে স্ট্রিংটি সর্বাধিক বিঘ্নিত হয় তা হ'ল সংকোচনের। এটি অসম্পূর্ণতা পদ্ধতির দিকে পরিচালিত করে, যা অ্যালগরিদমগুলি বাছাইয়ের গড়-কেস বিশ্লেষণ, এবং গড় এবং সবচেয়ে খারাপ ক্ষেত্রে বিশ্লেষণের মধ্যে সম্পর্ক খুঁজে পাওয়ার মতো কাজগুলিতে ব্যবহৃত হয়।
পিটার

আমার লক্ষ করা উচিত, আমি একজন আন্ডারগ্রাড ... আমি আরও কিছুটা সোজা সামনে খুঁজছিলাম, যেমন এই কাগজের একটি ব্যবস্থা (আমি কেবল কোনটি জানি না): citeseerx.ist.psu। ইডু / ভিউডোক / সারসংক্ষেপ? ডুই = 10.1.1.45.8017
রবার্ট এস বার্নেস


আপনার কোনও বিরোধী পিভোটিং কেসের চেয়ে প্রোগ্রামিং ত্রুটির সন্দেহ হওয়া উচিত। আপনার অ্যালগোরিদমটি বাছাই করে দেখুন 1 থেকে N পর্যন্ত পূর্ণসংখ্যার স্ক্যাম্বলড ক্রমটি বাছাই করুন!
ইয়ভেস দাউস্ট

@ ইয়ভেডউউস্ট আমি মনে করি না যে এটি সত্যই গুরুত্বপূর্ণ, "অ-একঘেয়েমি" এর পরিমাণটি কেবল দৈর্ঘ্যের স্ট্রিমের কলমোগোরভ জটিলতা এন!যা ক্রমের উপাদানগুলির ক্রমকে এনকোড করে। অবশ্যই এটি গণনাযোগ্য নয়, এবং আপনাকে সিউডোরান্ডম জাতীয় মতো গভীর স্ট্রিং সম্পর্কে ভাবতে হবে, তবে এটি এই অর্থে কার্যকর যে ডিসঅর্ডারের প্রতিটি পরিমাপ মূলত কোলমোগোরভ জটিলতার একটি অনুমিতিকরণ। এবং এটির সাথে জিনিসগুলি প্রমাণ করার জন্য আপনাকে এটি গণনা করার দরকার নেই। সংকোচনের পদ্ধতিতে অনেক জটিলতার ফলাফল দেখানো হয়েছে।
পিটার

উত্তর:


1


সমান কী বাছাই করার সময় লোমুটো বনাম হোরে লোমুটো বিভাজনে ভুগছে, যদিও হোয়ার পার্টিশনটি করে না।
উভয় পার্টিশন প্রকল্পগুলি মধ্য থেকে দূরে একটি পিভট ব্যবহার করে সমানভাবে ক্ষতিগ্রস্থ হয়।

বিশৃঙ্খলার
পরিমাপ কুইকোর্টের উদ্দেশ্যে বেছে নিতে অসুস্থতার পরিমাপ সহজ।
উত্তর: এলোমেলো তথ্যের তুলনায় স্থির পাইভটটি মধ্য থেকে কতটা সরানো হয়?
আপনি যদি লোমুতো পার্টিশনটি ব্যবহার করার বিষয়ে জেদ করেন এবং যদি অনুমান করেন যে সদৃশ মানগুলি অনুমোদিত হয় তবে আপনাকে এলোমেলোতার বিপরীতে নিম্নলিখিত পরীক্ষাটি যুক্ত করতে হবে: বি: এলোমেলো তুলনায় কয়টি
সদৃশ উপাদান রয়েছে।

অবশ্যই এটি অনুমান করার মতো মূর্খতা যে আপনার ডেটা সেটে সদৃশ মানগুলি অনুমোদিত এবং এখনও লোমুতো পার্টিশনটি মূল্যায়ন করে, সুতরাং আপনার সম্ভবত ডুপ্লিকেটগুলি আগেই মুছে ফেলা উচিত বা হোয়ের পার্টিশনে স্যুইচ করা উচিত বা অনুমান করা খুব কম।

উভয় পদক্ষেপ পরিসংখ্যান ব্যবহার করে পরিমান তুচ্ছ।

আমরা প্যাথোলজিকাল ডেটা বাতিল করে দিতে পারি
এলোমেলোতা থেকে অন্য কোনও বিচ্যুতি কুইকোর্টের বিশ্লেষণের উদ্দেশ্যে বিবেচ্য নয়। পিভট যতক্ষণ না মাঝের কাছাকাছি থাকে ততক্ষণ এটি সমস্ত ডেটাতে ভাল সঞ্চালন করবে যা রোগগত নয়।
এলোমেলো থেকে দূরত্বটি প্রকৃতপক্ষে চিক্সোর্ট-প্যাথলজিকাল হতে হবে, তাই আমরা এটিকে রায় দিতে পারি।

রিয়েল কোডে কোনও স্থির পাইভট (গুলি) কখনই ব্যবহার
করবেন না মনে রাখবেন যে আপনি যদি একটি নির্দিষ্ট পিভট * এর সাথে রিয়েল কোড লিখেন তবে ) (পিভট যাই হউক না কেন) আপনি নিজেকে সার্ভিস আক্রমণ অস্বীকার করার জন্য উন্মুক্ত করছেন, কারণ আক্রমণকারী একটি প্রবেশদ্বার canোকাতে পারে প্যাথলজিকালিক্যাল মানটি ঠিক সেই সময়ে এবং সুতরাং আপনাকে সর্বদা পিভট হিসাবে একটি এলোমেলো উপাদান বেছে নেওয়া উচিত।

*) বা একাধিক পিভট যদি আপনি সেরা x পিভট বেছে নেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.