এমন কোনও অ্যালগরিদম বা ডেটা স্ট্রাকচার রয়েছে যেগুলির জন্য একটি সেটের মধ্যম মান খুঁজে পাওয়া দরকার?


14

আমি আমার ক্লাস, র্যান্ডমাইজড অ্যালগরিদমসের জন্য এই বইটি পড়ছি । এই নির্দিষ্ট বইয়ে, এ্যান্ডমের মধ্যস্থতাকে এলোমেলো নির্বাচন ব্যবহার করে অনুসন্ধান করার জন্য উত্সর্গীকৃত একটি সম্পূর্ণ বিভাগ রয়েছে যা আরও কার্যকর অ্যালগরিদমের দিকে পরিচালিত করে। এখন, আমি জানতে চেয়েছিলাম একটি তাত্ত্বিক উন্নতির পাশাপাশি কম্পিউটার বিজ্ঞানের ডোমেনে এই অ্যালগরিদমের কোনও ব্যবহারিক প্রয়োগ রয়েছে কিনা। এমন কোন অ্যালগরিদম বা ডেটা স্ট্রাকচার রয়েছে যা অ্যারের মাঝারি আবিষ্কার করতে হবে?


3
আপনি কুইকোর্টের দিকে একবার নজর রাখতে চাইতে পারেন: মাঝারিটিকে পিভট হিসাবে বেছে নেওয়ার সাথে এর সবচেয়ে খারাপ পরিস্থিতি এড়ানো যায় (সবচেয়ে খারাপ ক্ষেত্রে রানটাইম = O (n লগ এন) ও (এন ^ 2) এর পরিবর্তে) এবং পুনরাবৃত্তির গভীরতা হবে ছোট করা (লগ 2 (এন))।
হাফমেল

1
@ হফমলে: তবে এর জন্য আপনাকে মাঝারি সন্ধানের দরকার নেই। এটির জন্য আপনার কাছে এমন কোনও মান খুঁজে পাওয়া দরকার যা মিডিয়েনের কাছাকাছি। উদাহরণস্বরূপ, শীর্ষস্থানীয় 5% বা নীচে 5% এর মধ্যে নেই এমন একটি পাইভট খুঁজে পাওয়া ও (এন লগ এন) এর গ্যারান্টি দেয়।
gnasher729

1
@ gnasher729: তবে এটি পুনরাবৃত্তির গভীরতা হ্রাস করবে না। উভয় বৈশিষ্ট্যই গুরুত্বপূর্ণ, যেমন রিসোর্স-সীমিত রিয়েল-টাইম পরিবেশে।
হাফমেল 19

@ হফমলে, ঘটনাক্রমে, বেস 2 লোগারিদমের (বিশেষত কম্পিউটার বিজ্ঞানীদের মধ্যে) সাধারণ স্বরলিপিটি (এলজি (এন)) হিসাবে কেবল "এলজি" হয়।
ওয়াইল্ডকার্ড

@ gnasher729 যেহেতু বিষয়টি স্টোকাস্টিক অ্যালগরিদম, তাই এই (= যুক্তিসঙ্গত কাছে) সম্ভবত এই অ্যালগরিদমগুলি কি করছে is
কনরাড রুডল্ফ

উত্তর:


17

তাত্ত্বিক উন্নতি ছাড়াও যদি কম্পিউটার বিজ্ঞানের ডোমেনে এই অ্যালগরিদমের কোনও ব্যবহারিক অ্যাপ্লিকেশন থাকে

এই অ্যালগরিদমের প্রয়োগটি তুচ্ছ - আপনি যখনই কোনও ডেটার সেট (অন্য কথায় অ্যারে) এর একটি মিডিয়ান গণনা করতে চান আপনি এটি ব্যবহার করেন । এই ডেটা বিভিন্ন ডোমেন থেকে আসতে পারে: জ্যোতির্বিদ্যার পর্যবেক্ষণ, সামাজিক বিজ্ঞান, জৈবিক ডেটা ইত্যাদি etc.

যাইহোক, এটি কখন মিডিয়াকে মানে (বা মোড) পছন্দ করবেন তা উল্লেখযোগ্য। মূলত, বর্ণনামূলক পরিসংখ্যানগুলিতে, যখন আমাদের ডেটাগুলি পুরোপুরি স্বাভাবিক বিতরণ করা হয় তখন গড়, মোড এবং মিডিয়ান সমান হয়, অর্থাত তারা একত্রিত হয়। অন্যদিকে, যখন আমাদের ডেটা স্কিউ করা হয়, অর্থাত্ আমাদের ডেটাগুলির জন্য ফ্রিকোয়েন্সি বিতরণ (বাম / ডান) স্কিউ করা হয়, তখন গড়টি সর্বোত্তম কেন্দ্রীয় অবস্থান সরবরাহ করতে ব্যর্থ হয় কারণ skewness এটিকে আদর্শ মান থেকে বাম বা ডানে টেনে নিয়ে যায় is , যদিও মিডিয়ান স্কিউড ডেটা দ্বারা ততটা দৃ influenced়ভাবে প্রভাবিত হয় না এবং এইভাবে একটি আদর্শ মানের দিকে ইঙ্গিত করে এই অবস্থানটি সর্বোত্তমভাবে ধরে রাখে। আপনি স্কিউড ডেটা নিয়ে কাজ করার সময় কোনও মিডিয়ানের গণনা করা ভাল।

এছাড়াও, মেশিন লার্নিং হ'ল যেখানে পরিসংখ্যানগত পদ্ধতিগুলি প্রচুরভাবে ব্যবহৃত হয়, উদাহরণস্বরূপ মিডিয়ান ক্লাস্টারিংk


ধন্যবাদ! এটি অত্যন্ত সহায়ক! অন্য কোনও অ্যালগরিদম বা কৌশলগুলির জন্য একটি মিডিয়ান খোঁজার দরকার হতে পারে?
শরণ দুগিরালা

5
যদিও এটি যথেষ্ট পরিমাণে (+1), প্রায়শই প্রয়োগিত পরিসংখ্যানগুলিতে না হওয়ার চেয়ে মিডিয়ানা সন্ধানের আগে তথ্যগুলি সাজানো হত, যেহেতু অনেকগুলি বা এমনকি বেশিরভাগ প্রসঙ্গে যেখানে মিডিয়ান পছন্দসই, তাই কমপক্ষে অন্যান্য আদেশের কিছু অংশও রয়েছে পরিসংখ্যান।
জন কোলম্যান

1
মজাদার. আমি ম্যানস ক্লাস্টারিংয়ের কথা শুনেছি , তবে কে-কে সম্পর্কে নয়kk মিডিয়ানদের ক্লাস্টারিংয়ের ।
সোভিক

13

ইমেজ প্রসেসিংয়ে কিছু ধরণের শব্দ হ্রাস করতে মিডিয়ান ফিল্টারিং সাধারণ is বিশেষত লবণ এবং গোলমরিচ শব্দ। এটি চিত্রের প্রতিটি স্থানীয় পাড়ায় প্রতিটি রঙের চ্যানেলে মধ্যম মানটি বাছাই করে এবং এর সাথে এটি প্রতিস্থাপন করে কাজ করে। এই পাড়াগুলি কত বড় vary জনপ্রিয় ফিল্টার আকার (পাড়াগুলি) উদাহরণস্বরূপ 3x3 এবং 5x5 পিক্সেল।


1
মিডিয়ান কেবল চিত্রগুলিতে শব্দ করার জন্য নয়, সমস্ত সেন্সর পঠনগুলির মধ্যে শোনার জন্য প্রযোজ্য, যার মধ্যে ক্যামেরা কেবল এক প্রকারের সেন্সর are স্কুল পাঠ্যপুস্তকগুলি কাজ করতে সুন্দর সাইনোসয়েডাল এবং স্কোয়ার ওয়েভ আকার দেখায়। বাস্তব বিশ্বে এর মতো পরিষ্কার ডেটা প্রায় কখনও ঘটে না। যদি এটি হয় তবে এটি প্রায় সর্বদা কারণ আপনি অন্য কেউ ডেটা ধরে রাখার আগে এটি মসৃণ করার জন্য যত্ন নিয়েছিলেন। যেমন আরও সাধারণ সেন্সর পড়ার ডেটা যার জন্য আপনাকে "সঠিক" মানটি বেছে নিতে হবে: (1, 3, 5, 65, 68, 70, 75, 80, 82, 85, 540, 555)। আমি আরও স্পষ্ট করতে ডেটা বাছাই করেছি।
ডাঙ্ক

1
হ্যাঁ আপনি ঠিক বলেছেন। তবে আমরা যদি সংকেত প্রক্রিয়াকরণে এটি ব্যবহার করতে পারি সেখানে সমস্ত ছোট জিনিস লিখে রাখি তবে এটি একটি দীর্ঘ এবং বিরক্তিকর উত্তর দেয়।
ম্যাথ্রেডার

1
চিত্র প্রক্রিয়াকরণে মেডিয়ানরা 5 বা ততোধিক ফটোগুলির সিকোয়েন্স সহ পিক্সেল প্রতিও ব্যবহার করা যেতে পারে, যা সাময়িক শব্দদ্বার থেকে মুক্তি পাওয়ার জন্য একটি উপায় (যেমন পর্যটকদের দৃষ্টিভঙ্গি আটকাচ্ছে)
হেগেন ভন ইটজেন

আপনি ঠিক বলেছেন! আসলে আমি কিছুদিন আগে বেশ অনুরূপ কিছু নিয়ে ভাবছিলাম। আশেপাশে অনেক পর্যটক ...
mathreadler

10

র্যান্ডমাইজড আলগোরিদিমগুলিতে গণনা মিডিয়ানদের বিশেষভাবে গুরুত্বপূর্ণ।

বেশিরভাগ ক্ষেত্রে, আমাদের একটি আনুমানিক আলগোরিদম থাকে যা কমপক্ষে সম্ভাবনার সাথে 341±ϵA34kA(1±ϵ)kA(1ϵ)A(1+ϵ)k

2nn


5

মধ্যমা মধ্যমা কিছু অ্যাপ্লিকেশন রয়েছে:

  • O(nlogn)
  • O(n)O(n2)

1
আসলে কুইকোর্টের জন্য একটি পিভট বেছে নিতে মিডিয়ান অফ মেডিয়ান ব্যবহার করা সম্ভবত অনুশীলনে অ্যালগরিদমকে ধীর করে ফেলবে কারণ এটি ক্যাশে লোকালটিকে পুরোপুরি মেরে ফেলে, যা কুইকোর্টের দ্রুততার প্রধান অবদান। তবে সবচেয়ে খারাপ ক্ষেত্রে জটিলতা সম্পর্কে আপনার মন্তব্য অবশ্যই সঠিক।
wchargin

@wchargin আপনি কি বিকল্প প্রস্তাব করেন? আমি জানি না এমন কোনও কুইকোর্টের বাস্তবায়ন যা ক্যাশে-সংবেদনশীল পাইভট ব্যবহার করে, কারণ এটি করার ফলে নৃশংসতম সবচেয়ে খারাপ ক্ষেত্রে রানটাইম ব্যবসা হয়। সেমিনাল "ইঞ্জিনিয়ারিং একটি সাজানোর ফাংশন" কাগজে বিকল্পগুলি নিয়ে আলোচনা করা হয় এবং সেগুলির কোনওটিই ক্যাশে-সচেতন নয় (এবং তা সত্ত্বেও নিষ্পাপ পাইভোট নির্বাচনকে ছাড়িয়ে যায়)।
কনরাড রুডলফ

1
@ ওয়াচারগিন ... আমার নিজের প্রশ্নের উত্তর: জাভা 7 একটি নতুন দ্বৈত-পিভট পদ্ধতিতে সরিয়ে নিয়েছে যা সম্পর্কে আমি অবগত ছিলাম না। এটি আকর্ষণীয় এবং মিডিয়ান পিভট অ্যালগরিদমগুলি অপ্রচলিত রেন্ডার হতে পারে।
কনরাড রুডল্ফ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.