বৈশ্বিক এবং সার্বজনীন সংক্ষেপণ পদ্ধতির মধ্যে পার্থক্য কী?


12

আমি বুঝতে পারি যে সংকোচনের পদ্ধতিগুলি দুটি প্রধান সেটে বিভক্ত হতে পারে:

  1. বিশ্বব্যাপী
  2. স্থানীয়

প্রথম সেটটি ডেটা প্রক্রিয়াজাতকরণ নির্বিশেষে কাজ করে, অর্থাত্‍ তারা ডেটার কোনও বৈশিষ্ট্যের উপর নির্ভর করে না, এবং এইভাবে ডেটাসেটের কোনও অংশে (সংক্ষেপণের আগেই) কোনও প্রিপ্রোসেসিংয়ের প্রয়োজন হয় না। অন্যদিকে, স্থানীয় পদ্ধতিগুলি ডেটা বিশ্লেষণ করে তথ্য আহরণ করে যা সাধারণত সংক্ষেপণের হারকে উন্নত করে।

এই কয়েকটি পদ্ধতির বিষয়ে পড়ার সময় আমি লক্ষ্য করেছি যে অযৌক্তিক পদ্ধতিটি সর্বজনীন নয় , যেহেতু আমি "বিশ্বতা" এবং "সার্বজনীনতা" একই জিনিসটিকে উল্লেখ করেছেন বলে আমি অবাক হয়েছিল। অ্যানারি পদ্ধতিটি এর এনকোডিংটি উত্পন্ন করার জন্য ডেটাগুলির বৈশিষ্ট্যগুলির উপর নির্ভর করে না (যেমন এটি একটি বিশ্বব্যাপী পদ্ধতি), এবং তাই এটি বৈশ্বিক / সর্বজনীন হওয়া উচিত, তাই না?

আমার প্রাথমিক প্রশ্ন:

  • সর্বজনীন এবং বৈশ্বিক পদ্ধতির মধ্যে পার্থক্য কী?
  • এই শ্রেণিবদ্ধতা প্রতিশব্দ না?

2
আপনি যেখানে পড়েছেন সেখানে কি আপনি / রেফারেন্সের সাথে লিঙ্ক করতে পারবেন যে ইউনিারি পদ্ধতি সর্বজনীন নয়? প্রসঙ্গ সাহায্য করতে পারে।
এয়ার

3
আমি ... এটি কীভাবে তথ্য বিজ্ঞানের সাথে সম্পর্কিত তা নিশ্চিত নই। এই স্ট্যাক এক্সচেঞ্জের জন্য এটি অফ-টপিক বলে মনে হচ্ছে। আপনি সম্ভবত এটি তথ্য বিজ্ঞানের সাথে সম্পর্কিত করতে পারেন?
স্লেটার ভিক্টোরফ

@ স্লেটারটাইরানস আমি ... খুব নিশ্চিত নই (এবং এটি আমার পোস্ট করা আরও দুটি প্রশ্ন সম্পর্কে আমাকে ভাবিয়ে তোলে)। আমার ধারণাটি এই প্রশ্নটি যুক্ত করা ছিল যেহেতু কম্প্রেশন পদ্ধতিগুলি মূলত তথ্য পুনরুদ্ধারে ব্যবহৃত হয় (মূলত ইনডেক্সিংয়ের সময়)। সাধারণভাবে, আমি এটি দক্ষতার সাথে সম্পর্কিত বলে মনে করি এবং এটি এই ভেন চিত্রের হ্যাকিং দক্ষতার ক্ষেত্রে স্থাপন করা যেতে পারে । যাইহোক, আমি অনুমান করি যে এই জাতীয় প্রশ্নটি বিষয়টিতে রয়েছে কিনা তা নিয়ে আলোচনা করা ভাল লাগবে।
রুবেন্স

@ রুবেন্সগুলি এটি একটি যুক্তিসঙ্গত আলোচনার মতো বলে মনে হচ্ছে, আমার মনে দক্ষতার কথাটি স্পষ্ট হ্যাকিং দক্ষতার চেয়ে তাত্ত্বিক সিএসের মতো আরও অনেক কিছুতে ফিট করে । আমার মনে, হ্যাকিং দক্ষতা ডেটাবেস, স্থাপনা এবং সরঞ্জামগুলির জ্ঞানের মতো বিষয়গুলির সাথে অনেক বেশি সম্পর্কিত।
স্লেটার ভিক্টোরফ

1
@ সোভানবালেন দুটি প্রধান বিষয়: ১. তথ্য বিজ্ঞানের কিছু পদ্ধতির ক্ষেত্রে তথ্য তত্ত্ব গুরুত্বপূর্ণ, তবে অন্য অনেকের ক্ষেত্রে এটি অপ্রাসঙ্গিক। ২. মৌলিক বিষয়গুলি সহজাতভাবে বিষয়বস্তু থেকে দূরে থাকে, পরিসংখ্যান বা রৈখিক বীজগণিত সম্পর্কে বিস্তারিত প্রশ্ন জিজ্ঞাসা করা একইভাবে বিষয়বস্তু থেকে দূরে থাকবে যদিও সেগুলি উভয়ই দরকারী ডেটা বিজ্ঞানের জন্য কঠোরভাবে প্রয়োজন।
স্লেটার ভিক্টোরফ

উত্তর:


3

নিম্নলিখিত তথ্য খণ্ড বিবেচনা করুন:

1010010110100101

সর্বজনীন - এগুলি হ'ল জেনেরিক সংক্ষেপণ অ্যালগরিদম যা ডেটা অজোনস্টিক। রান দৈর্ঘ্যের এনকোডিংয়ের একটি অশোধিত সংস্করণ এই বিভাগে আসবে। সুবিধাটি হ'ল এটি সংকোচনের এবং সংক্রমন করার জন্য খুব দ্রুত। ক্ষয়ক্ষতিটি হ'ল সংকুচিত হওয়া ডেটার উপর ভিত্তি করে এটি চূড়ান্তভাবে অকার্যকর হতে পারে।

111111111111111111 -> 16 1 (ভাগ্যবান কেস)

1010010110100101 -> 1010010110100101 (দুর্ভাগ্য কেস)

স্থানীয় - এই পদ্ধতিটি একটি নির্দিষ্ট দৈর্ঘ্যের ছোট অংশগুলিকে বিবেচনা করবে, 4 বলবে, নিদর্শনগুলি সন্ধান করবে এবং সেগুলি সংকুচিত করবে। যেমন। এই ডেটাগুলিতে কেবল এই দুটি ধরণের নিদর্শন রয়েছে - 1010 এবং 0101 These এই নিদর্শনগুলিকে 0 ও 1 গুলি হিসাবে উপস্থাপন করা যেতে পারে এবং সামগ্রিক ডেটা ম্যাপিংগুলি উপস্থাপন করে এমন একটি টেবিল এবং 0101 এর মতো কিছু হতে পারে This এর ফলে আরও অনেক ছোট হওয়ার সম্ভাবনা রয়েছে সংকুচিত আকার।

1010010110100101 -> 1010 0101 1010 0101 -> 0101 (0 = 1010,1 = 0101)

গ্লোবাল - এই পদ্ধতিটি পুরো ডেটাটি দেখবে এবং ডেটা সংকোচন করার জন্য সর্বোত্তম / আরও ভাল নিদর্শনগুলি খুঁজে পেতে পারে। উদাহরণস্বরূপ ডেটাতে 10100101 মাত্র একটি প্যাটার্ন রয়েছে এবং এটি ম্যাপিং টেবিলের সাথে 00 হিসাবে উপস্থাপন করে। এটি ক্ষুদ্রতম সম্ভাব্য সংকুচিত আকার পাওয়ার সম্ভাবনা রাখে, তবে এটি গণনার দিক থেকেও সবচেয়ে ভারী।

1010010110100101 -> 10100101 10100101 -> 00 (0 = 10100101)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.