কলমোগোরভ জটিলতা প্রায় অনুমান করা


22

আমি কোলমোগোরভ জটিলতা সম্পর্কে কিছু অধ্যয়ন করেছি , ভিটানাই এবং লি থেকে কিছু নিবন্ধ এবং বই পড়েছি এবং লেখকদের স্টাইলমিট্রি যাচাই করার জন্য নরমালাইজড কমপ্রেশন ডিস্টেন্সের ধারণাটি ব্যবহার করেছি (প্রতিটি লেখক কীভাবে কিছুটা পাঠ্য এবং গ্রুপের দলিলগুলি তাদের মিলের দ্বারা লেখেন তা চিহ্নিত করুন)।

সেক্ষেত্রে ডাটা কমপ্রেসারগুলি কলমোগোরভ জটিলতার অনুমান করতে ব্যবহৃত হত, যেহেতু ডেটা সংক্ষেপককে টুরিং মেশিন হিসাবে ব্যবহার করা যেতে পারে।

ডেটা সংক্ষেপণ এবং প্রোগ্রামিং ল্যাঙ্গুয়েজগুলি (যাতে আপনি কোনও ধরণের সংক্ষেপক লিখতেন) ছাড়াও কোলমোগোরভ জটিলতা অনুমান করার জন্য আর কী ব্যবহার করা যেতে পারে? অন্য কোন পদ্ধতি ব্যবহার করা যেতে পারে?


আমি নিশ্চিত না যে আমি আপনার প্রশ্নটি বুঝতে পেরেছি: কেসির সংজ্ঞাটিতে ট্যুরিং মেশিন অন্তর্ভুক্ত রয়েছে, যার মধ্যে প্রোগ্রামগুলি উদাহরণ তৈরি করে (কিছু অনুবাদ সম্মানের সাথে)। "প্রোগ্রামিং ল্যাঙ্গুয়েজ ব্যতীত" কোলমোগর্ভ জটিলতার আনুমানিক অর্থ কী?
কোডি

1
GZip এর মতো যে কোনও সংক্ষেপণ সফ্টওয়্যার ব্যবহার করে একটি স্ট্রিং সংকুচিত করুন। আউটপুটটির আকার স্ট্রিংয়ের কেসির উপরের একটি আবদ্ধ।
এম আলাগান

@ কোডি: হুবহু, আমি আমার গবেষণায় ডেটা কমপ্রেসারগুলি ব্যবহার করেছি (জিপ, বিজিপ, পিপিএমডি) আনুমানিক কেসিতে। ডেটা সংক্ষেপক, হুবহু প্রোগ্রামগুলি নয় .. সুতরাং, আমি ভাষা ছাড়াও কেসিতে কী ব্যবহার করতে পারি সে সম্পর্কে পরামর্শগুলি সন্ধান করছি (= সি / প্রলজ / যে কোনও ক্ষেত্রে একটি প্রোগ্রাম লিখুন) এবং ডেটা সংক্ষেপক (= জিপ, জিজিপ, পিপিএমসি, পিপিএমডি ...) :)
উলিভিরাজ

1
আমি অনুমান করি যে এটি কেবল আমার কাছে মনে হয় যে একটি ডেটা সংক্ষেপণ প্রোগ্রামের সংজ্ঞাটি হ'ল: একটি প্রোগ্রাম যা একটি স্ট্রিংয়ের কেসিকে একটি প্রোগ্রাম দ্বারা ("বিরামবিহীন") এবং অন্য স্ট্রিং (সংক্ষেপিত স্ট্রিং) দ্বারা সংযুক্ত করে।
કોડি

উত্তর:


9

আমার ধারণা আপনার প্রশ্নের একটি সম্ভাব্য উত্তর হ'ল সিউডোরডম নম্বর জেনারেটর নিন । জেনারেটরের যা কিছু শক্তিশালী হয়েছে বেছে নেওয়া হয়েছে করার চেষ্টা করুন আক্রমণের উত্তর: এটি বিরুদ্ধে র্যান্ডম সংখ্যা উত্পাদক আক্রমণ জন্য জি (আমাদের কাজের জন্য) হল, একটি অ্যালগরিদম একটি যা, যখন একটি imput স্ট্রিং প্রদত্ত গুলি স্থির করে একটি বীজ একটি ( গুলি ) , যেমন যে জি ( ( গুলি ) ) = এস । তারপর আনুমানিক এর কেসি গুলি :GGAs A(s)G(A(s))=ss

input: s
Compute A(s);
if |A(s)| + |G| > |s| output: |s|
otherwise output: |A(s)| + |G|

কোথায় জি ( গুলি ) গণনা করার প্রোগ্রামটির দৈর্ঘ্য (প্রায়শই সংক্ষিপ্ত, লিনিয়ার জেনারেটর হিসাবে)।|G|G(s)

মনে রাখবেন যে বাস্তবে, এলোমেলো সংখ্যা জেনারেটরের আক্রমণ বর্ণিত হিসাবে নেই: এগুলি ব্যর্থ হতে পারে বা অসম্পূর্ণ ফলাফল তৈরি করতে পারে । সেক্ষেত্রে আপনি আলগোরিদিমটি এমনভাবে খাপ খাইয়ে নিতে পারেন যাতে এটি ফিরে আসে যখন আক্রমণটির ফলাফল অসন্তুষ্টিজনক হয়। একই মন্তব্যটি সংক্ষেপণ অ্যালগরিদমের জন্য যায়।|s|

এই পদ্ধতির হিসাবে কম্প্রেশন আলগোরিদিম বিরোধিতা করার সতর্কীকরণ যে কম্প্রেশন আলগোরিদিম সাধারণভাবে আরো অনেক কিছু কম্পিউটিং কেসি হিসাবে তারা কাজ মতন হয় উপযুক্ত হয় কোনো , স্ট্রিং যেহেতু আক্রমনের শুধুমাত্র কাজ যদি করতে ইমেজ হতে হবে জি ( খুব সম্ভাবনা )।sG


7

p(x)logp(x)

এ কারণেই কোলমোগোরভ জটিলতা এত আকর্ষণীয়, কারণ এটি চূড়ান্ত সংকোচনের অ্যালগরিদম (যিনি যাইহোক সংক্ষেপণের বিষয়ে যত্নশীল) নয়, কারণ এটি চূড়ান্ত শেখার অ্যালগরিদম। সংক্ষিপ্তকরণ এবং শেখার মূলত একই জিনিস: আপনার ডেটাতে নিদর্শনগুলি খুঁজে পাওয়া। এই ধারণার উপর নির্মিত পরিসংখ্যান কাঠামোটিকে ন্যূনতম বিবরণ দৈর্ঘ্য বলা হয় এবং এটি সরাসরি কলমোগোরভ জটিলতায় অনুপ্রাণিত হয়েছিল।

সিস্টি স্ট্যাকএক্সচেঞ্জ এ এই প্রশ্নটিও দেখুন ।


5

ব্যাকরণ কোডিং একটি এর কম ঘন ঘন ব্যবহৃত সংস্করণ সংক্ষেপণ অ্যালগরিদমের এবং কোলমোগোরভ জটিলতার "রুক্ষ" অনুমান হিসাবে নেওয়া যেতে পারে। ব্যাকরণ কোডিং সাধারণভাবে কোনও সংক্ষেপণ অ্যালগরিদম হিসাবে ব্যবহৃত হয় না যেমন সাধারণ অন্যান্য পদ্ধতির যেমন টেক্সট ভিত্তিক কর্পাসগুলিতে লেপেল-জিভ থেকে সংকোচনের ক্ষেত্রে খুব বেশি উন্নতি হয় না, তবে এটি অন্যান্য ধরণের ডেটাতে ভাল করতে পারে। ব্যাকরণ নিয়ম ব্যবহার করে একটি স্ট্রিং "সংকুচিত" করার ধারণাটি। ব্যাকরণের ডাইরিভেশনটির ফলস্বরূপ একটি ডিএজি (বনাম কম জটিল গাছ) তৈরি হতে পারে তাই যথেষ্ট প্রতিনিধিত্বমূলক জটিলতা সম্ভব।

আরেকটি বিকল্প হ'ল ছোট / সর্বনিম্ন সার্কিটগুলি খুঁজে পাওয়া একটি স্ট্রিং প্রতিনিধিত্বকারী তবে এটি গণনার খুব বেশি জটিলতা হিসাবে পরিচিত এবং এটি কেবল ছোট স্ট্রিংগুলিতেই সাফল্য অর্জন করতে পারে।

সাধারণত কোন অনুমানের পরিমাণ গণনা করতে আসেকে(এক্স) জটিলতর।

কে(এক্স)

লেম্পেল-জিভ ছাড়াও অন্যান্য সংক্ষেপণ অ্যালগরিদম পদ্ধতি রয়েছে "রান দৈর্ঘ্যের এনকোডিং" টাইপ পদ্ধতির উদাহরণস্বরূপ ভেক্টর বীজগণিত এবং এসভিডি সংক্ষেপণ অ্যালগরিদম হিসাবে ব্যবহার করা যেতে পারে। এছাড়াও ফুরিয়ার ট্রান্সফর্মগুলি ঘন ঘন চিত্রগুলি সংক্ষেপণের জন্য ব্যবহার করা হয় যেমন জেপিজি স্ট্যান্ডার্ড।


1
অবশ্যই, সংক্ষেপণটি আসলে একটি অনুমান হিসাবে গণনা করতে ক্ষয়হীন হতে হবে কে(এক্স)। আমি নিশ্চিত যে জেপিজিতে ফুরিয়ার রূপান্তর ক্ষতিকারক (তবে আমি কোনও বিশেষজ্ঞ নই)।
কোডি

ভাল পয়েন্ট তবে ক্ষতিকারক অ্যালগরিদমে সাধারণত একটি নিয়মিত প্যারামিটার থাকে যা "ক্ষয়ক্ষতি" নির্ধারণ করে এবং তাত্ত্বিকভাবে পর্যাপ্ত "শর্তাদি" বা "ফ্রিকোয়েন্সি" বলতে বলতে লসলেস অর্জন করতে পারে এবং এটি ইনপুট নমুনাগুলির উপরও নির্ভর করে যেমন লসলেস প্যারামিটার মান নির্ভর করবে তাদের "আপেক্ষিক ক্রম বনাম
এলোমেলোভাবে

1
@ কোডি এবং ভিজেএন: উত্তরের জন্য ধন্যবাদ, আপনি আমার পিএইচডি
লসলেস

জেপিজি ডিটিটি ব্যবহার করে, ডিএফটি নয়।
এভিল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.