এখানে কেন্দ্রীয় ধারণাটি হ'ল কোলমোগোরভ জটিলতা এবং আরও নির্দিষ্টভাবে সংকোচনের । Compressibility একটি স্বজ্ঞামূলক অনুভূতি পেতে, দুটি স্ট্রিং বিবেচনা এবং , যেখানে । দিন B ∈ B ∗ B = { 0 , 1 }A∈B∗B∈B∗B={0,1}
1010 1010 1010A=1010 1010 1010 1010 , এবং
0110 0111 1001B=1011 0110 0111 1001 ।
নোট করুন । বা কতটা তথ্য রয়েছে তা আমরা কীভাবে প্রমাণ করতে পারি ? আমরা যদি শাস্ত্রীয় তথ্য তত্ত্ব সম্পর্কে ভাবি, সাধারণভাবে, দৈর্ঘ্যের এর একটি স্ট্রিং প্রেরণ করতে গড়ে বিট লাগে । তবে আমরা বলতে পারি না কতগুলি বিট আমরা একটি প্রেরণ করতে প্রয়োজন নির্দিষ্ট দৈর্ঘ্যের স্ট্রিং ।এ বি এন এন এন|A|=|B|=16ABnnn
কেন এলোমেলো স্ট্রিংয়ের তথ্য সামগ্রী শূন্য নয়?
কাছাকাছি চেহারাতে, আমরা দেখতে পারি বাস্তবে । যাইহোক, এটা অনেক বেশি কঠিন যদি বলতে হয় এর পরিকাঠামো যে কোন সুস্পষ্ট নিদর্শন আছে, অন্তত এটা মনে হয় এবং মতানুযায়ী চেয়ে বেশি র্যান্ডম । যেহেতু আমরা একটি প্যাটার্ন খুঁজে পেতে পারেন , আমরা সহজেই কম্প্রেস করতে পারেন এবং কম সঙ্গে এটি প্রতিনিধিত্ব বিট। তেমনি, যেহেতু কোনও নিদর্শন সনাক্ত করা সহজ নয় , তাই আমরা এটিকে এতটা সংকোচ করতে পারি না। সুতরাং আমরা বলতে পারি যে কাছে চেয়ে বেশি তথ্য রয়েছে । তদুপরি, দৈর্ঘ্যের একটি এলোমেলো স্ট্রিং বি এ এ এ 16 বি বি এ এন এনA=108BAAA16BBAnসর্বাধিক তথ্য রয়েছে যেহেতু কোনও উপায় নেই যে আমরা এটি সংকোচন করতে পারি, এবং তাই এটি কম বিট দিয়ে উপস্থাপন করে ।n
তাহলে দরকারী তথ্য কি?
জন্য দরকারী তথ্য , হ্যাঁ, একটা টুরিং মেশিন ব্যবহার করে একটি সংজ্ঞা নেই । দরকারী তথ্য হয়x ∈ বি ∗Tx∈B∗
minT { l(T)+C(x|T):T∈{T0,T1,...}},
যেখানে একটি টুরিং মেশিন জন্য স্ব-সীমাবদ্ধ এনকোডিংয়ের দৈর্ঘ্য বোঝায় । স্বরলিপিটি সাধারণত এমন হয় যে এবং কোলমোগোরভ জটিলতা বোঝায় প্রদত্ত এর শর্তসাপেক্ষে কোলমোগোরভ জটিলতা ।l(T)TC(x)xC(x|y)xy
এখানে মধ্যে থাকা দরকারী তথ্যের পরিমাণকে মূর্ত করে । আমরা যা চাইতে পারি তা হ'ল প্রয়োজনীয়তাকে সন্তুষ্টকারীদের মধ্যে এই জাতীয় নির্বাচন করা। সমস্যাটি হ'ল একটি সংক্ষিপ্ততম প্রোগ্রাম অংশগুলিতে st আলাদা করে একটি উপযুক্ত । এটি আসলে খুব ধারণা যা ন্যূনতম বিবরণ দৈর্ঘ্য (এমডিএল) তৈরি করেছিল ।TxTx∗x∗=pqpT