বাইনারি বনাম এএসসিআইআই ফাইলের আকার


17

আমাকে একটি গণনা থেকে কিছু তথ্য লিখতে হবে, যা পরবর্তীতে প্যারাভিউ (.vtu বা vtk ফাইল) দ্বারা পড়তে হবে।

যখন ফাইল আকারে আসে, আমি কি ASCII ফর্ম্যাট বা বাইনারি বিন্যাসে যাব?

উত্তর:


20

যদি আপনার একমাত্র উদ্বেগ ফাইলের আকার হয় তবে আপনি বাইনারি ফাইলগুলি চান। উদাহরণস্বরূপ উদাহরণস্বরূপ, ধরে নেওয়া যাক আপনি কোনও ফাইলটিতে 1 ডাবল নির্ভুলতা ভাসমান পয়েন্ট নম্বর লিখছেন। আসুন ধরে নেওয়া যাক ফাইল সিস্টেমটি এটি পুরোপুরি পরিচালনা করতে পারে এবং ফাইল, শিরোনাম এবং প্যাডিং সবই 0 করে।

বাইনারি ফাইলের জন্য, সেই সংখ্যাটি র‌্যামের সংখ্যা বা 8 বাইটের সঠিক আকারটি নিতে পারে।

এএসসিআইআই ফর্ম্যাটে এটি ধারণ করবে:

  • বেস 16 সংখ্যার
  • দশমিকের জন্য 1 পিরিয়ড
  • এক্সপোঞ্জারটি সীমিত করতে 1 চর
  • উদ্দিষ্টের সাইন ইন করার জন্য 1 চর
  • ঘাতক জন্য 2-3 চর

ধরে নিচ্ছি যে এটি কোনও অক্ষরের জন্য কেবল 1 বাইট ব্যবহার করে, এটি একই সংখ্যাটি ধরে রাখতে 22 বাইট। এটি সংখ্যার মধ্যে (যেহেতু কমপক্ষে কমপক্ষে 1) কমিয়ে আনতে প্রয়োজনীয় অক্ষরগুলি গণনা করে না। সুতরাং ASCII ফর্ম্যাটের জন্য ফাইলের আকারটি প্রায় 3 গুণ বেশি হবে be

সঞ্চিত ফাইলগুলিতে নির্ভুলতার জন্য আপনি ফাইল আকারে বাণিজ্য করতে পারেন (কেবল বেসে 5-6 সংখ্যা রাখুন), তবে এটি আপনি কী ব্যবহার করছেন তার উপর নির্ভর করে। ASCII এর প্রধান সুবিধা হ'ল মানব পাঠযোগ্য ডেটা ডিবাগিং বা উত্পাদন করা।


3
দীর্ঘমেয়াদী সংরক্ষণাগার এবং নির্ভরযোগ্য শেয়ারিং বৈজ্ঞানিক অঙ্গনেও গুরুত্বপূর্ণ, এ কারণেই এটি অদক্ষতা থাকা সত্ত্বেও, ASCII CSV এতটাই প্রচলিত এবং প্রস্তাবিত (পিডিএফ)
হর্চলার

2
আরেকটি দরকারী বিষয় হ'ল যদিও ASCII সিএসভি এনকোডিং খুব দক্ষ নয় তবে আপনার আসকি ফাইলটিতে একটি ফাইল সংক্ষেপণ ইউটিলিটি (যেমন জিপ, জিজিপ, ইত্যাদি) ব্যবহার করা সাধারণত ফাইলের আকারটিকে বাইনারি ফাইলের আকারের মতো কিছুতেই নামিয়ে আনবে ।
ব্রায়ান বোর্চারস

3
সতর্ক থাকুন কারণ কিছু ইনপুট / আউটপুট লাইব্রেরি আপনার ASCII এ আইইইই ডাবল যথার্থ সংখ্যাগুলি আউটপুট হিসাবে বিট প্রজননযোগ্যতার জন্য বিট পাওয়ার জন্য যথেষ্ট পরিমাণে সতর্ক নয় এবং আমার সে অভিজ্ঞতাতে, 17 বা 18 দশমিক সংখ্যা ব্যবহার করা কখনও কখনও সুরক্ষার জন্য প্রয়োজনীয় ।
ব্রায়ান বোর্চারস

5
হার্চলারের মন্তব্য সম্পর্কিত: আমি নিশ্চিত যে খুব ভালভাবে ব্যবহার করা হয়েছে, এইচডিএফ 5 এর মতো স্ট্যান্ডার্ডযুক্ত ওপেন বাইনারি ফর্ম্যাটগুলি দীর্ঘ সময়ের জন্য থাকবে। এটি আমি ব্যক্তিগতভাবে সুপারিশ করব।
AlexE

1
যথার্থতা, সংক্ষিপ্ততা, মনের শান্তি এবং (বিশেষত) গতির জন্য আমি যখনই সম্ভব বাইনারিগুলিতে স্থির থাকি। তারপরে আমার যদি আরও কমপ্যাক্টনেস প্রয়োজন হয় তবে আমি এটি জিপ করতে পারি। আমার যদি বিষয়বস্তুটি দৃষ্টিভঙ্গি পড়তে সক্ষম হয় তবে আমি এটির জন্য একটি ছোট প্রোগ্রাম লিখতে পারি। অন্যদিকে, যদি এটি চাক্ষুষ হওয়া আরও বেশি গুরুত্বপূর্ণ এবং সহজেই এক্সেল, আর ইত্যাদির মতো এলোমেলো প্রোগ্রামগুলিতে চলে যায় তবে CSV যাওয়ার উপায় to
মাইক ডুনলাভে

15

অনুশীলনে, আপনার ভিজ্যুয়ালাইজেশন ফাইলগুলিতে খুব কমই ডেটার প্রয়োজন যা 3 টি বৈধ সংখ্যার চেয়ে বেশি সঠিক বলে more সেক্ষেত্রে ASCII হ'ল - সম্ভবত আশ্চর্যরকম - প্রায়শই বাইনারি ফর্মের চেয়ে কমপ্যাক্ট। আপনি যদি সংরক্ষণাগার সংরক্ষণের কথা ভাবছেন, তবে এই ASCII ফাইলগুলিকে bzip-ing করা সম্ভবত আপনি যে ক্ষুদ্রতম ফাইলগুলি পেতে পারেন তা পেতে চলেছে।

এতে বলা হয়েছে, প্যারাভিউ ভিটিইউ ফর্ম্যাটটি পড়ে যা একটি সংকীর্ণ বাইনারি ফর্ম (এক্সএমএল-ভিত্তিক, তবে ডেটা প্রথমে লিব্জ-সংকুচিত হয় এবং তারপরে ASCII পাঠ্য উত্পন্ন করতে আবার ইউউনকোড হয়)। সাধারণ ফাইলগুলিতে এটি 4-10 এর একটি ফ্যাক্টর সংরক্ষণ করে। বড় ফাইলগুলির জন্য, এটি অবশ্যই যাওয়ার উপায়।


2
অন্যান্য উত্তরের বিপরীতে আমি এটিকে ভোট দিয়েছি। আমার পক্ষে কোনও মতই দৃ strong় মতামত নেই, তবে এখানে একটি ভাল বক্তব্য থাকতে হবে।
বিল বার্থ

বিকল্পভাবে, স্পষ্টভাবে কম বিটগুলি শূন্য করুন এবং বাইনারি সংকোচনের করুন।
জেড ব্রাউন

বাহ, এর জন্য বেশ কিছুটা বিট-ফিডিং লাগবে। বা আছে যে কর্ম আছে? (ডাবল ভাসা ভোটদান চেয়ে এবং ফিরে অন্য।)
উলফগ্যাং Bangerth
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.