ডিডি: কীভাবে অনুকূল ব্লকেজ গণনা করবেন? [বন্ধ]


122

একটি চালানোর সময় আপনি কীভাবে অনুকূল ব্লকেজ গণনা করবেন dd? আমি এটি কিছুটা গবেষণা করেছি এবং এটি কীভাবে সম্পন্ন হবে তার পরামর্শ দেওয়ার মতো কিছুই আমি পাইনি।

আমি এই ছাপে আছি যে বৃহত্তর ব্লকসাইজের ফলে দ্রুততর পরিণতি ঘটবে dd... এটি কি সত্য?

আমি প্রায় ddদু'টি অভিন্ন 500 জিবি হিটাচি এইচডিডি যা r২০০rpm তে একটি বাক্সে GB জিবি ডিডিআর ১৩৩৩৩ মেগাহার্টজ র‌্যাম সহ একটি ইন্টেল কোর আই 3 চালাচ্ছে, তাই আমি কী ব্লক ব্যবহার করব তা নির্ধারণ করার চেষ্টা করছি। (আমি একটি ফ্ল্যাশ ড্রাইভ থেকে উবুন্টু ১০.১০ x86 বুট করব এবং সেখান থেকে এটি চালাচ্ছি))


@ MacOS এর জন্য tdg5 উত্তর গৃহীত - macos_dd_ibs_test.sh এবং macos_dd_obs_test.sh
mixel

1
সর্বোত্তম উত্তরটি ddহ'ল ফাইলটি স্থানান্তর করার সময় অনুকূল ব্লকসাইজটি খুঁজে পেতে কোনও বৈশিষ্ট্য অবদান রাখবে
বোরিস

কেন এটিকে বিষয়বস্তু হিসাবে চিহ্নিত করা হয়েছিল এবং সুপারভাইজারে স্থানান্তরিত করা হয়নি?
ব্যবহারকারী 267092

উত্তর:


95

অপ্টিমাল ব্লকের আকার অপারেটিং সিস্টেম (এবং এর সংস্করণ) এবং বিভিন্ন হার্ডওয়্যার বাস এবং ডিস্ক জড়িত সহ বিভিন্ন কারণের উপর নির্ভর করে। বেশ কয়েকটি ইউনিক্সের মতো সিস্টেম (লিনাক্স সহ এবং বিএসডি অন্তত কিছু স্বাদ সহ) st_blksizeসদস্যকে সংজ্ঞায়িত করে struct statযা কার্নেল যা মনে করে তা সর্বোত্তম ব্লকের আকার:

#include <sys/stat.h>
#include <stdio.h>

int main(void)
{
    struct stat stats;

    if (!stat("/", &stats))
    {
        printf("%u\n", stats.st_blksize);
    }
}

সবচেয়ে ভাল উপায় হতে পারে পরীক্ষা করা: বিভিন্ন ব্লকের আকার এবং সময় সহ একটি গিগাবাটি অনুলিপি করুন। (প্রতিটি রান করার আগে কার্নেল বাফার ক্যাশেগুলি সাফ করার কথা মনে রাখবেন echo 3 > /proc/sys/vm/drop_caches:)।

তবে, থাম্বের নিয়ম হিসাবে, আমি দেখতে পেয়েছি যে একটি বৃহত পর্যাপ্ত ব্লকের আকার ddএকটি ভাল কাজ করতে দেয় এবং বলুন যে, 4 কিবি বনাম 64৪ কিবি তুলনায় Ki৪ কিবি এবং ১ এমআইবি মধ্যে পার্থক্য রয়েছে। (যদিও, স্বীকারোক্তি হিসাবে, আমি এটি করার পরে অনেক দিন হয়ে গেছে default আমি এখনই ডিফল্টরূপে একটি মেবিবাইট ব্যবহার করি, বা কেবল ddআকারটি চয়ন করি।)


11
এর উত্তর হিসাবে কখনও গ্রহণ না করায় আমি খুব দুঃখিত ... ধন্যবাদ!
একজা

ক্যাশে ফেলে দেওয়ার কথা স্মরণ করার জন্য দুর্দান্ত পয়েন্ট। এই আমার পরিমাপ গোলযোগ ছিল! (যদিও গৌণ সমস্যা: এটি "ড্রপ_ক্যাচস", একটি আন্ডারস্কোর সহ। দৃশ্যত সম্পাদনাগুলির কমপক্ষে characters টি অক্ষর হওয়া দরকার ... :()
টম

73

অন্যরা যেমন বলেছে, সর্বজনীনভাবে সঠিক ব্লকের আকার নেই; একটি পরিস্থিতির জন্য অনুকূল কি বা হার্ডওয়্যার এক টুকরা অন্যটির জন্য মারাত্মকভাবে অদক্ষ হতে পারে। এছাড়াও, ডিস্কগুলির স্বাস্থ্যের উপর নির্ভর করে "অনুকূল" এর চেয়ে আলাদা ব্লকের আকার ব্যবহার করা ভাল।

আধুনিক হার্ডওয়্যারটিতে একটি জিনিস যা বেশ নির্ভরযোগ্য তা হ'ল 512 বাইটের ডিফল্ট ব্লক আকারটি আরও অনুকূল বিকল্পের চেয়ে ধীরে ধীরে মাত্রার ধীরে ধীরে ক্রম হতে পারে। যখন সন্দেহ হয়, আমি খুঁজে পেয়েছি যে K৪ কে বেশ শক্ত আধুনিক ডিফল্ট। যদিও K৪ কে সাধারণত সর্বোত্তম ব্লকের আকার নয়, আমার অভিজ্ঞতায় এটি ডিফল্টের চেয়ে অনেক বেশি দক্ষ হয়ে ওঠে। K৪ কে-র নির্ভরযোগ্যভাবে পারফরম্যান্ট হওয়ার খুব দৃ history় ইতিহাস রয়েছে: আপনি ইউগ-লগ মেলিং তালিকাটি থেকে একটি বার্তা পেতে পারেন, ২০০২ সালে, K৪ কে-র একটি ব্লকের আকারের প্রস্তাব দিয়ে এখানে http://www.mail-archive.com/eug- lug@efn.org/msg12073.html

সর্বোত্তম আউটপুট ব্লকের আকার নির্ধারণের জন্য, আমি নিম্নলিখিত স্ক্রিপ্টটি লিখেছি যা বিভিন্ন ব্লকের আকারের একটি ডিডিতে একটি 128M টেস্ট ফাইল লেখার পরীক্ষা করে থাকে, 512 বাইটের ডিফল্ট থেকে সর্বোচ্চ 64 এম পর্যন্ত। সতর্কতা অবলম্বন করুন, এই স্ক্রিপ্টটি অভ্যন্তরীণভাবে ডিডি ব্যবহার করে, তাই সাবধানতার সাথে ব্যবহার করুন।

dd_obs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_obs_testfile}
TEST_FILE_EXISTS=0
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi
TEST_FILE_SIZE=134217728

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Calculate number of segments required to copy
  COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))

  if [ $COUNT -le 0 ]; then
    echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests."
    break
  fi

  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Create a test file with the specified block size
  DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null)

  # Extract the transfer rate from dd's STDERR output
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  # Clean up the test file if we created one
  if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

  # Output the result
  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

গিটহাবে দেখুন

আমি এই স্ক্রিপ্টটি কেবল একটি ডেবিয়ান (উবুন্টু) সিস্টেমে এবং ওএসএক্স যোসেমাইটে পরীক্ষা করেছি, সুতরাং অন্যান্য ইউনিক্স স্বাদে কাজ করতে সম্ভবত কিছুটা টুইট করা দরকার।

ডিফল্টরূপে কমান্ডটি বর্তমান ডিরেক্টরিতে dd_obs_testfile নামে একটি পরীক্ষা ফাইল তৈরি করবে । বিকল্পভাবে, আপনি স্ক্রিপ্ট নামের পরে একটি পথ সরবরাহ করে একটি কাস্টম পরীক্ষা ফাইলের জন্য একটি পথ সরবরাহ করতে পারেন:

$ ./dd_obs_test.sh /path/to/disk/test_file

স্ক্রিপ্টের আউটপুট হ'ল পরীক্ষিত ব্লক মাপের তালিকা এবং তাদের মতো স্বতন্ত্র স্থানান্তর হারের তালিকা:

$ ./dd_obs_test.sh
block size : transfer rate
       512 : 11.3 MB/s
      1024 : 22.1 MB/s
      2048 : 42.3 MB/s
      4096 : 75.2 MB/s
      8192 : 90.7 MB/s
     16384 : 101 MB/s
     32768 : 104 MB/s
     65536 : 108 MB/s
    131072 : 113 MB/s
    262144 : 112 MB/s
    524288 : 133 MB/s
   1048576 : 125 MB/s
   2097152 : 113 MB/s
   4194304 : 106 MB/s
   8388608 : 107 MB/s
  16777216 : 110 MB/s
  33554432 : 119 MB/s
  67108864 : 134 MB/s

(দ্রষ্টব্য: স্থানান্তর হারের ইউনিট ওএস দ্বারা পৃথক হবে)

অনুকূল পঠন ব্লক আকার পরীক্ষা করতে, আপনি একই প্রক্রিয়া কমবেশি ব্যবহার করতে পারেন তবে / dev / শূন্য থেকে পড়ার এবং ডিস্কে লেখার পরিবর্তে আপনি ডিস্ক থেকে পড়তে এবং / dev / নালকে লিখতে চাইবেন। এটি করার মতো স্ক্রিপ্টটি দেখতে এরকম হতে পারে:

dd_ibs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_ibs_testfile}
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi
TEST_FILE_SIZE=134217728

# Exit if file exists
if [ -e $TEST_FILE ]; then
  echo "Test file $TEST_FILE exists, aborting."
  exit 1
fi
TEST_FILE_EXISTS=1

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Create test file
echo 'Generating test file...'
BLOCK_SIZE=65536
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Read test file out to /dev/null with specified block size
  DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null)

  # Extract transfer rate
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

গিটহাবে দেখুন

এই ক্ষেত্রে একটি গুরুত্বপূর্ণ পার্থক্য হ'ল টেস্ট ফাইলটি এমন একটি ফাইল যা স্ক্রিপ্ট দ্বারা লিখিত হয়। কোনও বিদ্যমান ফাইলে এই কমান্ডটি নির্দেশ করবেন না বা বিদ্যমান ফাইলটি শূন্যের সাথে ওভাররাইট করা হবে!

আমার বিশেষ হার্ডওয়্যারটির জন্য আমি দেখতে পেয়েছি যে এইচডিডি-তে 128K সর্বাধিক অনুকূল ইনপুট ব্লক আকার এবং এসএসডি-তে 32K সর্বাধিক অনুকূল ছিল।

যদিও এই উত্তরটি আমার বেশিরভাগ অনুসন্ধানগুলি কভার করে, আমি এই পরিস্থিতিতে যথেষ্ট বার এসেছি যে আমি একটি ব্লগ পোস্ট লিখেছিলাম: http://blog.tdg5.com/tuning-dd- block-size/ আপনি আরও সুনির্দিষ্ট পেতে পারেন আমি সেখানে পরীক্ষা করেছি।


1
512 জি এসএসডি সহ 2015 আরএমবিপিতে আমি দ্বিতীয় স্ক্রিপ্টটি পড়েছি, পড়ার পারফরম্যান্স পরীক্ষা করছি। সেরা ব্লকের আকার ছিল 8388608: 3.582 জিবি বাইট / সেকেন্ড
কুইন কমেন্ডেন্ট

1
সংশোধন: আমি 512 জিবি এসএসডি সহ 2015 আরএমবিপিতে পঠন পারফরম্যান্সের পরীক্ষা করে দ্বিতীয় স্ক্রিপ্টটি চালিয়েছি। সেরা ব্লকের আকার ছিল 524288 (5.754 গিগাবাইট / সেকেন্ড)। দ্বিতীয় সেরা ব্লকের আকার ছিল 131072 (5.133 গিগাবাইট / সেকেন্ড)। (আমি আমার শেষ মন্তব্যের জন্য মানগুলি উত্পন্ন করার ক্ষেত্রে ফলাফলগুলি ভুলভাবে
সাজিয়েছি

কারণ dd_obs_test.sh conv=fsyncম্যাকোজে কাজ করে না এবং সরানো যায় be
rynop

আমার অভিজ্ঞতায়, বড় ব্লকের আকারগুলি বেঞ্চমার্কিংয়ের সঠিক হওয়ার জন্য আরও বড় নমুনার প্রয়োজন (বেশ কয়েক সেকেন্ড I'm আমি অনুমান করছি যে কোনও 128 এমবি ফাইলটি তৈরি করা উচিত তবে আমি নিশ্চিত নই)। নিশ্চিত কেন।
রল্ফ

2
শহরবাসী! কি আশ্চর্য উত্তর। এটি সোনার খনি সন্ধানের মতো, এক টন ময়লা খনন করে তারপরে প্রক্রিয়াজাত করা গোল্ড নুগেটটি আমি চাইছিলাম: K৪ কে অনেক ধন্যবাদ।
এসডসোলার

10

আমি আমার সর্বোত্তম ব্লক আকারটি 8 এমবি হতে পেয়েছি (ডিস্ক ক্যাশের সমান?) আমাকে একটি সংকুচিত চিত্র তৈরি করার আগে ডিস্কের ফাঁকা স্থানটি মুছতে হবে (কেউ কেউ বলে: ধোয়া)। আমি ব্যবহার করতাম:

cd /media/DiskToWash/
dd if=/dev/zero of=zero bs=8M; rm zero

আমি 4K থেকে 100M পর্যন্ত মান নিয়ে পরীক্ষা করেছি।

ডিডি কিছুক্ষণ চালিয়ে যাওয়ার পরে আমি এটি (Ctlr + C) মেরে আউটপুট পড়ি:

36+0 records in
36+0 records out
301989888 bytes (302 MB) copied, 15.8341 s, 19.1 MB/s

যেহেতু ডিডি ইনপুট / আউটপুট রেট প্রদর্শন করে (এই ক্ষেত্রে 19.1 এমবি / গুলি) আপনার চয়ন করা মানটি আগেরটির তুলনায় আরও খারাপ আচরণ করছে কিনা তা দেখতে সহজ।

আমার স্কোর:

bs=   I/O rate
---------------
4K    13.5 MB/s
64K   18.3 MB/s
8M    19.1 MB/s <--- winner!
10M   19.0 MB/s
20M   18.6 MB/s
100M  18.6 MB/s   

দ্রষ্টব্য: আপনার ডিস্ক ক্যাশে / বাফার আকারটি কি তা পরীক্ষা করতে আপনি ব্যবহার করতে পারেন sudo hdparm -i /dev/sda


4
আপনি কি একবারে প্রতিটি পরীক্ষা চালিয়েছেন? আমি মনে করি আপনি ≥≥৪ কে থেকে যা দেখতে পাবেন তা হ'ল বাফার ইতিমধ্যে পূর্ণ এবং পার্থক্যটি কেবল এলোমেলো বৈকল্পিক।
ম্যাডস ওয়াই

আমি একবার শুনেছি বড় মূল্যবোধগুলি সম্ভাব্যভাবে সিস্টেমকে বাধা দেয়। ব্যক্তিটি একটি বড় ফাইল নিয়ে কাজ করছিল। আমি এই সম্পর্কে আরও শুনতে পারলে ভাল হবে।
টড পার্টরিজ

1
আমার অভিজ্ঞতাটিও বোধ 8Mকরা কঠিন is
শ্রীধর সারনোবাত

মজাদার. আপনি কি মনে করেন এটি এল 3 ক্যাশে আকারের সাথে সম্পর্কিত কিনা? আমি ভাবছি L3 ক্যাশের চেয়ে ব্লক আকারগুলি আরও ধীর হয়ে যাবে কিনা।
সারপ্রাইজডগ

3

এটি সম্পূর্ণ সিস্টেম নির্ভর। সর্বোত্তম সমাধান সন্ধান করার জন্য আপনার পরীক্ষা করা উচিত। দিয়ে শুরু করার চেষ্টা করুন bs=8388608। (হিটাচি এইচডিডিগুলিতে মনে হয় 8 এমবি ক্যাশে রয়েছে))


5
অর্থাৎ, DD সংস্করণ অনেকটা shorthands গ্রহণ bs=8Mজিএনইউ / লিনাক্স বা bs=8mবাসদ উপর
Pascal

4
লল, ভেবেছিলেন আপনি " bs=8388608প্রতি ধাপে একবার শুরু করার এবং হ্রাস করার চেষ্টা করুন" বলতে যাচ্ছেন
lindhe

1
  • আরও ভাল পারফরম্যান্সের জন্য আপনি সবচেয়ে বড় ব্লকসাইজ ব্যবহার করতে পারবেন যা আপনি র‌্যামকে উপযুক্ত করতে পারবেন (ওএসে কম আই / ও কল পাঠাবে)
  • আরও ভাল নির্ভুলতা এবং ডেটা পুনরুদ্ধারের জন্য ইনপুটটির নেটিভ সেক্টর আকারের ব্লক সাইজ সেট করে

যেমন কনড = নোরের, সিঙ্ক বিকল্পের সাথে ডিডি অনুলিপি করে, এর ফলে যে কোনও ত্রুটির মুখোমুখি হয় তার ফলে ব্লকের বাকী অংশটি শূন্য-বাইট দ্বারা প্রতিস্থাপিত হয়। বৃহত্তর ব্লক আকারগুলি আরও দ্রুত অনুলিপি করবে, তবে প্রতিবার কোনও ত্রুটির সম্মুখীন হওয়ার পরে ব্লকের বাকী অংশগুলি উপেক্ষা করা হবে।

উৎস


1
আমি মনে করি যে যদি লেখার কোনও ত্রুটি হয় তবে আপনার
মাঝারিটি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.