উচ্চ লোড গড়, উচ্চ অপেক্ষা, dmesg অভিযান ত্রুটি বার্তা (ডেবিয়ান এনএফএস সার্ভার)


8

অভিযান সহ এইচপি প্রলিয়েন্টে (2 সিপিইউ) ডেবিয়ান 6 (2 * 1.5T RAID1 + 2 * 2 টি RAID1 3.5.5 তৈরি করতে RAID0 এ যোগ দিয়েছে) মূলত এনএফএস এবং ইমামপিডি (উইন্ডোজ শেয়ারের জন্য সাম্বা এবং ওয়েব পৃষ্ঠাগুলির প্রাকদর্শন করার জন্য স্থানীয় www); স্থানীয় উবুন্টু ডেস্কটপ ক্লায়েন্ট মাউন্টিং সহ OME হোম, ল্যাপটপগুলি এনএফএস / এসএমবি এর মাধ্যমে ইমেপ এবং বিজোড় ফাইলগুলি (যেমন ভিডিও) অ্যাক্সেস করছে; হোম রাউটার / স্যুইচের মাধ্যমে 100baseT বা ওয়াইফাই সংযুক্ত বাক্সগুলি

uname -a

Linux prole 2.6.32-5-686 #1 SMP Wed Jan 11 12:29:30 UTC 2012 i686 GNU/Linux

সেটআপ কয়েক মাস ধরে কাজ করছে তবে মাঝেমধ্যে খুব ধীর হয়ে যাওয়ার প্রবণতা রয়েছে (ডেস্কটপে মাউন্টিংয়ের ব্যবহারকারীর অভিজ্ঞতা server সার্ভার থেকে হোমোম, বা ল্যাপটপ প্লে ভিডিওগুলি) এবং এখন ধারাবাহিকভাবে এতটা খারাপ হয়েছে যা ভুল আছে তা আবিষ্কার করার জন্য আমাকে এটির মধ্যে ডুবে যেতে হয়েছিল (! )

সার্ভারটি কম লোডে ঠিক আছে যেমন (ল্যাপটপ) ক্লায়েন্ট (স্থানীয় ডিস্কে OME HOM সহ) সার্ভারের ইমপ্যাডের সাথে সংযুক্ত হচ্ছে এবং 1 ফাইল অ্যাক্সেসের জন্য এনএফএস মাউন্ট করা RAID: শীর্ষ দেখায় ~ 0.1 বা তারও কম, 0 অপেক্ষা

কিন্তু যখন (ডেস্কটপ) ক্লায়েন্ট $ হোম মাউন্ট করে এবং ব্যবহারকারী কে-ডি-কে সেশন শুরু করে (সমস্ত অ্যাক্সেসিং সার্ভার) তারপরে শীর্ষস্থানীয় শো যেমন shows

top - 13:41:17 up  3:43,  3 users,  load average: 9.29, 9.55, 8.27
Tasks: 158 total,   1 running, 157 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.4%us,  0.4%sy,  0.0%ni, 49.0%id, 49.7%wa,  0.0%hi,  0.5%si,  0.0%st
Mem:    903856k total,   851784k used,    52072k free,   171152k buffers
Swap:        0k total,        0k used,        0k free,   476896k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                     
 3935 root      20   0  2456 1088  784 R    2  0.1   0:00.02 top                                                                                                         
    1 root      20   0  2028  680  584 S    0  0.1   0:01.14 init                                                                                                        
    2 root      20   0     0    0    0 S    0  0.0   0:00.00 kthreadd                                                                                                    
    3 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/0                                                                                                 
    4 root      20   0     0    0    0 S    0  0.0   0:00.12 ksoftirqd/0                                                                                                 
    5 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/0                                                                                                  
    6 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/1                                                                                                 
    7 root      20   0     0    0    0 S    0  0.0   0:00.16 ksoftirqd/1                                                                                                 
    8 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/1                                                                                                  
    9 root      20   0     0    0    0 S    0  0.0   0:00.42 events/0                                                                                                    
   10 root      20   0     0    0    0 S    0  0.0   0:02.26 events/1                                                                                                    
   11 root      20   0     0    0    0 S    0  0.0   0:00.00 cpuset                                                                                                      
   12 root      20   0     0    0    0 S    0  0.0   0:00.00 khelper                                                                                                     
   13 root      20   0     0    0    0 S    0  0.0   0:00.00 netns                                                                                                       
   14 root      20   0     0    0    0 S    0  0.0   0:00.00 async/mgr                                                                                                   
   15 root      20   0     0    0    0 S    0  0.0   0:00.00 pm                                                                                                          
   16 root      20   0     0    0    0 S    0  0.0   0:00.02 sync_supers                                                                                                 
   17 root      20   0     0    0    0 S    0  0.0   0:00.02 bdi-default                                                                                                 
   18 root      20   0     0    0    0 S    0  0.0   0:00.00 kintegrityd/0                                                                                               
   19 root      20   0     0    0    0 S    0  0.0   0:00.00 kintegrityd/1                                                                                               
   20 root      20   0     0    0    0 S    0  0.0   0:00.02 kblockd/0                                                                                                   
   21 root      20   0     0    0    0 S    0  0.0   0:00.08 kblockd/1                                                                                                   
   22 root      20   0     0    0    0 S    0  0.0   0:00.00 kacpid                                                                                                      
   23 root      20   0     0    0    0 S    0  0.0   0:00.00 kacpi_notify                                                                                                
   24 root      20   0     0    0    0 S    0  0.0   0:00.00 kacpi_hotplug                                                                                               
   25 root      20   0     0    0    0 S    0  0.0   0:00.00 kseriod                                                                                                     
   28 root      20   0     0    0    0 S    0  0.0   0:04.19 kondemand/0                                                                                                 
   29 root      20   0     0    0    0 S    0  0.0   0:02.93 kondemand/1                                                                                                 
   30 root      20   0     0    0    0 S    0  0.0   0:00.00 khungtaskd                                                                                                  
   31 root      20   0     0    0    0 S    0  0.0   0:00.18 kswapd0                                                                                                     
   32 root      25   5     0    0    0 S    0  0.0   0:00.00 ksmd                                                                                                        
   33 root      20   0     0    0    0 S    0  0.0   0:00.00 aio/0                                                                                                       
   34 root      20   0     0    0    0 S    0  0.0   0:00.00 aio/1                                                                                                       
   35 root      20   0     0    0    0 S    0  0.0   0:00.00 crypto/0                                                                                                    
   36 root      20   0     0    0    0 S    0  0.0   0:00.00 crypto/1                                                                                                    
  203 root      20   0     0    0    0 S    0  0.0   0:00.00 ksuspend_usbd                                                                                               
  204 root      20   0     0    0    0 S    0  0.0   0:00.00 khubd                                                                                                       
  205 root      20   0     0    0    0 S    0  0.0   0:00.00 ata/0                                                                                                       
  206 root      20   0     0    0    0 S    0  0.0   0:00.00 ata/1                                                                                                       
  207 root      20   0     0    0    0 S    0  0.0   0:00.14 ata_aux                                                                                                     
  208 root      20   0     0    0    0 S    0  0.0   0:00.01 scsi_eh_0  

dmesg পরামর্শ দেয় একটি ডিস্ক সমস্যা আছে:

.............. (previous episode)
[13276.966004] raid1:md0: read error corrected (8 sectors at 489900360 on sdc7)
[13276.966043] raid1: sdb7: redirecting sector 489898312 to another mirror

[13279.569186] ata4.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[13279.569211] ata4.00: irq_stat 0x40000008
[13279.569230] ata4.00: failed command: READ FPDMA QUEUED
[13279.569257] ata4.00: cmd 60/08:00:00:6a:05/00:00:23:00:00/40 tag 0 ncq 4096 in
[13279.569262]          res 41/40:00:05:6a:05/00:00:23:00:00/40 Emask 0x409 (media error) <F>
[13279.569306] ata4.00: status: { DRDY ERR }
[13279.569321] ata4.00: error: { UNC }
[13279.575362] ata4.00: configured for UDMA/133
[13279.575388] ata4: EH complete
[13283.169224] ata4.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[13283.169246] ata4.00: irq_stat 0x40000008
[13283.169263] ata4.00: failed command: READ FPDMA QUEUED
[13283.169289] ata4.00: cmd 60/08:00:00:6a:05/00:00:23:00:00/40 tag 0 ncq 4096 in
[13283.169294]          res 41/40:00:07:6a:05/00:00:23:00:00/40 Emask 0x409 (media error) <F>
[13283.169331] ata4.00: status: { DRDY ERR }
[13283.169345] ata4.00: error: { UNC }
[13283.176071] ata4.00: configured for UDMA/133
[13283.176104] ata4: EH complete
[13286.224814] ata4.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[13286.224837] ata4.00: irq_stat 0x40000008
[13286.224853] ata4.00: failed command: READ FPDMA QUEUED
[13286.224879] ata4.00: cmd 60/08:00:00:6a:05/00:00:23:00:00/40 tag 0 ncq 4096 in
[13286.224884]          res 41/40:00:06:6a:05/00:00:23:00:00/40 Emask 0x409 (media error) <F>
[13286.224922] ata4.00: status: { DRDY ERR }
[13286.224935] ata4.00: error: { UNC }
[13286.231277] ata4.00: configured for UDMA/133
[13286.231303] ata4: EH complete
[13288.802623] ata4.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[13288.802646] ata4.00: irq_stat 0x40000008
[13288.802662] ata4.00: failed command: READ FPDMA QUEUED
[13288.802688] ata4.00: cmd 60/08:00:00:6a:05/00:00:23:00:00/40 tag 0 ncq 4096 in
[13288.802693]          res 41/40:00:05:6a:05/00:00:23:00:00/40 Emask 0x409 (media error) <F>
[13288.802731] ata4.00: status: { DRDY ERR }
[13288.802745] ata4.00: error: { UNC }
[13288.808901] ata4.00: configured for UDMA/133
[13288.808927] ata4: EH complete
[13291.380430] ata4.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
[13291.380453] ata4.00: irq_stat 0x40000008
[13291.380470] ata4.00: failed command: READ FPDMA QUEUED
[13291.380496] ata4.00: cmd 60/08:00:00:6a:05/00:00:23:00:00/40 tag 0 ncq 4096 in
[13291.380501]          res 41/40:00:05:6a:05/00:00:23:00:00/40 Emask 0x409 (media error) <F>
[13291.380577] ata4.00: status: { DRDY ERR }
[13291.380594] ata4.00: error: { UNC }
[13291.386517] ata4.00: configured for UDMA/133
[13291.386543] ata4: EH complete
[13294.347147] ata4.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0

[13294.347169] ata4.00: irq_stat 0x40000008
[13294.347186] ata4.00: failed command: READ FPDMA QUEUED
[13294.347211] ata4.00: cmd 60/08:00:00:6a:05/00:00:23:00:00/40 tag 0 ncq 4096 in
[13294.347217]          res 41/40:00:06:6a:05/00:00:23:00:00/40 Emask 0x409 (media error) <F>
[13294.347254] ata4.00: status: { DRDY ERR }
[13294.347268] ata4.00: error: { UNC }
[13294.353556] ata4.00: configured for UDMA/133
[13294.353583] sd 3:0:0:0: [sdc] Unhandled sense code
[13294.353590] sd 3:0:0:0: [sdc] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[13294.353599] sd 3:0:0:0: [sdc] Sense Key : Medium Error [current] [descriptor]
[13294.353610] Descriptor sense data with sense descriptors (in hex):
[13294.353616]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
[13294.353635]         23 05 6a 06 
[13294.353644] sd 3:0:0:0: [sdc] Add. Sense: Unrecovered read error - auto reallocate failed
[13294.353657] sd 3:0:0:0: [sdc] CDB: Read(10): 28 00 23 05 6a 00 00 00 08 00
[13294.353675] end_request: I/O error, dev sdc, sector 587557382
[13294.353726] ata4: EH complete
[13294.366953] raid1:md0: read error corrected (8 sectors at 489900544 on sdc7)
[13294.366992] raid1: sdc7: redirecting sector 489898496 to another mirror

এবং এগুলি বেশ ঘন ঘন ঘটছে, যা আমার ধারণা পারফরম্যান্স সমস্যার জন্য দায়বদ্ধ? (?)

# dmesg | গ্রেপ আয়না

[12433.561822] raid1: sdc7: redirecting sector 489900464 to another mirror
[12449.428933] raid1: sdb7: redirecting sector 489900504 to another mirror
[12464.807016] raid1: sdb7: redirecting sector 489900512 to another mirror
[12480.196222] raid1: sdb7: redirecting sector 489900520 to another mirror
[12495.585413] raid1: sdb7: redirecting sector 489900528 to another mirror
[12510.974424] raid1: sdb7: redirecting sector 489900536 to another mirror
[12526.374933] raid1: sdb7: redirecting sector 489900544 to another mirror
[12542.619938] raid1: sdc7: redirecting sector 489900608 to another mirror
[12559.431328] raid1: sdc7: redirecting sector 489900616 to another mirror
[12576.553866] raid1: sdc7: redirecting sector 489900624 to another mirror
[12592.065265] raid1: sdc7: redirecting sector 489900632 to another mirror
[12607.621121] raid1: sdc7: redirecting sector 489900640 to another mirror
[12623.165856] raid1: sdc7: redirecting sector 489900648 to another mirror
[12638.699474] raid1: sdc7: redirecting sector 489900656 to another mirror
[12655.610881] raid1: sdc7: redirecting sector 489900664 to another mirror
[12672.255617] raid1: sdc7: redirecting sector 489900672 to another mirror
[12672.288746] raid1: sdc7: redirecting sector 489900680 to another mirror
[12672.332376] raid1: sdc7: redirecting sector 489900688 to another mirror
[12672.362935] raid1: sdc7: redirecting sector 489900696 to another mirror
[12674.201177] raid1: sdc7: redirecting sector 489900704 to another mirror
[12698.045050] raid1: sdc7: redirecting sector 489900712 to another mirror
[12698.089309] raid1: sdc7: redirecting sector 489900720 to another mirror
[12698.111999] raid1: sdc7: redirecting sector 489900728 to another mirror
[12698.134006] raid1: sdc7: redirecting sector 489900736 to another mirror
[12719.034376] raid1: sdc7: redirecting sector 489900744 to another mirror
[12734.545775] raid1: sdc7: redirecting sector 489900752 to another mirror
[12734.590014] raid1: sdc7: redirecting sector 489900760 to another mirror
[12734.624050] raid1: sdc7: redirecting sector 489900768 to another mirror
[12734.647308] raid1: sdc7: redirecting sector 489900776 to another mirror
[12734.664657] raid1: sdc7: redirecting sector 489900784 to another mirror
[12734.710642] raid1: sdc7: redirecting sector 489900792 to another mirror
[12734.721919] raid1: sdc7: redirecting sector 489900800 to another mirror
[12734.744732] raid1: sdc7: redirecting sector 489900808 to another mirror
[12734.779330] raid1: sdc7: redirecting sector 489900816 to another mirror
[12782.604564] raid1: sdb7: redirecting sector 1242934216 to another mirror
[12798.264153] raid1: sdc7: redirecting sector 1242935080 to another mirror
[13245.832193] raid1: sdb7: redirecting sector 489898296 to another mirror
[13261.376929] raid1: sdb7: redirecting sector 489898304 to another mirror
[13276.966043] raid1: sdb7: redirecting sector 489898312 to another mirror
[13294.366992] raid1: sdc7: redirecting sector 489898496 to another mirror

যদিও অ্যারেগুলি এখনও সমস্ত ডিস্কে চলছে - সেগুলি এখনও ছাড়েনি:

# বিড়াল / প্রকল্প / এমডিস্ট্যাট

Personalities : [raid1] [raid0] 
md10 : active raid0 md0[0] md1[1]
      3368770048 blocks super 1.2 512k chunks

md1 : active raid1 sde2[2] sdd2[1]
      1464087824 blocks super 1.2 [2/2] [UU]

md0 : active raid1 sdb7[0] sdc7[2]
      1904684920 blocks super 1.2 [2/2] [UU]

unused devices: <none>

সুতরাং আমি মনে করি সমস্যাটি আমার কী আছে সে সম্পর্কে আমার কিছু ধারণা আছে তবে আমি কল্পনাটির দূরবর্তী অংশের দ্বারা কোনও লিনাক্স সিসাদমিন বিশেষজ্ঞ নই এবং আমার নির্ণয়ের সাথে এখানে কিছু ক্লু চেক করা সত্যই প্রশংসা করব এবং আমার কী করা দরকার:

  1. স্পষ্টতই আমার এসডিসির জন্য অন্য ড্রাইভ উত্স করা দরকার। (আমি অনুমান করছি দাম ঠিক থাকলে আমি আরও বড় ড্রাইভ কিনতে পারব: আমি ভাবছি যে একদিন আমাকে অ্যারের আকার বাড়ানো দরকার এবং এটি একটি বৃহত্তর সাথে প্রতিস্থাপনের জন্য একটি কম ড্রাইভ হবে))
  2. তারপরে বিদ্যমান এসডিসি ব্যর্থ করতে, এটি সরিয়ে ফেলতে এবং নতুন ড্রাইভের জন্য ফিট করতে এমডিএডএম ব্যবহার করুন
  3. পুরানোটির মতো অ্যারের জন্য একই আকারের পার্টিশন সহ নতুন ড্রাইভটি এডডিস্ক করুন
  4. অ্যারেতে নতুন ড্রাইভ যুক্ত করতে m دادm ব্যবহার করুন

ঠিক আছে?


1
হ্যাঁ, আপনার পরিকল্পনা স্পট রয়েছে।
মিলিগ্রোভেন

2
আমি আপনার লগগুলিতে উপরে এসডিবি এবং এসডিসিতে ত্রুটিগুলি দেখছি। আপনার ডিস্কগুলিতে স্মার্ট পরীক্ষা চালানো (এখন এবং নিয়মিত) সেরা। আমার নিজস্ব রাইড-অ্যারে এবং ডিস্কগুলিতে আমি সাধারণত সমস্ত ডিস্কগুলিতে সাপ্তাহিক 'স্মার্টলেট-দীর্ঘ দীর্ঘ' চেকগুলি চালাই। ত্রুটি এবং ব্যর্থ ডিস্কগুলি তখন দ্রুত পাওয়া যায়।
সিগ-আইও

1) একটি নতুন ড্রাইভ পান, সেই অনুযায়ী এটি বিভাজন করুন 2) এমডডএম - এডিডি / দেব / এমডিএক্স / দেব / এসডিএক্স 1) অপেক্ষা করুন
সিগ-আইও

1
iotop খুব ভবিষ্যতে আপনি সাহায্য করতে পারেন: apt-get install iotop
grs

3
আমি ধরে নিলাম আপনার পরিকল্পনাটি আশানুরূপভাবে কার্যকর হয়েছে। আপনার পোস্টটিতে হোঁচট খেতে পারে এমন অন্য পাঠকদের সহায়তা করার জন্য আপনি কি নিজের প্রশ্নের উত্তর একটি সংক্ষিপ্ত প্রতিবেদনে দিয়ে দিতে পারেন?
দিমিত্রি চুবারভ

উত্তর:


1

সাধারণত যখন আপনি দেখছেন ঠিক তেমন ডিস্ক ত্রুটি রয়েছে তখন ডিস্কটি নিজেই ত্রুটিটি চেষ্টা করে সংশোধন করার জন্য একটি মুহুর্তের জন্য বিরতি দেয় এবং লিনাক্স RAID যতটা ডিস্ক অপ্রত্যাশিত হয় ততক্ষণ এটি অপ্রত্যাশিত হয় until এই ডিস্কটি থামিয়ে দেওয়া হতে পারে যা ধীরে ধীরে হ্রাস পাচ্ছে (বিশেষত ত্রুটি হারে যা আপনি দেখছেন)।

আপনার ড্রাইভটি প্রতিস্থাপনের পরিকল্পনাটি সঠিক। যাইহোক, আমি প্রতিস্থাপন RAID এর জন্য পার্টিশন অংশের ধারণার সাথে আরও বড় চালক পাওয়ার পরামর্শ দেব না এবং তারপরে পরবর্তীতে অন্য কিছু ব্যবহারের জন্য অংশ নেব। অ্যারে অবিচ্ছিন্ন রাখতে কেবল মূল ডিস্কের (আকার এবং গতি) কাছাকাছি যাওয়া আরও বুদ্ধিমানের কাজ হবে। এটি বলেছিল, আপনি তাত্ত্বিকভাবে আরও বড় হয়ে যান এবং অ্যারের প্রতিস্থাপনের জন্য সঠিক প্রতিস্থাপনের আকারটি ভাগ করুন এবং তারপরে অন্য কোনও বিভাগের জন্য (এমনকি একটি অ্যারের অন্য সদস্য )ও ভাগ করুন।

একটি পার্শ্ব নোট যা ডিবাগিংয়ে সহায়তা করতে পারে: শীর্ষে প্রতিস্থাপন হিসাবে আমি যে সরঞ্জামটি ব্যবহার করতে চাই তার নাম atop ( http://www.atoptool.nl/ ) বলা হয় এবং এটি আপনাকে ডিস্ক আই ব্যবহার করে প্রতিটি ডিস্ক এবং প্রক্রিয়াগুলিতে আরও ভিজ্যুয়ালাইজেশন দিতে পারে may / O এবং যেখানে বাধা রয়েছে (আপনি খেয়াল করতে পারেন যে অপেক্ষা করতে হবে I / O সমস্যাযুক্ত নির্দিষ্ট ডিস্কের জন্য)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.