mptscsih: ioc0: কার্য বাতিল


12

I / O আমার সফ্টওয়্যার RAID6 প্রায়শই প্রায় 30 সেকেন্ডের জন্য জমাটবদ্ধ হয় যার পরে সবকিছু স্বাভাবিক হয়ে যায় to

ফ্রিজ শেষ হয়ে যাওয়ার পরে এটিকে সিসলগে লাগানো হয়:

Mar 14 18:43:57 server kernel: [35649.816060] sd 5:0:23:0: [sdy] CDB: Read(10): 28 00 6c 52 68 58 00 04 00 00
Mar 14 18:43:58 server kernel: [35651.149020] mptbase: ioc0: LogInfo(0x31140000): Originator={PL}, Code={IO Executed}, SubCode(0x0000) cb_idx mptscsih_io_done
Mar 14 18:43:58 server kernel: [35651.151962] mptscsih: ioc0: task abort: SUCCESS (rv=2002) (sc=ffff8807b02dfe80)
Mar 14 18:43:58 server kernel: [35651.151967] mptscsih: ioc0: attempting task abort! (sc=ffff88002a7f30c0)
Mar 14 18:43:58 server kernel: [35651.151972] sd 5:0:23:0: [sdy] CDB: Read(10): 28 00 6c 52 6c 58 00 04 00 00
Mar 14 18:43:58 server kernel: [35651.151981] mptscsih: ioc0: task abort: SUCCESS (rv=2002) (sc=ffff88002a7f30c0)
Mar 14 18:43:58 server kernel: [35651.151984] mptscsih: ioc0: attempting task abort! (sc=ffff8804120e5ec0)
Mar 14 18:43:58 server kernel: [35651.151988] sd 5:0:23:0: [sdy] CDB: Read(10): 28 00 6c 52 70 58 00 04 00 00
Mar 14 18:43:58 server kernel: [35651.151996] mptscsih: ioc0: task abort: SUCCESS (rv=2002) (sc=ffff8804120e5ec0)
Mar 14 18:43:58 server kernel: [35651.151999] mptscsih: ioc0: attempting task abort! (sc=ffff880154afb280)
Mar 14 18:43:58 server kernel: [35651.152020] sd 5:0:23:0: [sdy] CDB: Read(10): 28 00 6c 52 74 58 00 04 00 00
Mar 14 18:43:58 server kernel: [35651.152029] mptscsih: ioc0: task abort: SUCCESS (rv=2002) (sc=ffff880154afb280)

আমি ত্রুটিটি গুগল করেছিলাম এবং কেউ 3.0 জিবিএসের পরিবর্তে 1.5 জিবিপিএস ব্যবহার করার পরামর্শ দিয়েছেন trying ব্যবহার করে lsiutilআমি লিঙ্কের গতি পরিবর্তন করেছি:

# lsiutil -p 1 -i 

Firmware Settings
-----------------
SAS WWID:                       500605b002c0f680
Multi-pathing:                  Disabled
SATA Native Command Queuing:    Enabled
SATA Write Caching:             Enabled
SATA Maximum Queue Depth:       32
Device Missing Report Delay:    0 seconds
Device Missing I/O Delay:       0 seconds
Phy Parameters for Phynum:      0    1    2    3    4    5    6    7
  Link Enabled:                 Yes  Yes  Yes  Yes  Yes  Yes  Yes  Yes
  Link Min Rate:                1.5  1.5  1.5  1.5  1.5  1.5  1.5  1.5
  Link Max Rate:                1.5  1.5  1.5  1.5  1.5  1.5  1.5  1.5
  SSP Initiator Enabled:        Yes  Yes  Yes  Yes  Yes  Yes  Yes  Yes
  SSP Target Enabled:           No   No   No   No   No   No   No   No
  Port Configuration:           Auto Auto Auto Auto Auto Auto Auto Auto
Target IDs per enclosure:       1
Persistent mapping:             Enabled
Physical mapping type:          None
Target ID 0 reserved for boot:  No
Starting slot (direct attach):  0
Target IDs (physical mapping):  8
Interrupt Coalescing:           Enabled, timeout is 16 us, depth is 4

তাতে কোনও লাভ হয়নি।

আমি 'ডিভাইস মিসিং আই / ও বিলম্ব' 32 এ পরিবর্তনের চেষ্টা করেছি That

আমি 30 থেকে 100 এবং তারপরে 3 / এ / sys / শ্রেণী / scsi_device / * / ডিভাইস / সময়সীমা পরিবর্তন করার চেষ্টা করেছি All সমস্ত ব্যর্থ।

$ uname -a
Linux server 3.2.0-0.bpo.1-amd64 #1 SMP Sat Feb 11 08:41:32 UTC 2012 x86_64 GNU/Linux
$ grep LSISAS1068E /var/log/messages
Mar 13 15:47:44 server kernel: [   21.082363] scsi5 : ioc0: LSISAS1068E B3, FwRev=01210000h, Ports=1, MaxQ=483, IRQ=45
$ modinfo mptscsih
filename:       /lib/modules/3.2.0-0.bpo.1-amd64/kernel/drivers/message/fusion/mptscsih.ko
version:        3.04.20
license:        GPL
description:    Fusion MPT SCSI Host driver
author:         LSI Corporation
srcversion:     85D42A00FEBA3C95555E3AF
depends:        scsi_mod,mptbase
intree:         Y
vermagic:       3.2.0-0.bpo.1-amd64 SMP mod_unload modversions 
$ cat /sys/block/sdae/device/model
ST3000DM001-9YN1
$ cat /sys/block/sdae/device/rev
CC4C

সমস্যাটি খুব কমই ঘটে যদি কেবল পড়া বা লেখার কাজ থাকে: আমি কোনও সমস্যা ছাড়াই 1 টিবি পড়তে বা লিখতে পারি। সমস্যাটি মনে হয় যখন পড়া এবং লেখার উভয় অপারেশন রয়েছে। একটি রেইড On-তে ঘটে থাকে যদি আপনি স্ট্রাইপ আকারের চেয়ে ছোট ফাইল লেখেন এবং আপনার কাছে ইতিমধ্যে স্ট্রাইপ ক্যাশেড না রয়েছে (সেক্ষেত্রে নতুন চেকসাম গণনা করার জন্য স্ট্রাইপটি পড়তে হবে)।

সিস্টেমটি ভার্চুয়াল মেশিন নয়।

কি সমস্যা সৃষ্টি করা হয়? আমি কীভাবে 30 সেকেন্ডের জমাট থেকে মুক্তি পাব?

সম্পাদনা করুন: অতিরিক্ত পরীক্ষা করা

আমি একটি দুর্দান্ত পরীক্ষার সেট পেয়েছি যা সমস্যার উত্সাহিত করে বলে মনে হচ্ছে। এটিতে ফাইল রয়েছে যা স্ট্রাইপের আকারের চেয়ে ছোট এবং এইভাবে প্যারিটির পুনঃব্যবস্থাপনা জোর করে বাধ্যতামূলকভাবে লেখার সাথে মিলিত প্রচুর পাঠকে বাধ্য করে।

আমাকে অবশ্যই স্বীকার করতে হবে যে আমি মনে করি না যে সারি শিডিউলারের এই সমস্যার উপর কোনও প্রভাব ফেলবে। আমি ভৃল ছিলাম. এটি পরিষ্কার যে deadlineএটি অন্যদের চেয়ে অনেক খারাপ। যদিও তাদের কেউই সমস্যাটি সমাধান করেন না।

# cat /sys/block/sdaa/queue/scheduler
noop deadline [cfq]

সময়সূচী পরিবর্তন করার noopকারণে 100-120 সেকেন্ড পরে সমস্যা দেখা দেয়।

parallel echo noop \> {} ::: /sys/block/sd*/queue/scheduler

সময়সূচী পরিবর্তন করার deadlineকারণে 20-30 সেকেন্ড পরে সমস্যা দেখা দেয়।

parallel echo deadline \> {} ::: /sys/block/sd*/queue/scheduler

সময়সূচী পরিবর্তন করার cfqকারণে 120-300 সেকেন্ড পরে সমস্যা দেখা দেয়।

parallel echo cfq \> {} ::: /sys/block/sd*/queue/scheduler

Edit2

যেহেতু শিডিয়ুলারের একটি প্রভাব রয়েছে আমি ভাবছি যদি সময়সীমার মধ্যে অনেকগুলি অনুরোধের কারণে সমস্যা হয়। আমি কি একরকম প্রতি সেকেন্ডে প্রেরিত অনুরোধের সংখ্যা থ্রোট্ট করতে পারি?

উত্তর:


5

LSI থেকে MPTSCSIH-ড্রাইভার রিলিজ নোট বর্ণন আকর্ষণীয়।

Major Changes For Version 2.06.75.00-1
Release Date:  12/10/2007

General Changes
Functionality
•   Task Aborts for commands to a Volume are returned as FAILED and not sent to FW.

আপনার ড্রাইভারটি কোন সংস্করণ? ( modinfo mptscsih)

আপনার ব্যারাকুডা 3 টিবি ড্রাইভ সম্পর্কে সীগেট ফার্মওয়্যারের তথ্যের জন্য এই লিঙ্কটি ব্যবহার করুন। বিস্তারিত জানতে আপনাকে সিরিয়াল নম্বরটি প্রবেশ করতে হবে।

আপডেট: চেষ্টা smartctl -i /dev/sdaaকরে দেখুন আমি এটি এসসিএসআই এবং এসটিএতে পরীক্ষা করেছিলাম এবং সেইভাবে সিরিয়াল নম্বর পেয়েছি।


ড্রাইভার রিলিজ নোটগুলির কোন অংশগুলি আপনি এই সমস্যার জন্য প্রাসঙ্গিক বলে মনে করেন? উত্পাদিত ডিস্কগুলিতে জিএনইউ / লিনাক্স ব্যবহার করে সিরিয়াল নম্বরটি কীভাবে খুঁজে পাব? এবং আপনি কি সিগেট থেকে এটি খুঁজে পেতে আশা করবেন? Mptscsih এর সংস্করণ প্রশ্নের আপডেট হয়েছে।
ওলে টেঞ্জ

@ ওলেট্যাঞ্জ আমি "আকর্ষণীয়" বিভাগটি sertedোকালাম। যদিও আপনার ড্রাইভারটি এটির চেয়েও নতুন বলে মনে হচ্ছে এটি এখানে পুনরায় প্রদর্শিত হওয়া কোনও পুরানো সমস্যা হতে পারে। সিরিয়াল নম্বর হিসাবে ... সীগেটটি কেবল উইন্ডোজ-সরঞ্জাম সরবরাহ করে। লিনাক্সে আমি একটি inqকমান্ড চেষ্টা করতাম - সম্ভবত কিছু ইএমসি-ড্রাইভারের (নিখরচায় ডাউনলোডযোগ্য হওয়া উচিত) - তবে এটি কেবল অনুমান।
নিলস

2
@ ওলেট্যাঞ্জ আরই: "উত্পাদিত ডিস্কগুলিতে আমি জিএনইউ / লিনাক্স ব্যবহার করে সিরিয়াল নম্বরটি কীভাবে খুঁজে পাব?" এটি রান করুন dmidecodeএটি মেমরি থেকে হার্ডওয়্যার উপাদানগুলির বর্ণনা টানবে। প্রায়শই ভোক্তা স্তরের আইটেমগুলিতে আপনার হার্ড ড্রাইভ এসএন এর জন্য প্রবেশাধিকার থাকবে না তবে এন্টারপ্রাইজ গিয়ারের সাথে এটিতে সাধারণত এটি যুক্ত হবে বা ড্রাইভগুলির আরও বুদ্ধি থাকবে। সেখানে বিশেষ --typeকোডের MFR ডিভাইসের উল্লেখ করতে তারা তাদের পাওয়া উচিত ছিল। যে সংস্থাগুলি অ্যারে সরবরাহ করে তারা সাধারণত এই তথ্য সরবরাহ করে যাতে পুনরায় কল করা ড্রাইভগুলি অবস্থিত হতে পারে।
বিসি

@ লিনাক্স্লি চ্যালেঞ্জড dmidecodeকোনও ড্রাইভ দেখেনি - না অভ্যন্তরীণ বা বাহ্যিক। আমি inqডেবিয়ানের সন্ধান করতে অক্ষম ছিলাম ।
ওলে টাঞ্জ

@ ওলেট্যাঞ্জ ব্যবহার smartctlআমার আপডেট হওয়া উত্তরটি দেখুন ...
নীল

2

আপনি কি আপনার I / O সময়সূচী পরিবর্তন করার চেষ্টা করেছেন?

   mccoy:/sys/block/sdb/queue # cat scheduler 
   noop anticipatory deadline [cfq] 
   mccoy:/sys/block/sdb/queue # echo noop > scheduler 
   mccoy:/sys/block/sdb/queue # cat scheduler 
   [noop] anticipatory deadline cfq 

ডিফল্টটি সিএফকিউ সাধারণত বেশিরভাগ সিস্টেমে "বর্তমানে" থাকে।

I / O শিডিউলগুলি তুলনা করতে নিম্নলিখিতগুলি করুন:

পরীক্ষা পড়ুন:

# echo 3 > /proc/sys/vm/drop_caches

এটি নিশ্চিত করবে যে আপনি ডিস্কটি পরীক্ষা করছেন এবং র‌্যামের ক্যাশেড পৃষ্ঠাগুলি নেই, এটি ক্যাশে ফ্লাশ করবে।

লেখার পরীক্ষা:

একসাথে একাধিকবার আপনার ফাইলগুলি অনুলিপি করুন। একবার লেখাগুলি সম্পূর্ণ ইস্যু কsync

আপনি যদি উভয়ই পরীক্ষা করে থাকেন তবে অনুলিপিটি শেষ হয়ে গেলে আপনি drop_cachesকল করতে এবং কল করতে পারেন sync। সিডিউলার ছাড়াও প্রতিটি শিডিয়ুলারের জন্য টিউনেবল রয়েছে। তবে, দ্রুত পরীক্ষাটি হ'ল শিডিউলার পরিবর্তন করে আবার চেষ্টা করা। আপনার যদি একটি ভাল নিয়ামক থাকে noopতবে এটি "আই / ও শিডিউলিং" অফলোড করবে এবং কোনও ওএস স্তরের ডেটা শিডিয়ুলিং সম্পাদন করবে না।

যাইহোক, এটি চেষ্টা করার মতো এবং এটি echoএটির পিছনে সেট করতে কেবল একবার নেয় ।


ফলাফলের জন্য আপডেট হওয়া প্রশ্নটি দেখুন।
ওলে টেঞ্জ

2

আমি SAS2008 কার্ড কিনে সমস্যার সমাধান করেছি। এটি লগতে এখনও কিছুটা অভিযোগ করে, তবে এটি কখনই ডিস্ক আই / ওকে অবরুদ্ধ করে না। এছাড়াও আমি এটি পরীক্ষা করেছি যে এটি 4 টিবি সাটা ড্রাইভ সমর্থন করে, যেখানে এলএসআই-এসএএস 1068E কেবল 2 টিবি সমর্থন করে।

যেহেতু আমি LSI-SAS1068E বিক্রেতার কাছে ফিরিয়ে দেব, আমি অন্যান্য পরামর্শগুলি চেষ্টা করতে পারব না। সুতরাং আমি এখানে প্রশ্ন বন্ধ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.