উত্তর:
জন্য cut(1)
man পৃষ্ঠা:
একটি, এবং -b, -c বা -f এর মধ্যে একটি ব্যবহার করুন। প্রতিটি লিস্ট একটি রেঞ্জ বা বহু রেঞ্জকে কমা দ্বারা পৃথক করে তৈরি। নির্বাচিত ইনপুট একই ক্রমে লেখা হয় যা এটি পড়ে এবং ঠিক একবার লেখা হয়।
এটি প্রথমে 1 ফিল্ডে পৌঁছে যায়, তাই এটি মুদ্রিত হয়, ক্ষেত্র 2 পরে 2
awk
পরিবর্তে ব্যবহার করুন:
awk '{ print $2 " " $1}' file.txt
FS
একটি বিকল্প, OFS
একটি পরিবর্তনশীল। যেমনawk -v OFS=";" -F"\t" '{print $2,$1}'
| sed 's/\r//' |
দেওয়ার আগে এটি পাইপ করতে পারেনawk
awk '{print $4 "\t" $2 "\t" $6 "\t" $7}' file
আপনি একত্রিত করতে পারেন cut
এবং paste
:
paste <(cut -f2 file.txt) <(cut -f1 file.txt)
মন্তব্যের মাধ্যমে: বাশিজম এড়ানো এবং কাটা কাটা একটি দৃষ্টান্তটি করা সম্ভব:
paste file.txt file.txt | cut -f2,3
cut
ভেরিয়েবল-দৈর্ঘ্যের কলামগুলির জন্য সূক্ষ্মভাবে কাজ করে যতক্ষণ আপনার অনন্য কলাম বিভাজক থাকে।
bash
isms এবং এক উদাহরণ হিসেবে বলা যায় অপসারণ cut
: করে paste file.txt file.txt | cut -f2,3
শুধু খোল ব্যবহার করে,
while read -r col1 col2
do
echo $col2 $col1
done <"file"
"$col2"
এবং "$col1"
- ডেটাতে শেল মেটাচার্যাক্টর বা অন্যান্য শেননিগান থাকতে পারে।
আপনি তার জন্য পার্ল ব্যবহার করতে পারেন:
perl -ane 'print "$F[1] $F[0]\n"' < file.txt
পার্ল চালানোর সুবিধাটি হ'ল (আপনি পার্লকে জানলে) কলামগুলি পুনরায় সাজানোর চেয়ে আপনি F এ আরও অনেক বেশি গণনা করতে পারেন।
perl -ae print
কাজ করেcat
ব্যবহার join
:
join -t $'\t' -o 1.2,1.1 file.txt file.txt
মন্তব্য:
-t $'\t'
ইন গনুহ join
আরও বেশি ধারণাসম্পন্ন -t '\t'
ছাড়া$
ব্যর্থ হয়, ( coreutils v8.28 এবং তার আগে?); এটি সম্ভবত একটি বাগ যা এর মতো পরিশ্রমী $
হওয়া প্রয়োজন। দেখুন: ইউনিক্স বিভাজক চরটিতে যোগদান করুন ।
join
দুটি ফাইলের নাম প্রয়োজন, যদিও সেখানে কেবল একটি ফাইল কাজ করা হচ্ছে। join
কাঙ্ক্ষিত ক্রিয়া সম্পাদনের জন্য একই নামটি দু'বার কৌশল ব্যবহার করা।
স্বল্প সংস্থান সহ সিস্টেমগুলির জন্য join
অন্যান্য উত্তরে ব্যবহৃত কয়েকটি সরঞ্জামের চেয়ে ছোট পদচিহ্ন সরবরাহ করে:
wc -c $(realpath `which cut join sed awk perl`) | head -n -1
43224 /usr/bin/cut
47320 /usr/bin/join
109840 /bin/sed
658072 /usr/bin/gawk
2093624 /usr/bin/perl
সবেমাত্র খুব অনুরূপ কিছু নিয়ে কাজ করছি, আমি কোনও বিশেষজ্ঞ নই তবে আমি ভেবেছিলাম যে আমি যে কমান্ডগুলি ব্যবহার করেছি সেগুলি ভাগ করব। আমার একাধিক কলাম সিএসভি ছিল যা আমাকে কেবল 4 টি কলামের প্রয়োজন এবং তারপরে সেগুলি পুনঃক্রম করতে আমার দরকার হয়েছিল।
আমার ফাইলটি পাইপ ছিল '|' সীমানা ছাড়াই তবে তা সরে যেতে পারে।
LC_ALL=C cut -d$'|' -f1,2,3,8,10 ./file/location.txt | sed -E "s/(.*)\|(.*)\|(.*)\|(.*)\|(.*)/\3\|\5\|\1\|\2\|\4/" > ./newcsv.csv
স্বীকারযোগ্যভাবে এটি সত্যিই রুক্ষ এবং প্রস্তুত তবে এটি অনুসারে টুইট করা যেতে পারে!
সেড ব্যবহার
কলাম কন্টেন্ট ক্যাপচার এবং পুনঃক্রম করতে মৌলিক নিয়মিত অভিব্যক্তির নেস্টেড subexpressions সঙ্গে সেড ব্যবহার করুন। এই ক্ষেত্রে যেমন কলামগুলি পুনরায় অর্ডার করতে সীমিত সংখ্যক কাটা রয়েছে তখন এই পদ্ধতির পক্ষে উপযুক্ত।
মৌলিক ধারণা সার্চ প্যাটার্ন পারিপার্শ্বিক আকর্ষণীয় অংশ হয় \(
এবং \)
সঙ্গে প্রতিস্থাপন প্যাটার্ন ফিরে প্লে করা যাবে না যা \#
যেখানে#
অনুসন্ধান প্যাটার্ন subexpression এর অনুক্রমিক অবস্থান প্রতিনিধিত্ব করে।
উদাহরণ স্বরূপ:
$ echo "foo bar" | sed "s/\(foo\) \(bar\)/\2 \1/"
উৎপাদনের:
bar foo
একটি subexpression বাইরের পাঠ্য স্ক্যান করা হয় কিন্তু প্রতিস্থাপন স্ট্রিং মধ্যে প্লেব্যাক জন্য ধরে রাখা হয় না।
যদিও প্রশ্নটি স্থির প্রস্থের কলামগুলি নিয়ে আলোচনা করে নি, তবে আমরা এখানে আলোচনা করব কারণ এটি উত্থাপিত কোনও সমাধানের উপযুক্ত পরিমাপ। সরলতার জন্য ধরে নেওয়া যাক ফাইলটি স্থান সীমান্তে করা হয়েছে যদিও সমাধানটি অন্য ডিলিমেটারদের জন্য বাড়ানো যেতে পারে।
ভাঙ্গন স্থানগুলি
সহজ ব্যবহারটি চিত্রিত করার জন্য, ধরে নিই যে একাধিক স্পেস একক স্পেসে বিভক্ত হতে পারে এবং দ্বিতীয় কলামের মানগুলি EOL (এবং স্থান প্যাডড নয়) দিয়ে সমাপ্ত হবে।
ফাইল:
bash-3.2$ cat f
Column1 Column2
str1 1
str2 2
str3 3
bash-3.2$ od -a f
0000000 C o l u m n 1 sp sp sp sp C o l u m
0000020 n 2 nl s t r 1 sp sp sp sp sp sp sp 1 nl
0000040 s t r 2 sp sp sp sp sp sp sp 2 nl s t r
0000060 3 sp sp sp sp sp sp sp 3 nl
0000072
ট্রান্সফর্ম:
bash-3.2$ sed "s/\([^ ]*\)[ ]*\([^ ]*\)[ ]*/\2 \1/" f
Column2 Column1
1 str1
2 str2
3 str3
bash-3.2$ sed "s/\([^ ]*\)[ ]*\([^ ]*\)[ ]*/\2 \1/" f | od -a
0000000 C o l u m n 2 sp C o l u m n 1 nl
0000020 1 sp s t r 1 nl 2 sp s t r 2 nl 3 sp
0000040 s t r 3 nl
0000045
কলাম প্রস্থ সংরক্ষণ করা
কলামগুলি পৃথক পৃথক প্রস্থের মঞ্জুরি দেওয়ার সময় ধীরে ধীরে প্রস্থের কলামগুলির সাথে ফাইলগুলিতে পদ্ধতিটি প্রসারিত করা যাক।
ফাইল:
bash-3.2$ cat f2
Column1 Column2
str1 1
str2 2
str3 3
bash-3.2$ od -a f2
0000000 C o l u m n 1 sp sp sp sp C o l u m
0000020 n 2 nl s t r 1 sp sp sp sp sp sp sp 1 sp
0000040 sp sp sp sp sp nl s t r 2 sp sp sp sp sp sp
0000060 sp 2 sp sp sp sp sp sp nl s t r 3 sp sp sp
0000100 sp sp sp sp 3 sp sp sp sp sp sp nl
0000114
ট্রান্সফর্ম:
bash-3.2$ sed "s/\([^ ]*\)\([ ]*\) \([^ ]*\)\([ ]*\)/\3\4 \1\2/" f2
Column2 Column1
1 str1
2 str2
3 str3
bash-3.2$ sed "s/\([^ ]*\)\([ ]*\) \([^ ]*\)\([ ]*\)/\3\4 \1\2/" f2 | od -a
0000000 C o l u m n 2 sp C o l u m n 1 sp
0000020 sp sp nl 1 sp sp sp sp sp sp sp s t r 1 sp
0000040 sp sp sp sp sp nl 2 sp sp sp sp sp sp sp s t
0000060 r 2 sp sp sp sp sp sp nl 3 sp sp sp sp sp sp
0000100 sp s t r 3 sp sp sp sp sp sp nl
0000114
শেষ পর্যন্ত যদিও প্রশ্নের উদাহরণটিতে অসম দৈর্ঘ্যের স্ট্রিং নেই, তবে এই অভ্যাসটি এই ক্ষেত্রে সমর্থন করে।
ফাইল:
bash-3.2$ cat f3
Column1 Column2
str1 1
string2 2
str3 3
ট্রান্সফর্ম:
bash-3.2$ sed "s/\([^ ]*\)\([ ]*\) \([^ ]*\)\([ ]*\)/\3\4 \1\2/" f3
Column2 Column1
1 str1
2 string2
3 str3
bash-3.2$ sed "s/\([^ ]*\)\([ ]*\) \([^ ]*\)\([ ]*\)/\3\4 \1\2/" f3 | od -a
0000000 C o l u m n 2 sp C o l u m n 1 sp
0000020 sp sp nl 1 sp sp sp sp sp sp sp s t r 1 sp
0000040 sp sp sp sp sp nl 2 sp sp sp sp sp sp sp s t
0000060 r i n g 2 sp sp sp nl 3 sp sp sp sp sp sp
0000100 sp s t r 3 sp sp sp sp sp sp nl
0000114
শেলের অধীনে কলাম পুনঃক্রমের অন্যান্য পদ্ধতির সাথে তুলনা
আশ্চর্যজনকভাবে কোনও ফাইল ম্যানিপুলেশন সরঞ্জামের জন্য, জমিটি রেকর্ডের শেষ পর্যন্ত ক্ষেত্র থেকে কাটার জন্য অ্যাডক ভালভাবে উপযুক্ত নয়। Sed এই রেগুলার এক্সপ্রেশান্স ব্যবহার করে সম্পন্ন করা যেতে পারে, যেমন \(xxx.*$\)
যেখানে xxx
অভিব্যক্তি কলাম মেলানো।
শেল স্ক্রিপ্টগুলির ভিতরে প্রয়োগ করার সময় পেস্ট এবং কাটা সাবশেলগুলি ব্যবহার করা জটিল হয়ে ওঠে। কমান্ডলাইন থেকে কাজ করা কোড শেল স্ক্রিপ্টের ভিতরে আনলে পার্স করতে ব্যর্থ হয়। কমপক্ষে এটি আমার অভিজ্ঞতা ছিল (যা আমাকে এই পদ্ধতির দিকে চালিত করেছিল)।
@ মেট থেকে উত্তরটি প্রসারিত করা, পার্ল ব্যবহার করে:
যদি ইনপুট এবং আউটপুটটি ট্যাব-বিস্মৃত হয়:
perl -F'\t' -lane 'print join "\t", @F[1, 0]' in_file
যদি ইনপুট এবং আউটপুট সাদা স্থান-সীমিত হয়:
perl -lane 'print join " ", @F[1, 0]' in_file
এখানে
-e
পার্লকে আলাদা স্ক্রিপ্ট ফাইলের পরিবর্তে কোড ইনলাইনটি সন্ধান করতে বলেছে ,
-n
একবারে ইনপুট 1 লাইন পড়ে , লাইনটি পড়ার পরে
-l
ইনপুট রেকর্ড বিভাজক ( \n
* NIX- এ) সরিয়ে দেয় chomp
এবং আউটপুট যুক্ত করে রেকর্ড বিভাজক ( \n
প্রতিটি * কিসসু দিকে) print
,
-a
অ্যারের মধ্যে হোয়াইটস্পেস ইনপুট লাইন splits @F
,
-F'\t'
একযোগে সঙ্গে -a
টুকরা ইনপুট ট্যাব এ অ্যারের মধ্যে হোয়াইটস্পেস লাইন, পরিবর্তে @F
।
@F[1, 0]
@F
এই ক্রমে অ্যারের 2 ম এবং 1 ম উপাদানগুলির দ্বারা তৈরি অ্যারে হয় । মনে রাখবেন যে পার্লের অ্যারেগুলি শূন্য-সূচকযুক্ত, যখন ক্ষেত্রগুলি cut
1-সূচিকৃত। সুতরাং ক্ষেত্রগুলি @F[0, 1]
একই ক্ষেত্রগুলির মধ্যে রয়েছে cut -f1,2
।
নোট করুন যে এই জাতীয় স্বরলিপি উপরের পোস্ট হওয়া অন্যান্য উত্তরগুলির তুলনায় ইনপুটটির আরও নমনীয় ম্যানিপুলেশনকে সক্ষম করে (যা কোনও সাধারণ কাজের জন্য উপযুক্ত)। উদাহরণ স্বরূপ:
# reverses the order of fields:
perl -F'\t' -lane 'print join "\t", reverse @F' in_file
# prints last and first fields only:
perl -F'\t' -lane 'print join "\t", @F[-1, 0]' in_file
cut
এই স্বজ্ঞাত পুনরায় ক্রম আদেশটি সমর্থন করে না। যাই হোক, অন্য টিপ: আপনি ব্যবহার করতে পারেনawk
'র-FS
এবং-OFS
অপশন ব্যবহার কাস্টম ইনপুট এবং আউটপুট ক্ষেত্র বিভাজক (যেমন-d
এবং--output-delimiter
জন্যcut
)।