প্রশ্ন ট্যাগ «dataframe»

একটি ডেটা ফ্রেম একটি সারণী তথ্য কাঠামো। সাধারণত, এটিতে ডেটা থাকে যেখানে সারিগুলি পর্যবেক্ষণ এবং কলামগুলি বিভিন্ন ধরণের ভেরিয়েবল হয়। যদিও "ডেটা ফ্রেম" বা "ডেটা ফ্রেম" এই ধারণার জন্য বেশ কয়েকটি ভাষায় (আর, অ্যাপাচি স্পার্ক, ডিডল, ম্যাপেল, পাইথনের পান্ডাস লাইব্রেরি এবং জুলিয়ার ডেটা ফ্রেম লাইব্রেরি) শব্দ ব্যবহৃত হয়েছে, "টেবিল" শব্দটি ব্যবহৃত হয় ম্যাটল্যাব এবং এসকিউএল।

5
কী দ্বারা কীভাবে প্যান্ডাসের গোষ্ঠীভিত্তিক ডেটা ফ্রেমে অ্যাক্সেস করবেন
কী দ্বারা কীভাবে আমি একটি গ্রুপবাই অবজেক্টে সম্পর্কিত গ্রুপবাই ডেটাফ্রেমে অ্যাক্সেস করব? নিম্নলিখিত গ্রুপবাইয়ের সাথে: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) কীগুলি এবং গোষ্ঠীগুলি পেতে আমি এর মাধ্যমে পুনরাবৃত্তি করতে পারি: In [11]: for k, gp in …

9
ডেটা ফ্রেমের কলামগুলির ডেটা প্রকারগুলি নির্ধারণ করুন
আমি আর ব্যবহার করছি এবং ব্যবহার করে ডেটা ফ্রেমে ডেটা লোড করেছি read.csv()। আমি কীভাবে ডেটা ফ্রেমে প্রতিটি কলামের ডেটা টাইপ নির্ধারণ করব?
153 r  dataframe  types 

6
অক্ষর থেকে ফ্যাক্টারে ডেটা ফ্রেম কলাম ফর্ম্যাট রূপান্তর করুন
আমি আমার data.frame বস্তু (কিছু কলামের ফরম্যাট (বর্গ) পরিবর্তন করতে চান mydfথেকে) charactor করার ফ্যাক্টর । আমি যখন read.table()ফাংশন দ্বারা টেক্সট ফাইলটি পড়ছি তখন আমি এটি করতে চাই না । কোন সাহায্য প্রশংসা করা হবে।
153 r  dataframe  character  r-faq 

7
পান্ডাস: প্রদত্ত কলামগুলির জন্য ডেটা ফ্রেম সারিগুলি যোগ করে
আমার কাছে নিম্নলিখিত ডেটা ফ্রেম রয়েছে: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 আমি একটি কলাম যোগ করতে চাই 'e'কোন কলামে …
153 python  pandas  dataframe  sum 

6
আমার কি ডেটা.ফ্রেম বা ম্যাট্রিক্স ব্যবহার করা উচিত?
কখন একটি ব্যবহার করা উচিত data.frameএবং কখন এটি ব্যবহার করা ভাল matrix? উভয়ই আয়তক্ষেত্রাকার বিন্যাসে ডেটা রাখে, তাই কখনও কখনও এটি অস্পষ্ট। কোন ডাটা টাইপটি কখন ব্যবহার করতে হবে তার জন্য কি কোনও সাধারণ নিয়ম রয়েছে?
152 r  matrix  dataframe  r-faq 

5
কীভাবে প্যান্ডাস ডেটাফ্রেমে "অবরুদ্ধ: 0" কলামটি থেকে মুক্তি পাবেন?
আমি একটি অবস্থা যখন আমি পড়তে যেখানে কখনো কখনো একটি আছে csvথেকে dfআমি একজন অবাঞ্ছিত সূচক মত নামে কলাম পেতে unnamed:0। file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 সিএসভি এটি দিয়ে পড়া হয়: pd.read_csv('file.csv') Unnamed: 0 A B C 0 0 1 2 3 1 1 4 5 6 2 2 7 …
152 python  pandas  csv  dataframe 

3
পান্ডাসে বুলিয়ান ইনডেক্সিংয়ের জন্য লজিকাল অপারেটর
আমি পান্ডসে বুলিয়ান সূচক নিয়ে কাজ করছি। প্রশ্নটি কেন বিবৃতি: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] ভাল কাজ করে a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] ত্রুটি সহ প্রস্থান? উদাহরণ: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …

8
পান্ডারা কি স্বয়ংক্রিয়ভাবে তারিখগুলি সনাক্ত করতে পারে?
আজ আমি ইতিবাচকভাবে অবাক হয়েছি যে কোনও ডেটা ফাইল থেকে ডেটা পড়ার সময় (উদাহরণস্বরূপ) পান্ডাস বিভিন্ন ধরণের মান সনাক্ত করতে সক্ষম হয়: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) উদাহরণস্বরূপ এটি এইভাবে চেক করা যেতে পারে: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) নির্দিষ্ট সংখ্যায়, ফ্লোট এবং স্ট্রিংগুলি সঠিকভাবে স্বীকৃত …
151 python  date  types  dataframe  pandas 

3
পান্ডারা কেবল কলামের নাম দিয়ে খালি ডেটাফ্রেম তৈরি করে
আমার একটি ডায়নামিক ডেটা ফ্রেম রয়েছে যা সূক্ষ্মভাবে কাজ করে, তবে যখন ডেটা ফ্রেমে কোনও ডেটা যুক্ত করার দরকার নেই তখন আমি একটি ত্রুটি পাই। এবং তাই কেবলমাত্র কলামের নাম দিয়ে খালি ডেটা ফ্রেম তৈরি করতে আমার একটি সমাধান দরকার need আপাতত আমার কাছে এরকম কিছু রয়েছে: df = pd.DataFrame(columns=COLUMN_NAMES) …
151 python  pandas  dataframe 

10
একটি বৃহত ডেটা.টিবেলে এনএ প্রতিস্থাপনের দ্রুততম উপায়
আমার কাছে একটি বিশাল ডেটা টেবিল রয়েছে , যার প্রায় 200 ডলার সারি এবং 200 কলামে ছড়িয়ে থাকা অনেকগুলি মান রয়েছে। আমি সেই জাতীয় মানগুলি যথাসম্ভব দক্ষতার সাথে শূন্যগুলিতে কোড করতে চাই। আমি দুটি অপশন দেখতে পাচ্ছি: 1: একটি ডেটা.ফ্রেমে রূপান্তর করুন এবং এই জাতীয় 2 ব্যবহার করুন : কিছু …

8
প্রতিটি সারি ডেটা পুনরাবৃত্তি করুন a একটি কলামে নির্দিষ্ট সময়ের সংখ্যা ফ্রেম করুন
df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) উপরের ডাটা.ফ্রেমের প্রথম দুটি কলাম প্রতিটি সারি প্রসারিত করার সহজ উপায় কী, যাতে প্রতিটি সারিতে 'ফ্রিক' কলামে উল্লিখিত সময়ের সংখ্যাটি পুনরাবৃত্তি হয়? অন্য কথায়, এটি থেকে যান: df var1 var2 freq 1 a d 1 …
150 r  dataframe  replicate 

12
পান্ডে খালি মান (সাদা স্থান) প্রতিস্থাপন NaN এর সাথে
আমি একটি পান্ডাস ডেটা ফ্রেমে সমস্ত মান সন্ধান করতে চাই যেখানে সাদা স্থান (যেকোন স্বেচ্ছাসেবী পরিমাণ) থাকে এবং সেই মানগুলি NaN এর সাথে প্রতিস্থাপন করে। কোন ধারণা কীভাবে এটি উন্নত করা যায়? মূলত আমি এটি চালু করতে চাই: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 …
150 python  pandas  dataframe 

11
সমস্ত মানগুলি NA যেখানে ডেটাফ্রেম থেকে কলামগুলি সরান
আমি একটি ডেটা ফ্রেমে সমস্যায় পড়ছি এবং সত্যিই নিজেই এই সমস্যাটি সমাধান করতে পারছি না: ডেটাফ্রেমের কলাম হিসাবে নির্বিচারে বৈশিষ্ট্য রয়েছে এবং প্রতিটি সারি একটি ডেটা সেট উপস্থাপন করে । প্রশ্নটি হল: সমস্ত সারিগুলির মান এনএ যেখানে কলামগুলি থেকে কীভাবে মুক্তি পাবেন ?
149 r  apply  dataframe 

7
সারি নামগুলিকে প্রথম কলামে রূপান্তর করুন
আমার কাছে এই জাতীয় ডেটা ফ্রেম রয়েছে: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" আমি প্রথম কলামে সারির নামগুলি রূপান্তর করতে চাই। প্রথম কলাম হিসাবে সারির নাম তৈরি …
147 r  dataframe  col  rowname 

10
একটি পান্ডা কলামের ভিতরে আলাদা কলামগুলিতে অভিধান / তালিকা বিভক্ত করা
আমি পোস্টগ্রিজ এসকিউএল ডাটাবেসে ডেটা সংরক্ষণ করেছি। আমি পাইথন 2.7 ব্যবহার করে এই ডেটাটি অনুসন্ধান করছি এবং এটিকে একটি পান্ডাস ডেটা ফ্রেমে পরিণত করছি। যাইহোক, এই ডেটাফ্রেমের শেষ কলামটির মধ্যে মানগুলির একটি অভিধান (বা তালিকা?) রয়েছে। ডেটাফ্রেমটি দেখতে এমন দেখাচ্ছে: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.