প্রশ্ন ট্যাগ «pandas»

পান্ডাস হ'ল ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য পাইথন লাইব্রেরি, যেমন ডেটাফ্রেমস, বহু-মাত্রিক সময় সিরিজ এবং ক্রস-বিভাগীয় ডেটাসেটগুলি সাধারণত পরিসংখ্যান, পরীক্ষামূলক বিজ্ঞানের ফলাফল, একনোমেট্রিক্স বা ফিনান্সে পাওয়া যায়। পান্ডস পাইথনের অন্যতম প্রধান তথ্য বিজ্ঞান গ্রন্থাগার।

3
[:] বনাম আইলোক [:] এর সাথে নিয়োগের কারণে পান্ডে বিভিন্ন ফল পাওয়া যায়?
আমি ilocপান্ডায় ব্যবহার করে বিভিন্ন সূচক পদ্ধতিতে এত বিভ্রান্ত হয়ে পড়েছি । যাক আমি 1-d ডেটাফ্রেমকে 2-ডি ডেটাফ্রেমে রূপান্তর করার চেষ্টা করছি। প্রথমে আমার নীচের 1-ডি ডেটাফ্রেম রয়েছে a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T এবং আমি আকার হিসাবে এটি একটি 2-ডে ডাটাফ্রেমে রূপান্তর করতে যাচ্ছি 2x4। আমি নিম্নলিখিত হিসাবে 2-ডি …

1
পান্ডার টু এক্সেক্সেল ফাংশনটি একটি অপ্রত্যাশিত টাইপয়েরর উত্পন্ন করে
আমি পান্ডাস ডেটা ফ্রেমের একটি অভিধান তৈরি করেছি: d[k] = pd.DataFrame(data=data[i]) সুতরাং আমি ধরে নিই যে d[k]এটি একটি সঠিক পান্ডাস ডেটা ফ্রেম। তারপর for k in d.keys(): d[k].to_excel (file_name) তারপরে আমার ত্রুটি আছে: TypeError: got invalid input value of type <class 'xml.etree.ElementTree.Element'>, expected string or Element আমি পাইথন 3.7, পান্ডাস …

3
ধীরে ধীরে পান্ডাস ডেটাফ্রেম মাল্টিমিন্ডেক্সের পুনর্নির্মাণ
আমার কাছে ফর্মটির একটি পান্ডাস ডেটা ফ্রেম রয়েছে: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 …

2
ফিল্টারযুক্ত বাইনারি কার্টেসিয়ান পণ্য উত্পন্ন করুন
সমস্যা বিবৃতি আমি সম্পূর্ণ বাইনারি কার্টেসিয়ান পণ্যগুলি তৈরি করার জন্য একটি কার্যকর উপায় সন্ধান করছি (নির্দিষ্ট সংখ্যক কলামগুলির সাথে সত্য এবং মিথ্যা সব সংমিশ্রনের সাথে সারণী), কিছু নির্দিষ্ট একচেটিয়া শর্ত দ্বারা ফিল্টার করা। উদাহরণস্বরূপ, তিনটি কলাম / বিটের জন্য n=3আমরা পুরো টেবিলটি পেয়ে যাব df_combs = pd.DataFrame(itertools.product(*([[True, False]] * n))) …

1
পান্ডাসুডিএফ এবং পাইয়ারো 0.15.0
pysparkইএমআর ক্লাস্টারগুলিতে চলমান বেশ কয়েকটি কাজের জন্য আমি সম্প্রতি বেশ কিছু ত্রুটি পেতে শুরু করেছি । এরোরা হ'ল java.lang.IllegalArgumentException at java.nio.ByteBuffer.allocate(ByteBuffer.java:334) at org.apache.arrow.vector.ipc.message.MessageSerializer.readMessage(MessageSerializer.java:543) at org.apache.arrow.vector.ipc.message.MessageChannelReader.readNext(MessageChannelReader.java:58) at org.apache.arrow.vector.ipc.ArrowStreamReader.readSchema(ArrowStreamReader.java:132) at org.apache.arrow.vector.ipc.ArrowReader.initialize(ArrowReader.java:181) at org.apache.arrow.vector.ipc.ArrowReader.ensureInitialized(ArrowReader.java:172) at org.apache.arrow.vector.ipc.ArrowReader.getVectorSchemaRoot(ArrowReader.java:65) at org.apache.spark.sql.execution.python.ArrowPythonRunner$$anon$1.read(ArrowPythonRunner.scala:162) at org.apache.spark.sql.execution.python.ArrowPythonRunner$$anon$1.read(ArrowPythonRunner.scala:122) at org.apache.spark.api.python.BasePythonRunner$ReaderIterator.hasNext(PythonRunner.scala:406) at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37) at org.apache.spark.sql.execution.python.ArrowEvalPythonExec$$anon$2.<init>(ArrowEvalPythonExec.scala:98) at org.apache.spark.sql.execution.python.ArrowEvalPythonExec.evaluate(ArrowEvalPythonExec.scala:96) at org.apache.spark.sql.execution.python.EvalPythonExec$$anonfun$doExecute$1.apply(EvalPythonExec.scala:127)... এগুলি সমস্তই applyএকটি …

5
পান্ডাস ডেটা ফ্রেমের নতুন কলামে তালিকায় আইডি পাওয়া গেছে
বলুন আমার কাছে নিম্নলিখিত ডেটাফ্রেম (পূর্ণসংখ্যার কলাম এবং পূর্ণসংখ্যার তালিকার একটি কলাম) আছে ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] এবং আইডির একটি পৃথক তালিকা ... bad_ids = [15533, 876544, 36789, 11111] এটি দেওয়া হয়েছে এবং df['ID']কলাম এবং …

9
একটি কলাম প্যান্ডাস থেকে একটি এনএক্সএন ম্যাট্রিক্স তৈরি করুন
আমার প্রতিটি সারিতে একটি ডাটা মান রয়েছে বলে ডেটাফ্রেম রয়েছে। id list_of_value 0 ['a','b','c'] 1 ['d','b','c'] 2 ['a','b','c'] 3 ['a','b','c'] আমাকে এক সারি এবং অন্যান্য সমস্ত সারিগুলির বিপরীতে স্কোর গণনা করতে হবে যেমন: Step 1: Take value of id 0: ['a','b','c'], Step 2: find the intersection between id 0 and …
11 python  pandas  numpy 

1
পাইথন থেকে উত্পন্ন ডায়নামিক লুপ থেকে নাল মানগুলি কীভাবে বাদ দেওয়া যায়?
আমার কাছে এই জাতীয় ডেটা-ফ্রেম রয়েছে: ORDER_NO 2401 2504 2600 2020020 2019-12-04 2019-12-10 2019-12-12 2020024 2019-12-25 NaN 2019-12-20 2020034 NaN NaN 2019-12-20 2020020 2019-12-12 2019-12-15 2019-12-18 আমি উপরের ডেটা-ফ্রেম থেকে এক্সএমএল তৈরি করছি। আমি এক্সএমএল-তে পপুলেশন হওয়া নাল মানটি সরিয়ে ফেলতে চাই। আমার কোডটি XML থেকে সেই নির্দিষ্ট কলাম এবং …

3
প্যান্ডাস এক কলামে মানের শর্তের ভিত্তিতে একাধিক কলামে মানগুলি ওভাররাইট করে
আমার কাছে এই জাতীয় ডেটা ফ্রেম রয়েছে: df = pd.DataFrame(data={ 'col0': [11, 22,1, 5] 'col1': ['aa:a:aaa', 'a:a', 'a', 'a:aa:a:aaa'], 'col2': ["foo", "foo", "foobar", "bar"], 'col3': [True, False, True, False], 'col4': ['elo', 'foo', 'bar', 'dupa']}) আমি কল 1 এ ":" বিভক্ত হওয়ার পরে তালিকার দৈর্ঘ্য পেতে চাই, তারপরে আমি দৈর্ঘ্য> 2 …
11 python  pandas  apply 

2
ট্র্যাজিং সিএপিএসকে আলাদা কলামে সরানোর জন্য আমি কীভাবে রেজেেক্স দিয়ে কলামগুলি বিভক্ত করতে পারি?
আমি রেজেক্স ব্যবহার করে একটি কলাম বিভক্ত করার চেষ্টা করছি, তবে স্প্লিটটি সঠিকভাবে পাওয়া যাবে বলে মনে হচ্ছে না। আমি সমস্ত চলমান সিএপিএস নেওয়ার চেষ্টা করছি এবং এগুলি একটি পৃথক কলামে স্থানান্তরিত করব। সুতরাং আমি সমস্ত ক্যাপগুলি পাচ্ছি যা হয় পরপর 2-4 সিএপিএস হয়। তবে কলামটি ফাঁকা 'Name'থাকাকালীন এটি কেবল …
11 python  regex  pandas 

7
ডেটাফ্রেমে পুনরাবৃত্ত "কী = মান" জোড়ার ফাইলটি পড়ুন
আমার এই ফর্ম্যাটটিতে ডেটা সহ একটি টেক্সট ফাইল রয়েছে। প্রথম 3 লাইন বার বার পুনরাবৃত্তি করে। name=1 grade=A class=B name=2 grade=D class=A আমি একটি টেবিল বিন্যাসে ডেটা আউটপুট করতে চাই, উদাহরণস্বরূপ: name | grade | class 1 | A | B 2 | D | A আমি শিরোনামগুলি সেট করতে …

2
গাছের মূলের পিতামাতা এবং তাদের সমস্ত শিশুদের সনাক্ত করা
আমার কাছে যেমন একটি পান্ডাস ডেটা ফ্রেম রয়েছে: parent child parent_level child_level A B 0 1 B C 1 2 B D 1 2 X Y 0 2 X D 0 2 Y Z 2 3 এটি এমন গাছটিকে উপস্থাপন করে যা দেখতে দেখতে লাগে A X / / \ …
11 python  pandas 

4
উপাদানগুলির সংখ্যা 1 এর চেয়ে আলাদা এমন গোষ্ঠীতে ডেটাফ্রেম ফিল্টার করা
আমি নিম্নলিখিত স্ট্রাকচারযুক্ত ডেটাফ্রেমে কাজ করছি: import pandas as pd df = pd.DataFrame({'group':[1,1,1,2,2,2,2,3,3,3], 'brand':['A','B','X','C','D','X','X','E','F','X']}) print(df) group brand 0 1 A 1 1 B 2 1 X 3 2 C 4 2 D 5 2 X 6 2 X 7 3 E 8 3 F 9 3 X আমার লক্ষ্য হ'ল …

2
পান্ডাস: স্থানীয় মিনিমা-ম্যাক্সিমার ভিত্তিতে ডেটা জিগজ্যাগ বিভাজন
আমার একটি টাইমরিজ ডেটা আছে। ডেটা তৈরি করা হচ্ছে date_rng = pd.date_range('2019-01-01', freq='s', periods=400) df = pd.DataFrame(np.random.lognormal(.005, .5,size=(len(date_rng), 3)), columns=['data1', 'data2', 'data3'], index= date_rng) s = df['data1'] আমি স্থানীয় ম্যাক্সিমা এবং স্থানীয় মিনিমার মধ্যে সংযুক্ত একটি জিগ-জাগ লাইন তৈরি করতে চাই, যা এই শর্তটি সন্তুষ্ট করে যে |highest - lowest …

3
একাধিক শ্রেণিবদ্ধ কলাম রূপান্তর করুন
আমার ডেটাসেটে আমার দুটি শ্রেণীবদ্ধ কলাম রয়েছে যা আমি অঙ্ক করতে চাই। দুটি কলামে উভয় দেশ রয়েছে, কিছু ওভারল্যাপ রয়েছে (উভয় কলামে প্রদর্শিত হবে)। আমি একই দেশের জন্য কলাম 1 এবং কলাম 2 তে একই সংখ্যাটি দিতে চাই। আমার ডেটা কিছুটা মনে হচ্ছে: import pandas as pd d = {'col1': …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.