সফটওয়্যার খুব বড় ডেটা সেট জন্য প্লট উত্পাদন?


4

আমি কয়েকটি খুব বড় ডেটা সেট থেকে প্লট তৈরি করতে চাইছি। শুরু করতে আমি এতে ৪০ টি বিভিন্ন সিরিজের সাথে একটি ডেটা সেট করেছি, যার মধ্যে প্রতিটি 5000 টি নমুনা রয়েছে যার মধ্যে আমি প্লটের একটি লাইন দ্বারা প্রতিনিধিত্ব করে প্রতিটি সিরিজ দিয়ে লাইন চার্ট তৈরি করতে চাই।

সংখ্যা প্রায় 450 নমুনা পরে chokes। এক্সেল কিছুটা ভাল ভাড়া নেয় এবং 1000 টি নমুনায় যায়। তবে তাদের উভয়ই সমস্ত সিরিজ জুড়ে পুরো নমুনাগুলির পুরো সেটটি পরিচালনা করতে পারে না।

প্লট তৈরি করতে আমি কি আরও ভাল সফটওয়্যার ব্যবহার করতে পারি? চান OmniGraphSketcher ডেটা সেট এই আকার হ্যান্ডেল? আর কি হবে ? নাকি জ্ঞানপ্লট ?

একটি সহজ শেখার বক্ররেখার সাথে কিছু পছন্দ করা হয় (অর্থাত্ আমি প্লাগের মতো জিনুপ্লট এড়িয়ে চলেছি যতক্ষণ না এটি পরিষ্কার হয়ে যায় এটি আমার একমাত্র আশা ...) এবং প্লটটির জেনারেশন যদি সত্যিকার অর্থে না করা যায় তবে তা আমাকে বিরক্ত করে না । জিনিসগুলি সেট আপ করা এবং তারপরে পটভূমিতে প্লটটির কোনও চিত্র উত্পন্ন হওয়ার জন্য অপেক্ষা করতে আমার আপত্তি নেই। বোনাস পয়েন্টগুলি যদি এটি প্লট আউটপুট উত্পাদন করতে পারে যা চোখের পক্ষে সহজ যেমন সংখ্যা ছোট ডেটা সেটগুলির জন্য উত্পাদন করবে।


গ্রাফটি কি একটু স্প্যাগেটির মতো হবে না? বর্তমানে কোন ফরমেটে ডেটা রয়েছে? (একটি বিশাল পার্থক্য তৈরি করে না, তবে এটি জানতে সাহায্য করবে)) আমি আর প্রচুর ব্যবহার করি এবং আমি মনে করি এটি অবশ্যই আপনার গ্রাফটি পরিচালনা করতে পারে। আমি মাত্র 5000 সারি ম্যাট্রিক্স দ্বারা 40 কলাম তৈরি করার চেষ্টা করেছি এবং ম্যাটপ্ল্লট ব্যবহার করে এটির পরিকল্পনা করেছিলাম এবং এটি আমার ম্যাকের ব্যাটারি শক্তিতে 23 সেকেন্ড সময় নেয়।
ওয়েইন

@ ওয়াইন: চেহারা আমার উদ্দেশ্যগুলির জন্য ঠিক আছে। অ-শূন্য মানগুলির পর্যায়ক্রমিক সিরিজগুলিতে ডেটাগুলি অনেকগুলি শূন্য যা সত্যিকার অর্থে সিরিজ থেকে ক্রমে ওভারল্যাপ হয় না। এটি প্রতিটি সিরিজের একটি কলাম সহ সিএসভিতে রয়েছে এবং প্রথম কলামটি নমুনার ব্যবধানের টাইমস্ট্যাম্প।
আয়ান সি

আরে তিনটি পৃথক গ্রাফিক্স প্যাকেজ রয়েছে এবং প্রত্যেকের নিজের পছন্দমতো করার বিভিন্ন উপায় রয়েছে। বেস গ্রাফিক্স প্যাকেজে, আমি মনে করি ম্যাটপ্ল্লট আপনার যা ইচ্ছা তা করবে, এবং read.csv আপনার ডেটাতে পড়তে পারে।
ওয়েইন

উত্তর:


5

আমি ধরে নিলাম আপনি 5000 টি পর্যবেক্ষণ বোঝাতে চাইছেন। আর কাজ করবে, এবং আরস্টুডিও আপনাকে স্থানীয় অ্যাপ্লিকেশনটির চেয়ে আর কিছুটা জিইউআই দিয়ে আর ব্যবহার করতে পারবে। স্টাটার মতো বাণিজ্যিক সমাধান - যা একটি নরম শেখার বক্ররেখা রয়েছে, বিশেষত আর এর তুলনায় - কোনও ধরণের অসুবিধা ছাড়াই এ ধরণের নমুনা কাজ করবে (পরিসংখ্যানগত মান অনুসারে, 5000 টি পর্যবেক্ষণ অপেক্ষাকৃত ছোট ডেটাসেট)।

আপনি যদি কেবল একটি চক্রান্তের বাইরে পৌঁছতে চান তবে লার্নিং কার্ভটি গুরুত্বপূর্ণ হবে; অন্যথায়, লাইন গ্রাফগুলির জন্য ডকুমেন্টেশনগুলির তাত্ক্ষণিকভাবে নজর দেওয়া যথেষ্ট হবে (আর এর জন্য, উদাহরণস্বরূপ সেখানে এবং সেখানে চেক করুন )। আছে HTH!


প্রথম আর টিউটোরিয়াল লিঙ্কটি সত্যিই আশাব্যঞ্জক দেখাচ্ছে।
আয়ান সি

সেই প্রথম টিউটোরিয়ালটি প্লাস আরস্টুডিও আমাকে পেয়ে এই ডেটা প্লট করেছিল। ধন্যবাদ!
আয়ান সি

0

আর অবশ্যই আপনার জন্য সেই আকারের ডেটা পরিচালনা করবে। আপনি যদি নিয়মিত ডেটা সেট পরিচালনা করেন তবে আমি অবশ্যই এটি শেখার পরামর্শ দেব।

আপনাকে OpenOffice.org পরামর্শ দেওয়ার জন্য শর্টকাট (ওওও হিসাবে পরিচিত)।

তবে আমি অবাক হয়েছি যে এক্সেলটি আপনাকে ক্র্যাশ করেছে। আমি সম্প্রতি এক্সেল ব্যবহার করেছি (উইন্ডোজে) কোনও ইস্যু ছাড়াই 27 000 স্যাম্পলগুলির 8 সিরিজ পরিচালনা করতে, একটি সেকেন্ডের ভগ্নাংশে জটিল চার্ট উত্পাদন করে।

এই দুটি অ্যাপ্লিকেশন বাগ কোন মুহুর্তে বাগ? তারা যখন কোনও ডেটা সেট আমদানি করে, তখন কোনও সুযোগেই কি এটি তৈরি হয়, বা আপনি যখন কোনও চার্টে সংকলন করার চেষ্টা করেন তখন তারা কি বাগড হয়? আমি নাম্বারগুলি সম্পর্কে জানি না, তবে এক্সেলের একটি পদক্ষেপ না হারিয়ে কয়েক সহস্র সারি হ্যান্ডেল করতে সক্ষম হওয়া উচিত।


আমি 480 তম সারিটি নির্বাচন করার পরে নম্বরগুলি অনির্দিষ্টকালের জন্য প্লট আঁকার চেষ্টা করছে। এক্সেল: 1000 ম সারি। আমি সর্বশেষতম নম্বরগুলি ব্যবহার করছি তবে আমার এমএস অফিস বেশ কয়েক বছরের পুরনো। উভয়ই টেবিলগুলিতে কেবলমাত্র সূক্ষ্মভাবে ডেটা প্রদর্শন করে, প্লট করার সময় তারা কেবল আলাদা হয়ে যায়।
আয়ান সি

1
ম্যাক্সের জন্য মাইক্রোসফ্ট এক্সেল কুখ্যাতভাবে বিশ্বাসযোগ্য নয়, এটি পিসি সংস্করণের চেয়েও বেশি। আমি খুব কম ক্ষেত্রেই ক্র্যাশের মুখোমুখি হয়েছি যেখানে আমি এটি ডেটা সাফ করার চেয়ে বেশি ব্যবহার করেছি।
Fr.

@Fr। আমি এই বিবৃতিটি ব্যাক আপ করব, বৃহত্তর / আরও জটিল ডেটার জন্য মাইক্রোসফ্ট অফিস ব্যবহার করার সময় উইন্ডোজ ব্যবহার করার দৃ strongly় পরামর্শ দেব।
কঙ্কাল বো 19

1
@ স্কেলটনবো গত 7 বছরে আরও ভাল অর্জন করতে পারেনি, তাই না? এটা লজ্জার. :(
মিসানফোর্ড

আজ অবধি, আমি যে কোনও পরিস্থিতিতে এমএস এক্সেল ব্যবহারের বিরুদ্ধে পরামর্শ দেব এবং বেসিক ডেটা সংগ্রহ, পরিচালনা এবং ভিজ্যুয়ালাইজেশনের পরিবর্তে গুগল শীট ব্যবহার করব।
Fr.
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.