লোকেরা এসকিউএল এর চেয়ে পান্ডাকে কেন পছন্দ করে?


69

আমি ১৯৯ 1996 সাল থেকে এসকিউএল ব্যবহার করছি, তাই আমি পক্ষপাতদুষ্ট হতে পারি। আমি মাইএসকিউএল এবং এসকিউএলাইট 3 ব্যাপকভাবে ব্যবহার করেছি, তবে মাইক্রোসফ্ট এসকিউএল সার্ভার এবং ওরাকলও ব্যবহার করেছি।

পান্ডাদের সাথে আমি যে অপারেশনগুলি দেখেছি তার বেশিরভাগ অংশ এসকিউএল দিয়ে আরও সহজে করা যেতে পারে। এর মধ্যে একটি ডেটাসেট ফিল্টারিং, প্রদর্শনের জন্য নির্দিষ্ট কলামগুলি নির্বাচন করা, কোনও মানগুলিতে একটি ফাংশন প্রয়োগ করা ইত্যাদি includes

এসকিউএল এর একটি অপ্টিমাইজার এবং ডেটা অধ্যবসায় থাকার সুবিধা রয়েছে। এসকিউএল এর ত্রুটি বার্তাও রয়েছে যা পরিষ্কার এবং বোধগম্য। পান্ডাদের কিছুটা ক্রিপ্টিক এপিআই রয়েছে, যার মধ্যে কখনও কখনও [ stuff ]আপনার প্রয়োজন হয় এমন একক , অন্য সময় ব্যবহার করা উপযুক্ত [[ stuff ]]এবং কখনও কখনও আপনার প্রয়োজন হয় .loc। পান্ডাদের জটিলতার অংশটি এখানে দেখা গেছে যে এখানে প্রচুর ওভারলোডিং চলছে।

তাই আমি বোঝার চেষ্টা করছি কেন পান্ডাস এত জনপ্রিয়।


মন্তব্যগুলি বর্ধিত আলোচনার জন্য নয়; এই কথোপকথন চ্যাটে সরানো হয়েছে ।
শান ওভেন

উত্তর:


51

আসল প্রথম প্রশ্নটি হ'ল শুদ্ধ এসকিউএল বিমূর্তিগুলির চেয়ে ডেটাফ্রেম বিমূর্তিগুলি সহ লোকেরা কেন বেশি উত্পাদনশীল।

TLDR; এসকিউএল (মানব) বিকাশ এবং ডিবাগিং প্রক্রিয়াটির চারপাশে প্রস্তুত নয়, ডেটা ফ্রেমগুলি।

মূল কারণটি হ'ল ডেটা ফ্রেমের বিমূর্ততা আপনাকে ভার্চুয়াল এবং অযৌক্তিক বাসা বাঁধতে করতে এসকিউএল স্টেটমেন্টগুলি তৈরি করতে দেয়। নেস্টেড রুটিনগুলি লেখার প্যাটার্ন, সেগুলি পরীক্ষা করার জন্য তাদের মন্তব্য করে, এবং তারপরে সেগুলি সংশোধন করে পরিবর্তনের একক লাইনে প্রতিস্থাপন করা হয়। আপনি প্রাকৃতিকভাবে একটি প্রতিস্থাপনে (এমনকি স্পার্কেও) লাইনে লাইনে চালনা করতে পারেন এবং ফলাফলগুলি দেখতে পারেন।

একটি টেবিলটিতে একটি নতুন রূপান্তরিত (স্ট্রিং ম্যাংলেড কলাম) যুক্ত করার উদাহরণটি বিবেচনা করুন, তারপরে এর দ্বারা গোষ্ঠীকরণ এবং কিছু সংহতকরণ করুন। এসকিউএল বেশ কুৎসিত হয়। পান্ডারা এটি সমাধান করতে পারে তবে সত্যিকারের বড় ডেটা বা নির্দিষ্ট পার্টিশনে (সম্ভবত সম্প্রতি উন্নত) আসে যখন কিছু জিনিস অনুপস্থিত।

ডেটাফ্রেমগুলিকে এসকিউএল রুটিনগুলিতে একটি উচ্চ-স্তরের এপিআই হিসাবে দেখা উচিত, এমনকি পান্ডাস সহ কিছু এসকিউএল পরিকল্পনাকারীর কাছে রেন্ডার করা না হলেও।

-

আপনি সম্ভবত এটি প্রায় প্রযুক্তিগত আলোচনা করতে পারেন, কিন্তু আমি নীচের ব্যবহারকারীর দৃষ্টিভঙ্গি বিবেচনা করছি।

এসকিউএলের বিপরীতে আপনি পান্ডস ডেটা ম্যানিপুলেশনের আশেপাশে আরও অনেক প্রশ্ন দেখতে পাচ্ছেন তার একটি সহজ কারণ হ'ল এসকিউএল ব্যবহার করা, সংজ্ঞা অনুসারে, একটি ডাটাবেস ব্যবহার করা, এবং প্রচুর ব্যবহারের ক্ষেত্রে এই দিনগুলির জন্য কেবল 'ডেটা বিটস' দরকার হয় এক-সম্পন্ন 'কাজ (.csv, ওয়েব এপিআই ইত্যাদি থেকে)। এই ক্ষেত্রে ডেটাবেস থেকে লোডিং, স্টোরিং, হেরফের এবং নিষ্কাশন কার্যকর নয় vi

তবে, যেসব ক্ষেত্রে ব্যবহার-কেস পান্ডা বা এসকিউএল উভয়ই ব্যবহারযোগ্যতা প্রমাণ করতে পারে তা বিবেচনা করে আপনি অবশ্যই ভুল নন। যদি আপনি অনেকগুলি পুনরাবৃত্ত ডেটা ম্যানিপুলেশন কাজ করতে চান এবং ফলাফলগুলি চালিয়ে যান, আমি সর্বদা এসকিউএল দিয়ে যাওয়ার চেষ্টা করার পরামর্শ দিই। আমি যে কারণটি দেখেছি কেন এ থেকে অনেক ব্যবহারকারী এমনকি এসকিউএল এর মাধ্যমে দ্বিগুণ হয় না।

প্রথমত, এসকিউএল-এর উপর প্যান্ডাসের সবচেয়ে বড় সুবিধাটি হ'ল এটি বৃহত্তর পাইথন মহাবিশ্বের অংশ, যার অর্থ হ'ল আমি আমার ডেটা লোড, পরিষ্কার, হেরফের এবং দৃশ্যধারণ করতে পারি (আমি পান্ডার মাধ্যমে এসকিউএল চালাতে পারি ...)। অন্যটি, বেশ সহজভাবে, খুব বেশি ব্যবহারকারীরা এসকিউএল এর সক্ষমতার পরিমাণ জানেন না। প্রতিটি শিক্ষানবিশ এসকিউএল এর 'এক্সট্রাকশন সিনট্যাক্স' শিখেন (SELECT, FROM, WHERE, ইত্যাদি) ডিবি থেকে পরের স্থানে আপনার ডেটা পাওয়ার উপায় হিসাবে। কেউ কেউ আরও অগ্রিম গ্রুপিং এবং পুনরাবৃত্তির বাক্য গঠন গ্রহণ করতে পারে। কিন্তু এর পরে জ্ঞানগুলির মধ্যে একটি চমত্কার উল্লেখযোগ্য উপসাগর থাকে, যতক্ষণ না আপনি বিশেষজ্ঞদের কাছে পৌঁছে যান (ডিবিএ, ডেটা ইঞ্জিনিয়ার্স ইত্যাদি)।

tl; dr: এটি প্রায়শই ব্যবহারের ক্ষেত্রে, সুবিধার্থে বা এসকিউএল এর ক্ষমতার পরিমাণের কাছাকাছি জ্ঞানের ব্যবধানকেই কমিয়ে দেয়।


2
আমি মনে করি এসকিউএল মূলত সেট করা হচ্ছে একটি বড় অংশের ভূমিকা পালন করে, যখন অন্যান্য প্রযুক্তিগত অঞ্চলের লোকেরা লাইন দিয়ে ডেটা লাইন পরিচালনা করতে ব্যবহৃত হয়। এছাড়াও বিবেচনা করুন যে ডেটা বেশিরভাগই কেবল পান্ডার ডেটা তবে বিভিন্ন এসকিউএল ইঞ্জিন বিভিন্ন কার্যক্রমে নির্মিত বিভিন্ন সমর্থন করে যা আপনার কর্ম দিবসের সময় কাটাতে এবং পরিবর্তন করতে হলে বন্যভাবে বিরক্তিকর দ্রুত পেতে পারে
ডেভ

3
আমি বলব না এটি কার্যকর নয়। আপনি যদি কোনও পান্ডাস ডেটা ফ্রেমে ডেটা পেতে পারেন তবে আপনি সম্ভবত এটি পোস্টগ্রিসএসকিউএল ডিবিতে স্থানান্তর করতে পারেন। তবে একটি হয়ে ওঠার জন্য, সম্ভবত এটি আপনার সাশ্রয়ের চেয়ে বেশি প্রচেষ্টা এবং সময়।
jpmc26

2
আমি সম্মত হই যে কিছু ETL পদ্ধতি প্রোগ্রামারকেন্দ্রিক সিদ্ধান্ত হিসাবে উপস্থিত বলে মনে হচ্ছে। এটি হ'ল তারা ডেটা ম্যানিপুলেট করতে পছন্দ করে তারপরে ডাটাবেসে এই "নিখুঁত" পেডলোড উপস্থাপন করে। তবে, আপনি যেমনটি ইঙ্গিত করেছেন, এটি যদি বেশ কয়েকটি এসকিউএল কোয়েরির মাধ্যমে করা যায়, তবে অতিরিক্ত প্রোগ্রাম্যাটিক স্তরটি অপ্রয়োজনীয়। ঠিক আমি সম্প্রতি যা মুখোমুখি হয়েছিলাম। ওপি এবং আপনার উত্তরটি ইঙ্গিত করে, এটি "ওল্ড স্কুল" বা ডিবিএ-কেন্দ্রিক লোকেরা এটি দেখতে পারে এবং বলে, এসকিউএল এ এটি কেন করবেন না (এমনকি বেশ কয়েকটি সাধারণ প্রশ্নও!)। এটি বলেছিল, আমি পান্ডগুলি অত্যন্ত বিচিত্র ডেটা সেটের জন্য খুব শক্তিশালী বলে খুঁজে পেয়েছি।
সালটিসুব 2

1
@ সালটিসুব প্রোগ্রামিয়াল স্তর থেকে জিনিসগুলি এসকিউএলে স্থানান্তরিত করার ঠিক একটি বিষয়: এটি একটি ন্যায্য পয়েন্ট এবং পুরোপুরি বৈধ হতে পারে, তবে এসকিউএল পদ্ধতিতে অ্যাপ্লিকেশন লজিকের সমাহার যতটা সম্ভব মাথা ব্যথার নিজস্ব স্বাদ আনতে পারে।
বৈদ্যুতিন হেড

1
@ ইলেক্ট্রিকহিড আমি একমত যে এখানে সঠিক ভারসাম্য থাকা দরকার। যদি এসকিউএল প্রশ্নের একটি সিরিজ যথাযথভাবে কাজগুলি সম্পাদন করতে পারে, তবে এটি অবশ্যই সহজ এবং আরও কার্যকর হতে পারে। বিপরীতভাবে, আপনি যেমনটি ইঙ্গিত করেছেন, এসকিউএল পদ্ধতি ইত্যাদিতে যদি কাউকে প্রচুর পরিমাণে যুক্তি রাখতে হয় তবে পান্ডাদের দৃ strongly়ভাবে বিবেচনা করা উচিত। বিশেষত উপরের মত যদি আপনি বিভিন্ন ডাটাবেস স্বাদ ব্যবহার করছেন - এসকিউএল সিনট্যাক্স পার্থক্যগুলি তখন খুব লোমশ হয়ে উঠতে পারে।
সালটিসুব 2

29

এই দুটি জিনিসের প্রয়োগে যতটা ওভারল্যাপ রয়েছে, এটি আপেলকে কমলার সাথে তুলনা করে।

পান্ডাস হল ডেটা অ্যানালাইসিস টুলকিট যা পাইথনে প্রয়োগ করা হয়, এটি একটি সাধারণ উদ্দেশ্য প্রোগ্রামিং ভাষা। এসকিউএল একটি সম্পর্কিত ডোমেন-নির্দিষ্ট ভাষা যা সম্পর্কিত সম্পর্কিত তথ্য অনুসন্ধানের জন্য (সাধারণত একটি রিলেশনাল ডাটাবেস ম্যানেজমেন্ট সিস্টেমে যা এসকিউএল, মাইএসকিউএল, ওরাকল, এসকিউএল সার্ভার, পোস্টগ্রিসকিউএল ইত্যাদি উদাহরণ)।

এসকিউএল বোঝায়

  • কোনও আরডিবিএমএস * -এ ডেটা নিয়ে কাজ করা যা কাজের চাপের জন্য উপযুক্ত বা নাও হতে পারে, এমনকি এটি কেবলমাত্র একটি ছোট এসকিউএল ডাটাবেস,
  • ডাটাবেস ডোমেন জ্ঞান (শেষ ব্যবহারকারী, বিকাশকারী এবং / বা প্রশাসক হিসাবে; "এসকিউএল দ্রুত হয়" এই পরামর্শটি আমি প্রায়শই দেখি একটি বিশাল অতিরিক্ত-সরলকরণ) এবং এবং
  • কার্যকরভাবে এসকিউএল ব্যবহার করার ক্ষেত্রে অ-তাত্পর্যপূর্ণ শিক্ষার বক্ররেখা কাটিয়ে ওঠা, বিশেষত বিশেষজ্ঞ বিশিষ্ট অ্যাপ্লিকেশনগুলিতে যেমন ডেটা অ্যানালাইসিসে (সাধারণ তথ্যের সাধারণ প্রতিবেদন তৈরির বিরোধী)।

* এসকিউএল যে ডোমেইন-নির্দিষ্ট তাই নোএসকিউএল ডাটাবেসগুলির মতো সম্পর্কিত ডেটাবেসগুলির ক্রমবর্ধমান সাধারণ বিকল্পগুলির সাথে কাজ করার ক্ষেত্রে এটি খুব কম প্রাসঙ্গিক হয়ে উঠছে এ বিষয়টি সত্যভাবে আন্ডারলাইং করার যোগ্য । এটি কীভাবে ডেটা সংরক্ষণ এবং কাঠামোগত করা যায় তার একটি মৌলিক স্থানান্তর উপস্থাপন করে এবং এটি অর্জনের লক্ষ্যে এসকিউএল স্ট্যান্ডার্ডাইজেশনের বিকাশের মতো অ্যাক্সেস করার কোনও সর্বজনীন সাধারণ উপায় নেই।

অন্যদিকে পাইথন (পান্ডাস মোটামুটি "পাইথোনিক" তাই এটি এখানে সত্য হিসাবে ধরেছে) নমনীয় এবং বিভিন্ন ব্যাকগ্রাউন্ডের লোকদের কাছে অ্যাক্সেসযোগ্য। এটি একটি "স্ক্রিপ্টিং ল্যাঙ্গুয়েজ", একটি কার্যকরী ভাষা এবং সম্পূর্ণ বৈশিষ্ট্যযুক্ত ওওপি ভাষা হিসাবে ব্যবহার করা যেতে পারে। ভিজ্যুয়ালাইজেশন ক্ষমতা এবং ডেটা সোর্স ইন্টারঅ্যাপেরিবিলিটি পান্ডায় নির্মিত হয়েছে, তবে পাইথন আপনার কর্মপ্রবাহে (যা বেশিরভাগ জিনিসগুলি) যা করতে পারে তা অন্তর্ভুক্ত করতে পারেন; বৈজ্ঞানিক পাইথন বাস্তু ballooned এবং যেমন মহান সরঞ্জাম অন্তর্ভুক্ত করেছে Jupyter নোটবুক এবং অপরিহার্য scipy যেমন লাইব্রেরি matplotlib এবং numpy (যা পান্ডাস উপর বিল্ড)। পান্ডসের ডেটা বিশ্লেষণের গুরুত্বপূর্ণ উপাদানগুলি হ'ল আরইনস্পায়ার্ড এবং আপনি সাধারণত পরিসংখ্যানবিদদের উম্মিং এবং আহহিং পাবেন না যে তারা আর (বা সম্ভবত ক্রমবর্ধমান পাণ্ডা!) ব্যবহার করে কিনা এটি একটি ডেটাবেজে রাখে এবং এসকিউএল-এ তাদের বিশ্লেষণ লেখার উপর ব্যবহার করে।

আমি বলছি না পাণ্ডা এসকিউএল বা তদ্বিপরীত থেকে ভাল, তবে এসকিউএল একটি খুব ডোমেইন-নির্দিষ্ট সরঞ্জাম যেখানে পান্ডাস একটি বিশাল, নমনীয় এবং অ্যাক্সেসযোগ্য ইকোসিস্টেমের অংশ। আমি জিওপ্যাটিয়াল ডেটা সিস্টেমগুলির সাথে কাজ করি, যার মধ্যে সম্পর্কিত সম্পর্কিত ডাটাবেসগুলি একটি বিশাল অংশ এবং এসকিউএল একটি শক্তিশালী এবং প্রয়োজনীয় সরঞ্জাম। যাইহোক, পান্ডাস হ'ল একটি সমান নয় যদি আমার প্রতিদিনের সরঞ্জামকিট এবং এসকিউএল প্রায়শই ডেটা আনতে প্রেরণা হয় - সম্ভবত কিছু প্রাক প্রক্রিয়াজাতকরণ সহ - তাই আমি পান্ডাতে এটি দিয়ে জিনিসগুলি করতে পারি।


1
এটিই একমাত্র সত্য উত্তর, এটি বেছে নেওয়া উচিত। এসকিউএল এবং পান্ডস দুটি আলাদা জিনিস, লোকেরা কী তুলনা করতে চেষ্টা করছে তা আমি বুঝতে পারি না।
জেনেটে

আমি সন্দেহ করি যে এটি কোথাও থেকে কিছু ডেটা আনার এবং ম্যাসেজ করার জন্য কোড-জাতীয় কিছু লেখার একটি শেষ ব্যবহারকারীর দৃষ্টিভঙ্গি এবং কিছু নম্বর থুথু। আমি পুরোপুরি অবাক হই না; ডেটা বিশ্লেষকরা কীভাবে কোনও পুরানো তবে অন্যথায় অবিস্মরণীয় ওরাকল ডাটাবেস সহ উপস্থাপন করেছিলেন তার প্রথম হাতের অভিজ্ঞতা পেয়েছি যে এটি কী এবং কীভাবে এটির সাথে সংযুক্ত হবে তার প্রথম ধারণাটি কীভাবে পাওয়া যায় তা কেবল তথ্যই বেরিয়ে আসে। আমি বিশ্বাস করি এটি প্রযুক্তির বোঝার মৌলিক অভাবকে বিশ্বাসঘাতকতা করে - এসকিউএল এর ক্ষেত্রটি কীভাবে ভুল বোঝাবুঝি হয়ে যায় তা আমি আশাবাদী জোর দিতে আসলে কিছুটা যুক্ত করেছি।
বৈদ্যুতিন হেড

NoSQL পরিস্থিতিতে অপ্রাসঙ্গিক হওয়ার বিষয়ে আপনার বিটকে আমি চ্যালেঞ্জ জানাব। উদাহরণস্বরূপ পোস্টগ্র্রেএসকিউএল এর জেএসওএন স্টোরেজ দিয়ে যে পদক্ষেপ নিয়েছে তা বিবেচনা করুন।
jpmc26

আমি আমার কথাটি সাবধানে বেছে নেওয়ার চেষ্টা করেছি; অনেক কিছু ভালভাবে করা সত্ত্বেও পোস্টগ্রিসকিউএল এখনও একটি আরডিবিএমএস (যেমন এসকিউএল সার্ভারটি গ্রাফ সমর্থন করার পরেও রয়েছে)। তবে, আমি শব্দটিকে স্পর্শ করতে শিথিল করেছি কারণ এটি এখনও একটি ভাল পয়েন্ট: কিছু ক্রসওভার রয়েছে এবং গুরুত্বপূর্ণভাবে, কিছু নোএসকিউএল সিস্টেমের জন্য এসকিউএল এপিআই রয়েছে। এটা তোলে হয় সমম্বয় যদিও, এসকিউএল একটি সার্বজনীন ভাষা নয় এবং সমস্ত ডেটা relationally গঠিত হয়।
বৈদ্যুতিন হেড

আমি মনে করি আপনি এসকিউএল-তে যা কিছু করতে পারেন যা পান্ডসে সম্ভব। এসকিউএল নমনীয় নয় তবে এটি অনেকটাই অনুকূলিত।
মিডিয়া

22

প্রথমত, পান্ডাস খুব বেশি জনপ্রিয় নয়। আমি উভয়ই পান্ডা এবং এসকিউএল ব্যবহার করি। প্রথমে আমি টাস্কটি বোঝার চেষ্টা করি- এটি যদি এসকিউএল-এ করা যায় তবে আমি এসকিউএল পছন্দ করি কারণ এটি পান্ডার চেয়ে দক্ষ efficient একটি বড় ডেটা (10,000,000 x 50) এ কাজ করার চেষ্টা করুন। এসকিউএল এবং পান্ড উভয় ক্ষেত্রেই কিছু গ্রুপবাই অপারেশন করার চেষ্টা করুন । তুমি বুঝবে.

আমি পান্ডাগুলি ব্যবহার করি যেখানে এটি কার্যকর-যেমন একটি কলামের মানগুলিকে অ্যারেতে বিভক্ত করা এবং এতে কিছু স্টাফ করা (যেমন অ্যারের বাইরে কেবলমাত্র কয়েকটি মান নির্বাচন করা)। এখন এসকিউএল-তে কোড করা এই ধরণের টাস্ক তুলনামূলকভাবে শক্ত, তবে পান্ডাস আপনার কাজটি সহজ করবে।


এই অদক্ষতা পান্ডার সাথে নির্দিষ্ট? আমি সি # তে মেমরির ডেটা ম্যানিপুলেশনটি বেশ খানিকটা করেছি এবং এটি বেশ সহজ এবং দক্ষ বলে মনে করেছি, যদি এটি মেমরির সাথে ফিট হয় তবে এটি একটি শট ছিল (অর্থাত্ ডেটা পরিবর্তন হিসাবে সূচকগুলি ক্রমান্বয়ে আপডেট করার প্রয়োজন নেই)।
কোডসইনচাউস

পান্ডা বোঝা যাচ্ছে দ্রুত গতিতে সুবিধে হওয়ার জন্য, তবে এটি সঠিকভাবে ব্যবহার না করা হলে এটি দ্রুত হতে পারে না তা বলার অপেক্ষা রাখে না। শেষ পর্যন্ত, একটি ডাটাবেসে ডেটাতে একটি এসকিউএল কোয়েরি কার্যকর করা যাদু নয় - এর জন্য কোনও কিছুর মতো সংস্থান প্রয়োজন, এটি ঠিক (যদি আপনি এটি সঠিকভাবে করেন!) আপনি আশাবাদী সাবধানতার সাথে কনফিগার করা, মৌমাছি ডাটাবেস সার্ভারগুলিতে সংস্থানগুলি ব্যবহার করছেন । আপনার পাইপলাইন ডান পাণ্ডাস বা অনুরূপে পাওয়া (যেমন স্ট্রিমিং ডেটা এটি সমস্ত স্মৃতিতে লোড করার পরিবর্তে) নির্ধারণ করতে চলেছে যে কয়েকটি প্রচেষ্টা কতটা সফল।
ইলেকট্রিক হেড

@ কোডসইনচাওস পান্ডাস বনাম এসকিউএল - qr.ae/TUIpzE এর এই উত্তর রয়েছে । সেখানে এটি পান্ডাস ব্যবহারের সুবিধাগুলি এবং অসুবিধাগুলি বর্ণনা করা হয়েছে।
অঙ্কিত শেঠ

12

আমি সেই সমস্ত লোকদের মধ্যে যারা আমার এসকিউএল জানার পরেও যদি প্রতিটি ক্ষেত্রে আর এর ডিপ্লাইার (ভাষা, প্রয়োজনীয়ভাবে সরঞ্জাম নয়) ব্যবহার করে তবে আমি তাদের মধ্যে একজন

পান্ডাস / ডিপিপ্লায়ার / ডেটাতে আমি যে বড় সুবিধাটি দেখছি তা হল অপারেশনগুলি পারমাণবিক এবং উপরে থেকে নীচে পড়া যায়।

এসকিউএল-তে আপনাকে পুরো স্ক্রিপ্টটি পার্স করতে হবে, চারপাশে ঝাঁপিয়ে পড়ছে (কী ঘটছে যা আত্মবিশ্বাসিত হচ্ছে, কীভাবে যুক্ত হচ্ছে এবং কীভাবে - বামে? অভ্যন্তরীণ? ডান ?, কোনও ফিল্টার প্রয়োগ করা আছে?) কী ঘটছে তা পুরোপুরি উপলব্ধি করতে।

পান্ডাস এট আল পাইপলাইনের প্রতিটি ধাপে স্বয়ংসম্পূর্ণ, এটি ইনপুট ডেটা দিয়ে কিছু করে এবং আউটপুট ডেটার ফেরত দেয়, এই ক্রমিক ক্রিয়াকলাপটি কী ঘটছে তা নিয়ে যুক্তিটি সহজ করে তোলে যেহেতু প্রতিটি ক্রিয়াকলাপের জন্য সুস্পষ্টভাবে সংজ্ঞায়িত রাষ্ট্রের পরিবর্তে কেবলমাত্র কাজ করা হয় না একটি প্রশ্নের স্তর।

এবং হ্যাঁ আপনি WITHবিবৃতি এবং যেমন করতে পারেন তবে এটির জন্য আরও অনেক কোড প্রয়োজন এবং পাইপিংয়ের তুলনায় কোন বস্তুটি ব্যবহৃত হচ্ছে তা পরিষ্কার নয়।


6

আমি পান্ডা / পাইথনের কাছে মোটামুটি নতুন তবে এসকিউএল সার্ভার ডিবিএ, আর্কিটেক্ট, অ্যাডমিনিস্ট্রেটর ইত্যাদি হিসাবে আমার 20+ বছর রয়েছে I আমি পান্ডাকে ভালবাসি এবং আমি আমার স্বাচ্ছন্দ্যে ফিরে আসার আগে সবসময় পান্ডসে কাজ করার চেষ্টা করার জন্য নিজেকে চাপ দিচ্ছি, আরামদায়ক এসকিউএল ওয়ার্ল্ড।

আরডিবিএমএস কেন আরও ভাল: আরডিবিএমএসের সুবিধা হ'ল ক্যোরির গতি এবং ডেটা পড়ার ক্রিয়াকলাপগুলি অনুকূল করে তোলার অভিজ্ঞতা তাদের বছর। চিত্তাকর্ষক বিষয়টি হ'ল লেখার গতি অনুকূলকরণের প্রয়োজন এবং অত্যন্ত সহবর্তী অ্যাক্সেস পরিচালনা করার জন্য একই সাথে ভারসাম্য বজায় রেখে তারা এটি করতে পারে। কখনও কখনও এই অতিরিক্ত ওভারহেডগুলি পান্ডাদের কাছে সুবিধাটি কাত করে যখন সহজ, একক-ব্যবহারকারীর ক্ষেত্রে আসে। তবে তারপরেও, একটি পাকা ডিবিএ লেখার গতি বেশি পড়ার গতির জন্য একটি ডাটাবেসকে টিউন করতে পারে। ডিবিএ'র মাধ্যমে ডেটা স্টোরেজ অনুকূলকরণ, কৌশলগত ডিস্ক পৃষ্ঠা আকার, পৃষ্ঠা পূরণ / প্যাডিং, ডেটা কন্ট্রোলার এবং ডিস্ক বিভাজন কৌশল, অনুকূলিত আই / ও পরিকল্পনা, ইন-মেমরি ডেটা পিনিং, প্রাক-সংজ্ঞায়িত এক্সিকিউশন প্ল্যানস, ইনডেক্সিং, ডেটা সংকোচনের মতো জিনিসগুলি গ্রহণ করতে পারে , এবং আরো অনেক. আমি অনেক পান্ডার বিকাশকারীদের কাছ থেকে এই ধারণাটি পেয়েছি যে তারা ' সেখানে উপলব্ধ যে গভীরতা বুঝতে না। আমার মনে হয় যা ঘটে তা হ'ল যদি পান্ডা বিকাশকারীদের কাছে এই অপটিমাইজেশনগুলির প্রয়োজনের জন্য এত বড় ডেটা না থাকে তবে তারা আপনাকে বাক্স থেকে বাঁচাতে পারে এমন কতটা প্রশংসা করেন না। আরডিবিএমএসের বিশ্বটির এটির অনুকূলকরণের 30 বছরের অভিজ্ঞতা রয়েছে তাই যদি বড় ডেটাসেটের কাঁচা গতি প্রয়োজন হয়, আরডিবিএমএসকে পরাজিত করা যেতে পারে।

পাইথন / পান্ডাস কেন ভাল: এটি বলেছিল, গতি সবকিছু নয় এবং অনেকগুলি ব্যবহারের ক্ষেত্রে ড্রাইভিং ফ্যাক্টর নয়। আপনি কীভাবে ডেটা ব্যবহার করছেন, এটি ভাগ করা হয়েছে কি না এবং আপনি প্রক্রিয়াটির গতি সম্পর্কে যত্নশীল কিনা তা নির্ভর করে। আরডিবিএমএসগুলি তাদের ডেটা স্ট্রাকচারগুলিতে সাধারণত আরও কঠোর হয় এবং ডেটা আকারের সাথে আরও নিরঙ্কুশ হয়ে উঠতে বিকাশকারীকে বোঝা দেয়। পান্ডাস আপনাকে এখানে আরও .িলে .ালা হতে দেয়। এছাড়াও, এবং এটি আমার প্রিয় কারণ, আপনি সত্য প্রোগ্রামিং ভাষায় রয়েছেন। প্রোগ্রামিং ভাষা আপনাকে ডেটাতে উন্নত যুক্তি প্রয়োগ করতে অসীম আরও নমনীয়তা দেয়। অবশ্যই মডিউল সমৃদ্ধ ইকোসিস্টেম এবং তৃতীয় পক্ষের ফ্রেমওয়ার্ক রয়েছে যা এসকিউএল কাছে আসতে পারে না। এক কোড বেসে ওয়েব উপস্থাপনা বা ডেটা ভিজ্যুয়ালাইজেশনে সমস্ত উপায়ে কাঁচা ডেটা থেকে যেতে সক্ষম হওয়া খুব সুবিধাজনক। এটি আরও অনেক বহনযোগ্য। আপনি পাবলিক নোটবুকগুলি সহ প্রায় যেকোন জায়গায় পাইথন চালাতে পারেন যা আপনার ফলাফলের সীমা বাড়িয়ে দিতে পারে আরও দ্রুত লোকের কাছে পেতে। ডাটাবেসগুলি এ থেকে সেরা হয় না।

আমার উপদেশ? আপনি যদি নিজেকে বৃহত্তর এবং বৃহত্তর ডেটাসেটগুলিতে স্নাতক হন বলে মনে করেন তবে ডুবে যাবেন এবং আরডিবিএমএস কীভাবে সহায়তা করতে পারে তা শিখতে হবে। আমি মিলিয়ন সারি, মাল্টি-টেবিল জয়েন, সমষ্টিগত সমীক্ষাগুলি 5 মিনিট থেকে 2 সেকেন্ডে সুরযুক্ত দেখেছি। আপনার সরঞ্জাম বেল্টে এই বোঝাপড়াটি আপনাকে আরও ভাল গোলাকার ডেটা বিজ্ঞানী হিসাবে তৈরি করে। আপনি আজ পান্ডাসে সমস্ত কিছু করতে সক্ষম হতে পারেন তবে কোনও দিন আপনার একটি অ্যাসাইনমেন্ট থাকতে পারে যেখানে আরডিবিএমএস সেরা পছন্দ।


5

পান্ডারা যে কাজগুলি করতে পারে তা এসকিউএল করতে পারে না

  1. df.describe()
  2. প্লট করা, যেমন df['population'].plot(kind='hist')
  3. প্রশিক্ষণ মেশিন লার্নিং অ্যালগরিদমগুলির জন্য সরাসরি ডেটাফ্রেম ব্যবহার করুন

পান্ডারা যে কাজগুলি করতে পারে তা এসকিউএল পাশাপাশি করতে পারে তা আমি জানতাম না

  1. রপ্তানি CSV করুন: df.to_csv('foobar.sv')। আপনি যখন কোনও ব্যবসায়িক মালিককে এক্সেলের সাথে কাজ করতে চান এমন কিছু দেখাতে চান তখন এটি গুরুত্বপূর্ণ। এবং df.to_excelপাশাপাশি আছে। তবে এসকিউএল এ, আপনি SELECT a,b,a+b INTO OUTFILE '/tmp/result.txt' FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' LINES TERMINATED BY '\n' FROM test_table;(vy32 আপনাকে ধন্যবাদ!) করতে পারেন

1
খুশী হলাম। যদিও এগুলির বেশিরভাগগুলি এসকিউএল-তে কার্যকর করা যেতে পারে বলে মনে হয়। (এসকিউএলের সরাসরি সিএসভি রফতানি হয়))
vy32

আপনি দয়া করে আমাকে একটি ক্যোয়ারী পাঠাতে পারবেন যা সিএসভিতে রফতানি করে? (আমি শুধুমাত্র টুলস যা কিছু এসকিউএল ভিত্তিক ডাটাবেস জন্য এটা করতে জানি, কিন্তু আমি একটি ক্যোয়ারী দেখিনি ... তাই আমি সন্দেহ এই এসকিউএল স্পেসিফিকেশন অংশ)
মার্টিন Thoma

1
SELECT a,b,a+b INTO OUTFILE '/tmp/result.txt' FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' LINES TERMINATED BY '\n' FROM test_table; দেখুন dev.mysql.com/doc/refman/8.0/en/select-into.html
vy32

আপনাকে অনেক ধন্যবাদ, ভাই! আমি মনে করি যখন আমি ঘরে থাকব তখন আমি আমার উত্তর সামঞ্জস্য করব :-)
মার্টিন থোমা

ঠিক. মনে রাখবেন, ফাইলটি ক্লায়েন্ট নয়, এসকিউএল সার্ভারে শেষ হয়।
vy32

3

এই উত্তরগুলির মধ্যে যে বিষয়টি আমি উল্লেখ করতে চাইছি তা কেবল এটি আপনি এসকিউএল কীভাবে ব্যবহার করছেন তার উপরও নির্ভর করে। উদাহরণস্বরূপ তোরণ নিন। কিছু কারণে আরপিপি.ডি ফাংশনের কোনওটিতেই বেশ কয়েকটি বৈশিষ্ট্য কার্যকর করা যায় না। এটি সত্যিই অদ্ভুত কারণ কারণ প্রতিটি অন্যান্য অজগর বর্গ লাইব্রেরি করে। আরকিপি.ডি ফাংশনগুলিতে দ্য স্টেটমেন্টটিও প্রায় 120 টি অক্ষরের মধ্যে সীমাবদ্ধ। এর মূল অর্থ হ'ল যদি আপনার ডাটাবেসের সাথে তুলনামূলকভাবে উচ্চ সংখ্যক জিনিসগুলি করার চেষ্টা করেন তবে আপনার একমাত্র আসল পছন্দটি হল আপনার নির্বাচিত আরকিপি.ডি ফাংশনকে একাধিকবার কল করা এবং প্রতিবার যেখানেই বক্তব্যটি পরিবর্তন করা। এই প্রক্রিয়াটি দ্রুততর করতে আপনি কয়েকটি কৌশল ব্যবহার করতে পারেন - উদাহরণস্বরূপ আপনি আপনার ডেটাসেটের অংশগুলি পুনরাবৃত্তি করতে পারেন - তবে আক্ষরিক অর্থে এই কৌশলগুলি প্রতিটি আরকিপি.ডিএ ব্যবহার করার চেয়ে অনেক ধীর গতিতে থাকে। আপনার পুরো টেবিলটিকে পান্ডাস ডেটা ফ্রেমে লোড করতে সার্চকার্সার এবং তারপরে এটি পান্ডাস, নম্পী এবং যদি আপনার ডেটা সত্যিই বিশাল, ড্যাস্ক ব্যবহার করে ম্যানিপুলেট করে। আমাকে এখানে জোর দেওয়া দরকার যে পান্ডাগুলি এই ক্ষেত্রে কেবল সামান্য দ্রুত নয়। এটি ঘৃণ্যভাবে দ্রুত। এটি এত দ্রুত যে আমি তাড়াতাড়ি না করার জন্য আমি আক্ষরিকভাবে নিজের দিকে হাসছিলাম। পান্ডা ব্যবহার করে একটি স্ক্রিপ্টের কার্যকরকরণের সময়টি এক ঘন্টারও বেশি সময় থেকে নামিয়ে দেওয়া হয় - আমি ভুলে যাই যে এটি যদি 3.5 ঘন্টা বা 1.5 ঘন্টা থেকে আক্ষরিকভাবে 12 মিনিটে যায় if এত তাড়াতাড়ি যে আমি তাড়াতাড়ি না করার জন্য আমি আক্ষরিকভাবে নিজের দিকে হাসছিলাম। পান্ডা ব্যবহার করে একটি স্ক্রিপ্টের কার্যকরকরণের সময়টি এক ঘন্টারও বেশি সময় থেকে নামিয়ে দেওয়া হয় - আমি ভুলে যাই যে এটি যদি 3.5 ঘন্টা বা 1.5 ঘন্টা থেকে আক্ষরিকভাবে 12 মিনিটে যায় if এত তাড়াতাড়ি যে আমি তাড়াতাড়ি না করার জন্য আমি আক্ষরিকভাবে নিজের দিকে হাসছিলাম। পান্ডা ব্যবহার করে একটি স্ক্রিপ্টের কার্যকরকরণের সময়টি এক ঘন্টারও বেশি সময় থেকে নামিয়ে দেওয়া হয় - আমি ভুলে যাই যে এটি যদি 3.5 ঘন্টা বা 1.5 ঘন্টা থেকে আক্ষরিকভাবে 12 মিনিটে যায় if

একটি বিষয় লক্ষণীয় যে আমি যখন এসকিএল দিয়ে এটি করতে পারতাম তবে এটি শিখতে আমার অনেক বেশি সময় লাগত। আমাকে হয় বিশেষত অ্যাক্সেসে বর্গক্ষেত্রের জন্য ক্রিয়াকলাপগুলি শিখতে হবে - এই স্ক্রিপ্টটির ডেটা শেষ হয়েছিল - এ্যাক্স-এর এসকিউএল যতটা প্রয়োজন ছিল ততটা আমার ছিল না যখন আমি আসলে এটি করার চেষ্টা করছিলাম -, বা আমাকে আমার সমস্ত ডেটা একটি স্ক্যালিটি 3 ডাটাবেসে লিখতে হবে, সেখানে এটি চালিত করতে হবে এবং তারপরে এটি অ্যাক্সেসে রেখে দিতে হবে। যদিও এটি আমাকে অনুরূপ পারফরম্যান্স ফলাফল দিয়েছে, তবে ভবিষ্যতে আমার স্ক্রিপ্টটি সংশোধন করা আরও শক্ত করে তুলবে।

সুতরাং হ্যাঁ, কখনও কখনও পান্ডাস এবং আপনার নিজের হাতে থাকা এসকিএল বিকল্পগুলি ব্যবহার করার চেয়ে কেবল কঠোরভাবে ভাল । এসকিউএল করার জন্য আমার যা যা করা দরকার ছিল তা পান্ডাসে একটি ফাংশন দিয়েই করা হয়েছিল। আপনি চাইলে পান্ডাসের সাথে স্কয়ার সিনট্যাক্সও ব্যবহার করতে পারেন। ট্যানডেমে পান্ডা এবং স্কুয়েল ব্যবহার না করার সামান্য কারণ রয়েছে।

পাণ্ড এবং অদ্ভুত সম্পর্কে আমি আরও একটি বিষয় উল্লেখ করতে চাই তা হ'ল এই উভয় গ্রন্থাগার প্রকৃতির ভিত্তিতে নির্ধারিত পদ্ধতির দ্বারা। আপনি এই লাইব্রেরিগুলির সাহায্যে ডেটাফ্রেমগুলি এবং সিরিজ তৈরির মধ্য দিয়ে লুপ করতে পারেন তবে এই কাঠামোগুলিতে ডেটা পরিবর্তন করা সত্যিই শক্ত hard সুতরাং আপনি উভয় লাইব্রেরির সাথে আরও কার্যকর কোড - সেট ভিত্তিক লিখে শেষ করবেন কারণ এটি এত সহজ easier না। সেট বেইজড অ্যাপ্রোচগুলি ব্যবহার করে রেলপথ চালিত না হলে "গাইডড" হওয়াটা আমি এসকিউএল-এর সাথে অভিজ্ঞতা করেছি এমন কিছু নয়।

পান্ডাদের সাথে আরও একটি বৃহত্তর বিষয় উল্লেখ করতে ভুলে গিয়েছিলাম। টাকা । পান্ডাস এমন একটি সরঞ্জাম যা প্রচুর ডেটা সায়েন্সের জব আপনাকে কীভাবে ব্যবহার করতে হয় তা জানতে চায়। খুব সুন্দর প্রত্যেকটি ডাটা বিজ্ঞানের কাজ আমি দেখেছি ডাটাবেস পরিচালনার ধরণের কাজের চেয়ে বেশি অর্থ প্রদান করে। আমি লক্ষ্য করেছি এটির একমাত্র ব্যতিক্রম হ'ল ডেটা ইঞ্জিনিয়ারিংয়ে, তবে আমি সেই চাকরির পোস্টিংগুলির চেয়ে অনেক কম দেখেছি। পান্ডাস দেখে মনে হচ্ছে এটি এক নজরে আপনাকে আরও অর্থোপার্জন করে।


5
সম্ভবত দুঃখের বিষয় যে এটি যখন আধুনিক কাজের ক্ষেত্রে আসে তখন আপনার সমস্যার সমাধানের ক্ষেত্রে গ্রহণ করা পদ্ধতির বিপরীতে আপনার জীবনবৃত্তান্তে সঠিক বজডওয়ার্ডগুলি রাখার বিষয়ে (ধরে নেওয়া যায় আপনি তুলনামূলকভাবে দ্রুত বলেছিলেন বুজওয়ার্ড শিখতে পারবেন)। এটি সমস্যার সমাধানের চেয়ে বুজওয়ার্ডটি আরও গুরুত্বপূর্ণ like এক্স এর জন্য সমস্যা সমাধানের ক্ষেত্রে প্রযুক্তি, এ, বি, সি শিখতে এবং ব্যবহার করা উচিত, বিপরীত নয়। আমি ভাবছি যদি এখন বেশিরভাগ বিকাশকারী দলগুলি বাজওয়ার্ড-ইসম এবং ট্রেন্ডনেসের কারণে জিনিসগুলি ছিন্ন করে ফেলে, তবে মাধ্যমিক হিসাবে সমস্যা সমাধানের বিষয়ে ভাবুন বা "পুরাতন-স্কুল" জিনিসটির কারণ আপনি জানেন না / ব্যবহার করেননি বলে বুজওয়ার্ড বলে।
সালটিসুব 2

1
@ ইলেক্ট্রিকহাইড আমার অভিজ্ঞতায় যদি আপনি পাইথনটিতে স্কিলের সাথে জড়িত নিজের ফাংশনটি লিখে থাকেন তবে কেবল আপনার কার্সারের অপব্যবহার করা এবং পান্ডা / নম্পটি ব্যবহার করার চেয়ে খারাপ প্রশ্নগুলি লিখতে আরও সহজ। Gotta মনে রাখবেন যে সমস্ত বর্গক্ষেত্র মডিউল / গ্রন্থাগার একই হয় না। আমার ক্ষেত্রে, আরকিপি.ডি.সন্ধান সার্ভার এবং এর মতো, অদ্ভুত সীমাবদ্ধতার কারণে দক্ষতার সাথে রেকর্ডগুলির একটি গোছকে কিছু করার সত্যিই ভাল উপায় নেই। আমি যদি পান্ডা / নম্পী ব্যবহার করি তবে জিনিসগুলি করার একটি ভাল উপায় হয়ে যায় এবং পাইথনটি ব্যবহার করার সময় এটিই আমি চাই।

1
আচ্ছা ঠিক আছে. আপনার অর্থ হোমপান এসকিউএল পাইপলাইনটি অজগর / পাণ্ডা ব্যবহার করে অজগর ডিবাপি প্রয়োগের মাধ্যমে? যে ক্ষেত্রে, হ্যাঁ গ্যাচা, আমার পক্ষে সেখানে কোনও তর্ক নেই; যত্ন প্রয়োজন! এটি বনাম প্লেইন এসকিউএল হিসাবে আমার কাছে পড়েছিল যা আপনার স্পষ্টতই সেট অপারেশনগুলি বুঝতে হবে, তবে এটি একটি খুব দ্রুত খুঁজে বের করবে যখন কোনও ডাটাবেস ক্লায়েন্টের নিরীহ প্রশ্নগুলি চালানো হয়।
ইলেকট্রিক হেড

1
@ স্টিভ হ্যাঁ, মানুষ পান্ডা বা একই রকমের লুপগুলিতে গতিশীলভাবে স্টাফ সংশোধন করার চেষ্টা করা লোকদের আটকাবে না :) আমি মনে করি এসকিউএল বুঝতে প্যান্ডাসে কার্যকরভাবে কাজ করতে সহায়তা করে (এটি কিছু ধারণার মধ্যে মিলটি লুকিয়ে রাখার মতো নয়)।
ইলেকট্রিক হেড

1
@ স্টিভ প্রকৃতপক্ষে পান্ডাসও শক্তিশালী ... আমার ধারণা আমার এক হতাশা হ'ল বিকাশকারী এবং পরিচালনা উভয়ই আমাকে সহ, সমাধানের মূল্যায়ণ এবং প্রবণতাগুলি তাড়া করার জন্য পর্যাপ্ত সময় ব্যয় না করা (যেখানে অর্থ স্ব / সংস্থার প্রচারে অর্থ জড়িত)। এমনকি পাতলা প্রোটোটাইপিং / এমভিপিতেও স্কেলিংয়ের জন্য উপযুক্ত ভিত্তি তৈরি করতে হবে। এসকিউএল, নোএসকিউএল এবং পান্ডাস ... সকলেরই বিভিন্ন পর্যায়ে উপযুক্ত কাজ এবং প্রকল্পগুলির জন্য তাদের উদ্দেশ্য রয়েছে। বিগত বছরের প্লাসের জন্য, একটি চর্বিযুক্ত প্রোটোটাইপ / এমভিপি-র জন্য নোএসকিউএল অবশ্যই একের চেয়ে আরও বেশি উপায়ে আমাকে সহায়তা করেছিল। এসকিউএল এর জন্য ওভারকিল হত।
সালটিসুব 2

3

আমি ভেবেছিলাম আমি যুক্ত করব যে আমি প্রচুর সময়-সিরিজ ভিত্তিক ডেটা বিশ্লেষণ করব এবং এটি করার জন্য পান্ডা resampleএবং reindexপদ্ধতিগুলি অমূল্য। হ্যাঁ, আপনি এসকিউএল এ একই জিনিস করতে পারেন (আমি DateDimensionতারিখ-সম্পর্কিত প্রশ্নের সাথে সাহায্য করার জন্য একটি টেবিল তৈরির প্রবণতা রাখি ), তবে আমি কেবল পান্ডাস পদ্ধতি ব্যবহার করতে আরও সহজ পাই।

এছাড়াও, অন্যরা যেমন বলেছে, আমার বাকী মডেলিং পাইথনে রয়েছে এবং আমার প্রায়শই ওয়েব কল বা সিএসভি ফাইল থাকে।


2

আমি আমার নিজের অভিজ্ঞতার ভিত্তিতে এই প্রশ্নের উত্তর দেওয়ার চেষ্টা করব। অন্যান্য উত্তরের বিপরীতে, আমি Sqlগভীর শিক্ষা এবং বড়-ডেটা-সম্পর্কিত বিষয়গুলির পক্ষে পছন্দ করি। এর জন্য অসংখ্য কারণ রয়েছে। এটি এখানে দেখা যায় ,

পান্ডস ট্যাবুলার ডেটাতে একটি স্বজ্ঞাত, শক্তিশালী এবং দ্রুত ডেটা বিশ্লেষণের অভিজ্ঞতা সরবরাহ করে। তবে পান্ডারা মৃত্যুদন্ড কার্যকর করার একমাত্র থ্রেড ব্যবহার করে এবং সমস্ত ডেটা একবারে মেমরির জন্য থাকা প্রয়োজন, এটি গিগাবাইট স্কেল ছাড়িয়ে ডেটাসেটগুলিতে ভাল স্কেল করে না।

এসকিউএল ইঞ্জিনগুলি সাধারণত CRUD ক্রিয়াকলাপের সুবিধার্থে ট্রি এর মতো ডেটা স্ট্রাকচারে কী বা বিশেষ কলামগুলি রাখে । এই ডেটা স্ট্রাকচারটি ডেটাবেজে সমস্ত ডেটার স্থিতি রাখে। এটি পান্ডাসগুলি করতে পারে না কারণ এটি একই সাথে সমস্ত ডেটা অ্যাক্সেস করতে পারে না। অন্যদিকে, এটি রিড_সিএসভিতে ব্যবহৃত খাঁটি প্যারামিটার দিয়েও কিছু অপারেশন করতে পারে না। উদাহরণস্বরূপ, বড় ডেটাসেটের জন্য আপনার সরাসরি ব্যাচের ক্রিয়াকলাপ থাকতে পারে না যা আপনার স্মৃতি তাদেরকে সামঞ্জস্য করতে পারে না। আপনার সম্পূর্ণ ডেটাসেটের উপর নির্ভর করে অন্য কোনও কাজগুলির জন্য অতিরিক্ত কোডিং দরকার। এই সমস্তগুলি কেবল একটি সাধারণ ক্যোয়ারির সাহায্যে অতিরিক্ত কোডিং ছাড়াই স্কলে হ্যান্ডেল করা যায়। সাধারণ স্কেল অপারেশনগুলি মেমরি সম্পর্কে কোনও ভয় ছাড়াই সবেমাত্র ব্যবহৃত হয়।B+

আর একটি পার্থক্য হ'ল এসকিউএল-এ সিআরইউডি অপারেশনগুলি বিভিন্ন অনুমোদনের নীতিগুলি দিয়ে বিতরণ করা যেতে পারে যা পান্ডে সম্ভব নয়।

এটি কোনটি ভাল তা বোঝানোর জন্য নয়, এটি আপনার কাজের উপর নির্ভর করে। বড় আকারের গণনার জন্য আমি এসকিএল এবং ছোটদের পক্ষে, আমি পান্ডাকে পছন্দ করি।

প্যান্ডাসে নেই এমন অন্যান্য জিনিস রয়েছে যা ডেটা উত্তোলনের জন্য দ্রুত অভিজ্ঞতার জন্য সত্যই গুরুত্বপূর্ণ যা আমি পরে উল্লেখ করব। আপাতত, এখানে একবার দেখুন ।


1

পান্ডা যেহেতু পাইপটি বেশি জনপ্রিয় তাই জিউটার নোটবুক আকারে পাইথন সর্বাধিক জনপ্রিয় টুলবক্স যা নিউরাল নেটওয়ার্ক অঞ্চলে ডেটা বিজ্ঞানী ব্যবহার করে। পাইথন "দ্য" ল্যাংওয়েজকে বোকা করছে। এমনকি এসকিউএল ব্যাকএন্ড ব্যবহার করা এমনকি আপনার প্যান্ডা দিয়ে এসকিউএল এর সাথে আবদ্ধ নয়।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.