আপনার উত্তর দিতে প্রশ্ন:
বাহ্যিক টেবিলগুলির জন্য, Hive টেবিল তৈরির সময় নির্দিষ্ট করা LOCATION এ ডেটা সঞ্চয় করে (সাধারণত গুদাম ডিরেক্টরিতে নয়)। যদি বাহ্যিক টেবিলটি বাদ দেওয়া হয়, তবে সারণী মেটাডেটা মুছে ফেলা হবে তবে ডেটা নয়।
অভ্যন্তরীণ সারণীগুলির জন্য, Hive এর গুদাম ডিরেক্টরিতে ডেটা সঞ্চয় করে। যদি টেবিলটি বাদ দেওয়া হয় তবে টেবিল মেটাডেটা এবং ডেটা উভয়ই মুছে ফেলা হবে।
আপনার রেফারেন্সের জন্য,
অভ্যন্তরীণ এবং বাহ্যিক সারণীর মধ্যে পার্থক্য:
বাহ্যিক টেবিলগুলির জন্য -
বাহ্যিক টেবিলগুলি এইচডিএফএস সার্ভারে ফাইল সঞ্চয় করে তবে টেবিলগুলি উত্স ফাইলে সম্পূর্ণ লিঙ্কযুক্ত নয়।
আপনি যদি কোনও বাহ্যিক সারণী মুছেন তবে ফাইলটি এখনও এইচডিএফএস সার্ভারে রয়েছে।
উদাহরণস্বরূপ যদি আপনি এইচআইভি -কিউএল ব্যবহার করে এইচআইভিতে "টেবিল_স্টেস্ট" নামে একটি বাহ্যিক টেবিল তৈরি করেন এবং টেবিলটিকে " ফাইল " ফাইলের সাথে সংযুক্ত করেন , তবে এইচআইভি থেকে "টেবিল_স্টেস্ট" মোছা "এইচডিএফএস" থেকে "ফাইল" মুছবে না ।
এইচডিএফএস ফাইল কাঠামোর অ্যাক্সেস রয়েছে এমন যে কোনও ব্যক্তির পক্ষে বাহ্যিক টেবিল ফাইল অ্যাক্সেসযোগ্য এবং তাই সুরক্ষাটি এইচডিএফএস ফাইল / ফোল্ডার স্তরে পরিচালনা করা দরকার।
মেটা ডেটা মাস্টার নোডে রক্ষণাবেক্ষণ করা হয় এবং এইচআইভি থেকে কোনও বাহ্যিক টেবিল মুছে ফেলা কেবল ডেটা / ফাইল নয় মেটাডেটা মুছে দেয়।
অভ্যন্তরীণ টেবিলগুলির জন্য-
- সেটিংস উপর ভিত্তি করে একটি ডিরেক্টরির মধ্যে সংরক্ষিত
hive.metastore.warehouse.dir
,
ডিফল্ট অভ্যন্তরীণ টেবিল দ্বারা সংরক্ষণ করা হয় নিম্নলিখিত ডিরেক্টরির মধ্যে "/ ব্যবহারকারী / মধুচক্র / গুদাম" আপনি কনফিগ ফাইলে অবস্থান আপডেট করে এটি বদলাতে পারেন।
- সারণী মোছা হ'ল যথাক্রমে মাস্টার-নোড এবং এইচডিএফএস থেকে মেটাডেটা এবং ডেটা মুছে দেয়।
- অভ্যন্তরীণ সারণী ফাইল সুরক্ষা কেবলমাত্র এইচআইভির মাধ্যমে নিয়ন্ত্রণ করা হয়। সুরক্ষা HIVE এর মধ্যে পরিচালনা করা দরকার সম্ভবত স্কিমা স্তরে (সংস্থার উপর নির্ভর করে) depends
মধুদের অভ্যন্তরীণ বা বাহ্যিক সারণী থাকতে পারে, এটি এমন একটি পছন্দ যা ডেটা কীভাবে লোড, নিয়ন্ত্রণ এবং পরিচালনা করা হয় তা প্রভাবিত করে।
বহিরাগত সারণী ব্যবহার করুন যখন:
- এই তথ্যটি হিভের বাইরেও ব্যবহৃত হয় । উদাহরণস্বরূপ, একটি বিদ্যমান প্রোগ্রাম দ্বারা ডেটা ফাইলগুলি পড়া এবং প্রক্রিয়া করা হয় যা ফাইলগুলি লক করে না।
- ড্রপ টেবিলের পরেও ডেটা অন্তর্নিহিত স্থানে থাকা দরকার। আপনি যদি একক ডেটা সেটে একাধিক স্কিমা (সারণী বা দৃষ্টিভঙ্গি) নির্দেশ করে থাকেন বা আপনি যদি বিভিন্ন সম্ভাব্য স্কিমার মাধ্যমে পুনরাবৃত্তি করছেন তবে এটি প্রয়োগ করতে পারে।
- মৌচাকের ডেটা এবং নিয়ন্ত্রণ সেটিংস, ডিরেক্টরি ইত্যাদির মালিক হওয়া উচিত নয় , আপনার অন্য কোনও প্রোগ্রাম বা প্রক্রিয়া থাকতে পারে যা এই জিনিসগুলি করবে।
- আপনি বিদ্যমান টেবিলের ভিত্তিতে সারণী তৈরি করছেন না (AS নির্বাচন করুন)।
অভ্যন্তরীণ সারণীগুলি ব্যবহার করুন যখন:
- তথ্য সাময়িক ।
- আপনি চাইছেন যে হিভ পুরোপুরি সারণী এবং ডেটাটির জীবনচক্রটি পরিচালনা করে ।
উৎস :
এইচডি ইনসাইট: মধু অভ্যন্তরীণ এবং বহিরাগত টেবিলগুলি অন্তর্ভুক্ত
হ্যাডোপ-এইচআইভিতে অভ্যন্তরীণ এবং বাহ্যিক সারণী