বড় ডেটা কেস স্টাডি বা কেস উদাহরণ ব্যবহার করুন


13

আমি প্রচুর ব্লগ পড়েছি different বিভিন্ন ধরণের শিল্প কীভাবে বিগ ডেটা অ্যানালিটিক ব্যবহার করছে সে সম্পর্কে নিবন্ধ। তবে এই নিবন্ধগুলির বেশিরভাগই উল্লেখ করতে ব্যর্থ

  1. এই সংস্থাগুলি কী কী ডেটা ব্যবহার করেছিল। তথ্য আকার ছিল কি
  2. ডেটা প্রক্রিয়া করার জন্য তারা কী ধরণের সরঞ্জাম প্রযুক্তি ব্যবহার করেছিল
  3. তারা কী সমস্যার মুখোমুখি হয়েছিল এবং কীভাবে তারা তথ্য পেয়েছে অন্তর্দৃষ্টি তাদের সমস্যা সমাধানে সহায়তা করেছিল।
  4. কীভাবে তারা তাদের প্রয়োজনীয়তা অনুসারে সরঞ্জাম \ প্রযুক্তি নির্বাচন করেছে।
  5. তারা ডেটা থেকে কী ধরণের প্যাটার্ন সনাক্ত করেছে এবং ডেটা থেকে তারা কী ধরণের প্যাটার্ন খুঁজছিল।

আমি ভাবছি কেউ যদি আমাকে এই সমস্ত প্রশ্নের উত্তর দিতে পারে বা একটি লিঙ্ক দিতে পারে যা কমপক্ষে কিছু প্রশ্নের উত্তর দেয়। আমি বাস্তব বিশ্বের উদাহরণ খুঁজছি।

কেউ যদি ফিনান্স শিল্প কীভাবে বিগ ডেটা অ্যানালিটিক ব্যবহার করে তা ভাগ করে নিলে দুর্দান্ত হবে।

উত্তর:


14

নিউজ আউটলেটগুলি "বিগ ডেটা" ব্যবহার করার ঝোঁকটি বেশ আলগাভাবে। বিক্রেতারা সাধারণত তাদের নির্দিষ্ট পণ্যগুলি ঘিরে কেস স্টাডি সরবরাহ করে। ওপেন সোর্স বাস্তবায়নের জন্য খুব বেশি কিছু নেই, তবে তাদের উল্লেখ পাওয়া যায়। উদাহরণস্বরূপ, অ্যাপাচি হ্যাডুপে কেস স্টাডি তৈরি করতে অনেক সময় ব্যয় করবে না, তবে ক্লৌডেরা এবং হর্টন ওয়ার্কস এর মতো বিক্রেতারা সম্ভবত এটি করবে।

এখানে অর্থ খাতে ক্লৌডেরার উদাহরণ স্টাডি রয়েছে

অধ্যয়নের উদ্ধৃতি:

এক বৃহত বিশ্বব্যাপী আর্থিক পরিষেবা সংকলন দুর্বৃত্ত ব্যবসায়ের ক্রিয়াকলাপ শনাক্ত করতে সহায়তা করতে ক্লৌডেরা এবং ডাটামির ব্যবহার করে। ফার্মের সম্পদ পরিচালনার গোষ্ঠীর মধ্যে থাকা টিমগুলি প্রতিদিনের দাম, অবস্থান এবং অর্ডার সম্পর্কিত তথ্যের ফিডগুলির বিষয়ে অদম্য বিশ্লেষণ করছে। সমস্ত বিশদ ডেটাতে অ্যাডহক বিশ্লেষণ থাকার ফলে গোষ্ঠীটি নির্দিষ্ট কিছু সম্পত্তির শ্রেণি জুড়ে অনিয়ম সনাক্ত করতে এবং সন্দেহজনক আচরণ সনাক্ত করতে দেয়। ব্যবহারকারীরা এর আগে সম্পূর্ণরূপে ডেস্কটপ স্প্রেডশিট সরঞ্জামগুলিতে নির্ভর করত। এখন, ডেটাামির এবং ক্লৌডেরার সাথে, ব্যবহারকারীদের কাছে একটি শক্তিশালী প্ল্যাটফর্ম রয়েছে যা তাদের আরও ডেটা আরও দ্রুত ছড়িয়ে দিতে এবং সম্ভাব্য ক্ষতির হাত থেকে বাঁচার আগে তাদের এড়াতে দেয়।

একটি শীর্ষস্থানীয় খুচরা ব্যাংক ডড-ফ্র্যাঙ্ক আইন এবং অন্যান্য বিধিবিধি দ্বারা প্রয়োজনীয় ডেটা নির্ভুলতা এবং গুণমানকে বৈধতা দেওয়ার জন্য ক্লৌদেরা এবং ডেটামির ব্যবহার করছে। Loanণ এবং শাখার ডেটা পাশাপাশি সম্পদ পরিচালনার ডেটা সংহত করে, প্রতিটি রেকর্ডটি সঠিক কিনা তা নিশ্চিত করার জন্য ব্যাংকের ডেটা মানের মানের উদ্যোগ দায়বদ্ধ। প্রক্রিয়াটিতে 50 টিরও বেশি ডেটা স্যানিটি এবং গুণমানের পরীক্ষাগুলি অন্তর্ভুক্ত রয়েছে। ডেটা দুর্নীতি এবং ডেটা ডোমেনের সহনশীলতাগুলি প্রতিকূলভাবে পরিবর্তিত হচ্ছে না এবং বিনিয়োগকারী এবং নিয়ন্ত্রক সংস্থাগুলির কাছে যে ঝুঁকির প্রোফাইলগুলি বিচক্ষণ এবং নিয়ামক প্রয়োজনীয়তার সাথে সম্মতিতে লিখিত হয়েছে তা নিশ্চিত করার জন্য এই চেকগুলির ফলাফল সময়ের সাথে সাথে প্রবণতাযুক্ত। ফলাফলগুলি মুখ্য ঝুঁকি অফিসার এবং চিফ ফিনান্সিয়াল অফিসারের কাছে ডেটা মানের মানের ড্যাশবোর্ডের মাধ্যমে জানানো হয়,

ক্লৌডেরায় আমি অন্য কোনও আর্থিক সম্পর্কিত পড়াশোনা দেখিনি, তবে আমি খুব শক্তভাবে অনুসন্ধান করিনি। আপনি এখানে তাদের লাইব্রেরি একবার দেখতে পারেন ।

এছাড়াও, হর্টন ওয়ার্কস ট্রেডিং স্ট্র্যাটেজির ক্ষেত্রে একটি কেস স্টাডি করেছে যেখানে তারা কে-ইনস, হ্যাডোপ এবং আর ব্যবহার করে কৌশল বিকাশের ক্ষেত্রে 20% হ্রাস পেয়েছিল saw

প্রতিটি রঙ লাভ এবং ক্ষতির অনুরূপ সম্ভাবনা সহ কৌশলগুলির একটি গ্রুপকে ইঙ্গিত করে

হ্যাডোপ (হর্টন ওয়ার্কস ডেটা প্ল্যাটফর্ম) এবং কে-মানে অ্যালগোরিদম ব্যবহার করে কীভাবে বাণিজ্য ব্যবস্থার উন্নতি হয়েছিল

এগুলি আপনার সমস্ত প্রশ্নের উত্তর দেয় না। আমি দৃ sure়ভাবে নিশ্চিত যে এই উভয় স্টাডির মধ্যে বেশিরভাগই কভার হয়েছে। আমি বিশেষভাবে সরঞ্জাম নির্বাচন সম্পর্কে কিছুই দেখতে পাচ্ছি না। আমি ভাবি বিক্রয় সামগ্রীতে দরজাতে সামগ্রিক পণ্য পাওয়ার ক্ষেত্রে অনেক কিছুই ছিল, তবে ডেটা বিজ্ঞানীরা নিজেরাই যে সরঞ্জামগুলি দিয়ে সবচেয়ে বেশি স্বাচ্ছন্দ্যবোধ করেছেন সেগুলি তাদের কাজে লাগিয়েছে। বড় ডেটা স্পেসে আমার সেই অঞ্চলটি সম্পর্কে খুব বেশি অন্তর্দৃষ্টি নেই।


1
ধন্যবাদ. এটি খুব সহায়ক। আমি এটি একটি বাগ স্থান জানি এবং সঠিক উত্তর নেই। আমি কীভাবে একজন তাদের প্রয়োজন অনুসারে বড় ডেটা সরঞ্জাম এবং প্রযুক্তি নির্বাচন করে তা জানতে আগ্রহী। আমি এখনই এটিকে সঠিক উত্তর হিসাবে চিহ্নিত করছি না তবে এটি অবশ্যই ইউপি ভোটের প্রাপ্য। চিয়ার্স :)
ব্রাউন_ডিনামাইট

6

আর্থিক পরিষেবাগুলি বিগ ডেটার একটি বড় ব্যবহারকারী এবং উদ্ভাবকও। একটি উদাহরণ বন্ধকী বন্ড ট্রেডিং। এর জন্য আপনার প্রশ্নের উত্তর দিতে:

এই সংস্থাগুলি কী কী ডেটা ব্যবহার করেছিল। তথ্য আকার কি ছিল?

  • বিগত বহু বছর ধরে জারি করা প্রতিটি বন্ধকের দীর্ঘ ইতিহাস এবং তাদের বিরুদ্ধে মাসে মাসে পেমেন্ট। (কয়েক বিলিয়ন সারি)
  • Creditণ ইতিহাসের দীর্ঘ ইতিহাস। (কয়েক বিলিয়ন সারি)
  • বাড়ির দাম সূচকগুলি। (বড় হিসাবে না)

ডেটা প্রক্রিয়া করার জন্য তারা কী ধরণের সরঞ্জাম প্রযুক্তি ব্যবহার করেছিল?

এটি পরিবর্তিত হয়. কিছু Netezza বা Teradata এর মতো ডাটাবেসে নির্মিত গৃহ-গৃহের সমাধানগুলি ব্যবহার করে। অন্যরা ডেটা সরবরাহকারীদের দ্বারা সরবরাহিত সিস্টেমের মাধ্যমে ডেটা অ্যাক্সেস করে। (করোলজিক, এক্সপেরিয়ান ইত্যাদি) কিছু ব্যাংক কলামি ডাটাবেস প্রযুক্তি যেমন KDB বা 1010data ব্যবহার করে।

তারা কী সমস্যার মুখোমুখি হয়েছিল এবং কীভাবে তারা তথ্য পেয়েছে অন্তর্দৃষ্টি তাদের সমস্যা সমাধানে সহায়তা করেছিল।

মূল সমস্যাটি নির্ধারণ করছে কখন বন্ধকী বন্ডগুলি (বন্ধকী ব্যাকড সিকিওরিটিস) প্রিপেই বা ডিফল্ট হবে। এটি বিশেষত বন্ডগুলির জন্য গুরুত্বপূর্ণ যা সরকারের গ্যারান্টির অভাব রয়েছে। অর্থ প্রদানের ইতিহাস, ক্রেডিট ফাইলগুলিতে খনন করে এবং বাড়ির বর্তমান মূল্য বোঝার মাধ্যমে, কোনও ডিফল্ট সম্ভাবনার পূর্বাভাস দেওয়া সম্ভব। সুদের হারের মডেল এবং প্রিপেইমেন্ট মডেল যুক্ত করাও একটি প্রিপমেন্টের সম্ভাবনা সম্পর্কে ভবিষ্যদ্বাণী করতে সহায়তা করে।

কীভাবে তারা তাদের প্রয়োজনীয়তা অনুসারে সরঞ্জাম \ প্রযুক্তি নির্বাচন করেছে।

যদি প্রকল্পটি অভ্যন্তরীণ আইটি দ্বারা চালিত হয়, তবে এটি সাধারণত ওরাকল, টেরাদাতা বা নেতেজার মতো একটি বৃহত ডাটাবেস বিক্রেতার উপর ভিত্তি করে। যদি এটি কোয়ান্টগুলি চালিত হয় তবে তাদের সরাসরি ডেটা বিক্রেতা বা তৃতীয় পক্ষের "অল ইন ইন" সিস্টেমে যাওয়ার সম্ভাবনা বেশি।

তারা ডেটা থেকে কী ধরণের প্যাটার্ন সনাক্ত করেছে এবং ডেটা থেকে তারা কী ধরণের প্যাটার্ন খুঁজছিল।

ডেটা লিঙ্ক করা কারা তাদের onণে খেলাপি হতে পারে এবং সেগুলি পূর্বে পরিশোধ করতে পারে সে সম্পর্কে দুর্দান্ত অন্তর্দৃষ্টি দেয়। আপনি যখন বন্ডে একত্রিত করেন, তখন এটির জারি হওয়া বন্ডের মধ্যে পার্থক্য 20,000,000 এর চেয়ে ।100,000,000beingworththatamount,oraslittleas


আপনি কি এমন কোনও উদাহরণ দেখেছেন যেখানে প্রিপেই মডেলিংয়ের জন্য মেশিন লার্নিং কৌশল ব্যবহার করা হচ্ছে। আই নিউরাল নেট, এলোমেলো বন, জিবিএম?
জোশ

5

Kaggle অ্যাপ্লিকেশনগুলির একটি সংক্ষিপ্তসার রয়েছে:

বিপ্লব বিশ্লেষণগুলি অনেকগুলি সাধারণ কেস স্টাডি, ডাটাশিট এবং শ্বেতপত্রাদি প্রকাশ করেছে:

বিজ্ঞান এবং প্রকৌশল সংক্রান্ত অ্যাপ্লিকেশনগুলির জন্য, আপনি নোটোনিয়ান কেস স্টাডির সাথে পরামর্শ করতে পারেন :

অ্যানালিক্স সম্ভাব্য ক্লায়েন্টদের বাণিজ্যে অ্যাপ্লিকেশনগুলি সম্পর্কে বলেছিল:

ফাইনানশিয়াল টাইমস প্রকাশিত বড় ডেটার ব্যবসা অ্যাপ্লিকেশন সম্পর্কে গল্প একটি সংগ্রহ:

ম্যাককিন্সী অ্যাপ্লিকেশনগুলি 2011 সালে ফিরে রূপরেখা দিয়েছেন:

অন্যান্য পরামর্শ সংস্থাগুলি অনুরূপ প্রতিবেদন করেছে।

গার্ডনার বড় ডেটার জন্য হাইপ সাইকেল তৈরি করেছে:

এখানে চিত্র বর্ণনা লিখুন

অন্যান্য সংস্থাগুলি তাদের পণ্য প্রচার করতে চান তাদের কেস স্টাডি এবং শ্বেতপত্রের উল্লেখ না করে।


1

কটাক্ষপাত ও'রেলি ফ্রি ডাটা রিপোর্ট । আপনি ব্যাংকিং এবং ফিনটেক, স্পোর্টস, ফ্যাশন, সঙ্গীত, স্বাস্থ্য, তেল এবং গ্যাস ইত্যাদির উপর প্রতিবেদনগুলি পেতে পারেন।

মনে রাখবেন যে আগে উল্লিখিত ম্যাককিন্সির প্রতিবেদনটি একটি সর্বোত্তম প্রতিবেদন এবং অবশ্যই পড়তে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.