অ্যামাজন সুপারিশ বৈশিষ্ট্যটি কীভাবে কাজ করে?


144

অ্যামাজন সুপারিশ প্রযুক্তির পর্দার পিছনে কোন প্রযুক্তি চলে? আমি বিশ্বাস করি যে অ্যামাজনের সুপারিশটি বর্তমানে বাজারে সেরা, তবে কীভাবে তারা আমাদের এ জাতীয় প্রাসঙ্গিক প্রস্তাব দেয়?

সম্প্রতি, আমরা অনুরূপ প্রস্তাবের ধরণের প্রকল্পের সাথে জড়িত হয়েছি, তবে অবশ্যই প্রযুক্তিগত দিক থেকে অ্যামাজন সুপারিশ প্রযুক্তির ইন ও আউটগুলি সম্পর্কে জানতে চাই।

যে কোনও ইনপুট অত্যন্ত প্রশংসা করা হবে।

হালনাগাদ:

এই পেটেন্টটি ব্যাখ্যা করে যে কীভাবে ব্যক্তিগতকৃত সুপারিশগুলি করা হয় তবে এটি খুব প্রযুক্তিগত নয় এবং তাই কিছু অন্তর্দৃষ্টি সরবরাহ করা যেতে পারে তবে এটি সত্যিই দুর্দান্ত হবে।

ডেভের মন্তব্য থেকে, অ্যাফিনিটি এনালাইসিস এই জাতীয় প্রস্তাবন ইঞ্জিনগুলির জন্য ভিত্তি তৈরি করে। এছাড়াও এখানে টপিকটিতে কিছু ভাল পাঠ্য রয়েছে

  1. বাজারের ঝুড়ির বিশ্লেষণকে অপ্রত্যাশিত করা হচ্ছে
  2. বাজারের ঝুড়ি বিশ্লেষণ
  3. অ্যাফিনিটি বিশ্লেষণ

প্রস্তাবিত পড়া:

  1. ডেটা মাইনিং: ধারণা এবং প্রযুক্তি

3
আপনি কি তাদের পেটেন্টগুলির গাদা দিয়ে চালানোর চেষ্টা করেছিলেন? google.com
পেটেন্টস

হ্যাঁ আমি পেটেন্ট দিয়ে যাচ্ছিলাম তবে এটি খুব প্রযুক্তিগত নয় এবং তাই প্রক্রিয়াটির প্রযুক্তিগত দিক সম্পর্কে কিছু অন্তর্দৃষ্টি প্রশংসা করবে
রাচেল

1
@ ডেভ: এই প্রশ্নটি এখনই উন্মুক্ত এবং আমি সুপারিশ ইঞ্জিন আর্কিটেকচার এবং কার্যকারিতার পিছনে প্রযুক্তির উপর আরও কিছু অন্তর্দৃষ্টি দিতে পারি যা আমাজন সুপারিশ সরবরাহের জন্য ব্যবহার করে।
রাচেল

1
আমি অ্যামাজন সুপারিশ সিস্টেমটিকে "সেরা" বা এমনকি দরকারী বলব না। আপনি একটি মাউস অর্ডার করুন, এটি পাশাপাশি অন্য একটি কেনার পরামর্শ দেয়। কেন একজন সাধারণ ব্যবহারকারীর একবারে দুটি ইঁদুরের প্রয়োজন হবে ???

1
@ রেচেল: আপনি জানেন যে অ্যামাজনের সিস্টেমটি পেটেন্টযুক্ত এবং আপনি এরকম কিছু বিকাশ করতে চান, আমি তাদের পেটেন্টগুলিতেও নজর দেব না --- এবং অবশ্যই তাদের দিকে না তাকানোও আপনাকে রক্ষা করে না, তবে এটি একটি শুরু।

উত্তর:


104

এটি একটি শিল্প এবং একটি বিজ্ঞান উভয়ই। গবেষণার সাধারণ ক্ষেত্রগুলি বাজারের ঝুড়ি বিশ্লেষণকে ঘিরে আবর্তিত হয় (এটিকে অ্যাফিনিটি এনালাইসিসও বলা হয়) যা ডেটা মাইনিংয়ের ক্ষেত্রের একটি উপসেট। এই জাতীয় সিস্টেমে সাধারণ উপাদানগুলির মধ্যে প্রাথমিক ড্রাইভার আইটেমগুলির সনাক্তকরণ এবং অ্যাফিলিটি আইটেমগুলির সনাক্তকরণ (আনুষঙ্গিক উত্সাহ, ক্রস বিক্রয়) অন্তর্ভুক্ত।

তাদের যে ডেটা উত্সগুলি আছে তা মাথায় রাখুন ...

  1. ক্রয় শপিং কার্টস = আসল আইটেমগুলিতে ব্যয় করা প্রকৃত লোকের কাছ থেকে আসল অর্থ = শক্তিশালী ডেটা এবং এর প্রচুর পরিমাণ।
  2. আইটেমগুলি গাড়িতে যুক্ত হয়েছে তবে পরিত্যক্ত হয়েছে।
  3. অনলাইনে মূল্য নির্ধারণের পরীক্ষাগুলি (A / B টেস্টিং ইত্যাদি) যেখানে তারা একই দাম বিভিন্ন দামে সরবরাহ করে এবং ফলাফলগুলি দেখে
  4. প্যাকেজিং পরীক্ষা-নিরীক্ষা (A / B টেস্টিং ইত্যাদি) যেখানে তারা বিভিন্ন "বান্ডেলে" বিভিন্ন পণ্য সরবরাহ করে বা আইটেমের বিভিন্ন জুড়ি ছাড় দেয় where
  5. વિશলিস্টগুলি - বিশেষত আপনার জন্য সেগুলিতে কী রয়েছে - এবং সামগ্রিকভাবে এটি ঝুড়ি বিশ্লেষণের ডেটার অন্য স্ট্রিমের সাথে একইরকম আচরণ করা যেতে পারে
  6. রেফারেল সাইটগুলি (আপনি কোথা থেকে এসেছেন তার পরিচয় অন্য আগ্রহের আইটেমগুলি ইঙ্গিত করতে পারে)
  7. থাকার সময় (কতক্ষণ আগে আপনি ক্লিক করে আলাদা আইটেমটি বাছাই করার আগে)
  8. আপনার বা আপনার সোশ্যাল নেটওয়ার্ক / ক্রয়কারী চেনাশোনাতে থাকা ব্যক্তিদের দ্বারা রেটিং - আপনি যদি পছন্দ করেন এমন জিনিসগুলি রেট করেন তবে আপনি যা পছন্দ করেন তার থেকে বেশি পান এবং যদি আপনি "আমি ইতিমধ্যে এটির মালিক" বোতামটি দিয়ে নিশ্চিত করি তবে তারা আপনার একটি সম্পূর্ণ প্রোফাইল তৈরি করে
  9. ডেমোগ্রাফিক তথ্য (আপনার শিপিংয়ের ঠিকানা ইত্যাদি) - তারা আপনার বাচ্চাদের, নিজের, আপনার স্ত্রী, ইত্যাদির জন্য আপনার সাধারণ অঞ্চলে কী জনপ্রিয় তা জানে
  10. ব্যবহারকারীর সেগমেন্টেশন = আপনি কি কোনও ছেলের জন্য পৃথক মাসে 3 টি বই কিনেছিলেন? সম্ভবত একটি বাচ্চা বা আরও কিছু আছে .. ইত্যাদি
  11. ডেটা দ্বারা সরাসরি বিপণন ক্লিক - আপনি কি তাদের কাছ থেকে একটি ইমেল পেয়েছেন এবং মাধ্যমে ক্লিক করেছেন? এটি কোন ইমেলটি ছিল এবং আপনি কী ক্লিক করেছেন এবং ফলস্বরূপ আপনি এটি কিনেছিলেন তা তারা জানে।
  12. সেশনে পাথ ক্লিক করুন - এটি আপনার কার্টে গেছে কিনা তা বিবেচনা না করে আপনি কী দেখেছেন did
  13. চূড়ান্ত কেনার আগে কোনও আইটেম বার বার দেখেছেন
  14. যদি আপনি কোনও ইট এবং মর্টার স্টোর নিয়ে কাজ করে থাকেন তবে তাদের আপনার শারীরিক ক্রয়ের ইতিহাসও বন্ধ হয়ে যেতে পারে (যেমন খেলনা আমাদের বা অনলাইন যা কোনও কিছু এবং একটি শারীরিক স্টোর)
  15. ইত্যাদি ইত্যাদি ইত্যাদি

ভাগ্যক্রমে লোকেরা সমষ্টিতে একই রকম আচরণ করে তাই কেনার জনসংখ্যার বিষয়ে তারা যত বেশি জানে তারা কী বিক্রি করবে এবং কী বিক্রি করবে না তা আরও ভালভাবে জানবে এবং প্রতিটি লেনদেন এবং প্রতিটি রেটিং / ইচ্ছার তালিকা যুক্ত / ব্রাউজ করার সাথে তারা কীভাবে আরও ব্যক্তিগতভাবে দর্জি সুপারিশ করতে পারে তা জানে। মনে রাখবেন এটি সম্ভবত সুপারিশ ইত্যাদিতে কী ঘটে তার প্রভাবগুলির সম্পূর্ণ সেটগুলির কেবলমাত্র একটি সামান্য নমুনা is

অ্যামাজন কীভাবে ব্যবসা করে (এর আগে কখনই কাজ করেনি) এবং আমার সমস্ত কিছুই অনলাইন বাণিজ্য সমস্যার বিষয়ে ধ্রুপদী পদ্ধতির কথা বলছে - আমার এমন প্রধানমন্ত্রী ছিলেন যিনি মাইক্রোসফ্টের জন্য ডেটা মাইনিং এবং অ্যানালিটিকায় কাজ করেছিলেন used পণ্য সার্ভার নামে পরিচিত। আমরা কমার্স সার্ভারে এমন সরঞ্জামগুলি প্রেরণ করেছি যা লোককে অনুরূপ ক্ষমতা সহ সাইটগুলি তৈরি করতে দেয় .... তবে যত বেশি বিক্রয় পরিমাণের চেয়ে বেশি তত উন্নততর ডেটা মডেল হয় - এবং অ্যামাজনটি বিগ হয়। আমি কেবলমাত্র কল্পনা করতে পারি যে একটি বাণিজ্য চালিত সাইটে এত বেশি ডেটা সহ মডেলগুলির সাথে খেলা কত মজাদার। এখন সেই অ্যালগরিদমগুলির অনেকগুলি (যেমন পূর্বাভাসকারী যেমন বাণিজ্য সার্ভারে শুরু হয়েছিল) সরাসরি মাইক্রোসফ্ট এসকিউএল-র মধ্যে বাস করতে পেরেছেন ।

আপনার চারটি বড় বড় উপায় হওয়া উচিত:

  1. অ্যামাজন (বা যে কোনও খুচরা বিক্রেতা) প্রচুর পরিমাণে লেনদেন এবং প্রচুর লোকের জন্য সামগ্রিক ডেটা খুঁজছেন ... এটি তাদের সাইটে এমনকি বেনাম ব্যবহারকারীদের জন্য বেশ ভাল প্রস্তাব দেওয়ার অনুমতি দেয় allows
  2. অ্যামাজন (বা কোনও পরিশীলিত খুচরা বিক্রেতা) লগ ইন হওয়া যে কারওর আচরণ এবং ক্রয়ের উপর নজর রাখছে এবং এটি ব্যবহার করে সামগ্রিক সমষ্টিগত তথ্যের শীর্ষে আরও পরিমার্জন করতে।
  3. প্রায়শই সঞ্চিত ডেটা চালিয়ে যাওয়ার এবং নির্দিষ্ট লাইনের পণ্য পরিচালকদের পরামর্শের "সম্পাদকীয়" নিয়ন্ত্রণ নেওয়ার উপায় থাকে (যেমন কোনও ব্যক্তি যিনি 'ডিজিটাল ক্যামেরাগুলি' উলম্ব বা 'রোম্যান্স উপন্যাসের উল্লম্ব বা অনুরূপ মালিকানাধীন) যেখানে তারা সত্যই সত্য বিশেষজ্ঞ হয়
  4. প্রায়শই প্রচারমূলক ডিল হয় (যেমন সনি বা প্যানাসোনিক বা নিকন বা ক্যানন বা স্প্রিন্ট বা ভেরাইজন খুচরা বিক্রেতাকে অতিরিক্ত অর্থ প্রদান করে, বা সেই পরিমাণগুলিতে আরও বেশি পরিমাণে বা অন্যান্য জিনিসগুলিতে আরও ভাল ছাড় দেয়) যা নির্দিষ্ট "প্রস্তাবনাগুলি" উত্থিত করতে পারে অন্যদের তুলনায় প্রায়শই শীর্ষ - প্রতিটি লেনদেনকে আরও বেশি করে গড়ে তোলা বা পাইকারি ব্যয় হ্রাস করা ইত্যাদির পিছনে সর্বদা কিছু যুক্তিসঙ্গত ব্যবসায়িক যুক্তি এবং ব্যবসায়িক কারণ রয়েছে etc.

প্রকৃত বাস্তবায়নের ক্ষেত্রে? প্রায় সমস্ত বৃহত অনলাইন সিস্টেমগুলি পাইপলাইনের কিছু সেট (বা ফিল্টার প্যাটার্ন বাস্তবায়ন বা একটি ওয়ার্কফ্লো ইত্যাদি) সম্পর্কে ফোটায় যেগুলি আপনি যা চান তাই কল করেন) যা কোনও প্রসঙ্গে প্রযোজ্য মডিউলগুলির একটি সিরিজ দ্বারা মূল্যায়িত করার অনুমতি দেয় of ব্যবসায়িক যুক্তি।

সাধারণত পৃষ্ঠায় প্রতিটি পৃথক টাস্কের সাথে আলাদা আলাদা পাইপলাইন যুক্ত হবে - আপনার কাছে এমন একটি থাকতে পারে যা প্রস্তাবিত "প্যাকেজ / আপসেল" করে (যেমন আপনি যে আইটেমটি দেখছেন এটিই কিনে) এবং একটি "বিকল্প" দেয় (যেমন কিনুন) এটি আপনি যা দেখছেন তার পরিবর্তে) এবং অন্যটি যা আপনার ইচ্ছার তালিকা থেকে সবচেয়ে ঘনিষ্ঠভাবে সম্পর্কিত আইটেমগুলি টানছে (পণ্য বিভাগ বা অনুরূপ)।

এই পাইপলাইনগুলির ফলাফলগুলি পৃষ্ঠার বিভিন্ন অংশে (স্ক্রোল বারের উপরে, স্ক্রোলের নীচে, বাম দিকে, ডানদিকে, বিভিন্ন ফন্ট, বিভিন্ন আকারের চিত্র ইত্যাদি) রাখতে সক্ষম হয় এবং যা সম্পাদন করে তা পরীক্ষা করে দেখতে সক্ষম হয় সেরা। যেহেতু আপনি এই পাইপলাইনগুলির জন্য ব্যবসায়ের যুক্তি সংজ্ঞায়িত করার জন্য মডিউলগুলি প্লাগ এবং খেলতে খুব সহজ ব্যবহার করছেন আপনি লেগো ব্লকের নৈতিক সমতুল্য সমাপ্ত হন যা আপনি অন্য পাইপলাইন তৈরি করার সময় প্রয়োগ করতে চান এমন ব্যবসায়িক যুক্তি বাছাই করা এবং চয়ন করা সহজ করে তোলে যা দ্রুত নতুনত্ব, আরও পরীক্ষা-নিরীক্ষা এবং শেষ পর্যন্ত উচ্চতর মুনাফাকে মঞ্জুরি দেয়।

এটা কি আদৌ সহায়তা করেছিল? আশা করি যে আপনাকে কেবলমাত্র কোনও ইকমার্স সাইটের জন্য সাধারণভাবে কীভাবে কাজ করে তা আপনাকে একটি সামান্য অন্তর্দৃষ্টি দেয় - কেবল অ্যামাজন নয়। অ্যামাজন (সেখানে কাজ করা বন্ধুদের সাথে কথা বলার জন্য) খুব ডেটা চালিত এবং ক্রমাগত তার ব্যবহারকারীর অভিজ্ঞতার কার্যকারিতা এবং মূল্য নির্ধারণ, প্রচার, প্যাকেজিং ইত্যাদির পরিমাপ করে - তারা অনলাইনে অত্যন্ত পরিশীলিত খুচরা বিক্রেতা এবং সম্ভবত এর শীর্ষ প্রান্তে রয়েছে মুনাফা অনুকূল করার জন্য তারা প্রচুর অ্যালগরিদম ব্যবহার করে - এবং এগুলি সম্ভবত মালিকানাধীন গোপনীয়তা (আপনি কেএফসি এর গোপন মশলার সূত্রের মতো জানেন) এবং এর মতো গ্যারার্ডযুক্ত।


1
হ্যাঁ. এটি আমাকে প্রচুর পরিমাণে সহায়তা করেছে এবং আমি বিষয়টিতে আপনার ইনপুটগুলির সত্যই প্রশংসা করি।
রাহেল

আশ্চর্যজনক অন্তর্দৃষ্টি
শোবি

28

এটি সরাসরি অ্যামাজনের সুপারিশ পদ্ধতির সাথে সম্পর্কিত নয়, তবে নেটফ্লিক্স ব্যবহারকারী ডেটা ব্যবহার করে আরও ভাল সুপারিশ সিস্টেম বিকাশের প্রতিযোগী নেটফ্লিক্স পুরষ্কারে অংশ নেওয়া লোকদের ব্যবহৃত পদ্ধতিগুলি অধ্যয়ন করা সহায়ক হতে পারে । সাধারণভাবে ডেটা মাইনিংয়ের কৌশলগুলি সম্পর্কে তাদের সম্প্রদায়টিতে প্রচুর ভাল তথ্য বিদ্যমান ।

যে দলটি জিতেছে তারা প্রচুর বিভিন্ন মডেল / কৌশল দ্বারা উত্পন্ন সুপারিশগুলির মিশ্রণ ব্যবহার করেছে। আমি জানি যে ব্যবহৃত কয়েকটি প্রধান পদ্ধতি হ'ল প্রধান উপাদানগুলির বিশ্লেষণ, নিকটতম প্রতিবেশী পদ্ধতি এবং নিউরাল নেটওয়ার্ক। বিজয়ী দলের কিছু কাগজপত্র এখানে দেওয়া হয়েছে:

আর। বেল, ওয়াই। কোরেন, সি। ভলিনস্কি, " দ্য বেলকোর ২০০৮ সলিউশন টু নেটফ্লিক্স প্রাইজ ", (২০০৮)।

এ। ট্যাশার, এম জহরার, " দ্য বিগচোস সলিউশন টু নেটফ্লিক্স প্রাইজ ২০০৮ ", (২০০৮)।

এ। ট্যাশার, এম। জহর, আর। লেজস্টেইন, " বৃহত্তর স্কেল সুপারিশকারী সিস্টেমগুলির জন্য উন্নত নেবারহুড-ভিত্তিক অ্যালগরিদম ", লার্জ-স্কেল সুপারিশকারী সিস্টেমে সিগকেডিডি ওয়ার্কশপ এবং নেটফ্লিক্স পুরষ্কার প্রতিযোগিতা (কেডিডি'০৮), এসিএম প্রেস (২০০৮) ।

ওয়াই কোরেন, " দ্য বেলকোর সলিউশন টু নেটফ্লিক্স গ্র্যান্ড প্রাইজ ", (২০০৯)।

এ। ট্যাশার, এম জহার, আর। বেল, " দ্য বিগচোস সলিউশন টু নেটফ্লিক্স গ্র্যান্ড প্রাইজ ", (২০০৯)।

এম। পাইওট, এম। চ্যাবার্ট, " নেটফ্লিক্স গ্র্যান্ড প্রাইজের প্রাগমেটিক থিওরি সলিউশন ", (২০০৯)।

২০০৮ এর কাগজপত্র প্রথম বছরের অগ্রগতি পুরষ্কারের। আমি প্রথমটি পড়ার পরামর্শ দিই কারণ পরবর্তীগুলি পূর্ববর্তী কাজগুলির উপর ভিত্তি করে তৈরি করে।


2
এই উত্তর সম্পর্কে আমি যা পছন্দ করি তা হ'ল এটি এটিকে নির্দেশ করে যে কোনও "নিখুঁত" উত্তর নেই এবং লোকেরা এই ক্ষেত্রে উদ্ভাবন চালিয়ে যায় - উন্নতির জন্য সর্বদা কিছু জায়গা থাকে এবং সময়ের পরিবর্তনের সাথে সাথে সমস্যাগুলির ক্ষেত্রে নতুন পদ্ধতি প্রয়োগ করা হয় অন্যভাবে সমাধান হতে থাকবে। এবং আপনি যদি বিশদ লিঙ্কগুলি পড়েন তবে আপনি দেখতে পারবেন যে কীভাবে পুরষ্কারের জন্য প্রতিটি বড় প্রার্থীর মধ্যে ভবিষ্যদ্বাণী করার জন্য কয়েকটি অ্যাপ্রোচের একটি "মিশ্রণ" রয়েছে। দুর্দান্ত রেফারেন্স।
ডেভ কুইক


20

(দাবি অস্বীকারকারী: আমি আমাজনে কাজ করতাম, যদিও আমি সুপারিশকারী দলে কাজ করি না))

ইয়ার্নলির উত্তরটি সঠিক হওয়া উচিত - অ্যামাজনের মূল প্রস্তাবনা সিস্টেমের কাগজের লিঙ্কগুলি এবং আমি যা বলতে পারি (উভয়ই অ্যামাজন শপরের ব্যক্তিগত অভিজ্ঞতা থেকে এবং অন্যান্য সংস্থায় অনুরূপ সিস্টেমে কাজ করা) উভয়ই খুব কম পরিবর্তন হয়েছে: এ এটির মূল, অ্যামাজনের সুপারিশ বৈশিষ্ট্যটি এখনও আইটেম-টু-আইটেম সহযোগী ফিল্টারিংয়ের উপর ভিত্তি করে রয়েছে।

সুপারিশগুলি কী রূপ নেয় তা কেবল দেখুন: আমার প্রথম পৃষ্ঠায় সেগুলি ফর্মগুলির মধ্যে একটি হ'ল "আপনি এক্স দেখেছেন ... গ্রাহকরা এটিও দেখেছেন ...", অন্যথায় জিনিসগুলির মতো আইটেমগুলির মেলানজ আমি আগে কিনেছি বা দেখেছি। যদি আমি বিশেষত আমার "আপনার জন্য প্রস্তাবিত" পৃষ্ঠাতে যাই, প্রতিটি আইটেমটি আমার জন্য কেন এটি সুপারিশ করা হয় তা বর্ণনা করে: "প্রস্তাবিত আপনি কেনা ...", "প্রস্তাবিত কারণ আপনি আপনার ইচ্ছার তালিকায় এক্স যোগ করেছেন ..." ইত্যাদি। আইটেম টু আইটেমের সহযোগী ফিল্টারিংয়ের একটি সর্বোত্তম চিহ্ন sign

তাহলে আইটেম টু আইটেমের সহযোগী ফিল্টারিং কীভাবে কাজ করে? মূলত, প্রতিটি আইটেমের জন্য, আপনি সম্পর্কিত আইটেমগুলির একটি "পাড়া" তৈরি করেন (উদাহরণস্বরূপ, লোকেরা কী আইটেম একসাথে দেখেছেন বা লোকেরা কী কী আইটেম কিনেছেন তা দেখে - মিলটি নির্ধারণ করতে, আপনি জ্যাকার্ড সূচকের মতো মেট্রিক ব্যবহার করতে পারেন ; পারস্পরিক সম্পর্ক) আরেকটি সম্ভাবনা, যদিও আমি সন্দেহ করি যে অ্যামাজন রেটিং ডেটা খুব বেশি ব্যবহার করে না)। তারপরে, যখনই আমি কোনও আইটেম এক্স দেখি বা ক্রয় ওয়াই করি, আমাজন আমাকে এক্স বা ওয়াইয়ের মতো একই পাড়ার জিনিসগুলির পরামর্শ দেয়

অ্যামাজন সম্ভাব্যভাবে ব্যবহার করতে পারে এমন কিছু অন্যান্য পন্থা এখানে বর্ণিত হয়েছে: http://blog.echen.me/2011/02/15/an-overview-of-item-to-item-collaborative-filtering -সঙ্গে-amazons প্রস্তাবনা সিস্টেম /

ডেভ যা বর্ণনা করে তার অনেকগুলি প্রায় অ্যামাজনে প্রায় সম্পন্ন হয় না। (আমার সামাজিক নেটওয়ার্কের দ্বারা রেটিংগুলি? না, অ্যামাজনের আমার কোনও সামাজিক ডেটা নেই any এটি যে কোনও ক্ষেত্রে একটি বৃহত্তর গোপনীয়তার সমস্যা হবে, তাই অ্যামাজনের পক্ষে তাদের কাছে সেই ডেটা থাকলেও তা করা মুশকিল হবে): লোকেরা তাদের বন্ধুবান্ধবগুলি জানতে চায় না যে তারা কোন বই বা সিনেমা কিনছেন। ডেমোগ্রাফিক তথ্য? না, সুপারিশগুলিতে কিছুই বোঝায় না যে তারা এটি দেখছেন [[নেটফ্লিক্সের বিপরীতে, যারা আমার অঞ্চলের অন্যান্য লোকেরা কী দেখছেন তার পৃষ্ঠপোষকতা করেন না) ।])


আমাজন বছরের পর বছর ধরে উন্মুক্ত কেনাকাটার চেনাশোনাগুলি - যেগুলি কোম্পানির ডোমেন নাম এবং জিপ কোডের ভিত্তিতে বেনামে কেনার প্রবণতা ছিল। আপনার সম্পর্কে তথ্য পাওয়ার আগে ক্রয়ের চেনাশোনাতে কমপক্ষে 50 টি পৃথক ক্রেতা থাকতে হয়েছিল - সুতরাং অ্যামাজন অবশ্যই এই তথ্যটি নিজেরাই (এবং অন্যদের) কী জনপ্রিয় তা বুঝতে সাহায্য করার জন্য সেই তথ্যটি রাখে, ট্র্যাক করেছিল এবং ব্যবহার করেছিল। আপনি আপনার অঞ্চল বা আপনার কোম্পানিতে সিডি, ইলেকট্রনিক্স এবং বই ক্রয়ের দিকে নজর দিতে পারেন। এগুলি 1999-2002 থেকে প্রকাশিত হয়েছিল। ফোরাম.ডেভিডিটালক.com/আর্টিভ / টি -২২২৪36.h.এইচটিএমএল এ্যামেজ থেকে বর্ণিত পাঠ্যের একটি অনুলিপি এবং পেস্টও রয়েছে।
ডেভ কুইক

3

আমার বিশেষভাবে অ্যামাজনের অ্যালগরিদম সম্পর্কে কোনও জ্ঞান নেই, তবে এই জাতীয় অ্যালগরিদমের একটি উপাদান সম্ভবত একসাথে অর্ডার করা আইটেমগুলির গোলাগুলি অন্তর্ভুক্ত করতে পারে এবং তারপরে কোনও গ্রাহক যখন কিছু উপসেট কিনে থাকে তখন সেই গোষ্ঠীর অন্যান্য আইটেমগুলির প্রস্তাব দেওয়ার জন্য সেই ডেটা ব্যবহার করে would গ্রুপ।

আরেকটি সম্ভাবনা হ'ল আইটেম 'বি' অর্ডার করার পরে এন দিনের মধ্যে আইটেম বিয়ের ফ্রিকোয়েন্সি ট্র্যাক করা, যা কোনও পারস্পরিক সম্পর্কের পরামর্শ দিতে পারে।


2

আমি যতদূর জানি, এটি এর ইঞ্জিন হিসাবে কেস-ভিত্তিক যুক্তি ব্যবহার করে।

আপনি এই উত্সগুলিতে দেখতে পারেন: এখানে , এখানে এবং এখানে

গুগলে অনেকগুলি উত্স অ্যামাজন এবং কেস-ভিত্তিক যুক্তির সন্ধান করছে।


0

কেউ গত সপ্তাহে আমাদের বিশ্ববিদ্যালয়ে উপস্থাপনা করেছিলেন এবং আমাজন সুপারিশ সিস্টেমটি উল্লেখ করেছেন d আমি বিশ্বাস করি যে এটি লোকেদের তাদের বিভিন্ন কেনার অভ্যাসে গুচ্ছ করতে কে-ম্যানস ক্লাস্টারিংয়ের একটি ফর্ম ব্যবহার করে । আশাকরি এটা সাহায্য করবে :)

এটিও দেখুন: http://www.almaden.ibm.com/cs/people/dmodha/ML02.ps এবং এইচটিএমএল হিসাবে


0

যদি আপনি হ্যান্ডস অন টিউটোরিয়াল চান (ওপেন-সোর্স আর ব্যবহার করে) তবে আপনি এটির চেয়ে আরও খারাপ করতে পারেন: https://gist.github.com/yoshiki146/31d4a46c3d8e906c3cd24f425568d34e

এটি কাজের অন্য একটি অংশের রান-টাইম অনুকূলিত সংস্করণ: http://www.salemmarafi.com/code/collaborative-filtering-r/

তবে, প্রথম লিঙ্কে কোডের তারতম্যটি খুব দ্রুত চলে তাই আমি এটি ব্যবহার করার পরামর্শ দিই (আমি পেয়েছি yoshi1414 এর কোডের একমাত্র ধীর অংশটি চূড়ান্ত রুটিন যা ব্যবহারকারী পর্যায়ে প্রস্তাবনা উত্পন্ন করে - এতে আমার ডেটা সহ প্রায় এক ঘন্টা সময় লেগেছিল আমার মেশিন)।

আমি যে কোডটি ব্যবহার করি তার জন্য একটি প্রস্তাবন ইঞ্জিন হিসাবে কাজ করার জন্য এই কোডটি রূপান্তর করেছি।

ব্যবহৃত আলগোরিদমটি হ'ল - অন্যরা যেমন বলেছে - সহযোগী ফিল্টারিং। সিএফের এই পদ্ধতিটি একটি কোসিন মিলের ম্যাট্রিক্স গণনা করে এবং তারপরে প্রতিটি উপাদানটির জন্য 'নিকটতম প্রতিবেশী' (উদাহরণটিতে সংগীত ব্যান্ডটি দেওয়া হয়েছে, আমার অ্যাপ্লিকেশনে খুচরা পণ্য) সন্ধান করে similar

ফলস্বরূপ সারণী অন্য একটি বেছে নেওয়া ব্যান্ড / পণ্যের উপর ভিত্তি করে একটি ব্যান্ড / পণ্য সুপারিশ করতে পারে।

কোডের পরবর্তী বিভাগটি ব্যবহারকারী (বা গ্রাহক) ভিত্তিক সহযোগী ফিল্টারিংয়ের সাথে আরও এক ধাপ এগিয়ে যায়।

এর আউটপুটটি একটি প্রদত্ত ব্যবহারকারী / গ্রাহকের জন্য প্রস্তাবিত শীর্ষ 100 ব্যান্ড / পণ্য সহ একটি বৃহত টেবিল


1
যদিও এই লিঙ্কটি প্রশ্নের উত্তর দিতে পারে, উত্তরের প্রয়োজনীয় অংশগুলি এখানে অন্তর্ভুক্ত করা এবং রেফারেন্সের জন্য লিঙ্কটি সরবরাহ করা ভাল। লিঙ্কযুক্ত পৃষ্ঠাগুলি পরিবর্তিত হলে লিঙ্ক-শুধুমাত্র উত্তরগুলি অবৈধ হতে পারে। - পর্যালোচনা থেকে
কোস

সত্য ... ব্যবহৃত অ্যালগরিদমটি হ'ল - অন্যরা যেমন বলেছে - সহযোগী ফিল্টারিং। সিএফের এই পদ্ধতিটি একটি কোসিন মিলের ম্যাট্রিক্স গণনা করে এবং তারপরে প্রতিটি উপাদানটির জন্য 'নিকটতম প্রতিবেশী' (উদাহরণটিতে সংগীত ব্যান্ড দেওয়া হয়েছে, আমার অ্যাপ্লিকেশনে খুচরা পণ্য) সন্ধান করে। ফলস্বরূপ সারণী অন্য একটি বেছে নেওয়া ব্যান্ড / পণ্যের উপর ভিত্তি করে একটি ব্যান্ড / পণ্য সুপারিশ করতে পারে। কোডের পরবর্তী বিভাগটি ব্যবহারকারী (বা গ্রাহক) ভিত্তিক সহযোগী ফিল্টারিংয়ের সাথে আরও এক ধাপ এগিয়ে যায়। এর আউটপুটটি একটি বৃহত টেবিল যা প্রদত্ত ব্যবহারকারী / গ্রাহকের জন্য প্রস্তাবিত শীর্ষ 100 ব্যান্ড / পণ্য সহ
ক্রিসডি

দয়া করে আপনি উত্তরটি সম্পাদনা করুন এবং এই তথ্যটি সেখানে মন্তব্য বিভাগে নয় যুক্ত করুন
কোস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.