ওয়ার্ডলের মতো একটি শব্দ মেঘ বাস্তবায়নের জন্য অ্যালগরিদম


201

প্রসঙ্গ

  • ওয়ার্ডে একবার দেখুন: http://www.wordle.net/
  • আমি যে কোনও শব্দ মেঘ জেনারেটর দেখেছি তার চেয়ে অনেক ভাল দেখাচ্ছে looking
  • দ্রষ্টব্য: উত্সটি উপলভ্য নয় - এফএকিউ: http://www.wordle.net/faq#code পড়ুন

আমার প্রশ্নগুলো

  • ওয়ার্ডল যা করে তা কি কোনও অ্যালগরিদম উপলব্ধ আছে?
  • যদি না হয় তবে এমন কী কী বিকল্প রয়েছে যা একই ধরণের আউটপুট তৈরি করে?

আমি কেন জিজ্ঞাসা করছি

  • উৎসুক
  • শিখতে চাই

1
সেখানে একটি বিকল্প বাস্তবায়ন, ইমেজ প্রসেসিং উপর ভিত্তি করে এখানে । খুব দ্রুত নয়, তবে খুব নমনীয় এবং পরীক্ষার জন্য ভাল। (ম্যাথমেটিকায় এখানে একটি সম্পূর্ণ বাস্তবায়ন দেওয়া আছে))
জাজলাক্স

2
আমি আমার নিজের (বেশ সহজ) অ্যালগরিদম নিয়ে এসেছি এবং এটি সম্পর্কে ব্লগ করেছি । এটি পাইথনে লেখা এবং কাস্টমাইজ করা সহজ হওয়া উচিত। আমি এটিকে অর্ধপক্ষে দক্ষ করার চেষ্টা করেছি। ! চিত্রের বিবরণ এখানে প্রবেশ করুন
আন্দ্রেয়াস মুলার

4
আপনি এই প্রশ্নটি জিজ্ঞাসা করার উপায়টি আমি সত্যিই পছন্দ করেছি! +1
কলিস্টিভরা

উত্তর:


472

আমি ওয়ার্ডেলের স্রষ্টা। এখানে ওয়ার্ডল কীভাবে কাজ করে তা এখানে:

শব্দগুলি গণনা করুন, বিরক্তিকর শব্দগুলি ফেলে দিন এবং গণনা অনুসারে বাছাই করুন, অবতরণ করুন। কিছু এন এর জন্য শীর্ষ এন শব্দ রাখুন প্রতিটি শব্দকে তার গণনার সাথে আনুপাতিক একটি ফন্ট আকার নির্ধারণ করুন। জাভা 2 ডি এপিআই ব্যবহার করে প্রতিটি শব্দের জন্য একটি জাভা 2 ডি আকার তৈরি করুন।

প্রতিটি শব্দ "চায়" কোথাও হতে পারে যেমন "উল্লম্ব কেন্দ্রে কিছু র্যান্ডম এক্স পজিশনে"। ক্রমবর্ধমান ক্রম অনুসারে, প্রতিটি শব্দের জন্য এটি করুন:

place the word where it wants to be
while it intersects any of the previously placed words
    move it one step along an ever-increasing spiral

এটাই. হার্ড অংশ ছেদ-পরীক্ষার দক্ষতার, যার জন্য আমি গত-হিট ক্যাশে, হায়ারারকিকাল সীমান্ত বক্স ব্যবহার করছেন, এবং একটি quadtree স্থানিক ইনডেক্স (যার সকল জিনিষ আপনি কিছু পরিশ্রমী googling সঙ্গে সম্পর্কে আরও জানতে পারেন)।

সম্পাদনা করুন: রেটো আইবারসোল্ড যেমন উল্লেখ করেছেন, এখন এই বইয়ের একটি অধ্যায় রয়েছে যা অবাধে উপলভ্য, যা এই একই অঞ্চল জুড়ে: সুন্দর ভিজ্যুয়ালাইজেশন, অধ্যায় 3: ওয়ার্ড


22
"পরিশ্রমী গুগলিং"। এটি পছন্দ করুন :)
zengr

6
এখানে আরও তথ্য: static.mrfeinberg.com/bv_ch03.pdf - ধন্যবাদ জোনাথন।
রেটো আইবার্সোল্ড

জনাথন তথ্যের জন্য ধন্যবাদ - আমি বাস্তবের মতো সহজ অ্যালগরিদম দ্বারা মুগ্ধ হয়ে যা এর মতো দুর্দান্ত দৃশ্যধারণ করতে পারে।
জন প্যাট্রিক

"কোথাও হতে চাই" অংশ নিয়ে আমি এখনও কিছুটা বিস্মিত। শব্দের প্রাথমিক অবস্থান কি আসলেই এলোমেলো?
আদিব

30
যার সৌন্দর্য সম্পর্কে আপনি জিজ্ঞাসা করছেন সেই ব্যক্তির সৌন্দর্য আসলে আপনার প্রশ্নের উত্তর দিতে পারে!
অর্ণব দত্ত

33

এখানে জেসন ডেভিস থেকে ডি 3 ব্যবহার করে এমন একটি দুর্দান্ত জাভাস্ক্রিপ্ট রয়েছে। এমনকি আপনি এটির সাথে ওয়েবফন্টগুলিও ব্যবহার করতে পারেন।

ডেমো: http://www.jasondavies.com/wordcloud/

গিথুব: https://github.com/jasondavies/d3- ক্লাউড


কেবলমাত্র src = "। Js" ফাইলগুলি অনুলিপি করা এবং এগুলি নির্মাণের জন্য বা ঠিক যেমনটি ব্যবহার করার জন্য সেগুলি পুনরায় আপলোড করা খুব সহজ। ভাগ করে নেওয়ার জন্য ধন্যবাদ এবং দুর্দান্ত কাজ!
মাইকেল ডি

রঙিন প্যালেটটিকে আরও নান্দনিক কিছুতে পরিবর্তন করার কোনও উপায় আছে কি? কলরলভারগুলির এপিআইয়ের পরামর্শ অনুসারে আমি জেএসএন কল থেকে জেএসএন কলটি থেকে কলরলভার্স / অ্যাপি / প্যালেটস / র্যান্ডম থেকে কলরলভার্স / অ্যাপি / প্যালেটস / টপকে সংশোধন করার চেষ্টা করেছি তবে প্যালেটটি একই ছিল।
মাইকেল ডি

এখানে একটি প্রতিক্রিয়াশীল কাজের উদাহরণ যা ডেমোর উপর ভিত্তি করে তবে শব্দ এবং রঙে সম্পূর্ণ নিয়ন্ত্রণ সহ। একটি কাস্টম রঙ প্যালেট জন্য পরিবর্তে মন্তব্য কোড ব্যবহার করুন। jsbin.com/kiwojayoye/1/edit?html,js, আউটপুট
মার্টিন ব্রাউন

33

আমি ট্যাগ ক্লাউড তৈরি করতে পাইথন ব্যবহার করে জোনাথন ফিনবার্গের বর্ণিত একটি অ্যালগরিদম বাস্তবায়ন করেছি। এটি ওয়ার্ডল ডট নেট এর সুন্দর মেঘ থেকে অনেক দূরে তবে এটি আপনাকে কীভাবে করা যায় তা একটি ধারণা দেয়।

আপনি এখানে প্রকল্প খুঁজে পেতে পারেন ।


ভাগ করে নেওয়ার জন্য ধন্যবাদ! আমি অবশ্যই আপনার বাস্তবায়ন সন্ধান করব।
নাম্ন্লোস

এটা সত্যিই দারুন. ধন্যবাদ!
টোকুডু

লিঙ্ক (labs.atizo.com) আবার ভেঙে গেছে। আপনার সত্যিই একটি নমুনা চিত্র বা দুটি পোস্ট করা উচিত যাতে আমরা তুলনাটি দেখতে পারি।
smci

@ রিটোএবারসোল্ড কি এই কোডটিকে ফ্লাস্ক বা জ্যাঙ্গো কাঠামোর সাথে সংহত করার জন্য কি আছে?
মিতুল শাহ

30

আমি একটি সিলভারলাইট উপাদান তৈরি করেছি যা জোনাথনের পরামর্শ অনুসারে অ্যালগরিদম ব্যবহার করে। উত্স কোড এবং উদাহরণ প্রকল্পগুলি সমস্ত আমার ব্লগে উপলভ্য:

http://whydoidoit.com

রঙ শব্দ মেঘ

আমার মেঘ আপনাকে বিভিন্ন ওজনের উপর ভিত্তি করে শব্দের রঙ এবং আকার দিতে দেয় এবং এটি শব্দ নির্বাচন (একটি স্থানাঙ্ক থেকে) এবং নির্বাচিত শব্দ হাইলাইটিং সমর্থন করে। উত্সটি আপনার উপযুক্ত হিসাবে দেখতে ব্যবহার করার জন্য আপনার।

ওয়ার্ড ক্লাউড উদাহরণ


2
আপনার ব্লগটি খালি মনে হচ্ছে। লিঙ্কটি মারা গেছে?
বা ম্যাপার

এখানে archive.org স্ন্যাপশট, web.archive.org/web/20110820202717/http://whydoidoit.com/... আমিও GitHub উপর প্রকল্পের পাওয়া github.com/whydoidoit/WordCloud
ফ্রেম

14

আমি ওয়ার্ডক্র্যাম , ওয়ার্ড ক্লাউড তৈরির জন্য একটি প্রসেসিং লাইব্রেরিতে কাজ করছি । এটি ভার্চলে খুব ভারীভাবে প্রভাবিত হয়েছে এবং উপরের সাথে যুক্ত একই পিডিএফ দ্বারা অবহিত করা হয়েছে। এটি আপনার জন্য সংঘর্ষ সনাক্তকরণ পরিচালনা করে এবং আপনাকে কীভাবে আপনার শব্দগুলি ছড়িয়ে দেওয়া, রঙিন, ঘোরানো ইত্যাদির উপর নজর দিতে দেয় lets


আপনার পরিষেবাটি কোনও এপিআই সরবরাহ করে?
বার্ট

দুঃখিত, ওয়ার্ডক্রমে কোনও এপিআই নেই। এটি একটি গ্রন্থাগার, কোনও পরিষেবা নয়।
ড্যান বার্নিয়ার


8

আমি একটি ওয়ার্ল্ড-এর মতো ভিজ্যুয়ালাইজেশনের সন্ধান করছিলাম যা রঙের, প্রাথমিক অবস্থান এবং অন্যান্য স্ট্রিংয়ের সাথে সম্পর্কিত স্ট্রিংয়ের আকার যেমন কোনও পাঠ্যের মধ্যে প্রাসঙ্গিকতা - খুঁজে পায়নি, কিছুই খুঁজে পেল না, তবে আমি এখানে যে তথ্য পেয়েছি তার জন্য ধন্যবাদ (বিশেষত জোনাথনের ব্যাখ্যা এবং এবির লিঙ্ক), আমি অবশেষে ' ক্লাউডিও ' বাস্তবায়ন করতে পারি , যা তুলনামূলকভাবে ওয়ার্ডের নিকটে আসে (কমপক্ষে আমিও তাই মনে করি ...) এবং আমি যে বৈশিষ্ট্যগুলি সন্ধান করছিলাম সেগুলি সরবরাহ করে।

এটি এসডাব্লুটি এবং জেফিসির সাথে বাস্তবায়িত হয়েছে এবং আমি জেফিসির এমভিসি-মডেলটিতে এটি সংহত করার চেষ্টা করেছি, যেমন আপনি মেঘের বিন্যাসটি সংশোধন করতে এবং অন্যান্য গ্রহ-প্লাগইন বা আরসিপিতে যুক্ত করতে কনটেন্ট- এবং লেবেল-সরবরাহকারী সেট করতে পারেন অ্যাপ্লিকেশন রয়েছে। কোনও স্ট্রিংয়ের প্রাথমিক অবস্থান গণনা করার পদ্ধতিটিও আপনি সংশোধন করতে পারেন, যেমন এটি ক্লাস্টার ভিজ্যুয়ালাইজেশনের জন্য ব্যবহার করা অন্যথায় নয়। এটি এখনও বেশ কয়েকটি উপায়ে নথিভুক্ত এবং সীমাবদ্ধ রয়েছে (এবং আমি কয়েক ঘন্টা আগে প্রাথমিক আপলোডটি করেছি, তবে এটি এখনও কিছুটা বগিযুক্ত হতে পারে) তবে আপনি যদি আগ্রহী হন তবে এখানে লিঙ্কটি দিন:

এবং কিছু তৈরি মেঘের একটি লিঙ্ক এখানে দেওয়া হয়েছে, আপনি যদি দ্রুত ছাপ চান: https://github.com/sschwieb/Cloudio/wiki/Example- ক্লাউডস

চিয়ার্স, স্টিফান


8

এখানে মেঘের মতো আমার ওয়ার্ডেল বাস্তবায়ন দেখুন। এটি একই সর্পিল অ্যালগরিদম এবং কোয়াডট্রি ডেটা স্ট্রাকচার ব্যবহার করে।

http://sourcecodecloud.codeplex.com

অথবা

http://www.codeproject.com/Articles/224231/Word-Cloud-Tag-Cloud-Generator-Control-for-NET-Win


সোর্সকোডক্লাউড ডাউনলোডযোগ্য নয়, দ্বিতীয়
লিঙ্কটিও

আমি প্রথম লিঙ্কের উত্স কোড / ডাউনলোড যাচাই করেছি। এটা কাজ করেছে. দ্বিতীয় লিঙ্কটি সরানো হয়েছিল। এখন স্থির।
জর্জ মামালাদজে

4

সিংহ এবং ল্যাম্ব একটি ওপেন-সোর্স আইওএস অ্যাপ্লিকেশন যা বাইবেলের একটি নির্বাচিত বইয়ের সবচেয়ে ঘন ঘন শব্দ ব্যবহার করে শব্দ মেঘ তৈরি করে।

এটি জোনাথন ফিনবার্গের বর্ণিত অ্যালগরিদমের উপর ভিত্তি করে। হিট টেস্টিং একটি কোয়াড ট্রি ব্যবহার করে না, তবে সীমাবদ্ধ বাক্সগুলি গ্লিফের বাউন্ডিং আয়তক্ষেত্রের উপর ভিত্তি করে। আমি গ্লাইফের বাউন্ডিং বাক্সের মধ্যে শব্দ স্থান নির্ধারণের জন্য গ্লিফটি অনেকগুলি ছোট বাউন্ডিং রিক্সে ভেঙে ফেলতে চাই।

গিটহাব: https://github.com/PetahChristian/LionAndLamb

বাইবেল প্রকাশিত বাক্য বইয়ের একটি শব্দ মেঘ


4

আমার এখানে একটি ট্যাগ ক্লাউড জেনারেটর রয়েছে, যাকে আমি ডিসঅরগানাইজার বলি :)

সোর্সগুলি TagCloudService এবং রেজার মার্কআপ নিয়ন্ত্রণ এবং একটি উইনফর্ম যা পরীক্ষার উদ্দেশ্যে আপনি আপনার ব্লগ, প্রোফাইল ইত্যাদিগুলিতে কিছুটা মোড়কে রেখে দিতে পারেন testing এটি সি # 4.0 এবং সিস্টেম ব্যবহার করে name

আমি এটি তৈরি করেছি কারণ অন্যান্য ক্লাউড জেনারেটরের সাহায্যে আপনি নেভিগেট করতে ট্যাগগুলিতে ক্লিক করতে পারবেন না এবং সেগুলি ক্লিকযোগ্য show যেহেতু এইচটিএমএলটিতে হোভার অ্যানিমেশনটি দেখানো আমার জন্য প্রয়োজনীয় (আমি এটি ওভারলে-এড, একেবারে অবস্থানযুক্ত <a>ট্যাগ দিয়ে করছি) আমি কোনও-কোণের শব্দের প্রদর্শন তৈরি করি নি - সেগুলি হয় উলম্ব বা অনুভূমিক।

সতর্কতা: উপরের লিঙ্কগুলি কয়েক মাসের মধ্যে অবৈধ হয়ে যেতে পারে, আমি আশেপাশের প্রকল্প থেকে এটি একটি পৃথক প্রকল্পে আস্তে আস্তে খুলতে চাই।

আপনি এই নমুনা ব্লগ পোস্টে একটি ওয়ার্কিং ডেমো দেখতে পারেন , তবে এটি অসম্পূর্ণ এবং একটি অসম্পূর্ণ সাইটে। কেউ যদি অবদান রাখতে চায় তবে আমার সাথে যোগাযোগ করুন, আমি এটিকে অসম্পূর্ণভাবে আলাদা করে চালিয়ে যাব।


লিঙ্কগুলি অবৈধ হয়ে গেছে। আমি আপনার ব্লগে ইউআই পছন্দ করি।
ডগ এস

ধন্যবাদ, কেবল এগুলি ঠিক করে
রেখেছি

2

পাইথন 3- তে মূলত জোনাথন ফিনবার্গের (কোয়াডটিজস, সর্পিল ইত্যাদি) প্রাথমিক রূপরেখার উপর ভিত্তি করে পাইথন 3-এ ওয়ার্ডেলের আরও শেষ-শেষের প্রয়োগ এখানে রয়েছে ।

কোড (বিস্তারিত ReadMe ফাইল সহ মন্তব্য করা হয়েছে) এই গিথুব সংগ্রহস্থলে অবাধে উপলব্ধ এবং এটি কোড সহ তৈরি একটি নমুনা ওয়ার্ডল।

ম্যাকবেথ


0

টিম ড্রিম দ্বারা নির্মিত একটি দুর্দান্ত সুন্দর জাভাস্ক্রিপ্ট লাইব্রেরি আছে:

https://github.com/timdream/wordcloud2.js/blob/gh-pages/API.md

ফলাফলটি পরিবর্তন করার জন্য এটি প্রচুর বিকল্পের সাথে ক্যানভাসে বা এইচটিএমএল ট্যাগ সহ একটি শব্দ মেঘ তৈরি করতে পারে। এটি ওয়ার্ডলের আউটপুটটির কাছে আসলেই আসে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.