Data Cleaning Techniques (Remove Duplicates, Text-to-Columns)

Microsoft Technologies - মাইক্রোসফট এক্সেল (Excel) Excel Data Analysis Techniques |
232
232

Data Cleaning বা ডেটা পরিষ্কার করা হলো ডেটার অযাচিত বা ভুল তথ্য দূর করা, যাতে বিশ্লেষণের জন্য সঠিক এবং নির্ভুল ডেটা থাকে। Excel-এ Remove Duplicates এবং Text-to-Columns দুটি গুরুত্বপূর্ণ টুল যা ডেটা পরিষ্কার করার জন্য ব্যবহৃত হয়। এগুলি ডেটার গুণগত মান উন্নত করতে সহায়ক এবং বিশ্লেষণ বা রিপোর্ট তৈরির সময় ভুল ডেটা দূর করতে সাহায্য করে।


Remove Duplicates (ডুপ্লিকেট সরানো)

Remove Duplicates ফিচারটি ব্যবহার করে Excel-এ একে অপরের অনুরূপ বা ডুপ্লিকেট ডেটা দ্রুত সরানো যায়। এটি বিশেষভাবে ব্যবহারী যখন আপনার ডেটাবেসে একই তথ্য একাধিক বার পুনরাবৃত্তি হয়। ডুপ্লিকেট ডেটা সরিয়ে ফেলা বিশ্লেষণকে আরো নির্ভুল করে তোলে।

Remove Duplicates ব্যবহার করার ধাপ:

  1. ডেটা সিলেক্ট করুন: প্রথমে সেই ডেটা সিলেক্ট করুন যেখানে আপনি ডুপ্লিকেট চেক করতে চান।
  2. Data ট্যাব-এ যান: Excel-এর Data ট্যাবের নিচে Data Tools গ্রুপে Remove Duplicates অপশনটি ক্লিক করুন।
  3. Remove Duplicates উইন্ডো: এখন একটি উইন্ডো আসবে, যেখানে আপনি নির্ধারণ করতে পারবেন কোন কোলাম বা ফিল্ডগুলোতে ডুপ্লিকেট চেক করতে চান। যদি আপনি সব কলাম থেকে ডুপ্লিকেট চেক করতে চান, তাহলে সবগুলো কলাম সিলেক্ট করুন।
  4. OK ক্লিক করুন: OK ক্লিক করার পর Excel ডেটার মধ্যে থাকা ডুপ্লিকেট মানগুলো সরিয়ে ফেলবে এবং কতটি ডুপ্লিকেট সরানো হয়েছে, তা একটি পপ-আপ বার্তায় দেখাবে।

উদাহরণ:

ধরা যাক, আপনার একটি সেলস রিপোর্ট আছে যেখানে প্রোডাক্ট আইডি এবং বিক্রয় পরিমাণ উল্লেখ আছে। যদি একাধিক বার একই প্রোডাক্ট আইডিবিক্রয় পরিমাণ থাকে, তবে Remove Duplicates ব্যবহার করে আপনি অতিরিক্ত রেকর্ডগুলো সরিয়ে ফেলতে পারেন।


Text-to-Columns (টেক্সট-টু-কোলাম)

Text-to-Columns টুলটি ব্যবহার করে আপনি এক সেলে থাকা ডেটাকে পৃথক কলামে ভাগ করতে পারেন। এটি বিশেষত যখন একটি সেলে একাধিক তথ্য থাকে, যেমন নাম, ঠিকানা, ফোন নম্বর ইত্যাদি, তখন এটি খুব কার্যকরী। আপনি Delimited বা Fixed Width পদ্ধতি ব্যবহার করে ডেটা ভাগ করতে পারবেন।

Text-to-Columns ব্যবহার করার ধাপ:

  1. ডেটা সিলেক্ট করুন: প্রথমে সেই সেল বা কলাম নির্বাচন করুন, যেখানে এক সেলে একাধিক ডেটা রয়েছে।
  2. Data ট্যাব-এ যান: Excel-এর Data ট্যাব থেকে Text to Columns অপশনটি ক্লিক করুন।
  3. Delimited বা Fixed Width নির্বাচন করুন:
    • Delimited: যদি ডেটা স্পেস, কমা, সেমিকোলন, ট্যাব ইত্যাদি দ্বারা পৃথক করা থাকে, তবে এটি নির্বাচন করুন।
    • Fixed Width: যদি ডেটা সঠিক দৈর্ঘ্যের মধ্যে ভাগ করতে চান, তবে এটি নির্বাচন করুন।
  4. Delimiter নির্বাচন করুন: যদি আপনি Delimited পদ্ধতি ব্যবহার করেন, তাহলে পপ-আপ উইন্ডোতে ডেটা কী দিয়ে পৃথক হয়েছে তা নির্বাচন করুন (যেমন স্পেস, কমা, সেমিকোলন ইত্যাদি)।
  5. Finish: সবকিছু ঠিক থাকলে Finish ক্লিক করুন। এখন আপনার ডেটা পৃথক কলামে ভাগ হয়ে যাবে।

উদাহরণ:

ধরা যাক, একটি সেলে John Smith, 25, New York লেখা আছে এবং আপনি এই ডেটাকে আলাদা কলামে ভাগ করতে চান। তাহলে:

  • Delimited অপশন নির্বাচন করে Comma (কমা) delimiter ব্যবহার করুন এবং সেলটি Name, Age, এবং City হিসেবে ভাগ হয়ে যাবে।

অন্যান্য Data Cleaning Techniques

Find and Replace (খোঁজা এবং প্রতিস্থাপন)

Excel-এ Find and Replace ব্যবহার করে আপনি দ্রুত কোনো নির্দিষ্ট শব্দ বা মান খুঁজে বের করে সেটি পরিবর্তন করতে পারেন। এটি ভুল বানান বা নির্দিষ্ট মান সঠিকভাবে প্রতিস্থাপন করতে সহায়ক।

Trim (ট্রিম)

TRIM ফাংশনটি অতিরিক্ত স্পেস (যেমন শুরু বা শেষের অতিরিক্ত স্পেস) মুছে ফেলে, যা ডেটা পরিষ্কার করতে সাহায্য করে। উদাহরণস্বরূপ, =TRIM(A1) একটি সেলের অতিরিক্ত স্পেস মুছে ফেলবে।

Remove Blank Rows (খালি সারি মুছে ফেলা)

খালি সারি মুছে ফেলার জন্য আপনি Filter ব্যবহার করে খালি সারিগুলো নির্বাচন করতে পারেন এবং তারপর সেগুলো মুছে ফেলতে পারেন।


সারাংশ

Data Cleaning হল Excel-এ ডেটার গুণগত মান নিশ্চিত করতে ব্যবহৃত একটি গুরুত্বপূর্ণ প্রক্রিয়া। Remove Duplicates ফিচারটি ডুপ্লিকেট ডেটা সরাতে সাহায্য করে এবং Text-to-Columns ফিচারটি এক সেলে থাকা ডেটাকে আলাদা কলামে ভাগ করতে সাহায্য করে। এইসব ফিচারগুলো ডেটাকে আরও সুসংগঠিত ও বিশ্লেষণযোগ্য করে তোলে, যা আপনাকে নির্ভুল সিদ্ধান্ত নিতে সহায়তা করে।

common.content_added_by
টপ রেটেড অ্যাপ

স্যাট অ্যাকাডেমী অ্যাপ

আমাদের অল-ইন-ওয়ান মোবাইল অ্যাপের মাধ্যমে সীমাহীন শেখার সুযোগ উপভোগ করুন।

ভিডিও
লাইভ ক্লাস
এক্সাম
ডাউনলোড করুন
Promotion