Data Cleaning বা ডেটা পরিষ্কার করা হলো ডেটার অযাচিত বা ভুল তথ্য দূর করা, যাতে বিশ্লেষণের জন্য সঠিক এবং নির্ভুল ডেটা থাকে। Excel-এ Remove Duplicates এবং Text-to-Columns দুটি গুরুত্বপূর্ণ টুল যা ডেটা পরিষ্কার করার জন্য ব্যবহৃত হয়। এগুলি ডেটার গুণগত মান উন্নত করতে সহায়ক এবং বিশ্লেষণ বা রিপোর্ট তৈরির সময় ভুল ডেটা দূর করতে সাহায্য করে।
Remove Duplicates ফিচারটি ব্যবহার করে Excel-এ একে অপরের অনুরূপ বা ডুপ্লিকেট ডেটা দ্রুত সরানো যায়। এটি বিশেষভাবে ব্যবহারী যখন আপনার ডেটাবেসে একই তথ্য একাধিক বার পুনরাবৃত্তি হয়। ডুপ্লিকেট ডেটা সরিয়ে ফেলা বিশ্লেষণকে আরো নির্ভুল করে তোলে।
ধরা যাক, আপনার একটি সেলস রিপোর্ট আছে যেখানে প্রোডাক্ট আইডি এবং বিক্রয় পরিমাণ উল্লেখ আছে। যদি একাধিক বার একই প্রোডাক্ট আইডি ও বিক্রয় পরিমাণ থাকে, তবে Remove Duplicates ব্যবহার করে আপনি অতিরিক্ত রেকর্ডগুলো সরিয়ে ফেলতে পারেন।
Text-to-Columns টুলটি ব্যবহার করে আপনি এক সেলে থাকা ডেটাকে পৃথক কলামে ভাগ করতে পারেন। এটি বিশেষত যখন একটি সেলে একাধিক তথ্য থাকে, যেমন নাম, ঠিকানা, ফোন নম্বর ইত্যাদি, তখন এটি খুব কার্যকরী। আপনি Delimited বা Fixed Width পদ্ধতি ব্যবহার করে ডেটা ভাগ করতে পারবেন।
ধরা যাক, একটি সেলে John Smith, 25, New York লেখা আছে এবং আপনি এই ডেটাকে আলাদা কলামে ভাগ করতে চান। তাহলে:
Excel-এ Find and Replace ব্যবহার করে আপনি দ্রুত কোনো নির্দিষ্ট শব্দ বা মান খুঁজে বের করে সেটি পরিবর্তন করতে পারেন। এটি ভুল বানান বা নির্দিষ্ট মান সঠিকভাবে প্রতিস্থাপন করতে সহায়ক।
TRIM ফাংশনটি অতিরিক্ত স্পেস (যেমন শুরু বা শেষের অতিরিক্ত স্পেস) মুছে ফেলে, যা ডেটা পরিষ্কার করতে সাহায্য করে। উদাহরণস্বরূপ, =TRIM(A1) একটি সেলের অতিরিক্ত স্পেস মুছে ফেলবে।
খালি সারি মুছে ফেলার জন্য আপনি Filter ব্যবহার করে খালি সারিগুলো নির্বাচন করতে পারেন এবং তারপর সেগুলো মুছে ফেলতে পারেন।
Data Cleaning হল Excel-এ ডেটার গুণগত মান নিশ্চিত করতে ব্যবহৃত একটি গুরুত্বপূর্ণ প্রক্রিয়া। Remove Duplicates ফিচারটি ডুপ্লিকেট ডেটা সরাতে সাহায্য করে এবং Text-to-Columns ফিচারটি এক সেলে থাকা ডেটাকে আলাদা কলামে ভাগ করতে সাহায্য করে। এইসব ফিচারগুলো ডেটাকে আরও সুসংগঠিত ও বিশ্লেষণযোগ্য করে তোলে, যা আপনাকে নির্ভুল সিদ্ধান্ত নিতে সহায়তা করে।
common.read_more