এআই -এর জন্য কীভাবে মনোযোগী দৃষ্টিভঙ্গি গ্রহণ করা পক্ষপাতদুষ্ট ডেটা সেটগুলি হ্রাস করে

পক্ষপাতমূলক ডেটাসেট এবং নৈতিক এআই

এআই-চালিত সমাধানগুলি কার্যকর হওয়ার জন্য ডেটা সেট প্রয়োজন। এবং এই ডেটা সেটগুলির তৈরি একটি নিয়মতান্ত্রিক স্তরে একটি অন্তর্নিহিত পক্ষপাতের সমস্যায় পরিপূর্ণ। সমস্ত মানুষ পক্ষপাতদুষ্ট (উভয় সচেতন এবং অজ্ঞান) ভোগ করে। পক্ষপাতগুলি যে কোনও সংখ্যক রূপ নিতে পারে: ভৌগলিক, ভাষাগত, আর্থ-সামাজিক, যৌনতাবাদী এবং বর্ণবাদী। এবং এই পদ্ধতিগত পক্ষপাতগুলি ডেটাতে বেক করা হয়, যার ফলে AI পণ্যগুলি হতে পারে যা পক্ষপাতকে স্থায়ী করে এবং বড় করে। ডেটা সেটে ক্রমবর্ধমান পক্ষপাতের বিরুদ্ধে প্রশমন করার জন্য সংগঠনগুলির একটি মনোযোগী পদ্ধতির প্রয়োজন।

উদাহরণগুলি যে পক্ষপাত সমস্যা ব্যাখ্যা করে

এই ডেটা সেটের পক্ষপাতের একটি উল্লেখযোগ্য উদাহরণ যা সেই সময়ে প্রচুর নেতিবাচক প্রেস অর্জন করেছিল তা ছিল একটি জীবনবৃত্তান্ত পড়ার সমাধান যা মহিলাদের তুলনায় পুরুষ প্রার্থীদের পছন্দ করে। এর কারণ হল, নিয়োগের টুলের ডেটা সেটগুলি গত এক দশক থেকে জীবনবৃত্তান্ত ব্যবহার করে তৈরি করা হয়েছিল যখন বেশিরভাগ আবেদনকারী পুরুষ ছিলেন। তথ্য পক্ষপাতদুষ্ট ছিল এবং ফলাফল সেই পক্ষপাতকে প্রতিফলিত করেছিল। 

আরেকটি ব্যাপকভাবে রিপোর্ট করা উদাহরণ: বার্ষিক গুগল I/O ডেভেলপার কনফারেন্সে, গুগল একটি AI- চালিত ডার্মাটোলজি অ্যাসিস্ট টুলের প্রিভিউ শেয়ার করেছে যা মানুষকে বুঝতে সাহায্য করে যে তাদের ত্বক, চুল এবং নখ সম্পর্কিত সমস্যাগুলি কী হচ্ছে। ডার্মাটোলজি অ্যাসিস্ট্যান্ট আন্ডারস্কোর করে যে কীভাবে AI স্বাস্থ্যসেবাতে সাহায্য করার জন্য বিকশিত হচ্ছে — তবে এটি সমালোচনার পরিপ্রেক্ষিতে AI-তে পক্ষপাতিত্বের সম্ভাবনাকেও তুলে ধরে যে টুলটি রঙিন মানুষের জন্য পর্যাপ্ত নয়।

যখন গুগল টুলটি ঘোষণা করে, কোম্পানি উল্লেখ করে:

আমরা প্রত্যেকের জন্য তৈরি করছি তা নিশ্চিত করার জন্য, আমাদের মডেল বয়স, লিঙ্গ, জাতি এবং ত্বকের ধরনগুলির মতো বিষয়গুলির জন্য হিসাব করে - ফ্যাকাশে ত্বক থেকে বাদামী ত্বক যা খুব কমই পুড়ে যায়।

গুগল, সাধারণ ত্বকের অবস্থার উত্তর খুঁজে পেতে সাহায্য করার জন্য এআই ব্যবহার করে

কিন্তু ভাইসের একটি নিবন্ধে বলা হয়েছে যে Google একটি অন্তর্ভুক্তিমূলক ডেটা সেট ব্যবহার করতে ব্যর্থ হয়েছে:

কাজটি সম্পন্ন করার জন্য, গবেষকরা দুটি রাজ্যে অবস্থিত 64,837 রোগীর 12,399 চিত্রের একটি প্রশিক্ষণ ডেটাসেট ব্যবহার করেছেন। কিন্তু চিত্রিত হাজার হাজার ত্বকের অবস্থার মধ্যে, মাত্র 3.5 শতাংশ ফিটজপ্যাট্রিক ত্বকের ধরণ V এবং VI- এর রোগীদের কাছ থেকে এসেছে - যারা যথাক্রমে বাদামী ত্বক এবং গা dark় বাদামী বা কালো ত্বকের প্রতিনিধিত্ব করে। গবেষণায় বলা হয়েছে, 90 শতাংশ ডাটাবেস ছিল ফর্সা ত্বক, গা white় সাদা চামড়া বা হালকা বাদামী ত্বকের মানুষের সমন্বয়ে গঠিত। পক্ষপাতদুষ্ট নমুনার ফলস্বরূপ, চর্মরোগ বিশেষজ্ঞরা বলছেন যে অ্যাপটি সাদা নয় এমন ব্যক্তিদের বেশি বা কম রোগ নির্ণয় করতে পারে।

ভাইস, গুগলের নতুন চর্মরোগ অ্যাপটি গাark় ত্বকের মানুষের জন্য ডিজাইন করা হয়নি

Google বলেছে যে এটি আনুষ্ঠানিকভাবে প্রকাশ করার আগে টুলটিকে পরিমার্জন করবে:

আমাদের AI-চালিত ডার্মাটোলজি অ্যাসিস্ট টুল হল তিন বছরেরও বেশি গবেষণার চূড়ান্ত পরিণতি। যেহেতু আমাদের কাজটি নেচার মেডিসিনে বৈশিষ্ট্যযুক্ত ছিল, তাই আমরা আমাদের প্রযুক্তির বিকাশ এবং পরিমার্জন অব্যাহত রেখেছি যাতে হাজার হাজার মানুষের দ্বারা দান করা ডেটা এবং আরও লক্ষাধিক কিউরেটেড ত্বক সংক্রান্ত ছবি অন্তর্ভুক্ত অতিরিক্ত ডেটাসেট অন্তর্ভুক্ত থাকে।

গুগল, সাধারণ ত্বকের অবস্থার উত্তর খুঁজে পেতে সাহায্য করার জন্য এআই ব্যবহার করে

আমরা যতটা আশা করতে পারি এআই এবং মেশিন লার্নিং প্রোগ্রামগুলি এই পক্ষপাতের জন্য সংশোধন করতে পারে, বাস্তবতা রয়ে গেছে: সেগুলি কেবলমাত্র স্মার্ট যেহেতু তাদের ডেটা সেট পরিষ্কার। পুরানো প্রোগ্রামিং প্রবাদের একটি আপডেটে আবর্জনা আবর্জনা, AI সলিউশনগুলি কেবলমাত্র ততটাই শক্তিশালী যতটা তাদের ডেটা সেটের গুণমান থেকে শুরু করে। প্রোগ্রামারদের কাছ থেকে সংশোধন না করে, এই ডেটা সেটগুলির নিজেদেরকে ঠিক করার জন্য ব্যাকগ্রাউন্ড অভিজ্ঞতা নেই - কারণ তাদের কেবল রেফারেন্সের অন্য কোনও ফ্রেম নেই।

দায়িত্বের সাথে ডেটা সেট তৈরি করা সবার মূল বিষয় নৈতিক কৃত্রিম বুদ্ধিমত্তা। এবং মানুষ সমাধানের মূলে রয়েছে। 

মাইন্ডফুল এআই হল এথিক্যাল এআই

শূন্যতায় পক্ষপাত হয় না। অনৈতিক বা পক্ষপাতদুষ্ট ডেটা সেটগুলি বিকাশের পর্যায়ে ভুল পদ্ধতি গ্রহণ থেকে আসে। পক্ষপাতমূলক ত্রুটিগুলি মোকাবেলা করার উপায় হল একটি দায়িত্বশীল, মানব-কেন্দ্রিক, পদ্ধতি অবলম্বন করা যা শিল্পের অনেকেই মাইন্ডফুল AI বলে। মাইন্ডফুল এআই এর তিনটি গুরুত্বপূর্ণ উপাদান রয়েছে:

1. মননশীল AI হল মানব-কেন্দ্রিক

এআই প্রকল্পের শুরু থেকে, পরিকল্পনার পর্যায়ে, প্রত্যেকের সিদ্ধান্তের কেন্দ্রে মানুষের চাহিদা থাকতে হবে। এবং তার মানে সব মানুষ - শুধু একটি উপসেট নয়। এজন্য ডেভেলপারদের AI অ্যাপ্লিকেশনগুলিকে অন্তর্ভুক্তিমূলক এবং পক্ষপাতমুক্ত করার প্রশিক্ষণের জন্য বিশ্বব্যাপী ভিত্তিক লোকের একটি বিচিত্র দলের উপর নির্ভর করতে হবে।

একটি বৈশ্বিক, বৈচিত্র্যময় দল থেকে ডেটা সেট ক্রাউডসোর্সিং নিশ্চিত করে যে পক্ষপাতগুলি সনাক্ত করা হয়েছে এবং তাড়াতাড়ি ফিল্টার করা হয়েছে। বিভিন্ন জাতি, বয়সের গোষ্ঠী, লিঙ্গ, শিক্ষার স্তর, আর্থ-সামাজিক পটভূমি, এবং অবস্থানগুলি সহজেই ডেটা সেটগুলিকে সনাক্ত করতে পারে যা একটি মানকে অন্যের উপর সমর্থন করে, এইভাবে অনিচ্ছাকৃত পক্ষপাতকে দূর করে।

ভয়েস অ্যাপ্লিকেশনগুলি দেখুন। একটি মননশীল এআই পদ্ধতি প্রয়োগ করার সময়, এবং একটি বিশ্বব্যাপী প্রতিভা পুলের ক্ষমতাকে কাজে লাগানোর সময়, ডেভেলপাররা ডেটা সেটে বিভিন্ন উপভাষা এবং উচ্চারণের মতো ভাষাগত উপাদানগুলির জন্য হিসাব করতে পারে।

শুরু থেকেই মানবকেন্দ্রিক নকশা কাঠামো প্রতিষ্ঠা করা গুরুত্বপূর্ণ। উৎপন্ন, কিউরেটেড এবং লেবেল করা ডেটা শেষ ব্যবহারকারীদের প্রত্যাশা পূরণ করে তা নিশ্চিত করার দিকে এটি অনেক দূর এগিয়ে যায়। কিন্তু পুরো প্রোডাক্ট ডেভেলপমেন্ট লাইফ সাইকেল জুড়ে মানুষকে লুপে রাখাও গুরুত্বপূর্ণ। 

লুপের মধ্যে থাকা মানুষরাও মেশিনগুলিকে প্রতিটি নির্দিষ্ট দর্শকদের জন্য আরও ভাল AI অভিজ্ঞতা তৈরি করতে সাহায্য করতে পারে। Pactera EDGE এ, আমাদের AI ডেটা প্রজেক্ট টিম, বিশ্বব্যাপী অবস্থিত, বুঝতে পারে কিভাবে বিভিন্ন সংস্কৃতি এবং প্রসঙ্গ নির্ভরযোগ্য AI প্রশিক্ষণ ডেটা সংগ্রহ এবং পরিপূরককে প্রভাবিত করতে পারে। এআই-ভিত্তিক সমাধান লাইভ হওয়ার আগে তাদের সমস্যাগুলি চিহ্নিত করতে, তাদের পর্যবেক্ষণ করতে এবং সেগুলি ঠিক করার জন্য তাদের প্রয়োজনীয় সরঞ্জাম রয়েছে।

হিউম্যান-ইন-দ্য-লুপ এআই একটি প্রকল্প "সুরক্ষা জাল" যা মানুষের শক্তি-এবং তাদের বৈচিত্র্যময় পটভূমিকে মেশিনের দ্রুত কম্পিউটিং ক্ষমতার সাথে একত্রিত করে। এই মানব এবং এআই সহযোগিতা প্রোগ্রামের শুরু থেকে প্রতিষ্ঠিত হওয়া প্রয়োজন যাতে পক্ষপাতমূলক তথ্য প্রকল্পের ভিত্তি তৈরি না করে। 

2. মাইন্ডফুল এআই দায়ী

দায়িত্বশীল হওয়া নিশ্চিত করা যে এআই সিস্টেমগুলি পক্ষপাতমুক্ত এবং তারা নীতিশাস্ত্রের উপর ভিত্তি করে। এটি কীভাবে, কেন এবং কোথায় ডেটা তৈরি করা হয়, এটি কীভাবে এআই সিস্টেমগুলি দ্বারা সংশ্লেষিত হয় এবং এটি কীভাবে সিদ্ধান্ত গ্রহণে ব্যবহার করা হয় সে সম্পর্কে সচেতন হওয়া, সিদ্ধান্তগুলির নৈতিক প্রভাব থাকতে পারে। একটি ব্যবসার জন্য এটি করার একটি উপায় হল নিম্ন-প্রতিনিধিত্বশীল সম্প্রদায়ের সাথে আরও অন্তর্ভুক্তিমূলক এবং কম পক্ষপাতদুষ্ট হয়ে কাজ করা। ডেটা অ্যানোটেশনের ক্ষেত্রে, নতুন গবেষণা হাইলাইট করছে যে কীভাবে একটি মাল্টি-অ্যানোটেটর মাল্টি-টাস্ক মডেল যা প্রতিটি টীকাকারের লেবেলকে আলাদা সাবটাস্ক হিসাবে বিবেচনা করে তা সাধারণ গ্রাউন্ড ট্রুথ পদ্ধতিতে অন্তর্নিহিত সম্ভাব্য সমস্যাগুলিকে প্রশমিত করতে সাহায্য করতে পারে যেখানে টীকাকার মতানৈক্য নিম্ন-প্রতিনিধিত্বের কারণে হতে পারে এবং একটি একক গ্রাউন্ড ট্রুথের সাথে টীকাগুলির একত্রীকরণে উপেক্ষা করা যেতে পারে। 

3. বিশ্বাসযোগ্য

বিশ্বাসযোগ্যতা একটি ব্যবসায় থেকে আসে যা স্বচ্ছ এবং ব্যাখ্যাযোগ্য যে এআই মডেলটি কীভাবে প্রশিক্ষিত হয়, এটি কীভাবে কাজ করে এবং কেন তারা ফলাফলগুলি সুপারিশ করে। একটি ব্যবসার AI স্থানীয়করণের সাথে দক্ষতার প্রয়োজন যাতে তার ক্লায়েন্টদের তাদের AI অ্যাপ্লিকেশনগুলিকে আরও অন্তর্ভুক্ত এবং ব্যক্তিগতকৃত করা সম্ভব করে তোলে, স্থানীয় ভাষা এবং ব্যবহারকারীর অভিজ্ঞতার সমালোচনামূলক সূক্ষ্মতাকে সম্মান করে যা এক দেশ থেকে অন্য দেশে AI সমাধানের বিশ্বাসযোগ্যতা তৈরি করতে বা ভাঙতে পারে। . উদাহরণস্বরূপ, একটি ব্যবসার উচিত ব্যক্তিগতকৃত এবং স্থানীয় প্রেক্ষাপটের জন্য তার অ্যাপ্লিকেশন ডিজাইন করা, যার মধ্যে ভাষা, উপভাষা এবং ভয়েস-ভিত্তিক অ্যাপ্লিকেশনগুলির উচ্চারণ অন্তর্ভুক্ত। এইভাবে, একটি অ্যাপ ইংরেজি থেকে কম-প্রতিনিধিত্বিত ভাষা পর্যন্ত প্রতিটি ভাষায় একই স্তরের ভয়েস অভিজ্ঞতার পরিশীলিততা নিয়ে আসে।

ন্যায্যতা এবং বৈচিত্র্য

শেষ পর্যন্ত, মননশীল AI নিশ্চিত করে যে সমাধানগুলি ন্যায্য এবং বৈচিত্র্যময় ডেটা সেটের উপর তৈরি করা হয়েছে যেখানে সমাধান বাজারে যাওয়ার আগে নির্দিষ্ট ফলাফলের ফলাফল এবং প্রভাব পর্যবেক্ষণ করা হয় এবং মূল্যায়ন করা হয়। সমাধানের উন্নয়নের প্রতিটি অংশে সচেতন এবং মানুষকে অন্তর্ভুক্ত করে, আমরা এআই মডেলগুলি পরিষ্কার, ন্যূনতম পক্ষপাতদুষ্ট এবং যতটা সম্ভব নৈতিক থাকতে নিশ্চিত করতে সহায়তা করি।

আপনি কি মনে করেন?

এই সাইট স্প্যাম কমাতে Akismet ব্যবহার করে। আপনার ডেটা প্রক্রিয়া করা হয় তা জানুন.