স্বপন ভট্টাচার্য
প্রাবন্ধিক, অবসরপ্রাপ্ত অধ্যাপক
নিবন্ধের শিরোনাম, ঠিকই ধরেছেন, আমাদের যৌবনে প্রতি সপ্তাহে অপেক্ষায় রেখে দেওয়া দেশ পত্রিকায় প্রকাশিত মিলন মুখোপাধ্যায়ের বিখ্যাত উপন্যাসটির নামে। এ নিবন্ধের বিষয়বস্তুও মুখ, তবে মঁমার্তের শিল্পীদের প্যাস্টেল বা চারকোলে আঁকা মুখ তা নয়। এ মুখও ছবির তবে কিনা রিয়েল। বছর দুয়েক আগে চিনের কয়েকজন গবেষক একটি আন্তর্জাতিক জার্নালে এমন একটি গবেষণাপত্র প্রকাশ করেন যার বিষয়বস্তু ছিল তিব্বতি, কোরিয়ান এবং উইঘুর (উত্তর-পশ্চিম চিনের অধিবাসী) জনজাতির মুসলমানদের একটা মিশ্র জনসমষ্টি থেকে কৃত্রিম মেধাভিত্তিক কম্পিউটার সফটওয়্যার ব্যবহার করে কিভাবে কেবল উইঘুর জনজাতির মানুষকে চিহ্নিত করা যায়। এই গবেষকরা জানিয়েছিলেন তাঁরা ডালিয়ান মিনজু ইউনিভার্সিটির ১৮ থেকে ২২ বছর বয়সী ৩০০ জন ছাত্রের মুখের ছবি ব্যবহার করে এমন একখানি মানুষ ছেঁকে নেওয়ার নরম ছাঁকনির হদিশ পেয়েছেন। গবেষণাপত্রটি প্রকাশিত হওয়ার বেশ কিছুদিন পরে একই বিষয় নিয়ে কাজ করছেন এমন কয়েকজন উইলি ইন্টারন্যাশানালকে (যারা এই বিতর্কিত গবেষণার প্রকাশক) অনুরোধ করেন এই গবেষণাপত্রটি তুলে নিতে কেন না তাঁদের মতে মুখের ছবি ব্যবহার করে জনগোষ্ঠীকে চিহ্নিত করার প্রভাব সুদূরপ্রসারী হওয়া সম্ভব। গবেষণা প্রকাশিত হওয়ার বেশ কিছুদিন পরে সেটির লেখকেরা জানান যে ছবি এঁরা অনলাইন সংগ্রহ করেছেন এমন নয়, এঁরা নাকি সবার সম্মতি নিয়ে ছবি তুলেই কাজটা করেছেন। এর পর বিষয়টা যে আন্তর্জাতিক কূটনীতির আঙিনায় চলে আসবে তা কিছুটা প্রত্যাশিতই। প্রথমত, চিন তাদের দেশের সমস্ত অধিবাসীর জন্য একটা সংক্রামক রোগ শনাক্তকারী নেটওয়ার্ক অনুমোদন করে নিয়েছে ২০০২-এর সার্স মহামারির পর থেকেই। পশ্চিমি দুনিয়া এটাকে একটা নজরদারি সফটওয়্যার হিসাবেই দেখে। দ্বিতীয়ত, জিনজিয়াং প্রদেশের উইঘুর ডিটেনশন ক্যাম্পের অস্তিত্ব চিনও স্বীকার করে এবং তারা এগুলিকে রি-এডুকেশন ক্যাম্প বললেও পশ্চিমি দুনিয়ার কাছে এগুলির অস্তিত্বই মানবাধিকারের পরিপন্থী এবং তাদের মতে চিন এই অঞ্চলে মানুষের চলাফেরা অনুসরণ করবার জন্য উইঘুর মুখের সঙ্গে টিউন করা ক্যামেরা ব্যবহার করে থাকে। এই গবেষণাপত্রটি প্রকাশিত হবার পরে দেখা যায়, মুখের ছবি থেকে মানুষের জাতি, বর্ণ, গোষ্ঠী, অপরাধপ্রবণতা ইত্যাদি জরিপ করার সফটওয়্যার নিয়ে ইতিপূর্বেই বেশ কিছু পেপার বেরিয়েছে এবং বেরিয়েছে স্প্রিঙ্গার নেচার, এলসেভিয়ার বা ইন্সটিটিউট অফ ইলেকট্রিক্যাল এন্ড ইলেকট্রনিক্স ইঞ্জিনিয়ার্স-এর মত বিজ্ঞান গবেষণা প্রকাশকদের ঘর থেকে। এখন কথা হচ্ছে বিশ্ব জুড়ে এই ফেস রিকগনিশন টেকনোলজিভত্তিক গবেষণার এত ঢল নামল কেন? যদি ভেবে দেখা যায় এই কৃত্রিম মেধার যুগে যেখানে ছবি সহজেই লভ্য সেখানে এই প্রযুক্তি ব্যবহার করে ঠিক কি কি কাজ করে ফেলা যায় তাহলে এর গুরুত্ব কিছুটা পরিষ্কার হতে পারে। ধরুন, ফেসবুক থেকে লক্ষ লক্ষ মুখের ছবি ব্যবহার করে কোনও গবেষক বানিয়ে ফেললেন এমন সফটওয়্যার যা এনআরসি-র বিরুদ্ধে আন্দোলনরত সমাবেশে কারা বাংলাদেশ থেকে আসা অভিবাসী চিনে নিতে পারল, অথবা ধরুন স্কুলভর্তি ছাত্রছাত্রীদের মধ্যে কোন কোন মুখে অপরাধপ্রবণতা আছে তা চিনে নেওয়া গেল। সুতরাং দেখতে আপনি ডানাকাটা নাও হতে পারেন, আপনার মুখকে, অর্থাৎ মুখের ছবিখানাকে মোটেই হেলেফেলা করবেন না। তা যে এই মুহূর্তে কোথাও না কোথাও কাজে আসছে না, কে বলতে পারে?
এমন নয় যে মুখ চেনার এই অ্যালগোরিদম নিয়ে কাজ হচ্ছে সবেমাত্র কিছুদিন। গত শতাব্দীতেই এ কাজের শুরু, কিন্তু তখনকার থেকে এখনকার কাজে তফাত এই যে তখন স্বেচ্ছাসেবকদের ছবি তুলে কাজ হত আর অল্পসংখ্যক ছবি থেকেই কাজ চালিয়ে নেওয়ার চেষ্টা করতেন গবেষকরা। এখন ছবি লাগে লক্ষ লক্ষ এবং বহুরকম ফোকাসে ও বহুরকম অ্যাঙ্গেলে নেওয়া অজস্র ছবির নমুনা থেকে একটা ফেস রিকগনিশন সফটওয়্যার তৈরি করা যায়। ২০১৫-তে স্ট্যানফোর্ড ইউনিভার্সিটি সানফ্রান্সিস্কোর একটা ক্যাফেতে রাখা ওয়েবক্যাম থেকে লাইভ স্ট্রিম হওয়া বারো হাজার ছবি নিয়েছিল তাদের একটা প্রোজেক্টে। ২০১৬-তে ওয়াশিংটন স্টেট ইউনিভার্সিটি তেত্রিশ লক্ষ ছবির একটা বিশাল সফটওয়্যার আনল যার নাম ‘মেগাফেস’। আনল কোথা থেকে জানেন? Flickr নামক অতি সুপরিচিত ইমেজ শেয়ারিং সাইট থেকে মুখ তুলে নিয়ে। আর এর পরে পরেই ইন্টারনেট থেকে মুখ সংগ্রহ করে মাইক্রোসফট আনল MSCeleb, যা নাকি ১ কোটি মুখের একটা জবরদস্ত ডেটাবেস। সাধারণ রামা শ্যামা থেকে শুরু করে দুনিয়ার রথী মহারথী সেলেব্রিটিদের মুখ সেখানে বিভিন্ন মুডে, বিভিন্ন অ্যাঙ্গেলে জমা আছে। এগুলো তারা বাজারে এনেছিল কোনও উদ্দেশ্য ছাড়াই তা তো হয় না। ২০১৯-এ জার্মানির অ্যাডাম হার্ভে একটা প্রোগ্রাম বানালেন মেগাপিক্সেল নামের যার কাজ হল ধরে ফেলতে পারা কোন ছবি কোথায় ব্যবহৃত হয়েছে বা হচ্ছে। দেখা গেল মুখের মালিকের অনুমতির তোয়াক্কা না করে প্রচুর মুখ শেয়ার হয়েছে খোলাখুলিভাবে। ফিনান্সিয়াল টাইমস এ খবর প্রকাশ করার সঙ্গে সঙ্গেই মাইক্রোসফট সহ অন্যান্যরা এগুলি সরিয়ে নেয়, কিন্তু ভাববেন না এগুলোর ব্যবহার বন্ধ হয়েছে। হার্ভে জানাচ্ছেন, MSCeleb থেকে এখনও বহু ছবি শেয়ার হয়ে চলেছে।
ছবির অনভিপ্রেত ব্যবহার নিয়ে একটা নিবন্ধে ফেসবুকের নাম আসবে না তা হয় না। এ বছরই তাদের ফেডারেল কোর্ট ৬৫ কোটি ডলারেরও বেশি জরিমানা হয়েছে ইলিনয়তে একটা মামলায় যেখানে তাদের এমন কালেকশন থেকে ছবি চুরির অভিযোগ ছিল যে কালেকশন ফেসবুকের পাবলিক ডোমেইনে নেই। অর্থাৎ আপনার আমার শেয়ার না করা ছবি ফেসবুক থেকে হাতিয়ে নিচ্ছে মুখ ব্যবসায়ীরা ফেসবুক নাকি তা জানে না! আদালতে সে যুক্তি ধোপে টেঁকেনি এবং বিশাল জরিমানা দিতে হয়েছে তাদের। একই মামলা হয়েছে মাইক্রোসফট, গুগল, IBM আর আমাজনের বিরুদ্ধে। সবাইকে ছাড়িয়ে গেছে ClearviewAI নামের একটা মুখ চেনানোর সফটওয়্যার কোম্পানি যারা নাকি অনলাইন ছবি সংগ্রহ করেছে তিন কোটিরও বেশি স্রেফ ইন্টারনেট ঘেঁটে কিন্তু কারও কাছ থেকে ন্যূনতম সম্মতি নেওয়ার দায় দেখায়নি। এখানেই উঠে এসেছে মুখ নিয়ে রিসার্চের সঙ্গে মানবাধিকারের প্রশ্ন। কৃত্রিম মেধা, যা নানা জায়গা থেকে মুখের ছবি সংগ্রহ করে সারা বিশ্বেই তৈরি করে চলেছে এমন সব কমপিউটার প্রোগ্রামের যেগুলির স্কুলে অমনোযোগী ছাত্র থেকে রাষ্ট্রে সম্ভাব্য দেশদ্রোহী খোঁজার কাজে— হাজারো কিসিমের ক্ষেত্রে ব্যবহারের সুযোগ আছে, তার গবেষণায় এত মারকাটারি কম্পিটিশন কেন? কেন না এর ‘বাজার’ আছে। এক্ষেত্রে চিনের নাম বড় করে ঊঠে এসেছে মার্কিন যুক্তরাষ্ট্রের সঙ্গে তাদের সম্পর্কের অবনতির পর, নয়তো দেখা যাচ্ছে একাধিক মার্কিন বিশ্ববিদ্যালয় মুখপ্রযুক্তি ব্যবহারের জন্য চিনা সংস্থাগুলির উপরেই নির্ভরশীল। চিনা আর্টিফিসিয়াল ইন্টেলিজেন্স (এআই) কোম্পানি মেগভিল-এর সঙ্গে এমআইটি-র চুক্তি সামনে এল মার্কিন সরকার মেগভিল-কে নিষিদ্ধ ঘোষণা করার পর। এও জানা যায় যে ২০১৮-তে অপর একটি চিনা এআই কোম্পানি ‘সেন্সটাইম’ এমআইটি-কে ‘আনডিসক্লোজড অ্যামাউন্ট অফ সাম’ দিয়েছিল মুখ গবেষণায় যা এমআইটি, চিন-মার্কিন বাণিজ্যে যত টেনশনই থাক না কেন, ফিরিয়ে দিতে রাজি নয়।
মুখ গবেষণার নীতিগত প্রশ্নগুলি কোথায় তা কয়েকটি অতি-সাম্প্রতিক রিসার্চ পেপার দেখলেই পরিষ্কার বোঝা যায়। গত মে মাসে পেন্সিলভ্যানিয়ার হ্যারিসবার্গ বিশ্ববিদ্যালয় একটি প্রকাশনায় জানায় তারা এমন ফেস রিকগনিশন প্রযুক্তি তৈরি করতে সমর্থ হয়েছে যা মুখের ছবি থেকে সম্ভাব্য ক্রিমিনালদের চিনিয়ে দিয়ে পারবে। ভাবুন তো কেমন হয় যদি আপনি হাইস্কুলের হেডমাস্টার হন আর আপনাকে বলা হয় ছাত্রদের মুখ ঘাঁটাঘাঁটি করে সম্ভাব্য জ্যাক দ্য রিপার-দের খুঁজে বার করতে? হ্যারিসবার্গের গবেষণা নেচার-এ প্রকাশিত হবার জন্য অনুমোদন লাভ করার পরে ২৪০০ বিদ্বজ্জন একযোগে প্রতিবাদপত্র পাঠিয়ে এমন গবেষণা প্রকাশ করার বিরুদ্ধে মতপ্রকাশ করেছেন। তাঁরা এমন গবেষণাকে বলেছেন ‘আনসাউন্ড সায়েন্স’ অর্থাৎ অনির্ভরযোগ্য বিজ্ঞান যা ব্যবহৃত হওয়ার সম্ভাবনা রয়েছে একদেশদর্শী পুলিশ ও ক্রিমিনাল জাস্টিস সিস্টেম দ্বারা। মার্কিন ম্যাথেমেটিক্যাল সোসাইটির সহস্রাধিক সদস্য তাদের সহকর্মীদের কাছে আবেদন করেছেন পুলিশকে ফেস রিকগনিশন অ্যালগোরিদম দিয়ে সহায়তা না করতে।
সম্প্রতি নেচার পত্রিকার তরফেই ৪৮৪ জন ফেস রিকগনিশনে কাজ করেন বা গবেষণা করেন এমন প্রযুক্তিবিদদের নিয়ে একটা সার্ভে করে প্রশ্নোত্তরের ভিত্তিতে। নেচার-এর প্রশ্নগুলোই মুখ-প্রযুক্তির সম্ভাব্য ব্যবহারক্ষেত্রের একটা হদিশ দিতে পারে। প্রশ্নগুলো এইরকম:
- মুখ-প্রযুক্তি ব্যবহার করে অপরাধী শনাক্ত করা উচিৎ কি না?
- এয়ারপোর্ট যাত্রীদের পরিচিতি নির্ণয়ে ব্যবহার করা উচিৎ কি না?
- স্মার্টফোন আনলক করার কাজে এই প্রযুক্তির ব্যবহার উচিৎ কি না?
- একটি কোম্পানির অফিসে কারা ঢুকলেন তা জানার জন্য ব্যবহার করা উচিৎ কিনা?
- জনপরিবহন ব্যবস্থায় যাত্রীর পরিচয় সম্পর্কে নিশ্চিত হবার কাজে ব্যবহার উচিৎ কিনা?
- স্কুলছাত্রদের উপস্থিতি সম্পর্কে নিশ্চিত হবার জন্য ব্যবহৃত হওয়া ঠিক কি না?
- পুলিশের যে কোনও পাবলিক প্লেসে যে কোনও ব্যক্তির উপস্থিতি রেকর্ড করা ঠিক কি না?
- স্কুলে ছাত্রদের ব্যবহার চিনে রাখার কাজে ব্যবহার যুক্তিসঙ্গত কি না?
- চাকরির ইন্টারভিউতে আবেদনকারীর ব্যক্তিত্ব ও আবেগ পরখ করার কাজে ব্যবহার ঠিক কি না?
- যে কেউ যে কাউকে খুঁজে বার করার কাজে ব্যবহৃত হওয়া উচিত কি না?
প্রশ্নগুলোর জবাবে গবেষকদের উত্তরে অস্বস্তির স্তর ক্রমবর্ধমান। অর্থাৎ অপরাধী খুঁজে বার করার কাজে লাগলে তাঁরা বেশ আত্মপ্রসাদ লাভ করবেন কিন্তু চাকুরিপ্রার্থীকে মেপে নেবার কাজে বা বিশ্ববাজারে বিশেষ জাতি, বর্ণ, ধর্মের যে কোন লোককে খুঁজে বার করার কাজে তাঁদের গবেষণা ব্যবহৃত হচ্ছে এটা নাকি তাঁদের পক্ষে ঘোর অস্বস্তির। কিন্তু এই গবেষকদেরই যখন জিজ্ঞেস করা হল তাদের কি মনে হয় মুখের মালিকের অনুমতি নিয়েই কাজ করা উচিত নাকি তার তেমন দরকার নেই, তখন ৪০ শতাংশই জানাচ্ছেন অনুমতির প্রয়োজন আছে বলে তারা মনে করছেন না। সুতরাং, ভাবের ঘরে এমন চুরি হয়েই চলেছে আর মুখ-প্রযুক্তির পরিসর ক্লাসরুম থেকে বেরিয়ে এখন প্রকাণ্ড সাবালক রাষ্ট্রীয় সম্পদে পরিণত হয়েছে। মানুষকে গাত্রবর্ণের ভিত্তিতে ভাগ করা যতটা সহজ, মুখের ভিত্তিতে ততটা নয়। তেমন একখানা ফেস রিকগনিশন প্রযুক্তি যা ভিড়ের মধ্য থেকে চিনিয়ে দেবে কে হিন্দু আর কে মুসলিম, কে ভারতীয় মুসলমান আর কে বাংলাদেশি মুসলমান, তার চাহিদা ঠিক কতটা হতে পারে ভাবুন তো? আমার ধারণা ফেস রিকগনিশন প্রযুক্তি যা ভিড়ের মধ্যে আলাদা আলাদা করে লাল, নীল, সবুজে ভাগ করে দেবে বাঙালি, মারাঠি বা মালায়ালিকে— তার জন্য আজকের কলেজ স্তরের ছাত্রের গবেষণাই যথেষ্ট। ধরুন চাকরিতে বায়োমেট্রিক অ্যাটেন্ডেন্স দেওয়ার সময় মালিকের স্ক্রিনে শ্রমিকের মুখের তলায় ভেসে উঠল ‘আনহ্যাপি লেবার’— এমন প্রযুক্তি আজকের দিনে বাম হাতের ব্যাপার। মুখ প্রযুক্তি কোথায় কীভাবে ব্যবহৃত হচ্ছে তা আমরা ধারণাও করতে পারছি না, কিন্তু যেটা বোঝা যাচ্ছে বেশ যে আমাদের অজান্তেই আমাদের মুখের ছবি কাটাছেঁড়া হয়ে চলেছে অনবরত। ছবি আসছে আপনার আমার ফেসবুকে অনবরত বদলাতে থাকা নতুন নতুন প্রোফাইল পিকচার থেকে, আপনার আমার পোস্ট থেকে, ইন্সটাগ্রাম থেকে, টুইটার থেকে। খুব নিশ্চিত হয়ে বলা কি যায় ছবি আসছে না আপনার বায়োমেট্রিক থেকে, আধার থেকে? মলে ঢুকছেন, সোনার দোকানে ঢুকছেন, বহুজাতিক কোম্পানির অফিসে ঢুকছেন— আপনার অজান্তেই উঠে যাচ্ছে আপনার ছবি। এইসব ছবিই হল মুখ-প্রযুক্তি গবেষণার একমাত্র কাঁচামাল, বাকিটা গবেষকের গ্রে ম্যাটার। এভাবেই আপনি আমি থেকে যাচ্ছি টুকরো টুকরো হয়ে, অণু-পরমাণু হয়ে, সোজা হয়ে, পাশ হয়ে, মুখ তুলে বা মুখ নামিয়ে, হাসিমুখে বা গম্ভীরভাবে, সুখের বা দুঃখের ছাপ বিধৃত মুখে অগণিত ল্যাপটপে পৃথিবীর হরেক কোণায়। তার জন্য আমাদের অনুমতি নেওয়ার দায় কারই বা পড়েছে বলুন?
ঋণ:
নিবন্ধটির মূল উপজীব্য নেচার পত্রিকায় প্রকাশিত রিচার্ড ভন নুর্ডেন-এর একটি প্রতিবেদন। Richard Van Noorden (2020) | Nature | Vol 587 | 19 November 2020