অনিন্দ্য চৌধুরী অর্ণব
রাজনীতি থেকে বিনোদন জগৎ—সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব ও বিনোদন তারকা।
ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।
মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক ১ সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।
প্রায় ৭০০ বছর আগে, ১৯৯৭ সালে একটি গবেষণাপত্রকে ভিত্তি করে তৈরি হয় একটি অ্যালগরিদম। যদিও তখন এর কোনো নাম ছিল না। ব্রেগলার, কোভেল ও স্লানি এই তিনজনের গবেষণার বিষয় ছিল ‘ভিডিও রিরাইট: ড্রাইভিং ভিজ্যুয়াল স্পিচ উইথ অডিও’; অর্থাৎ অডিও সংশোধন। বিদ্যমান ভিডিও ফুটেজ ঠিক রেখে স্বয়ংক্রিয়ভাবে একজন ব্যক্তির নকল কণ্ঠস্বর দেওয়া। দেখে মনেই হবে না যে ব্যক্তিটির কণ্ঠ নকল। অথচ ভিডিওতে তা বলেননি। নকল ভয়েসের সঙ্গে তাল রেখে কেবল ঠোঁট নাড়ানোর মাধ্যমেই কাজটি করা হয়েছিল। ‘লিপসিঙ্ক’ শব্দটি এখানে সার্থক। যদিও ব্রেগলারদের এই প্রকল্পের মূল প্রস্তাবনা ছিল চলচ্চিত্রে কণ্ঠারোপ সহজ করা। তাই ডিপফেকের একক কোনো উদ্ভাবক নেই। বিভিন্ন হাত ঘুরে ধারণাটি উঠে এসেছে। ২০১৪ সালে এসে এর পরিপূর্ণ রূপদান করেছেন ইয়ন গুডফেলো। তাঁর তৈরি করা জেনারেটিভ অ্যাডভারসিয়াল নেটওয়ার্ক বা গানই ডিপফেক প্রযুক্তির মূল চাবিকাঠি।
ডিপফেক মূলত অডিও-ভিডিওর নকল প্রতিরূপ, যা প্রথম দর্শনে সত্য বলে মনে হয়। মেশিন লার্নিং এই প্রতিরূপ তৈরির প্রধান হাতিয়ার। এর একটি কৌশলের নাম ‘জেনারেল অ্যাডভারসেরিয়াল নেটওয়ার্ক’ বা গান। এর মাধ্যমে প্রথমত একজন ব্যক্তির হাজারখানেক অভিব্যক্তির ছবি সংগ্রহ করে বিন্যস্ত করা হয় স্বয়ংক্রিয়ভাবে। প্রস্তুত করা হয় ভিডিও সিমুলেশন। এর সঙ্গে জুড়ে দেওয়া হয় অডিও।
ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়।
পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম। প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে।
নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা।
প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি। এর কারণে অশ্লীলতায় পূর্ণ সব কনটেন্ট ভাইরাসের মতো দ্রুত ছড়িয়ে যাচ্ছে প্রতিদিন। সাধারণ মানুষ থেকে প্রেসিডেন্ট পর্যন্ত বাদ যায়নি কেউ। মার্কিন প্রেসিডেন্ট বারাক ওবামা ছাড়াও ৪৫তম প্রেসিডেন্ট ট্রাম্প ক্ষমতায় থাকা অবস্থাতেই তাঁর ডিপফেক ভিডিও ছড়িয়ে পড়ে। সেই নকল ভিডিওতে প্রেসিডেন্ট ট্রাম্প প্যারিস জলবায়ু চুক্তি-সম্পর্কিত সদস্যপদ নিয়ে বেলজিয়ামকে উপহাস করেন। ফেসবুকের প্রতিষ্ঠাতা মার্ক জাকারবার্গ, জনপ্রিয় কমেডিয়ান মিস্টার বিনসহ বহু অভিনেতা-অভিনেত্রী এর উদাহরণ। এই প্রযুক্তিতে তৈরি কনটেন্ট নিয়ে উদ্বিগ্ন অমিতাভ বচ্চন।
ডিপফেক কনটেন্টের অধিকাংশ হয় ভিডিও। খালি চোখে ডিপফেক কি না, তা শনাক্ত একপলকে সম্ভব না হলেও গভীর নজরে এখন পর্যন্ত তা ধরা যায়। চোখের পাতা ওঠানামার সময়ের পার্থক্য, মুখভঙ্গির ভিন্নতা, শারীরিক অঙ্গভঙ্গি, কথার গতি, কণ্ঠের নমনীয়তা-কঠোরতা, ঠোঁটের নড়ন তুলনামূলক কম-বেশি, চুলের রং ইত্যাদি মৌলিক কিছু বিষয় নজরে রেখে সহজেই আসল-নকল পার্থক্য করা যেতে পারে। এগুলোতেও ধরা না গেলে একটু গভীরে ভাবতে হবে কনটেন্টের আলো-ছায়ার খেলা নিয়ে। পটভূমিতে থাকা বিষয়বস্তুর চেয়ে মূল বিষয়বস্তু ঝাপসা না স্পষ্ট, সেটা বুঝতে হবে।
ডিপফেকে তৈরি করা অডিও-ভিডিও শনাক্ত করার জন্য কিছু সফটওয়্যার আছে। সেগুলোর মধ্যে ডিপট্রেস, ভিডিও ইনভিড সফটওয়্যার, রিভার্স ইমেজ সার্চ, ভিডিও মেটাডেটা, ফটো মেটাডেটা, অ্যামনেস্টি ইন্টারন্যাশনালের ইউটিউব ডেটা ভিউয়ার, জার্মানির মিউনিখ বিশ্ববিদ্যালয়ের ভিজ্যুয়াল কম্পিউটিং ল্যাবের গবেষক দলের ফেস-ফরেনসিক সফটওয়্যার অন্যতম।
প্রযুক্তি প্রতিনিয়ত নতুন নতুন দুয়ার খুলছে। প্রযুক্তির নেতিবাচক ব্যবহারের বিপরীতে উন্মোচিত হচ্ছে উপযোগী প্রযুক্তিও। তাই আশা করা যায়, দ্রুতই ডিপফেক সমস্যা সমাধানে যুগান্তকারী কোনো প্রযুক্তি আসবে।
রাজনীতি থেকে বিনোদন জগৎ—সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব ও বিনোদন তারকা।
ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।
মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক ১ সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।
প্রায় ৭০০ বছর আগে, ১৯৯৭ সালে একটি গবেষণাপত্রকে ভিত্তি করে তৈরি হয় একটি অ্যালগরিদম। যদিও তখন এর কোনো নাম ছিল না। ব্রেগলার, কোভেল ও স্লানি এই তিনজনের গবেষণার বিষয় ছিল ‘ভিডিও রিরাইট: ড্রাইভিং ভিজ্যুয়াল স্পিচ উইথ অডিও’; অর্থাৎ অডিও সংশোধন। বিদ্যমান ভিডিও ফুটেজ ঠিক রেখে স্বয়ংক্রিয়ভাবে একজন ব্যক্তির নকল কণ্ঠস্বর দেওয়া। দেখে মনেই হবে না যে ব্যক্তিটির কণ্ঠ নকল। অথচ ভিডিওতে তা বলেননি। নকল ভয়েসের সঙ্গে তাল রেখে কেবল ঠোঁট নাড়ানোর মাধ্যমেই কাজটি করা হয়েছিল। ‘লিপসিঙ্ক’ শব্দটি এখানে সার্থক। যদিও ব্রেগলারদের এই প্রকল্পের মূল প্রস্তাবনা ছিল চলচ্চিত্রে কণ্ঠারোপ সহজ করা। তাই ডিপফেকের একক কোনো উদ্ভাবক নেই। বিভিন্ন হাত ঘুরে ধারণাটি উঠে এসেছে। ২০১৪ সালে এসে এর পরিপূর্ণ রূপদান করেছেন ইয়ন গুডফেলো। তাঁর তৈরি করা জেনারেটিভ অ্যাডভারসিয়াল নেটওয়ার্ক বা গানই ডিপফেক প্রযুক্তির মূল চাবিকাঠি।
ডিপফেক মূলত অডিও-ভিডিওর নকল প্রতিরূপ, যা প্রথম দর্শনে সত্য বলে মনে হয়। মেশিন লার্নিং এই প্রতিরূপ তৈরির প্রধান হাতিয়ার। এর একটি কৌশলের নাম ‘জেনারেল অ্যাডভারসেরিয়াল নেটওয়ার্ক’ বা গান। এর মাধ্যমে প্রথমত একজন ব্যক্তির হাজারখানেক অভিব্যক্তির ছবি সংগ্রহ করে বিন্যস্ত করা হয় স্বয়ংক্রিয়ভাবে। প্রস্তুত করা হয় ভিডিও সিমুলেশন। এর সঙ্গে জুড়ে দেওয়া হয় অডিও।
ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়।
পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম। প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে।
নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা।
প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি। এর কারণে অশ্লীলতায় পূর্ণ সব কনটেন্ট ভাইরাসের মতো দ্রুত ছড়িয়ে যাচ্ছে প্রতিদিন। সাধারণ মানুষ থেকে প্রেসিডেন্ট পর্যন্ত বাদ যায়নি কেউ। মার্কিন প্রেসিডেন্ট বারাক ওবামা ছাড়াও ৪৫তম প্রেসিডেন্ট ট্রাম্প ক্ষমতায় থাকা অবস্থাতেই তাঁর ডিপফেক ভিডিও ছড়িয়ে পড়ে। সেই নকল ভিডিওতে প্রেসিডেন্ট ট্রাম্প প্যারিস জলবায়ু চুক্তি-সম্পর্কিত সদস্যপদ নিয়ে বেলজিয়ামকে উপহাস করেন। ফেসবুকের প্রতিষ্ঠাতা মার্ক জাকারবার্গ, জনপ্রিয় কমেডিয়ান মিস্টার বিনসহ বহু অভিনেতা-অভিনেত্রী এর উদাহরণ। এই প্রযুক্তিতে তৈরি কনটেন্ট নিয়ে উদ্বিগ্ন অমিতাভ বচ্চন।
ডিপফেক কনটেন্টের অধিকাংশ হয় ভিডিও। খালি চোখে ডিপফেক কি না, তা শনাক্ত একপলকে সম্ভব না হলেও গভীর নজরে এখন পর্যন্ত তা ধরা যায়। চোখের পাতা ওঠানামার সময়ের পার্থক্য, মুখভঙ্গির ভিন্নতা, শারীরিক অঙ্গভঙ্গি, কথার গতি, কণ্ঠের নমনীয়তা-কঠোরতা, ঠোঁটের নড়ন তুলনামূলক কম-বেশি, চুলের রং ইত্যাদি মৌলিক কিছু বিষয় নজরে রেখে সহজেই আসল-নকল পার্থক্য করা যেতে পারে। এগুলোতেও ধরা না গেলে একটু গভীরে ভাবতে হবে কনটেন্টের আলো-ছায়ার খেলা নিয়ে। পটভূমিতে থাকা বিষয়বস্তুর চেয়ে মূল বিষয়বস্তু ঝাপসা না স্পষ্ট, সেটা বুঝতে হবে।
ডিপফেকে তৈরি করা অডিও-ভিডিও শনাক্ত করার জন্য কিছু সফটওয়্যার আছে। সেগুলোর মধ্যে ডিপট্রেস, ভিডিও ইনভিড সফটওয়্যার, রিভার্স ইমেজ সার্চ, ভিডিও মেটাডেটা, ফটো মেটাডেটা, অ্যামনেস্টি ইন্টারন্যাশনালের ইউটিউব ডেটা ভিউয়ার, জার্মানির মিউনিখ বিশ্ববিদ্যালয়ের ভিজ্যুয়াল কম্পিউটিং ল্যাবের গবেষক দলের ফেস-ফরেনসিক সফটওয়্যার অন্যতম।
প্রযুক্তি প্রতিনিয়ত নতুন নতুন দুয়ার খুলছে। প্রযুক্তির নেতিবাচক ব্যবহারের বিপরীতে উন্মোচিত হচ্ছে উপযোগী প্রযুক্তিও। তাই আশা করা যায়, দ্রুতই ডিপফেক সমস্যা সমাধানে যুগান্তকারী কোনো প্রযুক্তি আসবে।
বৈদ্যুতিক গাড়ি বা ইভি চার্জিংয়ের জন্য নতুন ধরনের সোলার পেইন্ট (সূর্যশক্তি শোষণকারী রং) তৈরি করছে জার্মানির গাড়ি প্রস্তুতকারক কোম্পানি মার্সিডিজ-বেঞ্চ। এই বিশেষ রঙটিতে ফোটোভোলটাইক সেল (সোলার প্যানেল) রয়েছে, যা সূর্যালোক শোষণ করে
১০ ঘণ্টা আগেইন্টেল ও এএমডি এর মতো মহাকাশে চিপ পাঠিয়েছে চীনের চিপ প্রস্তুতকারক কোম্পানিটি লুনসন। এটি মহাকাশে পাঠানো ক্লাউড কম্পিউটিং প্ল্যাটফর্মগুলোর জন্য কাজ করবে। গত শুক্রবার কোম্পানিটির পক্ষ থেকে এসব তথ্য জানানো হয়।
১২ ঘণ্টা আগেভুলক্রমে বয়ফ্রেন্ডের ৫৬৯ মিলিয়ন বা ৫৬ কোটি ৯০ লাখ পাউন্ডের মূল্যের বিটকয়েন ‘কী’ ভাগাড়ে ফেলে দিয়েছিলেন এক নারী। এখন বয়ফ্রেন্ড বিটকয়েনগুলো ফিরে পাওয়ার জন্য যথাসাধ্য চেষ্টা করছেন। এমনকি বিষয়টি আদালত পর্যন্ত টেনে নেওয়া হচ্ছে।
১২ ঘণ্টা আগেপ্রযুক্তির জগতের অন্যতম পরিচিত নাম চিপ নির্মাতা কোম্পানি এনভিডিয়া এর প্রতিষ্ঠাতা এবং সিইও জেনসেন হুয়াং। তবে শুধু এনভিডিয়ার সাফল্যই তাঁর পুরো জীবনের গল্প নয়, বরং কলেজজীবনের একটি রোমান্টিক ও মজাদার অধ্যায়ও হুয়াংয়ের রয়েছে। যখন ১৭ বছর বয়সী কলেজ ছাত্র হুয়াং তাঁর ১৯ বছরের হবু স্ত্রী লরি হুয়াংয়ের মন জয়...
১৩ ঘণ্টা আগে