হোম > প্রযুক্তি

লেখা থেকে ভিডিও বানাবে মডেল সোরা

সৈকত দে

অবিশ্বাস্য শোনালেও বিষয়টি এখন বাস্তব। স্ক্রিপ্ট বা চিত্রনাট্য লিখে দিলে সোরা এআই মডেল তা নিয়ে ভিডিও তৈরি করে দিতে পারে। ঠিকঠাক চিত্রনাট্য লিখতে পারলে সোরা কি তবে পুরো সিনেমা বানিয়ে দেবে? তখন পরিচালক হিসেবে কার নাম থাকবে? কৌতুক সরিয়ে রেখে আমরা ওপেন ডটকমের একটি প্রতিবেদন অবলম্বনে সোরাকে আরেকটু ভালো করে চেনার চেষ্টা করি। 

আর্টিফিশিয়াল ইন্টেলিজেন্স যাতে বাস্তব দুনিয়াকে তার গতিসমেত বুঝে উঠতে পারে, সে জন্য বহুদিন ধরে বিভিন্ন মডেলকে শিখিয়ে-পড়িয়ে নেওয়া হচ্ছিল। বাস্তবিক পৃথিবীর সঙ্গে সম্পর্কিত সমস্যাগুলো মানুষকে বুঝতে সাহায্য করবে এআই—এটিই একমাত্র উদ্দেশ্য।

ব্যবহারকারীর নির্দেশনা অনুযায়ী ভিজ্যুয়াল কোয়ালিটি ঠিক রেখে সোরা এক মিনিট পর্যন্ত ভিডিও তৈরিতে সক্ষম। সাইবার নিরাপত্তা সংস্থা রেড ট্রিমার্স এখন অনলাইনে বিশেষ ক্ষতিকর বা ঝুঁকিপূর্ণ অঞ্চলগুলো সোরার সাহায্যে পরীক্ষা করছে। ওপেন এআই অসংখ্য ভিজ্যুয়াল আর্টিস্ট, ডিজাইনার ও চলচ্চিত্র নির্মাতাকে তাদের এআই সিস্টেমে প্রবেশ করতে দিচ্ছে ফিডব্যাকের আশায়। সৃজনশীল মানুষের এসব মতামত আরও কার্যকর মডেল প্রস্তুতে সাহায্য করবে বলে তাদের ধারণা। 

নিজেদের প্রতিষ্ঠানের বাইরের মানুষের সঙ্গেও গবেষণার অগ্রগতি ভাগ করে নেওয়া হচ্ছে। এআই প্রযুক্তিক্ষমতা সম্পর্কে জানাতেই এ ব্যবস্থা নেওয়া হয়েছে। সোরা একাধিক চরিত্রকে যুক্ত করে জটিল দৃশ্য নির্মাণ করতে পারে। নির্দিষ্ট ধরনের গতি, বিষয়ের নিখুঁত ডিটেইলিং এবং প্রেক্ষাপটের স্পষ্ট উপস্থাপনায় রয়েছে তার বিশেষ দক্ষতা। 

সোরা গভীরভাবে ভাষা বোঝার পাশাপাশি ব্যবহারকারীদের নির্দেশনাও বোঝে। একটিমাত্র জেনারেটর ভিডিও থেকে সোরা চরিত্র, ভিজ্যুয়াল স্টাইলনির্ভর একাধিক দৃশ্য নির্মাণ করতে পারে। এখনকার মডেল অবশ্য ফিজিকসের কিছু সূত্র নিয়ে জটিলতায় ভুগছে। কার্যকারণ বুঝতে সোরার সমস্যা হচ্ছে। যেমন দেখা গেল, কেউ বিস্কুট খাচ্ছে। কিন্তু বিস্কুটে হয়তো কামড়ের দাগ নেই। ডান-বাম জ্ঞান, দূরত্বের ধারণা—এসব তার এখনো হয়ে ওঠেনি। 

রেড ট্রিমার্স অনলাইন স্পেসে ভুল তথ্য, হেটফুল কনটেন্ট এবং পক্ষপাতমূলক সংবাদ চিহ্নিতকরণে কাজ করছে এআইয়ের সাহায্যে। সি টু পি এ মেটাডেটা যুক্ত করা হবে যদি ভবিষ্যতে সোরা ওপেন এআই পণ্য হিসেবে বিবেচিত হয়। ডাল ডট ই থ্রি যুক্ত হবে সোরা মডেলে। সেফটি টুল হিসেবে ওপেন এআই অন্যান্য পণ্যে ব্যবহার করে সুফল পাওয়া গেছে। 

অবশ্য টেক্সট ক্ল্যাসিফায়ার্স ব্যবহার করে ভিডিও জেনারেটের জন্য লেখা প্রতিটি টেক্সট বিচার করে দেখা সম্ভব। মানুষের জন্য ক্ষতিকর কিছু থাকলে বাদ দেওয়াটা সময়ের ব্যাপার। এমনকি ইমেজ ক্ল্যাসিফায়ার্স প্রযুক্তি সোরা জেনারেটেড ভিডিওর প্রতিটি ফ্রেম পরীক্ষা করে তবেই ব্যবহারকারীকে দেখাবে। পলিসি নির্মাতা, শিল্পী, শিক্ষাবিদ—সবাইকে যুক্ত করা হচ্ছে নতুন এ প্রযুক্তির সর্বোচ্চ সুফল পেতে। আশা করা হচ্ছে, জ্ঞানবিজ্ঞানের চর্চা ভবিষ্যতের পৃথিবীতে প্রযুক্তির বদান্যতায় আরেকটু সহজ হয়ে উঠবে। 

১০০ কিলোমিটার ওপর থেকে মানুষের চেহারা শনাক্ত করবে চীনের গোয়েন্দা স্যাটেলাইট

নিজস্ব এআই চিপ তৈরি করছে মেটা

হোয়াটসঅ্যাপ গ্রুপে অ্যাডমিন যুক্ত করবেন যেভাবে

প্রযুক্তি খাতে বড় ধস, সাতটি কোম্পানি হারাল ৭৫০ বিলিয়ন ডলার

চ্যাটজিপিটিও মানসিক চাপ ও উদ্বেগের লক্ষণ দেখায়: গবেষণা

স্মার্টফোনের ধারণা বদলে দিতে পারে আইফোন ১৭ প্রো ম্যাক্স

লাখ টাকার কমে দুটি ইলেকট্রিক বাইক আনল রিভো

ওপেনএআইয়ের সঙ্গে ১১.৯ বিলিয়ন ডলারের চুক্তি করল স্টার্টআপ কোম্পানি

চীনা সরকারকে কনটেন্ট সেন্সর শিখিয়েছে ফেসবুক: সাবেক কর্মকর্তা

এক্সে বিভ্রাটের জন্য সাইবার হামলাকে দুষলেন মাস্ক