এআই মডেল প্রশিক্ষণে ইউটিউবের ট্রান্সক্রিপটস ব্যবহার করছে অ্যাপল, এনভিডিয়া ও এনথ্রপিক

অনলাইন ডেস্ক
প্রকাশ : ১৭ জুলাই ২০২৪, ১৬: ২৭

এআই বা কৃত্রিম বুদ্ধিমত্তার মডেলগুলো প্রশিক্ষণ দিতে ইউটিউবের ভিডিওর ট্রান্সক্রিপটস বা সাবটাইটেল ব্যবহার করেছে অ্যাপল, এনভিডিয়া ও এনথ্রপিক। অনুমতি ছাড়াই ইউটিউবের ১ লাখ ৭৩ হাজার ভিডিও ব্যবহার করা হয়েছে। প্রযুক্তি বিষয়ক ওয়েবসাইট প্রুফ নিউজের প্রতিবেদনে এসব তথ্য উঠে এসেছে। 

ইউটিউবের ৪৮ হাজার চ্যানেলের ভিডিওর সাবটাইটেলের টেক্সট দিয়ে ডেটাবেজ তৈরি করে অলাভজনক কোম্পানি ‘এলিউথারএআই’। এই ডেটাবেইস অ্যাপল, এনভিডিয়া ও এনথ্রপিকের মতো বড় বড় প্রযুক্তি কোম্পানিগুলো ব্যবহার করেছে। এই তদন্তের মাধ্যমে জানা যায়, ক্রিয়টরদের অনুমতি না নিয়ে বা কোনো ক্ষতিপূরণ না দিয়েই তাদের কনটেন্ট এআই প্রযুক্তিতে ব্যবহার করছে এসব কোম্পানি। 

এই ডেটাবেইসে ইউটিউবের কোনো ছবি ও ভিডিও ছিল না। শুধু ট্রান্সক্রিপশন অর্থাৎ সাবটাইটেলের টেক্সট ছিল। মার্কেস ব্রাউনলি মিস্টারবিস্ট ও পিউডিপাইয়ের মতো ইউটিউবের জনপ্রিয় কনটেন্ট ক্রিয়েটরদের ভিডিওয়ের ট্রান্সক্রিপশনের ডেটাও এর মধ্যে রয়েছে। সেই সঙ্গে দ্য নিউ ইয়র্ক টাইমস, বিবিসি ও এবিসি নিউজের মতো জনপ্রিয় সংবাদমাধ্যমও রয়েছে। 

এর প্রতিক্রিয়ার মার্কেস ব্রাউনলি এক্স প্ল্যাটফর্মে বলেন, ‘এআই প্রশিক্ষণের জন্য বেশ কয়েকটি কোম্পানি থেকে তথ্য সংগ্রহ করেছে অ্যাপল। এগুলোর মধ্যে থেকে একটি আমার ও অন্যদের ইউটিউব ভিডিও থেকে প্রচুর পরিমাণে ডেটা বা ট্রান্সক্রিপ্ট চুরি করেছে। এটি একটি দীর্ঘমেয়াদি সমস্যা হতে পারে। 

ইউটিউবের প্রধান নির্বাহী নিল মোহান বলেন, যেসব কোম্পানি এআই মডেলকে প্রশিক্ষণ দিতে ইউটিউবের ডেটা ব্যবহার করছে, তারা প্ল্যাটফর্মটির নীতি লঙ্ঘন করবে। 

তবে বিষয়টি নিয়ে কোনো মন্তব্য করেনি অ্যাপল, এনভিডিয়া ও এনথ্রপিক। 

এই প্রতিবেদনের আগে কোম্পানিগুলো এআই মডেল প্রশিক্ষণের জন্য কোন ধরনের ডেটা ব্যবহার করা হচ্ছিল ‍তা সম্পর্কে স্পষ্ট তথ্য ছিল না। এআই মডেল ‘অ্যাপল ইন্টেলিজেন্স’ প্রশিক্ষণে কি ডেটা ব্যবহার করা হয়েছে তা নিয়ে স্পষ্ট কোনো তথ্য না দেওয়ায় অ্যাপলের সমালোচনা করের শিল্পী ও ফটোগ্রাফাররা। অ্যাপলের নতুন ডিভাইসে এই এআই মডেল ব্যবহার করা হবে। 

বিশ্বের সবচেয়ে বড় ভিডিওর ভান্ডার ইউটিউব। এখানে শুধু ট্রান্সক্রিপটই পাওয়া যায় না, সেই সঙ্গে অডিও, ভিডিও ও ছবিরও ভান্ডার রয়েছে। এআইকে প্রশিক্ষণ দেওয়ার জন্য এটি একটি খুব ভালো ডেটার উৎস। 

ওপেনএআইয়ের এআই ভিডিও জেনারেশন টুলকে প্রশিক্ষণের জন্য ইউটিউবের ভিডিও ব্যবহার করা হচ্ছে নাকি এমন প্রশ্ন করা হলে কোম্পানিটির চিফ টেকনলোজি অফিসার মিরা মুরাটি বলেন, ‘ওপেনএআইয়ের এআই মডেল সোরা–কে প্রশিক্ষণ দেওয়ার জন্য কোনো ডেটা ব্যবহার করা হয়েছে তার বিস্তারিত জানাবো না। তবে এটি সর্বসাধারণের উন্মুক্ত ও অনুমোদিত ডেটা ছিল।’ 

নিল মোহানের একই সুরে কথা বলেন অ্যালফাবেটের সিইও সুন্দর পিচাইও।

সর্বশেষ খবর পেতে Google News ফিড ফলো করুন

সরকারি চাকরিজীবীরা সম্পদের হিসাব না দিলে যেসব শাস্তির মুখোমুখি হতে পারেন

শেখ হাসিনাকে নিয়ে যুক্তরাজ্যে এম সাখাওয়াতের বিস্ফোরক মন্তব্য, কী বলেছেন এই উপদেষ্টা

শিক্ষকের নতুন ২০ হাজার পদ, প্রাথমিকে আসছে বড় পরিবর্তন

লক্ষ্মীপুরে জামায়াত নেতাকে অতিথি করায় মাহফিল বন্ধ করে দেওয়ার অভিযোগ

শ্রীপুরে পিকনিকের বাস বিদ্যুতায়িত হয়ে বিশ্ববিদ্যালয়ের ৩ শিক্ষার্থীর মৃত্যু, আহত ৩

এলাকার খবর
খুঁজুন

পাঠকের আগ্রহ

সম্পর্কিত