ভিডিও দেখার সময় স্বয়ংক্রিয়ভাবে সাবটাইটেল তৈরির জন্য কৃত্রিম বুদ্ধিমত্তা বা এআই প্রযুক্তি ব্যবহার করছে জনপ্রিয় মিডিয়া প্লেয়ার অ্যাপ ভিএলসি। এই ফিচারের মাধ্যমে একাধিক ভাষায় সাবটাইটেল তৈরি করে দেবে অ্যাপটি। ফলে ভিডিওতে সাবটাইটেল না থাকলেও আর কোনো সমস্যা হবে না।
গত ৭ জানুয়ারি থেকে শুরু হওয়া প্রযুক্তির মহাসম্মেলন কনজ্যুমার ইলেকট্রনিকস শোতে (সিইএস) ফিচারটি প্রকাশ্যে আনে অ্যাপটির মূল কোম্পানি ভিডিওল্যান। নতুন ফিচারটি বোঝানোর জন্য একটি ভিডিও উদাহরণ হিসেবে প্রদর্শন করেন কোম্পানিটির প্রেসিডেন্ট জিন-ব্যাপ্টিস্ট কেম্প।
ওপেন সোর্স এআই মডেল ব্যবহার করে চলমান ভিডিওর জন্য সাবটাইটেল তৈরি করবে ফিচারটি। ভিডিওতে কী বলা হচ্ছে, তা ট্রান্সক্রাইব করতে এবং তারপর সেটি নির্বাচিত ভাষায় অনুবাদ করতে এআই মডেলটি ব্যবহার করা হবে।
এটি ব্যবহারকারীদের পিসিতে স্থানীয়ভাবে সাবটাইটেল তৈরি করবে। ফলে কোনো তৃতীয় পক্ষের সার্ভারের ওপর নির্ভর করতে হবে না এবং অফলাইনে সাবটাইটেল দেখতে পারবেন ব্যবহারকারীরা। এই ফিচার শতাধিক ভাষা সমর্থন করবে।
ভিডিওতে পূর্বে সাবটাইটেল যুক্ত করা না থাকলে ভিডিও দেখার সময় তাদের প্রয়োজনীয় সাবটাইটেলগুলো আলাদা করে ‘. srt’ ফাইল আকারে ডাউনলোড করতে হয় ব্যবহারকারীদের। তবে এই সমস্যা সমাধানে ভিএলসি এআই মডেলগুলোর সাহায্য নিচ্ছে।
ভিএলসির চিফ মার্কেটিং অফিসার নাটাচা হোল্টজহাউসার বলেন, ‘এই উদ্ভাবন শুধু সাবটাইটেল সম্পর্কিত নয়; এটি অন্তর্ভুক্তির বিষয় এবং বিশ্বব্যাপী কনটেন্ট গ্রহণের অভিজ্ঞতা সমৃদ্ধ করার বিষয়ে একটি গুরুত্বপূর্ণ পদক্ষেপ।
হোল্টজহাউসার আরও জানান, ভিএলসির একটি ব্লগ পোস্টে এই প্রযুক্তি নিয়ে আরও বিস্তারিত জানানো হবে।
ভিএলসি এই প্রযুক্তি ব্যবহারের জন্য ওপেনএআইয়ের হুইসপার প্রযুক্তি ব্যবহার করতে পারে। এটি একটি ওপেন সোর্স স্পিচ রিকগনিশন টুল। তবে এআই মডেলগুলো কীভাবে প্রশিক্ষণ দেওয়া হয়েছে, তা নিয়ে সন্দেহ প্রকাশ করেছেন প্রযুক্তি বিশ্লেষকেরা। এ ছাড়া এআই দিয়ে তৈরি সাবটাইটেল মাঝে মাঝে ভুল বা বিভ্রান্তিকরণ তথ্য দিতে পারে, যা মানুষের তৈরি সাবটাইটেলের তুলনায় খারাপ অভিজ্ঞতা সৃষ্টি করতে পারে।
এ সপ্তাহে ৬ বিলিয়ন ডাউনলোডের মাইলফলক উদ্যাপন করেছে ভিডিওল্যান। বিষয়টি নিয়ে গর্ব করে কোম্পানিটির প্রেসিডেন্ট জিন ব্যাপটিস্ট কেম্প বলেন, স্ট্রিমিং সার্ভিসের এই যুগেও ভিএলসির সক্রিয় ব্যবহারকারীর সংখ্যা বাড়ছে।
তবে সাবটাইটেলের এআই ফিচার অ্যাপে আনুষ্ঠানিকভাবে কবে পাওয়া যাবে, তা জানায়নি কোম্পানিটি।
ভিএলসি মিডিয়া প্লেয়ার একটি ওপেন-সোর্স সফটওয়্যার, যা ভিডিও ও অডিও প্লেব্যাকের জন্য ব্যবহৃত হয়। এটি উইন্ডোজ, ম্যাকওএস, লিনাক্স, অ্যান্ড্রয়েড ও আইওএসের মতো একাধিক প্ল্যাটফর্মে চালানো যায়। যেমন: ২০০১ সালে প্রথম প্রকাশিত হয় ভিএলসি। এরপর এটি বিশ্বের অন্যতম জনপ্রিয় মিডিয়া প্লেয়ার হয়ে ওঠে।
তথ্যসূত্র: পিসি ম্যাগ ও দ্য ভার্জ