Ajker Patrika

উইকিপিডিয়ার ৬০ লাখের বেশি আর্টিকেল লেখা হয়েছে এআই বট দিয়ে

অনলাইন ডেস্ক
ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপিনের পাঠক পায়। ছবি: দ্য টেক ওয়্যার এশিয়া
ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপিনের পাঠক পায়। ছবি: দ্য টেক ওয়্যার এশিয়া

বিশ্বের সবচেয়ে বড় অনলাইন বিশ্বকোষ উইকিপিডিয়ার ইংরেজি সংস্করণে আর্টিকেল বা নিবন্ধের সংখ্যা ৭০ লাখের কাছাকাছি। তবে দ্বিতীয় বৃহত্তম সংস্করণটি ফরাসি, স্প্যানিশ বা চীনা ভাষায় নয়—এটি ফিলিপাইনের দক্ষিণাঞ্চলে প্রচলিত স্থানীয় ভাষা সেবুয়ানোয় লেখা হয়েছে। এই সংস্করণের নিবন্ধ সংখ্যা ৬০ লাখেরও বেশি। আর অবাক করা বিষয় হলো সেবুয়ানো উইকিপিডিয়ার অধিকাংশ নিবন্ধ লিখেছেন একজন ব্যক্তি—সুইডিশ ভাষাবিদ সভারকার ইয়োহানসন। তবে হাতে নয়, এক স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে। এই প্রোগ্রামের নাম এলএসজেবট।

যেভাবে কাজ করে এলএসজেবট

উইকিপিডিয়ায় নানা ধরনের কাজ সহজ করতে বহু বছর ধরেই বট বা স্বয়ংক্রিয় প্রোগ্রাম ব্যবহার হয়ে আসছে। এরা সাধারণত সাইট ঘুরে ডেড লিংক ঠিক করা বা সংক্ষিপ্ত নিবন্ধ তৈরি করার মতো কাজ করে।

২০১০ দশকের শুরুতে, উইকিপিডিয়ায় লিখতেন সভারকার ইয়োহানসন। তখনই তিনি এই স্বয়ংক্রিয় নিবন্ধ-লেখক বটগুলোর সঙ্গে পরিচিত হন।

এরপর তিনি তৈরি করেন এলএসজেবট নামের বিশেষ প্রোগ্রাম। এটি বিভিন্ন অনলাইন ডেটাবেস থেকে তথ্য সংগ্রহ করে নির্দিষ্ট কিছু বাক্য কাঠামোতে বসিয়ে নিবন্ধ তৈরি করে।

উদাহরণস্বরূপ, কোনো প্রাণীর ওপর একটি নিবন্ধের শুরুতে লেখা থাকতে পারে—‘দ্য এক্স ইজ অ্যা ওয়াই বিলংগস টু দ্য জেড ফ্যামিলি’। এখানে এক্স, ওয়াই এবং জেড জায়গাগুলো ফাঁকা থাকে। এখানে এক্স=লাইওন (সিংহ), ওয়াই=ম্যামল (স্তন্যপায়ী), জেড=ক্যাট (বিড়াল)। তাহলে সম্পূর্ণ বাক্যটি দাঁড়ায়–‘দ্য লাইয়ন ইজ অ্যা ম্যামল দ্যাট বিলংগস টু দ্য জেড ক্যাট ফ্যামিলি।’ এভাবে তৈরি হয় লাখ লাখ নিবন্ধ।

ঠিক এইভাবে, এলএসজবট নামের প্রোগ্রামটি একটি নির্দিষ্ট ফরম্যাটে বা টেমপ্লেটে তথ্য বসিয়ে অসংখ্য নিবন্ধ তৈরি করত। এটি মূলত ডেটাবেইস থেকে তথ্য নিয়ে বানানো নির্দিষ্ট বাক্যের ছাঁচে ফেলে লেখা তৈরি করত—কোনো নতুন কথা বা ব্যাখ্যা তৈরি করত না।

বটটি মূলত জীববিজ্ঞান ও ভূগোলভিত্তিক তথ্য ব্যবহার করে উদ্ভিদ ও প্রাণীদের নিয়ে এখন পর্যন্ত প্রায় ২০ লাখ নিবন্ধ এবং ভৌগোলিক স্থান নিয়ে ৪০ লাখ বিভিন্ন নিবন্ধ তৈরি করেছে।

সেবুয়ানো ভাষায় কাজ করার পেছনে ইয়োহানসনের ব্যাখ্যা ছিল ব্যক্তিগত। তাঁর স্ত্রীর মাতৃভাষা সেবুয়ানো। তিনিই বাক্য কাঠামো তৈরিতে সাহায্য করেন।

এলএসজেবট নিয়ে বিতর্ক

সেবুয়ানো উইকিপিডিয়ায় এলএসজেবট ব্যবহার নিয়ে তীব্র বিতর্ক তৈরি হয়। বটের তৈরি অসংখ্য নিবন্ধে ব্যাকরণগত ভুল ও তথ্যগত ত্রুটি পাওয়া যায়। অনুবাদগুলো ছিল অসম্পূর্ণ বা ভুল হওয়ার কারণে এই সমস্যা তৈরি হয়।

অতিরিক্ত সংখ্যক নিবন্ধ তৈরি করাও এই সমস্যার কারণ হয়। এ ছাড়া সম্পাদক স্বল্পতার কারণে এই বিশাল তথ্যভান্ডার ত্রুটিমুক্ত করাও কঠিন হয়ে পড়ে।

এমনকি পুরো সেবুয়ানো উইকিপিডিয়া মুছে ফেলার প্রস্তাবও আসে ২০১৮ সালে, যা পরে বাতিল করা হয়।

ফিলিপাইনের আরেক উইকিপিডিয়ান ইরভিন স্টো. তোমাস জানান, কিছু স্থানীয় স্বেচ্ছাসেবক এখনো চেষ্টা চালিয়ে যাচ্ছেন গুণগত মান উন্নয়নে এবং ড. ইয়োহানসনের সঙ্গেও কাজ করেছেন।

এদিকে উইকিপিডিয়ার লেখক জোশ লিম বলেন—বট ব্যবহারের কারণে আগে থেকেই বিশ্বাসযোগ্যতার সমস্যা তৈরি হয়েছে। সেবুয়ানো উইকিপিডিয়ার প্রাথমিক পর্যায়ে বহু ফরাসি গ্রাম নিয়ে নিবন্ধ ছিল, অথচ স্থানীয় বিষয় ছিল অপ্রতুল। এটি একটি ‘লজ্জাজনক’ বিষয় হয়ে দাঁড়ায়। বটের কারণে ভাষাভিত্তিক উইকিপিডিয়াগুলোর মধ্যে ‘পরিমাণের প্রতিযোগিতা’ শুরু হয়, যাতে গুণমান উপেক্ষিত হয়।

লিম আরও বলেন, সমালোচনা থাকলেও ইয়োহানসনের উদ্দেশ্য ছিল নিষ্ঠার সঙ্গে জ্ঞানের প্রসার ঘটানো। তিনি বলেন, বট বা স্বয়ংক্রিয় প্রযুক্তিকে পুরোপুরি বাদ দেওয়া ঠিক নয় বরং সঠিকভাবে ব্যবহার করতে শিখতে হবে।

২০২১ সাল থেকে এলএসজেবট নিষ্ক্রিয় এবং বিতর্কই এর পেছনে অন্যতম কারণ বলে জানান ইয়োহানসন নিজেই।

উইকিপিডিয়ায় স্থানীয় ভাষার অবমূল্যায়ন ও জেনারেটিভ এআইয়ের চ্যালেঞ্জ

ড. ইয়োহানসনের তৈরি এলএসজেবট বন্ধ হয়ে যায়, কারণ এটি সেবুয়ানো উইকিপিডিয়ায় বেশি পাঠক তৈরি করতে পারেনি। সাইটে লাখো নিবন্ধ থাকলেও, পাঠক ছিল হাজার হাজার। অন্যদিকে, ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপাইনের পাঠক পায়।

উইকিপিডিয়ান জোশ লিম বলেন, এটা ফিলিপাইনের সমাজে ঔপনিবেশিক মানসিকতার প্রতিফলন, যেখানে মাতৃভাষাকে অবমূল্যায়ন করা হয়। এর ফলে স্থানীয় ভাষায় তথ্যের ঘাটতি তৈরি হয়। তবে তিনি মনে করেন, বর্তমানে নিজস্ব ভাষা নিয়ে মানুষের মধ্যে নতুন করে আগ্রহ ও সচেতনতা তৈরি হচ্ছে এবং উইকিপিডিয়া এতে বড় ভূমিকা রাখতে পারে।

অস্ট্রেলিয়ার গবেষক হিদার ফোর্ড বলেছেন, সেবুয়ানো উইকিপিডিয়ার ডেটাভিত্তিক নিবন্ধ এবং ইংরেজি উইকিপিডিয়ার মানুষের দৃষ্টিকোণ থেকে লেখা বর্ণনা তুলনা করলে বোঝা যায় যে, তথ্যের উপস্থাপন ভাষার ভিত্তিতে ভিন্ন হয়।

এদিকে ড. ইয়োহানসন জোর দিয়ে বলেন, এলএসজেবট নতুন কিছু বানায় না, শুধু ডেটা দিয়ে প্রস্তুত ফর্মুলায় তথ্য বসায়। তবে জেনারেটিভ এআই (যেমন চ্যাটজিপিটি) তথ্য ‘উদ্ভাবন’ করে, যা বাস্তব নয় এবং বিশ্বাসযোগ্যতার ঝুঁকি তৈরি করে।

তারপরও তিনি মনে করেন, জেনারেটিভ এআই ভাষাগত সহায়তা ও স্টাইল ঠিক করতে কাজে আসতে পারে। তবে মানব সম্পাদকের যাচাই অপরিহার্য।

গবেষণায় দেখা গেছে, উইকিপিডিয়ার ১-৫ শতাংশ পর্যন্ত এআই দিয়ে তৈরি হতে পারে। তবে যদি এই সংখ্যা বাড়ে, তবে রক্ষণাবেক্ষণ অসম্ভব হয়ে উঠতে পারে, যেমনটা সেবুয়ানোর ক্ষেত্রে হয়েছে।

লিম বলেন, ‘আমরা নির্ভরযোগ্য, তবে ভুল করতে পারি। তাই তথ্য নিয়ে ঈশ্বরসুলভ ক্ষমতার আচরণ করা উচিত নয়।’

তথ্যসূত্র: এবিসি নিউজ

Google News Icon

সর্বশেষ খবর পেতে Google News ফিড ফলো করুন

এলাকার খবর
খুঁজুন

পাঠকের আগ্রহ

সম্পর্কিত