অনলাইন ডেস্ক
বিশ্বের সবচেয়ে বড় অনলাইন বিশ্বকোষ উইকিপিডিয়ার ইংরেজি সংস্করণে আর্টিকেল বা নিবন্ধের সংখ্যা ৭০ লাখের কাছাকাছি। তবে দ্বিতীয় বৃহত্তম সংস্করণটি ফরাসি, স্প্যানিশ বা চীনা ভাষায় নয়—এটি ফিলিপাইনের দক্ষিণাঞ্চলে প্রচলিত স্থানীয় ভাষা সেবুয়ানোয় লেখা হয়েছে। এই সংস্করণের নিবন্ধ সংখ্যা ৬০ লাখেরও বেশি। আর অবাক করা বিষয় হলো সেবুয়ানো উইকিপিডিয়ার অধিকাংশ নিবন্ধ লিখেছেন একজন ব্যক্তি—সুইডিশ ভাষাবিদ সভারকার ইয়োহানসন। তবে হাতে নয়, এক স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে। এই প্রোগ্রামের নাম এলএসজেবট।
যেভাবে কাজ করে এলএসজেবট
উইকিপিডিয়ায় নানা ধরনের কাজ সহজ করতে বহু বছর ধরেই বট বা স্বয়ংক্রিয় প্রোগ্রাম ব্যবহার হয়ে আসছে। এরা সাধারণত সাইট ঘুরে ডেড লিংক ঠিক করা বা সংক্ষিপ্ত নিবন্ধ তৈরি করার মতো কাজ করে।
২০১০ দশকের শুরুতে, উইকিপিডিয়ায় লিখতেন সভারকার ইয়োহানসন। তখনই তিনি এই স্বয়ংক্রিয় নিবন্ধ-লেখক বটগুলোর সঙ্গে পরিচিত হন।
এরপর তিনি তৈরি করেন এলএসজেবট নামের বিশেষ প্রোগ্রাম। এটি বিভিন্ন অনলাইন ডেটাবেস থেকে তথ্য সংগ্রহ করে নির্দিষ্ট কিছু বাক্য কাঠামোতে বসিয়ে নিবন্ধ তৈরি করে।
উদাহরণস্বরূপ, কোনো প্রাণীর ওপর একটি নিবন্ধের শুরুতে লেখা থাকতে পারে—‘দ্য এক্স ইজ অ্যা ওয়াই বিলংগস টু দ্য জেড ফ্যামিলি’। এখানে এক্স, ওয়াই এবং জেড জায়গাগুলো ফাঁকা থাকে। এখানে এক্স=লাইওন (সিংহ), ওয়াই=ম্যামল (স্তন্যপায়ী), জেড=ক্যাট (বিড়াল)। তাহলে সম্পূর্ণ বাক্যটি দাঁড়ায়–‘দ্য লাইয়ন ইজ অ্যা ম্যামল দ্যাট বিলংগস টু দ্য জেড ক্যাট ফ্যামিলি।’ এভাবে তৈরি হয় লাখ লাখ নিবন্ধ।
ঠিক এইভাবে, এলএসজবট নামের প্রোগ্রামটি একটি নির্দিষ্ট ফরম্যাটে বা টেমপ্লেটে তথ্য বসিয়ে অসংখ্য নিবন্ধ তৈরি করত। এটি মূলত ডেটাবেইস থেকে তথ্য নিয়ে বানানো নির্দিষ্ট বাক্যের ছাঁচে ফেলে লেখা তৈরি করত—কোনো নতুন কথা বা ব্যাখ্যা তৈরি করত না।
বটটি মূলত জীববিজ্ঞান ও ভূগোলভিত্তিক তথ্য ব্যবহার করে উদ্ভিদ ও প্রাণীদের নিয়ে এখন পর্যন্ত প্রায় ২০ লাখ নিবন্ধ এবং ভৌগোলিক স্থান নিয়ে ৪০ লাখ বিভিন্ন নিবন্ধ তৈরি করেছে।
সেবুয়ানো ভাষায় কাজ করার পেছনে ইয়োহানসনের ব্যাখ্যা ছিল ব্যক্তিগত। তাঁর স্ত্রীর মাতৃভাষা সেবুয়ানো। তিনিই বাক্য কাঠামো তৈরিতে সাহায্য করেন।
এলএসজেবট নিয়ে বিতর্ক
সেবুয়ানো উইকিপিডিয়ায় এলএসজেবট ব্যবহার নিয়ে তীব্র বিতর্ক তৈরি হয়। বটের তৈরি অসংখ্য নিবন্ধে ব্যাকরণগত ভুল ও তথ্যগত ত্রুটি পাওয়া যায়। অনুবাদগুলো ছিল অসম্পূর্ণ বা ভুল হওয়ার কারণে এই সমস্যা তৈরি হয়।
অতিরিক্ত সংখ্যক নিবন্ধ তৈরি করাও এই সমস্যার কারণ হয়। এ ছাড়া সম্পাদক স্বল্পতার কারণে এই বিশাল তথ্যভান্ডার ত্রুটিমুক্ত করাও কঠিন হয়ে পড়ে।
এমনকি পুরো সেবুয়ানো উইকিপিডিয়া মুছে ফেলার প্রস্তাবও আসে ২০১৮ সালে, যা পরে বাতিল করা হয়।
ফিলিপাইনের আরেক উইকিপিডিয়ান ইরভিন স্টো. তোমাস জানান, কিছু স্থানীয় স্বেচ্ছাসেবক এখনো চেষ্টা চালিয়ে যাচ্ছেন গুণগত মান উন্নয়নে এবং ড. ইয়োহানসনের সঙ্গেও কাজ করেছেন।
এদিকে উইকিপিডিয়ার লেখক জোশ লিম বলেন—বট ব্যবহারের কারণে আগে থেকেই বিশ্বাসযোগ্যতার সমস্যা তৈরি হয়েছে। সেবুয়ানো উইকিপিডিয়ার প্রাথমিক পর্যায়ে বহু ফরাসি গ্রাম নিয়ে নিবন্ধ ছিল, অথচ স্থানীয় বিষয় ছিল অপ্রতুল। এটি একটি ‘লজ্জাজনক’ বিষয় হয়ে দাঁড়ায়। বটের কারণে ভাষাভিত্তিক উইকিপিডিয়াগুলোর মধ্যে ‘পরিমাণের প্রতিযোগিতা’ শুরু হয়, যাতে গুণমান উপেক্ষিত হয়।
লিম আরও বলেন, সমালোচনা থাকলেও ইয়োহানসনের উদ্দেশ্য ছিল নিষ্ঠার সঙ্গে জ্ঞানের প্রসার ঘটানো। তিনি বলেন, বট বা স্বয়ংক্রিয় প্রযুক্তিকে পুরোপুরি বাদ দেওয়া ঠিক নয় বরং সঠিকভাবে ব্যবহার করতে শিখতে হবে।
২০২১ সাল থেকে এলএসজেবট নিষ্ক্রিয় এবং বিতর্কই এর পেছনে অন্যতম কারণ বলে জানান ইয়োহানসন নিজেই।
উইকিপিডিয়ায় স্থানীয় ভাষার অবমূল্যায়ন ও জেনারেটিভ এআইয়ের চ্যালেঞ্জ
ড. ইয়োহানসনের তৈরি এলএসজেবট বন্ধ হয়ে যায়, কারণ এটি সেবুয়ানো উইকিপিডিয়ায় বেশি পাঠক তৈরি করতে পারেনি। সাইটে লাখো নিবন্ধ থাকলেও, পাঠক ছিল হাজার হাজার। অন্যদিকে, ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপাইনের পাঠক পায়।
উইকিপিডিয়ান জোশ লিম বলেন, এটা ফিলিপাইনের সমাজে ঔপনিবেশিক মানসিকতার প্রতিফলন, যেখানে মাতৃভাষাকে অবমূল্যায়ন করা হয়। এর ফলে স্থানীয় ভাষায় তথ্যের ঘাটতি তৈরি হয়। তবে তিনি মনে করেন, বর্তমানে নিজস্ব ভাষা নিয়ে মানুষের মধ্যে নতুন করে আগ্রহ ও সচেতনতা তৈরি হচ্ছে এবং উইকিপিডিয়া এতে বড় ভূমিকা রাখতে পারে।
অস্ট্রেলিয়ার গবেষক হিদার ফোর্ড বলেছেন, সেবুয়ানো উইকিপিডিয়ার ডেটাভিত্তিক নিবন্ধ এবং ইংরেজি উইকিপিডিয়ার মানুষের দৃষ্টিকোণ থেকে লেখা বর্ণনা তুলনা করলে বোঝা যায় যে, তথ্যের উপস্থাপন ভাষার ভিত্তিতে ভিন্ন হয়।
এদিকে ড. ইয়োহানসন জোর দিয়ে বলেন, এলএসজেবট নতুন কিছু বানায় না, শুধু ডেটা দিয়ে প্রস্তুত ফর্মুলায় তথ্য বসায়। তবে জেনারেটিভ এআই (যেমন চ্যাটজিপিটি) তথ্য ‘উদ্ভাবন’ করে, যা বাস্তব নয় এবং বিশ্বাসযোগ্যতার ঝুঁকি তৈরি করে।
তারপরও তিনি মনে করেন, জেনারেটিভ এআই ভাষাগত সহায়তা ও স্টাইল ঠিক করতে কাজে আসতে পারে। তবে মানব সম্পাদকের যাচাই অপরিহার্য।
গবেষণায় দেখা গেছে, উইকিপিডিয়ার ১-৫ শতাংশ পর্যন্ত এআই দিয়ে তৈরি হতে পারে। তবে যদি এই সংখ্যা বাড়ে, তবে রক্ষণাবেক্ষণ অসম্ভব হয়ে উঠতে পারে, যেমনটা সেবুয়ানোর ক্ষেত্রে হয়েছে।
লিম বলেন, ‘আমরা নির্ভরযোগ্য, তবে ভুল করতে পারি। তাই তথ্য নিয়ে ঈশ্বরসুলভ ক্ষমতার আচরণ করা উচিত নয়।’
তথ্যসূত্র: এবিসি নিউজ
বিশ্বের সবচেয়ে বড় অনলাইন বিশ্বকোষ উইকিপিডিয়ার ইংরেজি সংস্করণে আর্টিকেল বা নিবন্ধের সংখ্যা ৭০ লাখের কাছাকাছি। তবে দ্বিতীয় বৃহত্তম সংস্করণটি ফরাসি, স্প্যানিশ বা চীনা ভাষায় নয়—এটি ফিলিপাইনের দক্ষিণাঞ্চলে প্রচলিত স্থানীয় ভাষা সেবুয়ানোয় লেখা হয়েছে। এই সংস্করণের নিবন্ধ সংখ্যা ৬০ লাখেরও বেশি। আর অবাক করা বিষয় হলো সেবুয়ানো উইকিপিডিয়ার অধিকাংশ নিবন্ধ লিখেছেন একজন ব্যক্তি—সুইডিশ ভাষাবিদ সভারকার ইয়োহানসন। তবে হাতে নয়, এক স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে। এই প্রোগ্রামের নাম এলএসজেবট।
যেভাবে কাজ করে এলএসজেবট
উইকিপিডিয়ায় নানা ধরনের কাজ সহজ করতে বহু বছর ধরেই বট বা স্বয়ংক্রিয় প্রোগ্রাম ব্যবহার হয়ে আসছে। এরা সাধারণত সাইট ঘুরে ডেড লিংক ঠিক করা বা সংক্ষিপ্ত নিবন্ধ তৈরি করার মতো কাজ করে।
২০১০ দশকের শুরুতে, উইকিপিডিয়ায় লিখতেন সভারকার ইয়োহানসন। তখনই তিনি এই স্বয়ংক্রিয় নিবন্ধ-লেখক বটগুলোর সঙ্গে পরিচিত হন।
এরপর তিনি তৈরি করেন এলএসজেবট নামের বিশেষ প্রোগ্রাম। এটি বিভিন্ন অনলাইন ডেটাবেস থেকে তথ্য সংগ্রহ করে নির্দিষ্ট কিছু বাক্য কাঠামোতে বসিয়ে নিবন্ধ তৈরি করে।
উদাহরণস্বরূপ, কোনো প্রাণীর ওপর একটি নিবন্ধের শুরুতে লেখা থাকতে পারে—‘দ্য এক্স ইজ অ্যা ওয়াই বিলংগস টু দ্য জেড ফ্যামিলি’। এখানে এক্স, ওয়াই এবং জেড জায়গাগুলো ফাঁকা থাকে। এখানে এক্স=লাইওন (সিংহ), ওয়াই=ম্যামল (স্তন্যপায়ী), জেড=ক্যাট (বিড়াল)। তাহলে সম্পূর্ণ বাক্যটি দাঁড়ায়–‘দ্য লাইয়ন ইজ অ্যা ম্যামল দ্যাট বিলংগস টু দ্য জেড ক্যাট ফ্যামিলি।’ এভাবে তৈরি হয় লাখ লাখ নিবন্ধ।
ঠিক এইভাবে, এলএসজবট নামের প্রোগ্রামটি একটি নির্দিষ্ট ফরম্যাটে বা টেমপ্লেটে তথ্য বসিয়ে অসংখ্য নিবন্ধ তৈরি করত। এটি মূলত ডেটাবেইস থেকে তথ্য নিয়ে বানানো নির্দিষ্ট বাক্যের ছাঁচে ফেলে লেখা তৈরি করত—কোনো নতুন কথা বা ব্যাখ্যা তৈরি করত না।
বটটি মূলত জীববিজ্ঞান ও ভূগোলভিত্তিক তথ্য ব্যবহার করে উদ্ভিদ ও প্রাণীদের নিয়ে এখন পর্যন্ত প্রায় ২০ লাখ নিবন্ধ এবং ভৌগোলিক স্থান নিয়ে ৪০ লাখ বিভিন্ন নিবন্ধ তৈরি করেছে।
সেবুয়ানো ভাষায় কাজ করার পেছনে ইয়োহানসনের ব্যাখ্যা ছিল ব্যক্তিগত। তাঁর স্ত্রীর মাতৃভাষা সেবুয়ানো। তিনিই বাক্য কাঠামো তৈরিতে সাহায্য করেন।
এলএসজেবট নিয়ে বিতর্ক
সেবুয়ানো উইকিপিডিয়ায় এলএসজেবট ব্যবহার নিয়ে তীব্র বিতর্ক তৈরি হয়। বটের তৈরি অসংখ্য নিবন্ধে ব্যাকরণগত ভুল ও তথ্যগত ত্রুটি পাওয়া যায়। অনুবাদগুলো ছিল অসম্পূর্ণ বা ভুল হওয়ার কারণে এই সমস্যা তৈরি হয়।
অতিরিক্ত সংখ্যক নিবন্ধ তৈরি করাও এই সমস্যার কারণ হয়। এ ছাড়া সম্পাদক স্বল্পতার কারণে এই বিশাল তথ্যভান্ডার ত্রুটিমুক্ত করাও কঠিন হয়ে পড়ে।
এমনকি পুরো সেবুয়ানো উইকিপিডিয়া মুছে ফেলার প্রস্তাবও আসে ২০১৮ সালে, যা পরে বাতিল করা হয়।
ফিলিপাইনের আরেক উইকিপিডিয়ান ইরভিন স্টো. তোমাস জানান, কিছু স্থানীয় স্বেচ্ছাসেবক এখনো চেষ্টা চালিয়ে যাচ্ছেন গুণগত মান উন্নয়নে এবং ড. ইয়োহানসনের সঙ্গেও কাজ করেছেন।
এদিকে উইকিপিডিয়ার লেখক জোশ লিম বলেন—বট ব্যবহারের কারণে আগে থেকেই বিশ্বাসযোগ্যতার সমস্যা তৈরি হয়েছে। সেবুয়ানো উইকিপিডিয়ার প্রাথমিক পর্যায়ে বহু ফরাসি গ্রাম নিয়ে নিবন্ধ ছিল, অথচ স্থানীয় বিষয় ছিল অপ্রতুল। এটি একটি ‘লজ্জাজনক’ বিষয় হয়ে দাঁড়ায়। বটের কারণে ভাষাভিত্তিক উইকিপিডিয়াগুলোর মধ্যে ‘পরিমাণের প্রতিযোগিতা’ শুরু হয়, যাতে গুণমান উপেক্ষিত হয়।
লিম আরও বলেন, সমালোচনা থাকলেও ইয়োহানসনের উদ্দেশ্য ছিল নিষ্ঠার সঙ্গে জ্ঞানের প্রসার ঘটানো। তিনি বলেন, বট বা স্বয়ংক্রিয় প্রযুক্তিকে পুরোপুরি বাদ দেওয়া ঠিক নয় বরং সঠিকভাবে ব্যবহার করতে শিখতে হবে।
২০২১ সাল থেকে এলএসজেবট নিষ্ক্রিয় এবং বিতর্কই এর পেছনে অন্যতম কারণ বলে জানান ইয়োহানসন নিজেই।
উইকিপিডিয়ায় স্থানীয় ভাষার অবমূল্যায়ন ও জেনারেটিভ এআইয়ের চ্যালেঞ্জ
ড. ইয়োহানসনের তৈরি এলএসজেবট বন্ধ হয়ে যায়, কারণ এটি সেবুয়ানো উইকিপিডিয়ায় বেশি পাঠক তৈরি করতে পারেনি। সাইটে লাখো নিবন্ধ থাকলেও, পাঠক ছিল হাজার হাজার। অন্যদিকে, ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপাইনের পাঠক পায়।
উইকিপিডিয়ান জোশ লিম বলেন, এটা ফিলিপাইনের সমাজে ঔপনিবেশিক মানসিকতার প্রতিফলন, যেখানে মাতৃভাষাকে অবমূল্যায়ন করা হয়। এর ফলে স্থানীয় ভাষায় তথ্যের ঘাটতি তৈরি হয়। তবে তিনি মনে করেন, বর্তমানে নিজস্ব ভাষা নিয়ে মানুষের মধ্যে নতুন করে আগ্রহ ও সচেতনতা তৈরি হচ্ছে এবং উইকিপিডিয়া এতে বড় ভূমিকা রাখতে পারে।
অস্ট্রেলিয়ার গবেষক হিদার ফোর্ড বলেছেন, সেবুয়ানো উইকিপিডিয়ার ডেটাভিত্তিক নিবন্ধ এবং ইংরেজি উইকিপিডিয়ার মানুষের দৃষ্টিকোণ থেকে লেখা বর্ণনা তুলনা করলে বোঝা যায় যে, তথ্যের উপস্থাপন ভাষার ভিত্তিতে ভিন্ন হয়।
এদিকে ড. ইয়োহানসন জোর দিয়ে বলেন, এলএসজেবট নতুন কিছু বানায় না, শুধু ডেটা দিয়ে প্রস্তুত ফর্মুলায় তথ্য বসায়। তবে জেনারেটিভ এআই (যেমন চ্যাটজিপিটি) তথ্য ‘উদ্ভাবন’ করে, যা বাস্তব নয় এবং বিশ্বাসযোগ্যতার ঝুঁকি তৈরি করে।
তারপরও তিনি মনে করেন, জেনারেটিভ এআই ভাষাগত সহায়তা ও স্টাইল ঠিক করতে কাজে আসতে পারে। তবে মানব সম্পাদকের যাচাই অপরিহার্য।
গবেষণায় দেখা গেছে, উইকিপিডিয়ার ১-৫ শতাংশ পর্যন্ত এআই দিয়ে তৈরি হতে পারে। তবে যদি এই সংখ্যা বাড়ে, তবে রক্ষণাবেক্ষণ অসম্ভব হয়ে উঠতে পারে, যেমনটা সেবুয়ানোর ক্ষেত্রে হয়েছে।
লিম বলেন, ‘আমরা নির্ভরযোগ্য, তবে ভুল করতে পারি। তাই তথ্য নিয়ে ঈশ্বরসুলভ ক্ষমতার আচরণ করা উচিত নয়।’
তথ্যসূত্র: এবিসি নিউজ
দৃষ্টিপ্রতিবন্ধী ও স্বল্পদৃষ্টিসম্পন্ন ব্যক্তিদের জন্য নিরাপদে চলাফেরার পথ সহজ করতে এক নতুন ধরনের পরিধানযোগ্য ডিভাইস তৈরি করেছেন চীনের বিজ্ঞানীরা। কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ডিভাইসটি ব্যবহারকারীদের চারপাশের প্রতিবন্ধকতা শনাক্ত করে এবং চলার জন্য নিরাপদ পথের নির্দেশনা দেয়।
২ ঘণ্টা আগেসরকার ইতিমধ্যে সাবমেরিন কেবল ব্যান্ডউইথের মূল্য ১০ শতাংশ কমিয়ে এনেছে। ফাইবারের জটিলতা নিরসন করা হয়েছে। এর মধ্যে ৫০০ টাকায় ৫ এমবিপিএসের বদলে ১০ এমবিপিএস গতির ইন্টারনেট সেবা দেওয়ার ঘোষণা দিয়েছে ইন্টারনেট সার্ভিস প্রোভাইডার্স অ্যাসোসিয়েশন অব বাংলাদেশ (আইএসপিএবি)।
৩ ঘণ্টা আগেতথ্য চুরির জন্য প্রতিনিয়ত নতুন কৌশল বের করছে সাইবার অপরাধীরা। ইন্টারনেট ব্যবহারকারীরা যখন ফিশিং লিংক, ভুয়া ওয়েবসাইট, প্রতারণামূলক ইমেইল ও ছদ্মবেশী স্ক্যামের ব্যাপারে সচেতন হচ্ছে, তখন হ্যাকাররা তাদের পদ্ধতিতে নতুনত্ব আনছে। সাম্প্রতিক সময়ে হ্যাকাররা যেসব কৌশল ব্যবহার করছে, তার একটি হলো—ইউএসবি ফ্ল্যাশ
৫ ঘণ্টা আগেবর্তমান ডিজিটাল যুগে ব্যবসা-বাণিজ্য বা ব্যক্তিগত ব্র্যান্ডিংয়ের জন্য ফেসবুক পেজ একটি অপরিহার্য মাধ্যম। তবে ফেসবুক পেজ খুললেই শুধু হবে না, দর্শকদের সঙ্গে যোগাযোগ গড়ে তোলার জন্য সেটিকে আরও কার্যকরভাবে গুছিয়ে তুলতে হবে। আর ঠিক এখানেই গুরুত্বপূর্ণ হয়ে ওঠে ‘অ্যাকশন বাটন’।
৭ ঘণ্টা আগে