মেশিন লার্নিং থেকে ডিপ লার্নিং: এআই কী ভাবে শেখে?

Artificial Intelligence: আমাদের মাঝে এখন স্মার্ট ওয়াচ খুবই জনপ্রিয়; সারাদিন কতটা হাঁটছি, কীভাবে হাঁটছি, এসব নিয়ে আমরা খুবই সচেতন। সেই ট্রেন্ডটাই কাজে লাগাচ্ছে কোম্পানিরা। আর এইসব ডেটায় আরও সমৃদ্ধ হচ্ছে, কৃত্রিম বুদ্ধিমত্...

বর্তমানে চারিদিকে কৃত্রিম বুদ্ধিমত্তার জয়-জয়াকার। আমাদের সকাল থেকে রাত পর্যন্ত জীবনের প্রতিটি ক্ষেত্রে ছাপ ফেলেছে এই এআই— স্বাস্থ্য, বীমা, ব‍্যাঙ্কিং, প্রযুক্তি, গবেষণা, সবক্ষেত্রেই যেন রাজ করে চলেছে যন্ত্র, কারণ সে মানুষের মতো চিন্তা করতে শিখেছে। কিন্তু প্রশ্ন হচ্ছে, এআই শিখলো কী করে?

শুধু কর্মঠ হলেই চলবে না, মেধাবী হতে হবে। আর তাই, যন্ত্রকে শেখানোর প্রচেষ্টা মানুষ বহুদিন ধরেই করে আসছে, এর একটা পোশাকি নামও আছে— ‘মেশিন লার্নিং’। আমাদের বাড়ির বাচ্চাদেরকে, আমরা যেমন কোনো নতুন জিনিস শেখাই, যার ফলে তারা কোনো জিনিসকে দেখে বুঝতে পারে সেটি ফুল না ফল, যন্ত্রকে ধীরে ধীরে শিক্ষিত করা হয় সেই গুণে। কোনো জিনিস দেখলে, আমাদের মস্তিষ্ক কী করে তার স্মৃতিতে থাকা ছবি গুলির সঙ্গে মেলানোর চেষ্টা করে, যাকে কম্পিউটার বিজ্ঞানের পরিভাষায় বলে ‘প্যাটার্ন রিকগনিশেন’। একই নিয়মে প্রশিক্ষণ দেওয়া হয় এআই নির্ভর চ‍্যাটবটকে; এক্ষেত্রে অজস্র ডেটা বিশ্লেষণ করে দেখার চেষ্টা করা হয় কোনো প্যাটার্ন লুকিয়ে আছে কি না। প্রযুক্তির জগতে, এটি ডিপ লার্নিং নামে বহুল পরিচিত; মূলত এআই এর বিকাশের জন্যই এর অবতারণা। তাড়াহুড়োতে, সময় বাঁচাতে আমরা অনেক সময় টাইপ না করে, স্পিচ রিকগনিশন প্রযুক্তি ব্যবহার করে থাকি, যার মূলেও আছে এই ডিপ লার্নিং।

আরও পড়ুন

এবার হাতের লেখা, সইও নকল করবে এআই! আপনি নিরাপদ তো?

যে কোনো উন্নত মেশিন লার্নিং সিস্টেম বানাতে গেলে সবচেয়ে ঝামেলার কাজ হলো অসংখ্য ডেটার মাঝে কোনো কমন প্যাটার্ন খুঁজে বের করা। কার্যত এই কাজটিই করে ডিপ লার্নিং। আপনার মনে হতেই পারে, কীভাবে কাজটি করে সে, অর্থাৎ কোন কোন বৈশিষ্ট্যের নিরিখে যন্ত্র মেধাবী সিদ্ধান্ত গুলি নিয়ে থাকে?

কম্পিউটার বিজ্ঞানের খুবই পরিচিত একটা সমস্যার কথা উল্লেখ করি। ধরা যাক, আপনার বাগানের দু'টো গোলাপ ফুলের ছবি একই ক‍্যামেরায় পরপর তোলা হয়েছে, ওই ধরুন মাত্র ২ সেকেন্ড অন্তর। আমাদের চোখে দু'টি ছবি একইরকম দেখতে লাগলেও, এআই এর জোরে  কম্পিউটার কিন্তু ঠিক বুঝবে দুটো আলাদা ছবি, কারণ এদের পিক্সেল আলাদা। এবার সমস্যাটা একটু পাল্টে দেই। ধরুন, বাগানের উত্তর দিকের এক কোণে থাকা গত সিজনের গোলাপের ছবির সঙ্গে এবছরের একই গাছের গোলাপের তুলনা করা হচ্ছে, এক্ষেত্রে ছবি দু'টির অনেক পার্থক্যই ধরা পড়বে; কারণ বাগানে আলোর পরিমাণ, ছবি তোলার ভঙ্গি, ব্যাকগ্রাউন্ড, এসবের কিছু তারতম্য তো থাকবেই। এখন, প্রশ্ন হচ্ছে ছবি দু'টি যে আলাদা, এই জ্ঞান যন্ত্রকে কী করে শেখানো হলো?

কিছু বৈশিষ্ট্যকে সামনে রেখে কোডিং করেই দেওয়া যায়, কিন্তু কাজটা অনেক সময় সাপেক্ষ। এইসব ক্ষেত্রে সাহায্য নিতে হয় ডিপ লার্নিং এর; অজস্র  প্রাসঙ্গিক তথ্য সহযোগে প্রশিক্ষিত করতে হয় সিস্টেমকে। যেগুলি বিশ্লেষণ করে, একসময় নিজেরাই আপাত দৃষ্টিতে পৃথক বিন্দুগুলি জুড়তে পারে। অর্থাৎ, নিজেরাই প্যাটার্ন শনাক্ত করতে শিখে যায়; অনেকটা আমাদের মস্তিষ্কের নিউরাল নেটওয়ার্কের মতোই। ১৯৫০ এর পর থেকেই  নিউরাল নেটওয়ার্কের ধারণা পাওয়া যায়। তবে এআই এর জন‍্য, বর্তমান সময়ে এটির এত রমরমা। এই সফলতার পেছনে কারণ মূলত দুটো। প্রথমত, কাজের প্রয়োজনে আমাদেরকে এখন বিশাল সংখ্যক তথ্য নাড়াচাড়া করতে হয়, সেই সঙ্গে এখনকার কম্পিউটার আগের তুলনায় অনেক বেশি শক্তিশালী ও দ্রুত কাজ করে। কৃত্রিম বুদ্ধিমত্তার জগৎ মূলত দাঁড়িয়ে আছে ডেটার উপরে। এআইকে দক্ষ বানাতে গেলে একে যত বেশি সম্ভব ডেটা দিয়ে প্রশিক্ষণের ব্যবস্থা করতে হবে; আর তার জন‍্য দরকার লাখ লাখ ডেটা।

বর্তমানে সময়ে, তো আমরা বাস করছি ডেটার সমুদ্রে; প্রতি মুহূর্তে  ইন্টারনেটে অসংখ্য ভিডিও, অডিও, ছবি, ইত্যাদি আপলোড হচ্ছে। ফলে যন্ত্রকে শেখানোর জন্য ডেটার কোনো ঘাটতি নেই। ডিপ মাইন্ড নামের গুগলের এক কোম্পানি আলফা গো (AlphaGo) নামক কৃত্রিম বুদ্ধিমত্তা ভিত্তিক একটি সিস্টেম তৈরি করে, যেটি চিনা বোর্ড গেম ‘গো’ (Go) খেলায় বেশ দক্ষ। এই সিস্টেমের কাছে, ২০১৬ সালের গো চ্যাম্পিয়ন জয়ী খেলোয়াড়, লি সিডল (Lee Sedol) পরাজিত হয়। আশ্চর্যের ব্যাপার হলো ‘আলফা গো’ কে এই খেলার নিয়ম কেউ শেখায়নি এর আগে; শুধুমাত্র পুরোন খেলার ভিডিও দেখেই সে এতই দক্ষ হয়ে ওঠে, যে হারিয়ে দেয় লি-কে।

আরও পড়ুন

এআই যতটা গর্জাচ্ছে ততটা বর্ষাবে?

অসংখ্য ছবি থেকে নির্দিষ্ট কোনো ছবি, অথবা বহুভাষী কথোপকথনের মাঝে কোনো বিশেষ ভাষা খোঁজার জন্যে নিউরাল নেটওয়ার্কের জুড়ি নেই। সেজন্য বিভিন্ন কোম্পানি তাদের পণ্যের প্রচারের জন্য, বিভিন্ন স্পিচ রিকগনিশন সিস্টেমের জন্য এই নিউরাল নেটওয়ার্ক ব্যবহার করে। শুধুই স্পিচ নয়, মানুষের মুখবায়ব শনাক্তকরণের জন্য তৈরি ফেস ডিটেকশন সিস্টেমেও এই নেটওয়ার্কের বহুল ব্যবহার রয়েছে। এটিকে, আরও শক্তিশালী করে তোলার জন্যে কাজে লাগানো হচ্ছে ফেসবুক, ইউটিউবের মতো কোম্পানির বিশাল সংখ্যক ডেটা ভাণ্ডার।

আমাদের মাঝে এখন স্মার্ট ওয়াচ খুবই জনপ্রিয়; সারাদিন কতটা হাঁটছি, কীভাবে হাঁটছি, এসব নিয়ে আমরা খুবই সচেতন। সেই ট্রেন্ডটাই কাজে লাগাচ্ছে কোম্পানিরা। আর এইসব ডেটায় আরও সমৃদ্ধ হচ্ছে, কৃত্রিম বুদ্ধিমত্তা ভিত্তিক চ্যাটবট গুলি। অর্থাৎ, আমাদের প্রয়োজনে আমরা স্মার্ট গাজেটে ডেটা দিচ্ছি, যেগুলি যাচ্ছে কোনো না কোনো  ডিপ লার্নিং সিস্টেমে, আবার তারাই সেই ডেটা থেকে স্বতপ্রণদিত ভাবে, তারা আরও প্রশিক্ষিত হচ্ছে। এ যেন সিস্টেম নিজেই তার জ্বালানি (ডেটা) জোগাড় করছে প্রতিনিয়ত।

আধুনিক বিশ্বে, ডিপ লার্নিং খুবই শক্তিশালী একটি কৌশল, এর সফল প্রয়োগ লক্ষ করা যায় স্বয়ংক্রিয় বা রোবট ভ্যাকুয়াম ক্লিনার, বিভিন্ন অটোনোমাস ভেহিকল বা স্ব-চালিত যানবাহন, ইত্যাদি ক্ষেত্রে। যে কোনো এআই সিস্টেম টিকে আছে মেশিন লার্নিং এর উপর, যেটি আবার ডিপ লার্নিং এর উপর নির্ভরশীল। রহস্যময় এই প্রযুক্তি মাঝে মধ্যে ঘোল খাওয়াচ্ছে  তাবড়-তাবড় গবেষকদের। কারণ, এর উপর নির্ভর করছে ভবিষ্যতের কৃত্রিম বুদ্ধিমত্তার  জগৎ।

More Articles