নতুন ওপেন সোর্স ChatGPT ক্লোন

দটাব্রিক্স এন্টারপ্রাইজ সফ্টওয়্যার কোম্পানি দ্বারা তৈরি করা দলি লার্জ ভাষা মডেল (ডিএলএল) এর মুক্তিদিনে, ওপেন সোর্স জিপিটি চ্যাট আরও একটি পদক্ষেপ নিতে চলেছে।

নতুন ChatGPT ক্লোনটি ডলি নামে পরিচিত হয়, যা এই নামের জন্য প্রসিদ্ধ ভেড়াটির পক্ষে, প্রথম প্রাণী যা ক্লোনিং করা হয়েছিল।

ওপেন সোর্স বৃহত্তর ভাষা মডেলসমূহ

ডলি এলএলএম সে বিস্তারিত অতিভুবনবীন হয়েছে যা সম্প্রসারিত ওপেন সোর্স এইআই আন্দোলনের অংশ এবং এটি সূচনা করে যে তেমনি বড় প্রতিষ্ঠানগুলি নিয়ন্ত্রণ ও মুক্তভাবে মনোপথে রাখা হচ্ছে।

ওপেন সোর্স AI আন্দোলনের মধ্যে একটি চিন্তা হচ্ছে যে ব্যবসাপন্থীগণগণ আইআই প্রযুক্তিটি নিয়ন্ত্রণ করে একটি তৃতীয় পক্ষের কাছে সংরক্ষিত তথ্য সম্পর্কে অস্বীকার করতে পারেন।

ওপেন সোর্সের উপর ভিত্তি করে

Dolly হল একটি বোধশক্তি বহনকারী মডেল, যার উৎসপত্তি হল গৈরলাভযোগ্য সংস্থা EleutherAI গবেষণা প্রতিষ্ঠান এবং স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের Alpaca মডেল। যে মডেলটি তৈরি করা হয়েছে তা আগে মেটা দ্বারা নির্মিত ৬৫ বিলিয়ন প্যারামিটার ধারণকারী ওপেন সোর্স LLaMA মডেল থেকে তৈরি করা হয়েছে।

এলএলএমএ, যা ছিলে শিরেষ্ঠ ভাষা মডেল মেটা এইআই, একটি ভাষা মডেল যা সর্বজনীনভাবে উপলব্ধ তথ্যে যোগ্যতা অর্জন করে।

ওইট্স এবং বায়াস একটি নিবন্ধে বলছেন, LLaMA অনেকগুলি শীর্ষ ভাষা মডেল (OpenAI GPT-3, Gopher by Deep Mind এবং Chinchilla by DeepMind) এর চেয়ে ছোট হওয়ার পরেও এর ঔচিত্য অনুযায়ী অনেক ভাল করতে পারে।

একটি উত্তম ডেটাসেট তৈরি করা

আরও একটি উদ্দীপকতা আসে একটি একাডেমিক গবেষণা পেপার থেকে (SELF-INSTRUCT: স্বনিয়ামিত নির্দেশিকা সঙ্গীত ভাষা মডেলের সাথে সমন্বিত PDF), যা সীমিত পাবলিক ডেটার চেয়ে ভাল হাতের তৈরি প্রশ্ন-উত্তর প্রশিক্ষণ ডেটা তৈরির একটি উপায় বর্ণনা করে।

সেলফ-ইন্সট্রাক্ট গবেষণা পত্রের প্রবন্ধটি বর্ণনা করে:

“...আমরা নবীনতম কার্যগুলির জন্য কিছু বিশেষজ্ঞদ্বারা লেখিত নির্দেশাবলী সংগ্রহ করি, এবং মানব মূল্যায়ন দ্বারা প্রদর্শন করি যে SELF-INSTRUCT ব্যবহার করে GPT3 এর সাথে মূল্যায়ন করা, বিদ্যমান পাবলিক নির্দেশিকা ডেটাসেটের চেয়ে সর্বাধিক জ্ঞান দ্বারা আরোব্যাপক ফলাফল প্রদান করে এবং একটি উপরোক্ত InstructGPT এ শুধুমাত্র একটি 5% প্রামাণিক পার্থক্য পাশে ছেড়ে দেই...

...আমাদের পদ্ধতিটির প্রয়োগ করে ভ্যানিলা GPT3 এর উপর, সুপারন্যাচারাল নির্দেশিকা বিষয়ে আমরা মূল মডেলের সাথে 33% প্রামাণিক উন্নতি দেখাচ্ছি, যা InstructGPT এর কর্মক্ষমতার সাথে সমতুল্য... যা ব্যক্তিগত ব্যবহারকারী ডেটা এবং মানব মন্বুন দ্বারা প্রশিক্ষিত।”

ডলির গুরুত্ব হলো যে এটি প্রয়োজনীয় একটি বড় ভাষা মডেল নির্মাণ করতে পারে, যা একটি ছোট কিন্তু উচ্চ মানের ডেটাসেট দিয়ে সম্ভব হয়।

ডেটাব্রিকস মন্তব্য করে:

“ডলি নিদ্রিত অপেন সোর্স 6 বিলিয়ন প্যারামিটার মডেল নিয়ে কাজ করে, যা এলেউথেরএআই থেকে আগমনী fifty সম্ভাবনা অনুসরণ দক্ষতা এবং মূল মডেলে অনুপস্থিত প্রচেষ্টার সাথে সম্পন্ন করার জন্য এটিকে সংশোধিত করে, আলপাকা থেকে ডেটা ব্যবহার করে।

আমরা প্রদর্শন করি যে কেউ ডেটেড বাজারে পাওয়া অপেন সোর্স বড় ভাষা মডেল নিয়ে গেলে তাকে 30 মিনিটে একটি যন্ত্রে প্রশিক্ষণ দিয়ে ম্যাজিকাল চ্যাটজিপিটির মতো নির্দেশ অনুসরণ সক্ষম করা যায়, উচ্চ মানের প্রশিক্ষণ ডেটা ব্যবহার করে।

আশ্চর্যজনকভাবেই, নির্দেশ-অনুসরণের জন্য নতুনত্ব বা সর্বাধিক বড় মডেলের প্রয়োজন হয় না: আমাদের মডেল শুধুমাত্র ৬ বিলিয়নটি প্যারামিটারের, যেটিকে GPT-3 এর ১৭৫ বিলিয়ন প্যারামিটারের সাথে তুলনা করলেন।"

ডেটাব্রিকস ওপেন সোর্স এইআই

বলা হচ্ছে ডলি কৃত্রিম বুদ্ধিমত্তা জনতার মধ্যে প্রসার করার চেষ্টা করছে। এটি সম্ভাবত একটি বৃহত্তর আন্দোলনের অংশ, যাতে কমতে কমতে নিজস্ব অর্থহীন প্রগতিশীল Mozilla প্রতিষ্ঠানটি সংযুক্ত হয়েছে এমন অস্লা যার সাথেই Mozilla.ai প্রতিষ্ঠানটি প্রতিষ্ঠিত করা হয়েছে। Mozilla হচ্ছে ফায়ারফক্স ব্রাউজার এবং অন্যান্য ওপেন সোর্স সফটওয়্যারের প্রকাশক।

নতুন ওপেন সোর্স চ্যাটজিপিটি ক্লোন - Dolly বলা হচ্ছে।

ওপেন সোর্স বৃহত্তর ভাষা মডেলসমূহ

ওপেন সোর্সের উপর ভিত্তি করে

একটি উত্তম ডেটাসেট তৈরি করা

ডেটাব্রিকস ওপেন সোর্স এইআই

সম্পর্কিত নিবন্ধসমূহ