বিজ্ঞান ও প্রযুক্তি

লেখা থেকে দীর্ঘ মিউজিক তৈরি করবে গুগলের মিউজিক এআই

মার্কিন প্রযুক্তি জায়ান্ট গুগলের গবেষকরা এমন এক এআই মডেল তৈরি করেছেন যা লেখা থেকে কয়েক মিনিট দীর্ঘ মিউজিক তৈরি করতে পারে।

এটি হুইসেল যুক্ত বা হামড মেলোডিকে অন্যান্য বাদ্যযন্ত্রের মিউজিকে রূপান্তর করতে পারে। যেভাবে ডিএএলএএল-ই এর মতো সিস্টেমগুলো লিখিত প্রম্পট থেকে ইমেজ তৈরি করে থাকে।

দ্য আউটলেটের মতে, এই মডেলের নাম দেওয়া হয়েছে মিউজকএলএম। এই মডেল ব্যবহার করে তৈরি কয়েকটি স্যাম্পল আপলোড করেছে গুগল।

গুগলের এক গবেষণায় বলা হয়েছে, আমরা নিয়ে এসেছি মিউজিক এআই। যা লেখা মিউজিকে রূপান্তরিত করতে পারে। এটি বিকৃত গিটারের সুরকে শান্ত ভায়োলিনের মিউজিকে পরিণত করতে পারে। সেই সঙ্গে 24 kHz এ মিউজিক জেনারেট করে। যা কয়েক মিনিট ধরে সামঞ্জস্যপূর্ণ থাকে।

গুগলের প্রকাশিত এই স্যাম্পলগুলো বেশ আকর্ষণীয়। এটি টেক্সটের বর্ণনা অনুযায়ী জনরা, ভাইব এমনকী নির্দিষ্ট বাদ্যযন্ত্রের মিউজিক তৈরি করতে সক্ষম এবং এক বা দুই শব্দের মেলোডিক টেকনো থেকে পাঁচ মিনিটের মিউজিক তৈরি করতে পারে।

ডেমো সাইটে প্রদর্শিত উদাহরণগুলো দিয়ে দেখানো হয়েছে, মডেলটি যে কোন ধরনের মিউজিক তৈরি করতে পারে। এটি ১০ সেকেন্ডের সেলো বা মারাকাস, ৮ সেকেন্ডের নির্দিষ্ট জনরার মিউজিক এমনকি এটি যেকোনো লেভেলের পিয়ানোর মিউজিক তৈরি করতে পারে। এতে ফিউচারিস্টিক ক্লাব এবং অ্যাকর্ডিয়ন ডেথ মেটাল-এর ব্যাখ্যাও রয়েছে।

মিউজিক এলএম মানুষের আওয়াজেরও অনুকরণ করতে পারে। তবে এর আওয়াজ এবং টোন ঠিক থাকলেও এর কোয়ালিটিতে ঘাটতি রয়েছে।

দ্য ভার্জের মতে, এআই-উত্পাদিত মিউজিকের কয়েক দশকের দীর্ঘ ইতিহাস রয়েছে। এমন সিস্টেম রয়েছে যা পপ গান রচনা, ৯০ এর দশকে মানুষের চেয়ে স্ট্রিমকে আরও ভালোভাবে অনুলিপি করতে এবং লাইভ পারফরম্যান্সের সঙ্গেও কাজ করতে পারে।

Leave a Reply

Your email address will not be published. Required fields are marked *