ويعتمد المشروع على نماذج الذكاء الاصطناعي الخاصة بشركة ميتا، المعروفة باسم “Llama”، لتنفيذ جزء كبير من عمليات المعالجة.
وعلى غرار NotebookLM، يمكن لـ NotebookLlama توليد ملخصات صوتية بأسلوب حواري يشبه حلقات البودكاست استنادًا إلى الملفات النصية التي تُرفع إليه.
وفي البداية، تحوّل أداة NotebookLlama النصوص إلى ملفات صوتية، مثل مقالات الأخبار أو المنشورات، ثم تضيف “لمسات درامية” وتفاعلات تُضفي طابعًا حيويًا على النصوص قبل إرسالها إلى نماذج مفتوحة لتحويل النص إلى كلام.
ولا تضاهي النتائج حاليًا الجودة الصوتية لأداة NotebookLM من غوغل، إذ يظهر في عينات الصوت من أداة ميتا NotebookLlama أن الأصوات لا تبدو طبيعية، وتبدو آلية إلى حد بعيد، كما تميل إلى التداخل في الحديث بنحو غير متناسق.
ومع ذلك، يشير الباحثون في ميتا إلى إمكانية تحسين الجودة باستخدام نماذج أقوى، مضيفين أن “نموذج تحويل النص إلى كلام هو المحدد الرئيسي لمدى طبيعية الصوت”، كما أوضحوا أنه يمكن أيضًا اتباع نهج آخر لتوليد البودكاست عبر جعل اثنين من وكلاء الذكاء الاصطناعي يناقشان الموضوع ويضعان هيكل الحوار، في حين يُستخدم حاليًا نموذج واحد لكتابة المخطط.
ومن الجدير بالذكر أن أداة NotebookLlama ليست المحاولة الأولى لاستنساخ ميزة البودكاست من أداة جوجل NotebookLM، فقد ظهرت عدة مشاريع تتفاوت في مستوى النجاح، لكن لم يتمكن أي منها حتى الآن من التغلب على مشكلة “الهلوسة” التي تُعانيها كافة تطبيقات الذكاء الاصطناعي، ومنها أداة NotebookLM نفسها، إذ قد تولّد معلومات غير دقيقة أو مُختلَقة في البودكاست.