Чи можемо ми сказати, що LLM нездатні генерувати лише один маркер за один прохід під час висновку?
Ні, деякі LLM можуть генерувати кілька маркерів за один прохід під час висновку, наприклад. див. Краще & Швидші великі мовні моделі за допомогою багатотокенного прогнозування.