Більшість із них підпадає під CC BY-SA, але LLM не вміють відстежувати походження основних знань/джерел, які використовуються для генерування певного результату, тому відсутність атрибуції може суперечити вимогам BY (AFAIK, це все ще має бути визначено в суді), хоча більшість genAI Провайдери, здається, на практиці не надто дбають про це, оскільки це рідкість зразки навчання папуг LLM так багато. Також див. Чи незаконно для фірми тренувати модель штучного інтелекту на корпусі CC BY-SA 4.0 і використовувати її в комерційних цілях без розповсюдження моделі під CC BY-SA?