Сценарій 3: надайте своїм користувачам високоякісні документи за допомогою хорошої пошукової системи, яка показує витяги. Оскільки ці документи є високоякісними для LLM, щоб використовувати їх як навчальні дані, усе в них правдиве, якщо вирвати його з контексту: тому просто зробіть це. (Ви хочете ризикнути майже впевненістю, що модель говорить неправильні речі в тому ж авторитетному стилі, що й ваші вихідні тексти?) Багато існуючих програмних рішень зроблять це за вас, за значно менші витрати, ніж запуск LLM. Cēterum cēnsō dēlendam esse GPT quā vēritātem.
Якщо вам справді потрібно вибрати між сценаріями 1 і 2, це залежить від того, наскільки тексти схожі на модель. Якщо тексти достатньо схожі, Сценарій 1 фактично з втратами стискає їхній вміст, що робить його очевидним вибором; однак, якщо тексти досить різні, вбудовування не буде вірним представленням, і вам потрібно змінити модель (à la Scenario 2), щоб зробити її більш схильною до створення цих текстів. Кращим варіантом було б виконати обидва з них, оскільки це наближає вас до поведінки сценарію 3.
Cēterum autem cēnsō dēlendam esse GPT quā vēritātem. Використовуйте інструменти лише там, де вони придатні.