-
"Чи можна використовувати ChatGPT для створення наукових гіпотез?" безпосередньо запитує GPT-4 про гіпотези та повідомляє про низку успіхів ("нетривіальні передбачення, які деякі з нас достатньо мотивовані перевірити в лабораторії"). Автори намагалися переконатися, що вони ще не існували в написаному людиною вмісті, хоча це неможливо з абсолютною впевненістю. Вони також відзначають, що він схильний до очевидних помилок, і вважають, що людське курування гіпотез наразі є важливим.
-
"Використання потужності змагальних підказок і великих мовних моделей для надійного створення гіпотез в астрономії" використовує GPT-4 із пошуком документів на астрономічних документах, щоб зменшити галюцинації. Що стосується оцінки якості, оцінка за допомогою суддів-людей дала "майже експертний рівень 4/5, якщо було включено 1000 документів" – де "3/5 відповідає типовій гіпотезі компетентного аспіранта".
Обидві статті виявили цінність того, що GPT-4 критикує власні ідеї для покращення гіпотез.