Я припускаю, що просто бракує навчальних даних і OpenAI зосереджується на англійській мові. Набори даних, які зазвичай використовуються для навчання LLM, часто не містять стільки китайських даних (приклад -> китайська мова становить 3,6% набору даних), а піньїнь навіть менше.